国产精品久久久久久久福利,夂久精品国产久精国产,国产三级视频在线观看网址

手機(jī)版

客戶(hù)端

融媒體矩陣

微信視頻號(hào)

快手視頻號(hào)

今日頭條

郵箱

zgc_west@126.com 復(fù)制

繁繁體

簡(jiǎn) 簡(jiǎn)體

訂報(bào)/續(xù)訂 | 廣告服務(wù) | PDF電子報(bào) | 電子報(bào)

首頁(yè) 港聞財(cái)經(jīng) 商聯(lián)通視聽(tīng) 港深合作評(píng)論綜合灣區(qū) 社團(tuán) Life Style 地方新界專(zhuān)刊專(zhuān)題

--℃

滾動(dòng)新聞：

視覺(jué)提示新突破！IDEA研究院發(fā)布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗(yàn)20:07 深圳首艘3000噸級(jí)海洋執(zhí)法船入列首次亮相國(guó)際海洋周20:06 港燈首次到深圳招聘深受求職者歡迎20:01 深圳調(diào)整二套住房最低首付款比例最低為40%19:51 3人涉詐騙社署及保險(xiǎn)公司逾90萬(wàn) 遭廉署起訴周五提堂19:48 深圳調(diào)整享受優(yōu)惠政策普通住房認(rèn)定標(biāo)準(zhǔn)19:44 【收藏「琪」觀】森羅萬(wàn)象19:42 孫玉菡率團(tuán)在深圳出席多項(xiàng)活動(dòng) 推廣香港大灣區(qū)人才服務(wù)港角色19:40

視覺(jué)提示新突破！IDEA研究院發(fā)布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗(yàn)

責(zé)任編輯：朱劍明 2023-11-22 20:07:59 來(lái)源：香港商報(bào)網(wǎng)

　繼火爆出圈的Grounded SAM之後，IDEA研究院團(tuán)隊(duì)攜重磅新作歸來(lái)：全新視覺(jué)提示(Visual Prompt)模型T-Rex，以圖識(shí)圖，開(kāi)箱即用，開(kāi)啟開(kāi)集檢測(cè)新天地!

QQ截圖20231122201315.jpg

　(動(dòng)態(tài)圖)

QQ截圖20231122201324.jpg

　(靜態(tài)圖)

　拉框、檢測(cè)、完成!在剛剛結(jié)束的2023 IDEA大會(huì)上，IDEA研究院創(chuàng)院理事長(zhǎng)、美國(guó)國(guó)家工程院外籍院士沈向洋展示了基於視覺(jué)提示的目標(biāo)檢測(cè)新體驗(yàn)，並發(fā)布了全新視覺(jué)提示模型T-Rex的模型實(shí)驗(yàn)室(playground), Interactive Visual Prompt(iVP)，掀起現(xiàn)場(chǎng)一波試玩小高潮。

　在iVP上，用戶(hù)可以親自解鎖「一圖勝千言」的prompting體驗(yàn)：在圖片上標(biāo)記感興趣的對(duì)象，向模型提供視覺(jué)示例，模型隨即檢測(cè)出目標(biāo)圖片中與之相似的所有實(shí)例。整套流程交互便捷，只需幾步操作就可輕鬆完成。

QQ圖片20231122201435.png

　(動(dòng)態(tài)圖)

QQ圖片20231122201445.png

　(靜態(tài)圖)

　IDEA研究院4月份發(fā)布的Grounded SAM (Grounding DINO + SAM) 曾在Github上火爆出圈，至今已狂攬11K星。有別於只支持文字提示的Grounded SAM，此次發(fā)布的T-Rex模型提供著重打造強(qiáng)交互的視覺(jué)提示功能。

　T-Rex具備極強(qiáng)的開(kāi)箱即用特性，無(wú)需重新訓(xùn)練或微調(diào)，即可檢測(cè)模型在訓(xùn)練階段從未見(jiàn)過(guò)的物體。該模型不僅可應(yīng)用於包括計(jì)數(shù)在內(nèi)的所有檢測(cè)類(lèi)任務(wù)，還為智能交互標(biāo)註場(chǎng)景提供新的解決方案。

QQ圖片20231122201522.png

　團(tuán)隊(duì)透露，研發(fā)視覺(jué)提示技術(shù)是源自對(duì)真實(shí)場(chǎng)景中痛點(diǎn)的觀察。有合作方希望利用視覺(jué)模型對(duì)卡車(chē)上的貨物數(shù)量進(jìn)行統(tǒng)計(jì)，然而，僅通過(guò)文字提示，模型無(wú)法單獨(dú)識(shí)別出每一個(gè)貨物。其原因是工業(yè)場(chǎng)景中的物體在日常生活中較為罕見(jiàn)，難以用語(yǔ)言描述。在此情況下，視覺(jué)提示顯然是更高效的方法。與此同時(shí)，直觀的視覺(jué)反饋與強(qiáng)交互性，也有助於提升檢測(cè)的效率與精準(zhǔn)度。

　基於對(duì)實(shí)際使用需求的洞察，團(tuán)隊(duì)將T-Rex設(shè)計(jì)成可接受多個(gè)視覺(jué)提示的模型，且具備跨圖提示能力。除了最基本的單輪提示模式，目前模型還支持以下三種進(jìn)階模式。

QQ圖片20231122201543.png

　? 多輪正例模式：適用於視覺(jué)提示不夠精準(zhǔn)造成漏檢的場(chǎng)景

　? 正例+負(fù)例模式：適用於視覺(jué)提示帶有二義性造成誤檢的場(chǎng)景

　? 跨圖模式：適用於通過(guò)單張參考圖提示檢測(cè)他圖的場(chǎng)景

　在同期發(fā)布的技術(shù)報(bào)告中，團(tuán)隊(duì)總結(jié)了T-Rex模型的四大特性：

QQ圖片20231122201613.png

　開(kāi)放集：不受預(yù)定義類(lèi)別限制，具有檢測(cè)一切物體的能力

　視覺(jué)提示：利用視覺(jué)示例指定檢測(cè)目標(biāo)，克服罕見(jiàn)、複雜物體難以用文字充分表達(dá)的問(wèn)題，提高提示效率

　直觀的視覺(jué)反饋：提供邊界框等直觀視覺(jué)反饋，幫助用戶(hù)高效評(píng)估檢測(cè)結(jié)果

　交互性：用戶(hù)便捷參與檢測(cè)過(guò)程，對(duì)模型結(jié)果進(jìn)行糾錯(cuò)

　研究團(tuán)隊(duì)指出，在目標(biāo)檢測(cè)場(chǎng)景中，視覺(jué)提示的加入能夠補(bǔ)足文本提示的部分缺陷。未來(lái)，兩者的結(jié)合將進(jìn)一步釋放CV技術(shù)在更多垂直領(lǐng)域的落地潛能。

　有關(guān)T-Rex模型的技術(shù)細(xì)節(jié)，請(qǐng)參考同期發(fā)布的技術(shù)報(bào)告。

QQ圖片20231122201624.png

　iVP 模型實(shí)驗(yàn)室：https://deepdataspace.com/playground/ivp

　Github連結(jié)：trex-counting.github.io

　本項(xiàng)工作來(lái)自IDEA研究院計(jì)算機(jī)視覺(jué)與機(jī)械人研究中心。該團(tuán)隊(duì)此前開(kāi)源的目標(biāo)檢測(cè)模型DINO是首個(gè)在COCO目標(biāo)檢測(cè)上取得榜單第一的DETR類(lèi)模型;在Github上大火的零樣本檢測(cè)器Grounding DINO與能夠檢測(cè)、分割一切的Grounded SAM，同樣為該團(tuán)隊(duì)作品。

責(zé)任編輯：朱劍明視覺(jué)提示新突破！IDEA研究院發(fā)布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗(yàn)