AR行業(yè)的大事兒!臉書開源Detectron計算機視覺算法
2022-10-05 07:12:47 來源:
![]()
本文系網(wǎng)易智能工作室(公眾號smartman 163)出品。聚焦AI,讀懂下一個大時代!
【網(wǎng)易智能訊 1月26日消息】Facebook本周宣布Detectron開放源代碼正式向大眾公開,該項目也是Facebook基于深度學(xué)習(xí)框架進行設(shè)計的關(guān)于計算機視覺對象檢測算法平臺。該公司表示,開放該項目的動機是加速計算機視覺研究,并且Facebook公司內(nèi)部團隊正在使用該代碼進行各種應(yīng)用測試,其中就包括針對增強現(xiàn)實技術(shù)的研究。
在我最近發(fā)表的一篇文章中,詳細介紹了當(dāng)今增強現(xiàn)實技術(shù)即將面臨的三大挑戰(zhàn),在這其中我注意到計算機進行實時對象分類是我們最大的技術(shù)難區(qū)之一:
不僅僅只觀察一個形狀,讓計算機利用視覺去理解“杯子”的物體含義是一個值得深究的問題。這就是為什么多年以來,我們在看到的增強現(xiàn)實技術(shù)演示中發(fā)現(xiàn)人們將基準(zhǔn)標(biāo)記附加到觀察對象上,從而促進機器與觀察物體之間更細致的跟蹤和交互。
為什么難?我們要提到的第一個技術(shù)挑戰(zhàn)是如何進行視覺分類。我們了解到,杯子有數(shù)千種形狀,大小,顏色和紋理。有些杯子有特殊的屬性,它們是為了特殊目的而制造的(如燒杯),這意味著它們在不同的地方和環(huán)境中有多種多樣的用法。
讓我們來想象關(guān)于如何寫一個能幫助計算機理解所有我們在上面提到的這些概念的算法有多難,而且這只是為了能夠在多個杯子中辨認(rèn)出其中一個目標(biāo)的杯子。我們還可以想想,關(guān)于寫一個能夠幫助電腦區(qū)分杯子和碗的代碼是另一項需要完成的挑戰(zhàn)。
![]()
我還談到了為什么“深度學(xué)習(xí)”技術(shù)是實時對象分類問題的一個潛在的解決方案,它能夠做到“培訓(xùn)”一臺計算機來解釋它所看到的,而不是用人工編程不斷的一行行進行檢測。 Facebook本周已經(jīng)開發(fā)出了他們自創(chuàng)的對象檢測算法,這可能會加速系統(tǒng)的開發(fā),使系統(tǒng)能夠進行實時對象分類,從而使增強現(xiàn)實技術(shù)真正得到廣泛使用。
關(guān)于增強現(xiàn)實技術(shù)與我們周圍物體實際相互作用的方式,在粗略地了解附近特定的場景之前并不用針對特定環(huán)境進行預(yù)先編程。例如,如果您戴著AR眼鏡,并希望能夠?qū)⒖鞠錅囟韧队暗娇鞠渖戏剑缓筮€需要將冰箱中需要拿出來的食物的列表在AR眼鏡中顯示出來,則您的眼鏡需要分辨烤箱和冰箱的樣子。鑒于各種烤箱和冰箱以及它們生產(chǎn)地方的不同和放置位置的不同,這是一項極具挑戰(zhàn)性的任務(wù)。
Facebook的人工智能研究團隊最近一直在研究計算機視覺對象檢測問題,并且它們正在嘗試通過深度學(xué)習(xí)使計算機能夠得出關(guān)于場景中存在什么物體的結(jié)論。在Facebook宣布基于Caffe2深度學(xué)習(xí)框架的對象檢測算法開發(fā)的被稱為Detectron的平臺向大眾開放后,現(xiàn)在任何人都可以在GitHub上利用該算法進行試驗。 Facebook公司希望Detectron平臺將使世界各地的計算機視覺研究人員能夠嘗試并不斷改進最新的技術(shù)。
我們從項目的GitHub主頁信息了解到,“Detectron的目標(biāo)是為物體檢測研究提供高質(zhì)量,高性能的代碼庫。它的設(shè)計目的是通過靈活的方式來支持關(guān)于新穎技術(shù)的快速應(yīng)用和評估的研究。”
該算法能通過檢查視頻輸入信息,從而猜測離散對象來構(gòu)成對應(yīng)場景。諸如檢測和識別人與物體相互作用(Gkioxari等)的研究項目已經(jīng)使用了Detectron作為了解人類在環(huán)境中的行為的基礎(chǔ)平臺,該項目朝著幫助計算機充分理解我們正在做的事情的正確方向邁出了正確的步伐,從而使機器觀察以后能夠即時提供有價值的信息。
除了進行人工智能技術(shù)研究之外,Detectron也被Facebook內(nèi)部廣泛使用。該公司在Detectron宣布開放的消息中寫道:“我們團隊使用這個平臺來培訓(xùn)各種應(yīng)用的定制模型,其中包括增強現(xiàn)實技術(shù)和檢查數(shù)據(jù)信息完整性的相關(guān)應(yīng)用。”
具體哪些團隊將使用Detectron應(yīng)用增強現(xiàn)實技術(shù)并未公布,但是我們現(xiàn)在知道Oculus很可能會使用它,因為他的首席科學(xué)家Michael Abrash最近就增強現(xiàn)實技術(shù)將如何以及何時改變我們的生活發(fā)表了長篇演講。
(選自:roadtovr編譯:網(wǎng)易見外 參與:付曾)
關(guān)注網(wǎng)易智能公眾號(smartman163),獲取人工智能行業(yè)最新報告。
-
全球首條城市微循環(huán)Robo-Bus市民體驗線路在蘇發(fā)布
網(wǎng)易科技訊7月14日消息,近日,在長三角G60科創(chuàng)走廊智能駕駛產(chǎn)業(yè)對接會暨智能駕駛產(chǎn)業(yè)蘇州創(chuàng)新論壇上,由自動駕駛新銳企業(yè)輕舟智航部署的R
2022-10-05 06:06
-
IBM在德國慕尼黑投資2億美元設(shè)立物聯(lián)網(wǎng)總部
(原標(biāo)題:IBM在德國慕尼黑設(shè)立物聯(lián)網(wǎng)總部) 網(wǎng)易科技訊2月17日消息,據(jù)彭博社報道,IBM沃森集團在德國慕尼黑投資2億美元建設(shè)的物
2022-10-04 22:16
-
唯瑞高源:專業(yè)窄邊框液晶顯示器的細分行業(yè)應(yīng)用
網(wǎng)易科技訊 10月15日消息,首屆中國商用顯示(B2B)發(fā)展高峰論壇今天在北京萬壽賓館舉行,網(wǎng)易科技做為獨家門戶合作媒體在現(xiàn)場做了直播報
2022-10-04 20:17
-
無人機已被拋棄?谷歌打算讓“狗”送快遞
在科技飛速發(fā)展的今天,無論發(fā)生什么奇聞怪事都不會令人感到驚奇,即使谷歌透露出打算讓狗來幫助人類送快遞,當(dāng)然了,這只狗是機器狗。
2022-10-04 14:06
-
【重磅】2022(第七屆)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)大會完整榜單揭曉
(原標(biāo)題:【重磅】2022(第七屆)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)大會完整榜單揭曉) 由賽迪傳媒、大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟、《軟件和集成電路》雜志社聯(lián)
2022-10-04 13:30
-
華為云舉辦AI院長峰會,五大人才培養(yǎng)計劃打通產(chǎn)學(xué)研鏈路
(原標(biāo)題:華為云舉辦AI院長峰會,五大人才培養(yǎng)計劃打通產(chǎn)學(xué)研鏈路) 9月15日,在華為云AI院長峰會上,華為云聯(lián)合國內(nèi)頂尖高校共同成立
2022-10-03 19:02
-
云從科技發(fā)布行業(yè)級AI產(chǎn)品和能力平臺“輕舟 -
寶寶類理財收益率連跌5周再創(chuàng)年內(nèi)新低 -
微軟稱移動辦公app將有新設(shè)計體系使用感覺 -
迪士尼研究院與蘇黎世理工研發(fā)能爬墻的電動 -
日產(chǎn)汽車宣布到2025年在中國市場發(fā)售9款純 -
正式應(yīng)用還要數(shù)年但這次CES我們?yōu)楹我P(guān)注5G -

經(jīng)緯創(chuàng)投合伙人叢真自爆離職將加入天善資本 -

Windows盡管藍屏死機但仍是最偉大的操作系統(tǒng) -

知否日本為何熱衷在廁所吃飯?真相讓人有些 -

鹿和小兔的愛情故事



