色婷婷av一区二区_国产一区二区三区四区在线观看 _中文字幕一区二区在线观看_亚洲综合激情另类小说区

您的位置:首頁 >鑒藏 > 陶瓷 >

Transformer為什么這么火?毫末智行工程師一文揭秘

2021-09-02 16:34:30 來源:

  作為在自然語言處理(NLP)領域應用廣泛的深度學習模型,Transformer 近兩年強勢來襲,不僅橫掃 NLP 領域,而且在 CV 上也鋒芒畢露。江湖傳言,Transformer 架構就像是絕世高手的武林秘籍,得秘籍者得天下!

  毫末智行作為國內首先大規模使用 Vision Transformer 技術的公司,正在練就獨門絕學,力求在智能駕駛的賽道上搶占先機。

  Transformer 的殺手锏

  我們知道,最初的 Transformer 來自于 NLP,它的出現將 NLP 領域向前推動了一大步。其中的關鍵要素就是Transformer 具備:超強的序列建模能力、全局信息感知能力。

  得益于這兩點優勢,Transformer 幾乎取代了基于 RNN 的算法在 NLP 中的地位,也被引入到 CV 領域。但值得我們深入思考的是,Transformer 如何利用優勢在視覺領域發揮作用呢?

  我們知道 NLP 中處理的是語句,句子是天然的序列數據,所以我們很容易理解 Transformer 是如何處理它們的。可在視覺領域,序列的概念并不是顯式的,因此我們可以從空間和時間兩個維度去理解。

  首先是空間維度,靜態圖像從空間上可以被劃分成多個區域(block),一種典型的劃分方式就是按照高和寬進行劃分,例如,一幅圖像的高和寬分別是 H 和 W,我們要求 block 的長寬均為 M,那么最終我們會得到 (H/M ×;W/M) 個 block。

  事實上,我們可以把 block 看成是 NLP 句子中的詞,這里的只不過是視覺詞(visual words)。這樣一來,就可以將一幅圖像轉化成一個按照空間順序排列的 block 集合,一方面這樣的視角轉換保證了不丟失視覺信息,另一方面讓應用 Transformer 變得非常容易。

  另一種則是通過時間維度去理解視覺中的序列,即視頻。視頻是由靜態的圖像幀組成,把每一幀看成是一個基本單元(同樣可以類別成句子中的詞),那么我們就可以很自然地按照時間序列把一個片段組織起來,從而應用 Transformer 進行后續的特征提取。

圖引自論文《An Image is Worth 16x16 Words Transformer for Image Recognition at scale》

  除了強大的序列建模能力,Transformer 的主要模塊 Multi-Head Self-Attention 可以同時感知到輸入序列的全局信息,這是 Transformer 相比于 CNN 的巨大優勢。在 CNN 中,信息只能從局部開始,隨著層數的增加,能夠被感知到的區域逐步增大。然而Transformer 從輸入開始,每一層結構都可以看到所有的信息,并且建立基本單元之間的關聯,也意味著Transformer 能夠處理更加復雜的問題。

  Transformer 的優化升級

  目前處于 Transformer 在視覺中應用的早期,大家使用 Transformer 的方式主要參考了其在 NLP 中的應用經驗。但是,如果直接將 Transformer 應用到視覺上,也會存在一些難題。

  其一,核心模塊多頭注意力機制(Multi-Head Self-Attention )的計算量與 block 的個數成正比,因此在視覺中 block 數量要遠多于 NLP 中句子的詞數,這就造成了計算量的陡增。

  其二,Transformer 擅長全局關系的學習,對于局部細節信息關注有限,然而視覺中很多任務需要足夠豐富的細節信息做判斷,比如語義分割。

  針對上述的問題,毫末智行人工智能研發團隊對核心模塊多頭注意力機制(Multi-Head Self-Attention)進行了優化,同時采用了金字塔的結構增強 Transformer 對于細節信息的感知。

圖引自論文《LeViT a Vision Transformer in ConvNet Clothing for Faster Inference》

  Transformer 的未來演化

  盡管我們在上面提到了 Transformer 的一些不盡如意之處,但隨著研究的深入,大家逐步發現在同一結構中結合 CNN 和 Transformer 各自的優勢,即可做到相互的揚長避短。在未來,把CNN 和 Transformer 進行整合將成為 Transformer 的演化路徑之一。

  具體來說,主干網使用 CNN,Head 使用 Transformer 結構,可以有效提升網絡的速度(相比純使用 Transformer);相反,主干網使用 Transformer 結構,Head 使用 CNN 的結構,可以有效提升結果精度(相比于純使用 CNN)。

  其次,核心模塊 Multi-Head Self-Attention 內部也可以通過降低子空間的維度、對輸入 block 進行分組等手段降低其計算量且不至于損失過多精度。

  最后,通過控制 block 的粒度,使 Transformer 能夠感知到不同尺度的信息,從而達到局部和全局的信息融合。

  毫末智行團隊已經將上述的改進逐步添加到了毫末智行自己的模型中。未來,我們將不斷在提升速度的同時保證出色的精度,讓 Transformer 在實際的業務中生根發芽。

圖引自論文《End to End Object Detection with Transformers》

  基于 Transformer 的感知算法表現出了極強的泛化性和魯棒性,我們堅定認為,Transformer 的特性極有可能在智能駕駛的場景中發揮出傳統 CNN 算法所不能企及的感知能力。

  鑒于此,毫末智行的人工智能團隊正在逐步將基于 Transformer 的感知算法應用到實際的道路感知問題,例如車道線檢測、障礙物檢測、可行駛區域分割、紅綠燈檢測識別、道路交通標志檢測、點云檢測分割等。 未來,相關 Transformer 感知算法更加和穩定成熟后,逐步替換基于 CNN 的感知算法。

  Transformer 技術的進一步應用,不僅為毫末智行在各條智能駕駛產品線上的視覺算法落地帶來成倍的效率提升,還能夠讓各項視覺性能指標快速達到業內水平。

相關閱讀
熱門新聞
Transformer為什么這么火?毫末智行工程師一文揭秘

Transformer為什么這么火?毫末智行工程師一文揭秘

  作為在自然語言處理(NLP)領域應用廣泛的深度學習模型,Transformer 近兩年強勢來襲,不僅橫掃 NLP 領域,而且在 CV 上也鋒芒畢露。江

2021-09-02 16:34
三星今年美國發明專利數將超越IBM

三星今年美國發明專利數將超越IBM

  北京時間12月15日上午消息,三星今年很可能將超過IBM,成為獲得美國發明專利數量最多的公司。  過去22年中,IBM一直是獲得美國發明專利

2021-09-02 15:04
銀興智能:助力廣發銀行打造Hadoop資源管理平臺

銀興智能:助力廣發銀行打造Hadoop資源管理平臺

  據深圳銀興智能數據有限公司(簡稱:銀興智能)介紹,隨著廣發銀行大數據平臺hadoop集群應用場景越來越多,研發中心、數據中心、卡中心和分

2021-09-02 10:41
搭載Viband技術一數科技Cast化身智能管家

搭載Viband技術一數科技Cast化身智能管家

  在科技與需求的雙重驅動下,人機交互形式逐漸從多點觸控開始向體感技術發展,作為可以直接佩戴在身上參與人機交互的智能穿戴設備,智能

2021-09-02 09:37
愛普生智能光學模組VM-40賦能行業應用落地

愛普生智能光學模組VM-40賦能行業應用落地

  7月8日至10日,2021世界人工智能大會在上海世博展覽館召開,全球行業精英齊聚一堂,圍繞AI賦能城市數字化轉型主題,勾畫人工智能技術創新

2021-09-02 04:22
它來了!MoChat開源了一款超好用的企業微信開源SCRM系統,太香了

它來了!MoChat開源了一款超好用的企業微信開源SCRM系統,太香了

  大家都知道,企業微信是騰訊旗下一款非常好用的、免年費的私域用戶運營工具,但可惜的是企業微信只提供基礎的能力,基于場景更豐富的功

2021-09-01 23:51
主站蜘蛛池模板: 亚洲欧洲日本国产| 久久精品国产美女| 亚洲精品无码久久久久久| 日韩久久久久久久久久久久| 久久九九视频| 视频一区二区三区免费观看| 97国产精品久久| 欧美亚洲另类在线| 亚洲欧美日韩综合一区| 91禁国产网站| 久久精品欧美| 日韩不卡视频一区二区| 日本在线播放一区| 欧美日韩一道本| 亚洲最大av在线| 亚洲中文字幕无码专区| 91极品视频在线| 久久亚洲国产精品日日av夜夜| 欧美日韩精品免费观看视一区二区| 日韩欧美视频一区二区三区四区| 国产精品日韩欧美综合| 久久本道综合色狠狠五月| 亚洲色欲综合一区二区三区| 日韩视频在线一区| 欧美精品色婷婷五月综合| 午夜精品三级视频福利| 亚洲综合视频一区| 日本成人中文字幕在线| 日日摸日日碰夜夜爽无码| 欧美日韩福利在线| 久久99国产综合精品女同| 国产成人精品电影久久久| 精品久久久久亚洲| 精品国产中文字幕| 久久久久久综合网天天| 精品国产一区二区三区在线| 国产福利精品在线| 亚洲精品自在在线观看| 亚洲精品欧洲精品| 日本一区二区三区视频在线播放| 日本不卡视频在线播放|