人工智能時代,谷歌、英特爾和英偉達之間的計算能力角逐戰
2022-03-30 15:05:44 來源:
2001年6月26日,著名導演史蒂文·;斯皮爾伯格執導的《人工智能》(英文名:《AI》)在美國上映。影片講述的是機器人小男孩大衛為了尋找養母,并縮短機器人與人類的差距而奮斗的故事。

《人工智能》電影劇照
大衛是一個被輸入情感程序的機器人男孩,Cybertronics Manufacturing公司員工亨瑞和他妻子制造出的一個試驗品。他們收養了大衛,并給了他足夠的愛,但是人類與機器都無法接受大衛。于是大衛踏上旅程去尋找真正屬于自己的地方,渴望成為一個真正意義上的人。
在這部影片上映15年后,機器人還沒有成為真正意義上的人, 但人工智能在圍棋領域戰勝了人類。它的強大和超強的進化能力,讓人類棋手難以望其項背。

AlphaGo以3!0戰勝柯潔九段
AlphaGo Master比AlphaGo Lee(與李世石對戰的版本)要強大,Master在對戰中耗費的能力(性能和功耗)僅是Lee版本的十分之一,需要4個TPU在單臺電腦上運行即可。DeepMind首席科學家David Silver在AlphaGo 戰勝李世石后這樣解釋說。
AlphaGo強大到令人絕望,引發了人工智能威脅人類的討論。但在本質上,人工智能是算法、數據和硬件三個要素綜合的結果。
一旦涉及到算法、數據,就離不開計算。在這個領域,用來計算的硬件主要是TPU、GPU和CPU,他們背后代表的公司則分別是谷歌、英偉達和英特爾。這幾家公司彼此競爭,又互相需要。
TPU(Tensor Processing Unit)是專為機器學習而定制的芯片,經過了專門深度機器學習方面的訓練。谷歌工程師Norm Jouppi介紹,在人工智能相關的算法上,它的計算速度更快,計算結果更精準,同時也更加節能。

谷歌在I/O 2017上發布第二代Cloud TPU
人工智能依賴于機器學習(Machine Learning),機器學習又依賴于硬件,它需要硬件平臺提供大量的運算資源。就計算效率來說,專用工具的計算效率遠高于通用工具。專門為機器學習定制而出現的谷歌的TPU就是一種專用的工具,業內普遍認為它的出現對于通用工具GPU來說是一種威脅。
GPU的設計初衷不是主要用來進行神經網絡運算,而是圖像處理。由于其特殊的構造碰巧也比較適用于神經網絡運算,所以在TPU出現之前,大多數做機器學習廠商都在同時利用FPGA和GPU來改進訓練自己的神經網絡算法。
英偉達創始人兼CEO黃仁勛卻不認同TPU威脅論,在接受鳳凰科技的采訪時,他表示谷歌的TPU不會對英偉達的Volta GPU構成威脅,雙方在TensorFlow項目上保持著合作,而Volta GPU的運算能力甚至在TPU之上。
作為世界最大的GPU制造商之一,英偉達一直不遺余力地推廣GPU在深度學習領域的應用。老黃將英偉達稱為一家人工智能公司。
談到英偉達基于GPU的人工智能戰略,需要先從Volta說起。
在今年5月11日的NVIDIA GTC 2017上,英偉達推出了全新的GPU架構Volta。英偉達應用深度學習研究副總裁Bryan Catanzaro表示這并不是前代架構Pascal的升級,而是一個全新的架構。Volta提供大量的FLOP(浮點運算),基于Volta的架構,人們就可以使用需要更多FLOP的深度學習模型。如今很多流行的模型都需要很大的計算資源,例如卷積學習神經網絡。

黃仁勛展示基于Volta架構的Tesla V100加速芯片
基于全新的Volta架構,英偉達推出Tesla V100加速器,它速度比其前身Tesla P100快2。4倍。
Tesla V100凝聚了英偉達內部數千名工程師數年的開發,研發投入相當于30億美金。黃仁勛在NVIDIA GTC 2017的主題演講中,展示了一塊Tesla V100,他笑稱全世界唯一一塊就在他手上,如果有人想買的線億美金。
而在Tesla V100加速器基礎上,英偉達推出了超級計算機DGX-1V和HGX。
DGX-1V內置了8塊Tesla V100,黃仁勛表示DGX-1V相當于400個服務器,過去Titan X(GTX TITAN X,泰坦顯卡)需要花費8天訓練的神經網絡,DGX-1V只需要8個小時,性能提升了24倍。
HGX是英偉達和微軟聯合開發的云圖形加速器,是英偉達人工智能戰略的硬件支撐。它同樣內置了8塊Tesla V100。目前微軟的Project Olympus計劃、Facebook的Big Basin系統都是使用的HGX作為數據中心設計方案的核心。
黃仁勛在臺北國際電腦展的主題演講中表示,GPU的運算能力提升非常快,能在未來取代CPU成為最主要的人工智能芯片。
但是英特爾并不這么認為。臺北國際電腦展期間,英特爾數據中心全球銷售部產品和技術總經理陳葆立在接受鳳凰科技采訪時提到, TPU和GPU只是加速芯片,目前是無法獨立工作的,沒有CPU它跑不起來。
不管是AMD或者是ARM出的CPU,都是不能直接連接到英偉達的GPU的,連接的標準是PCIE(這屬于英特爾),傳輸速度取決于PCIE的速度。但是目前我們自己的芯片組合可以跳過PCIE,所以能比CPU+GPU更快。他說。
在收購Nervana之后,英特爾擁有了將至強融核處理器和FPGA兩個不同的芯片整合成一個芯片的能力。在最新的Nervana系統中,就包含了FPGA加速芯片Arria 10和至強融核處理器的整合。

Arria 10就是一款主流的Altera FPGA產品
FPGA最初是從專用集成電路發展起來的半定制化的可編程電路,它可以作為一種用以實現特殊任務的可再編程芯片應用與機器學習中。
譬如百度的機器學習硬件系統就是用FPGA打造了AI專有芯片,制成FPGA版百度大腦。FPGA比相同性能水平的硬件系統消耗能率更低,在刀片式服務器上可以由主板上的PCI Express總線供電。使用FPGA可以將一個計算得到的結果直接反饋到下一個,不需要臨時保存在主存儲器,所以存儲帶寬要求也在相應降低。
英特爾的方案是將CPU與FPGA融合起來,組合芯片的運算更加靈活和高效,同時還能實現最低的功耗,獲得性能和功耗的平衡。
人工智能方興未艾,谷歌的TPU、英偉達的GPU和英特爾的CPU組合方案,在硬件層面上都還只是嘗試,這種嘗試能幫助實現早期的技術積累。在采訪的最后陳葆立提到,雖然是不同的硬件平臺,但是大家都在想辦法融合,這有利于幫助開發者,從而真正幫助人工智能向前發展。
-
鈔券雕刻師花瑞松講述雕刻背后的故事
人物名片 花瑞松 上海印鈔有限公司高級工藝美術師 鈔券雕刻師第四套人民幣一元券背面主景圖案雕刻者第五套人民幣壹佰元券背面主景圖案雕刻
2019-07-11 10:03
-
新版人民幣即將發行 怎樣收藏最好呢
中國人民銀行定于2019年8月30日起發行2019年版第五套人民幣50元、20元、10元、1元紙幣和1元、5角、1角硬幣。 新版人民幣發行的時期,往
2019-07-16 12:37
-
99版成龍頭品種 第六套人民幣將不再發行
前段時間,19版人民幣的發行公告在市場中吵得沸沸揚揚!突如其來的人民幣改版既在意料之中,又挺讓人意外。意料之中的是紙幣改版早有傳言,
2019-07-16 12:39
-
關于新版人民幣疑問解答在這里
前幾天,新版人民幣又雙叒叕上微博熱搜了!幸好,從8月30日起,萬眾期待的新版人民幣就要來了!新版人民幣包含50元、20元、10元、1元紙幣
2019-07-18 13:19














