探秘小米聲學實驗室DanielPovey為何選擇小米?
2022-09-04 07:04:26 來源:
探秘小米聲學實驗室 Daniel Povey為何選擇小米?
在小米科技園舉辦針對人工智能的媒體開放日,網易科技也第一次近距離地接觸了小米“神秘”的人工智能實驗室。小米集團副總裁、集團技術委員會主席崔寶秋博士、人工智能部總經理葉航軍博士、AI實驗室主任王斌博士,介紹了小米在AI領域的自主研發技術成果、技術人才引進情況。
![]()
葉航軍、崔寶秋、王斌(從左至右)
探秘小米聲學實驗室
首先我們來到小米聲學語音實驗室,可以看到,各種以小米智能硬件生態鏈核心產品小愛音箱為中樞,四周布滿了供聲學語音測試使用的硬件設備,據介紹,小米的智能硬件產品中,所有具備麥克風、揚聲器的語音交互設備,都要經過這個實驗室測試后上線。目前,小愛音箱語音算法已經做到由小米全部自主研發,在這個實驗室中,以小愛音箱為代表的小米全系智能語音設備,均會進行遠場、近場、靈敏度等一系列詳細測試并進行調試,其中近場測試,主要針對手機進行。
![]()
圖:小米聲學語音實驗室
據現場工程師介紹,實驗室中的人工模型及揚聲器等設備,均會高度會模擬日常的人聲及環境音、噪聲干擾等,其中人聲的測試,機器可以分別模擬不同性別、不同年齡的聲音并反復進行機器還原測試,而無需人工測試,既節省了人力成本,又可以保證精準的測試效果。在這個實驗室中,工程師會在測試過程中發現算法中可提升的部分,并反饋給小米研發團隊進行優化和算法調試。
![]()
圖:小米聲學語音實驗室
不同于前者,進入與硬件強相關的聲學實驗室后,馬上會感覺有些安靜的不適應,房間四周布滿了錐形吸引墻,房間整體重量約70噸,用料極其奢侈。據工程師介紹,該實驗室內部各個角落,都不會產生聲音的回波,所有聲音都會被錐形墻體吸收,因此理論上講,房間內,只存在源頭聲音一個干擾源。實驗室包括三層墻體,均為實心磚墻,主要作用為在絕對安靜的環境條件下,對設備進行高靈敏度的測試,以便準確找到硬件設備各類極值。
![]()
圖:小米聲學語音實驗室
據介紹,語音識別的頂層為云識別算法,但是在硬件設備底層,要極大保證設備的靈敏度,如麥克風對于聲音的采集,只有這樣,才可以在云端更好地進行算法識別,小米不惜成本地打造聲學語音實驗室,原因也在于此。
![]()
圖:小米智能廚衛
接下來,在體驗了包括智能客廳、智能臥室、智能書房、智能廚衛等以小愛同學為智能家庭中樞的小米全系智能家居場景后,可以很直觀地感受到,小米AIoT,已經把之前描繪的未來智能生活場景完全變為了現實。
![]()
圖:小米智能客廳
Daniel Povey選擇小米的三個理由
Daniel Povey是全球公認的國際語音識別和AI領域知名教授、語音識別開源工具Kaldi之父。他于1993年到2003在劍橋大學度過了自己的高等教育經歷,獲得語音識別的博士學位。2003年至2008年,他在IBM研究院負責計算機語音識別的工作,并且獲得了Research Staff Member的角色;隨后在2008年到2012年,Daniel Povey在微軟研究院參與計算機語音識別方面的工作。2012年,Daniel Povey加入約翰霍普金斯大學,擔任語言和語音處理中心的副教授。
![]()
圖:崔寶秋與Daniel Povey
2019年,Daniel Povey在長達兩周的中國之旅中,分別走訪了包括清華、北大等頂級學府,以及多個中國的頭部科技互聯網公司,但其最終選擇了加盟小米,崔寶秋認為,第一是因為Daniel Povey已經了解小米“手機+AIoT”雙引擎戰略生態的強大,同時他十分清楚語音識別在“手機+AIoT”雙引擎戰略中所扮演的重要角色;第二,Daniel Povey在參觀了小米公司總部后,了解到小米對于人才和技術的重視,以及具備大批優秀的工程師,以及這也是吸引Daniel Povey加盟的重要原因;第三,小米從云計算、大數據到今天的AI,對于開源的擁抱,也是吸引Daniel Povey的關鍵點。
崔寶秋透露,在與Daniel Povey談offer的過程中,Daniel Povey對于其他入職大部分細節基本不關心,他最關心的是保證Kaldi100%的開源,而崔寶秋給出的回答是:對于小米來說,這根本不是問題。Daniel Povey入職當天,崔寶秋表示,無論對于Daniel Povey本人、對于小米、對于中國的語音識別屆,今天都是很重要的一天。
人工智能技術已實現廣泛產品落地
目前,小米人工智能技術實現了廣泛的產品落地,比如AI相機、小米電視、AI音箱、MIUI、搜索推薦、IoT設備等,涵蓋聲學、語音、深度學習、視覺等各個領域,一句話概括,AI在小米已經無處不在。此外,據了解,小米還承建了智能家居國家新一代人工智能開放創新平臺。
說到小愛同學,其語音識別技術包括聲學和語音,嚴格來說,這是兩個不同的技術領域,小米人工智能的聲學技術包括:回聲消除,去混響,聲源定位,多通道降噪以及多種麥克風陣列解決方案;而語音技術則包括:喚醒,識別,聲紋以及語音合成。目前,小米小愛音箱語音算法已經實現全部自主研發。
在參觀后的采訪中,葉航軍介紹,在小米“手機+AIoT”的雙引擎戰略里,AI扮演了非常重要的角色。在手機上,對于用戶經常使用的拍照功能,葉航軍認為“目前在整個行業,手機相機研發有一個明顯的趨勢,就是人工智能的深度整合,具體來講有兩個方面,一個就是手機相機的軟件化和算法化,之前很多手機相機的體驗是靠硬件去做,但是最近這兩年,一些領先的體驗是通過軟件算法實現。 第二個趨勢就是算法AI化,越來越多的相機算法從傳統圖像處理算法轉變成AI算法。”
王斌博士則分享了小米AI自主研發技術成果,目前小米已經在聲學、語音、視覺,NLP、知識圖譜、機器學習6大方向取得一系列成果。此外,王斌還介紹了小米在視覺、NLP、知識圖譜、機器學習等技術上的進展。視覺方面,自研的人臉識別、美顏、魔法換天、場景識別在多款手機上落地應用。小米已經打造了自己的NLP平臺和知識圖譜,全面支撐公司的多項內容業務。小米面向移動端的深度學習開源計算平臺MACE(Mobile AI Compute Engine)一推出便受到業界的廣泛關注,目前廣泛用于公司的各項產品中。
公開數據顯示,2016年—2018年間,小米在AI領域申請專利684項,列居世界第11位。在宣布“手機+AIoT”雙引擎戰略為未來5年內小米的核心戰略同時,雷軍表示,未來5年小米將在AIoT領域持續投入超過100億元,綜合人才、技術積累以及資金投入等因素,不難推測,相對于競品,小愛音箱的線下場景優勢依然具備提升空間。(張楠)
-
字節跳動入股倉儲物流機器人關聯公司
天眼查App顯示,近日,倉儲物流自動化解決方案服務商「Syrius炬星」關聯公司大揚智能科技(北京)有限公司發生多項工商變更,注冊資本增至
2022-09-04 04:42
-
熱點解析!神舟十四號乘組空間站建造階段首次出艙有哪些不同?
點擊查看視頻 9月2日0點33分,經過約6小時的出艙活動,神舟十四號航天員陳冬、劉洋、蔡旭哲完成全部既定任務,出艙活動圓滿成功。神舟
2022-09-03 13:20
-
“神十四”乘組新成績!問天“新居”首次出艙盤點來了
2022年9月2日 神舟十四號航天員乘組圓滿完成 約6小時出艙活動的全部既定任務 一起來盤點空間站建造階段 首次出艙活動的關
2022-09-03 11:34
-
防窺膜傷眼睛嗎防窺膜會影響視力嗎防窺膜原理
想必很多朋友們不是很了解防窺膜傷眼睛這條熱搜是怎么回事那么接下來就帶給各位朋友們防窺膜對眼睛有傷害嗎的相關介紹,不要錯過,一起
2022-09-02 18:22
-
oppowatch3pro怎么開通esim在哪設置esim卡連接
oppowatch3pro有著很多功能,為用戶提供了獨立通訊,獨立上網能力,但是很多用戶并不清楚在哪開通esim,為了大家更好的使用,小編帶來了op
2022-09-02 12:33














