“80后”青年專家扎根重慶 解鎖智能汽車人機交互新模式
馬鴻鵬指導同事進行智能車載系統(tǒng)測試。(受訪者供圖)
前不久,長安汽車旗下的歐尚汽車智慧快樂座艙在渝發(fā)布,將人工智能技術(shù)與汽車使用場景深度融合,打造全球首發(fā)的車外語音交互系統(tǒng)。
這一交互系統(tǒng),來自科大訊飛智能汽車重慶分中心“80后”青年專家馬鴻鵬的團隊。
2018智博會上,科大訊飛董事長劉慶峰宣布將西南總部落地重慶,同時落地的還有科大訊飛智能汽車重慶分中心,由來自東北的馬鴻鵬擔任該中心總經(jīng)理。從此,馬鴻鵬的團隊開始與重慶結(jié)緣。
4年來,科大訊飛與長安汽車等重慶車企共建聯(lián)合實驗室,在汽車電子智能化的技術(shù)研發(fā)、產(chǎn)品設(shè)計以及整車應(yīng)用領(lǐng)域展開合作,取得了多項技術(shù)突破。
“我們在重慶的團隊平均年齡27歲左右,是一群有技術(shù)、有理想、有沖勁的科技青年,致力于通過‘AI+汽車’,解鎖智能汽車人機交互新模式,賦能重慶汽車產(chǎn)業(yè)開創(chuàng)新格局!5月4日是五四青年節(jié),馬鴻鵬在接受重慶日報記者采訪時如是說。
反復(fù)測試建立龐大的場景知識庫
讓車機系統(tǒng)精準理解說話人的前言后語
“小安你好,幫我查一下北京的天氣。”
“好的,北京天氣晴,白天氣溫20℃。”
“再幫我訂一張去那兒的機票!
……
這樣的對話,在人與人交流中再簡單平常不過。但是,對于人機互動而言,想要和機器持續(xù)對話,并讓機器理解“那兒”就是上文所指的北京,并非易事。
“人坐在車內(nèi),一次喚醒車機系統(tǒng)就實現(xiàn)多個指令,還要讓系統(tǒng)能前言后語結(jié)合理解,這種交互方式是之前沒有的!瘪R鴻鵬說道,要達到這樣的效果,機器需要記憶和理解當前說話人的意圖和場景,因此就需要覆蓋盡可能多的場景和可能的問法。這樣一來,算法復(fù)雜度會呈幾何級數(shù)增長,使軟件的開發(fā)和維護都有較大難度。
為了實現(xiàn)這一看似簡單的“高難度”操作,馬鴻鵬帶領(lǐng)著20多人組成的團隊入駐長安汽車,反復(fù)測試并建立了一個龐大的場景知識庫。
“通常車內(nèi)常用指令不超過2000種,但我們在車機上內(nèi)置了常用指令近6000條,以及不常用指令近2萬條,才實現(xiàn)了精準獲取用戶指令。”馬鴻鵬說。
如今,搭載了相關(guān)技術(shù)的飛魚OS已經(jīng)在長安CS95、CS75等車型上使用,助力重慶汽車在智能汽車賽道拔得頭籌。
訓練外語語音識別系統(tǒng)能理解會思考
助力“重慶造”汽車走向國際市場
隨著智能汽車產(chǎn)業(yè)發(fā)展,不少重慶汽車品牌也開始走向國際市場。智能汽車在海外使用,必須適用當?shù)氐恼Z種,而在過去,外語的車載語音識別及合成系統(tǒng)被國外企業(yè)掌握,國內(nèi)車企只能使用國外企業(yè)的語音技術(shù)。
“過去很長一段時間長安汽車在面向中東、南美等海外發(fā)行的車型中,語音識別系統(tǒng)一直是采用的國外技術(shù),安全問題是最大的考量。”馬鴻鵬坦言。
為了解決這一“卡脖子”問題,馬鴻鵬團隊聯(lián)合科大訊飛研究院展開了長安汽車車載外語語音識別及合成系統(tǒng)研發(fā)。
“做車載外語識別,不僅需要聽懂,還要理解其他國家的語言文化習慣,甚至同一語種不同地區(qū)的口音,這就需要有強大的識別模型和機器學習做支撐。”馬鴻鵬解釋說,車載語音的“識別”分為“語音識別”和“語義識別”兩個技術(shù)層次,“語音識別”相當于人的嘴巴和耳朵,負責表達和獲取;“語義識別”相當于人的大腦,負責思考和信息處理。為了實現(xiàn)外語的能聽會說、能理解會思考,團隊還找來“外援”,邀請一大批留學生和外語專家加入語音系統(tǒng)的訓練中,通過算法的積累和機器學習,讓車載外語語音系統(tǒng)更穩(wěn)定高效。
2021年,這套車載外語語音識別系統(tǒng)已成功實現(xiàn)國產(chǎn)化,長安汽車海外發(fā)行的車型均采用了這一國產(chǎn)系統(tǒng)。
獨創(chuàng)神經(jīng)網(wǎng)絡(luò)降噪算法和“冷啟動”系統(tǒng)
讓車主可以在車外喚醒車輛“開出來”
在歐尚汽車上打造全球首發(fā)的車外語音交互系統(tǒng),也是智能汽車領(lǐng)域的一大技術(shù)創(chuàng)新。
“以前汽車的語音交互都在車內(nèi),實際上車外智能交互也是用戶的需求!瘪R鴻鵬說,以往用戶在用車場景中,常會有開門難、挪車難等痛點,而這套車外語音交互系統(tǒng)可以讓車主在車外喚醒車輛,比如在擁擠的停車場,可以叫它“把車開出來”,車輛即可自動向前駛出。購物歸來雙手不方便開門,也可以說一聲“打開后備廂”,后備廂即可自動開啟。
車外語音交互較車內(nèi)語音交互來說,難點在于如何保障在有車外噪音等復(fù)雜環(huán)境下,機器能聽清楚并執(zhí)行指令。馬鴻鵬介紹,為了實現(xiàn)車外的人車交互,他和團隊獨創(chuàng)了神經(jīng)網(wǎng)絡(luò)降噪算法和“冷啟動”系統(tǒng)兩項技術(shù),讓車外語音交互系統(tǒng)做到360度語音降噪和無死角識別覆蓋,實現(xiàn)穩(wěn)定高效的車外語音交互。
“汽車革命的下半場是智能化、網(wǎng)聯(lián)化、共享化!彼硎,未來,他們還將繼續(xù)扎根重慶,進一步探索汽車多語種、多模態(tài)交互技術(shù),為重慶的車域生態(tài)伙伴提供更具有生命力和創(chuàng)新力的智能化場景服務(wù),助力重慶汽車智能制造再上臺階。(記者 張亦筑 實習生 冉羅楠)
分享讓更多人看到
本網(wǎng)專稿
- 有“顏”有“能” 長江消落帶上的“衛(wèi)士”
- 萬州區(qū)大周鎮(zhèn)長江消落帶上的中山杉。人民網(wǎng) 劉政寧攝 時下,地處長江北岸的重慶市萬州區(qū)大周鎮(zhèn),碧波蕩漾、春色撩人,數(shù)百畝中山杉已褪去冬季的“紅黃彩衣”,換身新綠,茁壯成長,蔚然成林!