2018年10月18日,備受矚目的世界智能網(wǎng)聯(lián)汽車大會如期在北京國家會議中心拉開帷幕,這場為期4天的大會由北京人民政府、工業(yè)和信息化部主辦,云集了徐留平、馬化騰、李彥宏、李書福等眾多知名企業(yè)大佬及政府領(lǐng)導(dǎo),19日,驀然認(rèn)知CEO戴帥湘也出席了本次大會并發(fā)表演講。
2017年,三部委聯(lián)合發(fā)布的《汽車產(chǎn)業(yè)中長期發(fā)展規(guī)劃》中,提出將智能網(wǎng)聯(lián)汽車作為我國汽車產(chǎn)業(yè)轉(zhuǎn)型升級的重要突破口;在2018年1月發(fā)改委《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》意見稿中,明確指出:“2020年中國智能新車比例達(dá)到50%,2025年新車基本實現(xiàn)智能化。” 足見,未來車聯(lián)網(wǎng)發(fā)展?jié)摿薮?,機(jī)會眾多。
作為一家以認(rèn)知計算、自然語言理解技術(shù)為核心的人工智能公司,驀然認(rèn)知一早就看到了這樣的趨勢,并在成立之初便在車聯(lián)網(wǎng)方面進(jìn)行技術(shù)深耕,不僅是行業(yè)內(nèi)最短時間切入汽車前裝的AI公司,也是最短的時間內(nèi)為汽車前裝提供軟硬一體的AI解決方案的公司。截至目前,驀然認(rèn)知已經(jīng)與眾多國際及本土主機(jī)廠及車機(jī)Tier 1 建立了長期合作伙伴關(guān)系。
隨著電動化、智能化、網(wǎng)聯(lián)化、共享化等的快速融合發(fā)展,全球汽車產(chǎn)業(yè)正在迎接一場前所未有的變革浪潮,在這樣的時代背景下,驀然認(rèn)知能夠帶給汽車行業(yè)什么樣的變革?驀然認(rèn)知CEO戴帥湘的演講或許能告訴我們答案。
接下來,針對戴帥湘先生的演講,筆者做了如下整理及歸納:
演講中,戴帥湘提到驀然認(rèn)知想要打造的是智能語音交互中的iOS,他表示:“我們要做的是用對話機(jī)器人來分發(fā)服務(wù),協(xié)同設(shè)備工作,構(gòu)建真正意義上的智能車聯(lián)網(wǎng)?!睘榇耍嚾徽J(rèn)知在原先語義理解、對話系統(tǒng)、學(xué)習(xí)系統(tǒng)、自動服務(wù)對接及語言生成等”核心技術(shù)的基礎(chǔ)上,又自主研發(fā)了特別針對車載場景的“語音識別、遠(yuǎn)場降噪、喚醒+離線命令詞、聲紋識別、語音合成”等技術(shù),形成了一整套完整的技術(shù)閉環(huán)。當(dāng)然,驀然認(rèn)知所做的,遠(yuǎn)不止這些……
打破APP之間的壁壘 一語喚醒即用即停
自2007年蘋果第一代iphone上市以來,智能手機(jī)和移動互聯(lián)網(wǎng)早已徹底顛覆了人們的生活場景和鏈接方式,然而十多年過去,曾經(jīng)為我們帶來眾多便利的APP正在充斥著手機(jī),不僅占據(jù)了大量的空間,信息的泛濫、賬號密碼的繁多也讓人們困擾不已,APP背后隱藏問題和弊端已經(jīng)開始出現(xiàn)……在這樣的情況下,很多所謂的智能車聯(lián)網(wǎng),卻依舊照搬手機(jī)的老路子,僅僅是把APP移植到了車機(jī)上而已,這顯然是行不通的。
我們可以試想一下,當(dāng)用戶想要去外地自駕游玩兒,為此他可能需要下載美食點評、酒店預(yù)訂、機(jī)票、導(dǎo)航等繁多的應(yīng)用,原本一個簡單的需求實現(xiàn)起來卻大費(fèi)周章,著實不美。況且,與其在車機(jī)屏上操作,何不用手機(jī)來的更加方便?
熟悉驀然認(rèn)知的朋友們想必對”對話即應(yīng)用“都不會陌生,早在成立之初,戴帥湘就提出了這一概念,即通過語音對話的方式來獲取和分發(fā)服務(wù)。
我們再來試想另一種場景,用戶在開車途中突然想到去某地旅游,他可以直接對著車機(jī)說:“小驀,幫我訂一張明天去上海的機(jī)票,要東方航空的?!贝藭r,小驀會自動推薦適合的機(jī)票,并指導(dǎo)用戶直接通過語音操作完成訂票等一系列流程。接著,小驀會主動詢問是否要定當(dāng)天的酒店并推薦相關(guān)的景點,用戶只需要詢問或者回答即可,這樣一來,不僅車主的行車安全得到了保障,同時也省卻了繁雜的流程和步驟,快速高效。同時,在語音交互過程中,只需一次喚醒便可持續(xù)多輪對話,無需多次喚醒,并且可以隨時喚起隨時停止,方便快捷。
打通吃穿住行娛樂多生態(tài) 構(gòu)建連貫場景的智慧車聯(lián)網(wǎng)服務(wù)生態(tài)
據(jù)悉,目前驀然認(rèn)知已經(jīng)接入的服務(wù)包括O2O類的有外賣、咖啡、生活用品……出行類的有酒店、機(jī)票、火車票、景點門票……娛樂類的有電影票、有聲節(jié)目、音/視頻資源……當(dāng)然,也包括了圍繞汽車場景的停車、加油、路況、限行、保險等等。從最簡單的查天氣、查新聞、問股價到吃飯、穿衣、娛樂休閑,都可以直接通過語音來完成。
當(dāng)然,驀然認(rèn)知要做的,并非是將這些功能服務(wù)進(jìn)行簡單的累加堆砌,而是將人們吃穿住行娛樂整個生態(tài)服務(wù)打通的連貫場景服務(wù),真正為用戶提供全語音對話的全方位智慧車聯(lián)網(wǎng)服務(wù)。
舉例來講,在家時,當(dāng)你想看近期的電影《江湖兒女》,可以直接對小驀說:“幫我訂一張附近的今天晚上7點左右的《江湖兒女》的電影票”,此時小驀便會為您推薦適合的場次供選擇,語音選座之后,直接掃碼付款即可;上車后,電影院的地址便直接在車機(jī)屏幕上顯示出來,并主動詢問是否要導(dǎo)航去此地。而在導(dǎo)航去電影院的途中,小驀除了會提供跟電影相關(guān)的音樂及信息服務(wù)之外,還會主動提供所到目的地周圍的餐飲及娛樂服務(wù),甚至為你提前排號或者預(yù)定餐館。到達(dá)目的地后,驀然認(rèn)知接入的ETCP等服務(wù)也讓用戶的停車更加方便快捷。
車載語音全棧技術(shù)領(lǐng)航者
針對智能車載場景,驀然認(rèn)知擁有一整套全自主研發(fā)的車載語音處理技術(shù):包括語義理解、對話系統(tǒng)、學(xué)習(xí)系統(tǒng)、自動服務(wù)對接、語音識別、語音合成、聲紋識別、喚醒+離線命令詞、遠(yuǎn)場降噪、語言生成等全棧技術(shù)。為了將車聯(lián)網(wǎng)服務(wù)做到極致,驀然認(rèn)知針對車載環(huán)境,對語音處理技術(shù)進(jìn)行了優(yōu)化,使其深度適配車載環(huán)境。驀然的車載專屬信號處理技術(shù),可以做到去除空調(diào)、胎噪等平穩(wěn)噪聲,語音、喇叭等非平穩(wěn)噪聲及去除車內(nèi)混響。
語音喚醒方面,可以自定義多個喚醒詞,擁有多達(dá)200個離線命令詞,并支持一語即達(dá)、喚醒打斷等;喚醒率大于96%,誤喚醒率小于0.03次每小時。
語音識別方面,驀然認(rèn)知擁有車載環(huán)境專屬的聲學(xué)模型,深度適配不同車載使用場景、車載噪聲環(huán)境及麥克風(fēng)陣列及降噪算法;識別率大于93%,場景覆蓋導(dǎo)航、音樂、POI查詢、車輛控制等方面。
聲紋識別方面,準(zhǔn)確率高達(dá)97%,支持文本無關(guān)的注冊和驗證方式,支持快速的聲紋提取與驗證,應(yīng)用場景更加靈活。
語音合成方面,驀然認(rèn)知基于深度學(xué)習(xí)的高質(zhì)量語音合成技術(shù),可以生成流暢自然的語音輸出。
除了以上這些技術(shù)方面的深度定制之外,最重要的一點其實是:驀然認(rèn)知的車載語音交互更加類人,在與機(jī)器的交互過程中,車主可以完全按照自己平時說話的方式來,而不需要遵循特定的詞語或模式,驀然認(rèn)知的對輪對話也讓整個交互過程更加的方便舒適,這些都得益于驀然認(rèn)知在語音方面深厚的技術(shù)積累及創(chuàng)新。
在之后的采訪中,有問到:“對比目前熱門的斑馬,驀然認(rèn)知有什么不同?”戴帥湘回答到:“與斑馬的技術(shù)集成商身份不同,驀然認(rèn)知的全棧核心技術(shù)都掌握在自己手中,這就使得驀然的成本、過程、效果都更加可控;整個語音通路是非常復(fù)雜的東西,只有像驀然認(rèn)知這樣的擁有全棧核心技術(shù)的公司才能達(dá)到最大的協(xié)同效益?!?/p>
隨著智能網(wǎng)聯(lián)發(fā)展的越來越快,眾多公司涌入,一時間行業(yè)魚龍混雜,很多公司將精力花費(fèi)在那一塊兒液晶屏之上,卻忽略了用戶們最基本的需求——信息的傳遞和優(yōu)質(zhì)的服務(wù),而驀然認(rèn)知卻從一開始便立足于用戶需求,將信息的傳遞和服務(wù)做到極致,做語音交互時代應(yīng)用生態(tài)的締造者。