思必馳CMO龍夢竹:AI浪潮下,萬物皆可echo金融
整個對話技術會給行業帶來什么?帶來更多的行業融合,包括現在的傳統的智能處理,跟醫療結合,做成智能診療的助手,包括帶來很多新的大數據,新的用戶維度劃分,對廣告行業用戶數據跟蹤帶來影響…
10月25日-26日,由清科集團、投資界、新芽NEWSEED舉辦的“2017V武林大會”在北京召開。 從“少有人做的事”,到“全民創業”,V50陪伴創業者們跋涉了十二年。2017 V計劃,匯聚最具代表性的創客及投資大佬,解讀最尖端的技術、分享最前瞻商業模式、展示最摩登的產品,最具投資價值企業巔峰對決,探討浪潮之中與浪潮之外的創業、投資機會。
會上,思必馳CMO龍夢竹女士發表了《AI浪潮下 萬物皆可echo》主題演講。
以下為演講實錄,經新芽NewSeed(www.NewSeed.cn)編輯整理:
大家好!標題很有意思“AI浪潮下 萬物皆可echo”,echo是這兩年智能硬件物聯網行業非常出眾的爆款,對全世界來說都是。
echo是亞馬遜2014年推的一個智能音箱,除了echo之外,在物聯網方向下的智能家居設備,其他互聯網巨頭比如微軟、谷歌、蘋果都有產出類似的智能硬件,比如2014年亞馬遜echo,微軟的Button,谷歌的Home,蘋果的Hmoe Pod,看上去是智能音箱,像echo這樣的爆款產品,國內國外到底有多少可能?
我們把時間線和目光放長遠,不看現在,看以后,與其說是智能音箱,不如說是智能處理的終端設備,只是恰好偶然以智能音箱的外形呈現,如果做成中空的,能夠插上一只花,就是帶echo功能的智能花瓶,如果做成路由器,就是帶echo功能的智能路由。
大家耳熟能詳的科大訊飛的叮咚音箱,阿里的天貓精靈,小米AI音箱小愛同學,包括藍天科技都在做智能音箱。現在在音箱里面品牌覆蓋是第一的。
至于今年下半年和明年,我們還會力推智能家居物聯網以音箱和電視為代表的諸多產品類目合作。所有產品合作里面,在語音技術來看,反映的是一個需求。認知型的自然口語對話,不再是簡單的語音識別,不再是簡單的語義理解。整個語音交互是非常長的鏈條,合成到理解、內容服務,echo帶火這一些智能處理設備終端來看,反映自然口語對話的趨勢。
什么叫做對話?大家第一印象會覺得對話就是語音,思必馳就是一個做語音的公司,從技術剖析來看,所謂語音交互第一撥鏈條,語音綜合信號進行采集、處理,轉化成其他信息,比如文字或者其他格式,用計算機語言進行編譯和理解,對話不僅包括語義,包括文本、圖像信息,打開手機微信,任何一個朋友的整個溝通的記錄,稱之為完整的對話,發送歌曲、地圖位置、某個小程序,這些都是在對話的范疇里。
對話的類型根據次數、結構層次,大概分成四大類:最簡單的是命令式對話,開燈、關燈,空調調到26度,我要去中山公園,只有一句話,單輪的,并且語義結構相對簡單。這兩年跟語音、語義相關的創業公司,超過一百家。絕大部分都在做跟語義相關的,而其中以閑聊式對話的創業公司最多,閑聊式對話跟問答式對話剛好有比較明顯的區別,問答式對話比較多地介于專業的相關技術競賽里面、比賽上面,在某個特定的領域下,對信息搜索、識別、挖掘、回答進行一個判定。
在問答式對話里,有非常明確的主題,用戶想說什么,想知道什么非常明確,有正確、錯誤的區別,而閑聊式對話,在整個交互過程里,用戶可能不知道自己想問什么,也可能不知道自己想要什么答案,純粹的設置希望通過多輪交互,獲得一種聊天樂趣。這種閑聊式的對話交互,這兩年的機器人里面比較常見。
最近同學給我講一個小花絮,帶著我們的合作產品小樂出去做參展的時候,常常遇到消費者跟小樂互動,我們小樂有喚醒詞“你好小樂”。用戶會問:“你好小樂,你叫什么名字?”這種交互不在乎獲得什么答案,在乎作為機器人跟我聊天的時候,是否給我一個好玩的結果。真正的人機對話交互里,能夠真正去幫助用戶解決一些問題,去處理一些任務的這種對話,其實是最上面的任務型對話,通過多輪的一種交互方式,通過后端的內容服務和語音信號處理和對話內容的一個解析,幫助用戶最終完成某一項工作。
我們現在最好的類似人與人之間的任務式交互,中間站的位置比較寬的對話框,比如附近有人均一百元的川菜館嗎?這句話正常的解析和語音識別里,這句話的識別率一般都能夠達到99%或者100%的正確。當你再把這句話解析出來以后,需要對用戶說話的意圖和需求的內容服務進行進一步理解,以及采取什么樣的一個反饋,是跟他說,我找到了川菜館,有這么多,還是直接給他一個選擇的導航界面,讓用戶快速選擇。這種對話是現在在實際的應用落地場景里面會做得比較多的一種復雜的多層次的一個任務型對話。
思必馳的特點就是我們其實成立了有十年,在2007年的時候,我們的中文名字源于音譯AISPEBCH,云技術體系專注對話交互方向,我們的對話特點專注任務型對話,同時保證有效的人機交互,也會做協調和問答,保證整個人機交互的體驗有序性和整個體驗的更好。
整個echo是只能助理設備終端,只是偶然以音箱的外形呈現,真正讓大家覺得好用,背后是Alexa平臺,可能做出不同款的echo,聯想智能音箱國外的海外版用的Alexa技術,整個體驗跟echo保持一致。完全做智能音箱,不如想產品用戶需要什么,有什么外形的智能處理設備終端什么更符合產品設備需要。
不同的場景下,所謂個人助理設備終端,就是能夠解決這個環境下用戶的所有核心剛需,比如我們的客戶車蘿卜HUD,可以稱為車里的echo,聯想的音箱可以稱為帶屏幕的echo,能夠聯動所有的聯動設備,做個人日程的設定。比如機器人,陪護版的機器人,可以叫做兒童版的echo,解決兒童那個年齡段所需要的內容服務。包括很多投資人也在看,未來得一個趨勢,我們在猜除了echo智能音箱以外,下一個火的類目是什么,智能藍牙耳機是新方向,因為輕巧、輕便,我們可以叫做輕量版的個人隨身echo,只要產品切合場景,跟用戶需求達成一個一致都OK。
Alexa平臺是國外的,是亞馬遜的,要出海的用Alexa很合適,國內將近50來家以對話平臺、語音平臺為teamwork的公司,我們對50家公司進行分類,基本上從它是否有前端的感知能力,就是識別跟合成,包括背后的語義理解NOP能力,背后是否有內容服務,真正擁有全套能力平臺不算特別多。
思必馳今年9月推出了DUI全鏈路的對話定制平臺,我們擁有所有底層技術包括識別、合成、理解各種技術能力。思必馳在《機智過人》中有兩節目的參與,一個是我們的聲文識別,一個是語音歌曲合成技術?!稒C智過人》還是比較有趣的,大家可以看一下。
我們推的DUI平臺,除了把單純的語音識別技術出來以后,還對整個工程化項目的支持做了深度定制和服務,我們以前專注在物聯網,現在DUI平臺,泛物聯網化合作。以前的合作方案里,比如新上的一部電影《三生三世十里桃花》,把這個電影解析出來以后,定位到合適的內容,可能根據客戶的需求,需要升級提供方案的版本。
現在客戶可以在后臺自己快速去定制本地的固定詞,命中率會更高,能夠用秒級直接傳到客戶端,用戶直接體驗,整個人機對話由客戶定制。
我們現在所有平臺公司考察三個能力,第一,核心的底層的技術實力,就是所有語音技術對話解析能力是否可以?第二,工程化落地的能力,包括大數據運維團隊,一些線上的跟蹤功能等等。第三,接地氣的服務能力。
整個DUI平臺,9月份剛剛推出,思必馳最大的特點是做賦能公司,我們不會做任何C端硬件產品,而是希望把我們的最好的技術公平、公開提供給所有的合作客戶,包括我們現在已經跟行業內,包括海知、三角獸、盛世科技達成全面戰略合作,希望把最好的技術做成集成,讓客戶做更多的可流通的對話智能,不是采用以前的打包式的封閉方案。
以前方案推出去以后,十個產品有九個產品企業是一樣的,現在希望把更多的定制功能,做更多的智能處理設備終端,把這樣的技術實力提供給客戶。
整個對話技術會給行業帶來什么?帶來更多的行業融合,包括現在的傳統的智能處理,跟醫療結合,做成智能診療的助手,包括帶來很多新的大數據,新的用戶維度劃分,對廣告行業對用戶數據跟蹤帶來影響,帶來很多行業的重構,比如二次元的社交,比如新型行業,都基于語音交互、人工智能的發展而起來的。
今天分享到這里。謝謝!
來源:新芽NewSeed
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。