近日,百度大腦發(fā)布《2017年語音交互體驗藍皮書》,為手機端語音交互產品的開封梳理行業(yè)規(guī)范。隨著語音識別準確率的提升,語音交互成為許多產品的必備能力。其中手機上的語音交互作為人機交互的一個細分領域,已應用于輸入法、搜索、地圖、購物、智能助手等APP。而如何完成語音指令、用戶體驗是否優(yōu)質,則成為從業(yè)者在進行語音交互設計時的挑戰(zhàn)。
百度大腦《2017年語音交互體驗藍皮書》(下簡稱藍皮書)一經推出,便覆蓋了各行各業(yè),受到了眾多人群關注,僅微信平臺就引發(fā)了大量獲取需求,成為手機端語音交互體驗探索的重要參考,也是該領域首個規(guī)范報告之一。
揚長避短 打造零障礙語音交互閉環(huán)
作為全球第一個結合用研、數據做分析,并從交互、功能設計上梳理的語音交互規(guī)范,藍皮書除了專業(yè)洞察外,不僅為開發(fā)者提供常規(guī)解決方案,還提供了案例參考,并對案例相關產品目前的用戶體驗做了調研。調研顯示,語音識別的痛點是識別錯誤及其后的修改。由于語音識別和打字輸入天然的差異,像糾錯功能、學習反饋機制這些打字能夠輕松做到而語音還沒有做到的,就是解決問題的關鍵所在。
這些技術層面的理論其實與各行各業(yè)息息相關。藍皮書中舉了語音識別輸入法與地圖語音助手兩個實戰(zhàn)案例,案例中存在可能提高用戶體驗的功能設計亮點,如讓你拋棄鍵盤,體驗飛一般輸入速度的語音輸入;能夠快速將用戶習慣使用的日??谡Z或網絡用語識別為正確結果的特殊學習、反饋機制等等。那么針對這些亮點,藍皮書在功能設計方面從指令糾錯功能與執(zhí)行體驗、特殊機制的設計等角度提出了建議。
不難設想,隨著手機語音交互功能體驗發(fā)展成熟,不僅將可以實現(xiàn)多種方言、多語種的即時交流,還將對傳統(tǒng)行業(yè)、輕工業(yè)、娛樂產業(yè)等帶來積極影響。
傳承人工智能技術基因 引領“可對話”的語音交互時代
手機語音交互體驗需要從交互、技術性能、功能以及特殊機制,多角度全方位立體設計。而手機語音交互體驗的優(yōu)化水平一定程度上決定了語音交互時代到來的速度?;凇胺现庇X、快速及有趣”的IFF核心原則,百度大腦從多個角度去反思手機語音交互體驗,探索得出這套行業(yè)方案。
百度的語音交互能力是基于人工智能的技術基因,目前百度語音技術已集成語音識別、語義理解、深度問答、多輪對話、情感分析、語音合成等能力,語音交互能力在搜索、地圖等產品中均有體現(xiàn),并通過DuerOS賦能合作伙伴,開放能力,共同推進產業(yè)發(fā)展。此次藍皮書的開放獲取,為更多從業(yè)者提供“規(guī)范捷徑”,為用戶帶來更好的語音交互體驗,也將整體提高行業(yè)水平。
在未來,智能設備、車載、聊天機器人等領域關于遠場、喚醒、對話的語音交互研究也會越來越重要,這也將成為百度大腦下一步研究的計劃。
官方微博
官方微信公眾號
官方百家號