近日,國家知識產權局網站上公開了百度一系列針對移動設備和服務的安全專利,專利內容顯示,百度正試圖使用語音技術讓移動用戶體驗更加安全便利。
根據公開資料中的描述,該系列專利可“基于特定人的聲音特征提取相應的特征碼,從而實現(xiàn)對用戶移動設備、支付及其他互聯(lián)服務的無文本密碼登錄操作”。根據這幾份專利而形成的百度聲紋安全專利方案,很好地平衡了使用方便和保證安全兩個方面的需求,據百度語音研發(fā)團隊透漏,該方案已初步應用于手機百度,未來還將在貼吧、百度Hi等賬號登錄應用及百度錢包等移動支付系統(tǒng)上使用。
新專利完美平衡便利性和安全性
隨著語音技術的成熟和發(fā)展,聲紋識別已經成為繼指紋識別之后又一基于生物特征的識別和鑒權技術。目前的聲紋認證技術主要分為文本無關和文本相關兩種。文本無關的聲紋認證技術對用戶說的內容不加區(qū)分,而文本相關的聲紋認證技術需要用戶說的內容與注冊時必須一致,這兩種技術各有優(yōu)缺點。而百度的聲紋識別專利則結合了兩者的優(yōu)點,采用了基于限定文本的聲紋驗證,用戶在注冊階段說幾個固定的短文本,在認證階段說有限個短文本的組合,從而實現(xiàn)具有一定文本自由度的聲紋認證。
通過對多項專利技術的組合,百度提出了基于隨機數(shù)字串文本的聲紋驗證模式,用戶設定聲紋特征時錄入10個數(shù)字的組合,并將其作為用戶個人的特征碼,當用戶需要使用聲紋登錄或者支付時,將會被要求讀出此前錄入的10個數(shù)字中的6個數(shù)字組合,系統(tǒng)將提取用戶讀出的6個數(shù)字組合的聲紋特征,并與此前錄入的特征進行比對,如吻合則認證成功。
此外,為了進一步提高安全系數(shù),用戶還可以設定用特殊字符替代解鎖時顯示的某些數(shù)字,相當于給聲紋解鎖再加上了一道密碼鎖。
實際應用過程優(yōu)于現(xiàn)有技術方案
相比需要增加相應硬件的指紋識別技術,聲紋識別技術的優(yōu)勢在于幾乎所有設備都可以在無需增加識別設備硬件的前提下實現(xiàn)這一功能。依靠深度學習技術、大數(shù)據引擎和百度大腦的支撐,百度聲紋識別技術會記錄用戶每一次登錄的使用,并對特定用戶的聲音進行建模和學習,登錄次數(shù)越多,用戶的聲音模型越完整,對聲音識別的采集精確度越高,越不容易被盜用,進一步提高了聲紋識別的整體安全性。
目前,BAT三家公司都已經在自己的移動服務上應用了聲紋識別技術。例如微信新版升級之后就可以通過朗讀8個數(shù)字進行聲紋特征匹配,之后就可以用這幾個數(shù)字進行登錄。不過,騰訊采用的是固定數(shù)字,相比百度的隨機數(shù)字組合,固定數(shù)字很容易被錄音模仿和偽造。而如果要求用戶對每個數(shù)字進行單獨錄音,則無法記錄特定用戶在朗讀連續(xù)數(shù)字時出現(xiàn)的連讀變調特征,導致實際使用中的特征比對失敗。另外,微信的登錄文本只要讀對一部分即可登錄,而百度聲紋識別需要有100%的準確率才能打開相應的應用,更加安全便利。
此外,支付寶此前也在客戶端推出了聲波支付,在支付時手機發(fā)出固定的聲波頻率,由對方設備獲取后上傳服務器進行比對,比對成功則可以完成支付。不過和百度聲紋技術鎖定的是用戶個人不一樣的是,支付寶的聲音特征是與手機進行綁定的,如果用戶手機不在身邊,則無法完成付款,而百度聲紋技術則只要用戶本人在場,使用任何客戶端或移動服務都可以完成支付,為用戶提供更便利的服務。
百度的這一系列聲紋識別專利,不僅是對已有技術研發(fā)成果的積極保護,更重要的是將搶占語音技術戰(zhàn)略、語音產品戰(zhàn)略的制高點,為百度引領行業(yè)技術與產品戰(zhàn)略走向奠定基礎。同時,對“聲音”這一重要生物識別介質的充分利用,將令百度系列產品的移動體驗更加便利安全,讓百度“技術改變O2O”的未來愿景,更引人遐想。