百度表示,Deep Voice 2可以“學習數(shù)百種不同的語音,從每個說話者那里吸收的數(shù)據(jù)不到半個小時,但卻可以實現(xiàn)很高的音質(zhì)?!倍弦淮a(chǎn)品要達到類似的目的,每個聲音需要接受20小時的訓練。在短短幾個月的時間內(nèi),該系統(tǒng)便在效率上進一步超越谷歌WaveNet。
百度表示,與之前的TTS系統(tǒng)不同,Deep Voice 2可以完全憑借自己的能力找到進行訓練的語音之間的共同特點,不需要接受任何事先指導?!癉eep Voice可以學習并完美模仿數(shù)百種語音?!痹摴驹诓┛椭姓f。
百度還在一篇論文中總結道,該公司的神經(jīng)網(wǎng)絡只需要通過數(shù)百個不同的講話者吸收很小的聲音樣本便可創(chuàng)作很好的語音效果。由此看來,可能要不了多久就能聽到數(shù)字語音助手用更加自然的語音與我們交流。(書聿)
官方微博
官方微信公眾號
官方百家號