3月30日,百度發(fā)布了DuerOS智慧芯片,百度官方稱,這將“完善智能物聯(lián)網(wǎng)生態(tài),開(kāi)啟‘可對(duì)話’智慧設(shè)備時(shí)代”。
發(fā)布會(huì)上,百度宣布與紫光展銳、ARM、上海漢楓達(dá)成戰(zhàn)略合作。具體講:百度的DuerOS智慧芯片與紫光展銳RDA5981集成,“低功耗、低成本”,提供豐富的IO接口,支持Wi-Fi/藍(lán)牙多種連接模式;同時(shí),采用ARM公司mbed OS內(nèi)核及其安全網(wǎng)絡(luò)協(xié)議棧,實(shí)現(xiàn)云端連接,“降低了設(shè)備開(kāi)放商應(yīng)用門(mén)檻”;在此基礎(chǔ)上,作為物聯(lián)網(wǎng)方案服務(wù)商的漢楓科技,則基于該芯片推出WiFi模組HF-LPB200U,集成了DuerOS智能語(yǔ)音交互功能,已經(jīng)處于量產(chǎn)階段。
這一招除了對(duì)做智能語(yǔ)音及相關(guān)產(chǎn)品的公司構(gòu)成威脅,百度讓“度秘大腦”成為智能時(shí)代無(wú)處不在的“大腦”的布局也全面鋪開(kāi)。
吳恩達(dá)的離開(kāi)并沒(méi)有讓中國(guó)的人工智能“冷”下來(lái),不僅沒(méi)有冷,BAT 在這之后緊鑼密鼓的出招讓“AI三國(guó)殺”全面升級(jí)。在吳恩達(dá)宣布計(jì)劃離開(kāi)百度的第二天,騰訊就高調(diào)迎來(lái)了張潼。很快,阿里云棲大會(huì)揭幕了阿里經(jīng)由云計(jì)算通往智能之路的一系列重大產(chǎn)品和布局。
昨天百度發(fā)布的這款DuerOS智慧芯片及合作計(jì)劃,將構(gòu)建包括度秘大腦、語(yǔ)音解決方案、芯片/模組在內(nèi)的三層結(jié)構(gòu)。其中,前兩層由百度度秘提供,芯片模組板塊則由紫光展銳、ARM、漢楓共同支持。
除了DuerOS智慧芯片,百度還將推出了DuerOS開(kāi)放平臺(tái),讓客戶可以在云端完成對(duì)DuerOS的個(gè)性化定制,同時(shí)提供設(shè)備與云端、APP端互聯(lián)的能力。
DuerOS是由度秘研發(fā)的對(duì)話式人工智能操作系統(tǒng),強(qiáng)調(diào)使用自然語(yǔ)言進(jìn)行語(yǔ)音對(duì)話的交互方式,同時(shí)通過(guò)云端大腦時(shí)刻進(jìn)行自動(dòng)學(xué)習(xí)。DuerOS今年1月在拉斯維加斯CES大會(huì)上首次對(duì)外發(fā)布。當(dāng)時(shí),百度度秘總經(jīng)理景鯤在CES現(xiàn)場(chǎng)接受了新智元的專(zhuān)訪,景鯤表示DuerOS是百度重點(diǎn)推出的戰(zhàn)略性產(chǎn)品,是“人工智能時(shí)代的操作系統(tǒng)”。
景鯤說(shuō):“我們一直在提一個(gè)新的概念,叫Conversational Computer(對(duì)話式計(jì)算機(jī))。我認(rèn)為的趨勢(shì)是將來(lái)人們會(huì)越來(lái)越多地跟設(shè)備對(duì)話,而且我們從百度搜索、百度語(yǔ)音搜索上已經(jīng)看到了這樣的趨勢(shì),用戶會(huì)越來(lái)越接受跟設(shè)備進(jìn)行對(duì)話,用自然語(yǔ)言的方式進(jìn)行交流。用戶獲取信息服務(wù)的門(mén)檻在降低,我們希望將來(lái)的入口是無(wú)處不在的,用戶在有需要的時(shí)候就跟設(shè)備進(jìn)行對(duì)話。這次我們重點(diǎn)推出的戰(zhàn)略性產(chǎn)品就是——DuerOS,我們把它叫做 Conversational AI OS(對(duì)話式的人工智能操作系統(tǒng))?!?/span>
有話說(shuō)得好,“得操作系統(tǒng)者得天下”,在各家都號(hào)稱要做萬(wàn)物智能、萬(wàn)物互聯(lián)的現(xiàn)在,連接上下游的操作系統(tǒng)才是真正的核心。從第一代的Wintel、第二代iOS和安卓,到如今的第三代人工智能操作系統(tǒng),這無(wú)疑是一個(gè)巨大的機(jī)會(huì),從中完全可能誕生世界級(jí)的公司。
百度的DuerOS定位于嵌入式操作系統(tǒng),雖然并不構(gòu)成“中央集權(quán)”,但無(wú)疑將自己融入了更廣泛的場(chǎng)景之中。而為了應(yīng)對(duì)這些不同場(chǎng)景里的交互,百度將賭注押在了對(duì)話式OS上面。雖有亞馬遜 Alexa/Echo 的光輝例子,但還是有很多人不看好語(yǔ)音交互,認(rèn)為語(yǔ)音是一個(gè)“偽入口”。但百度顯然不這樣認(rèn)為,同時(shí)百度在開(kāi)拓生態(tài)方面也全力以赴。在DuerOS智慧芯片發(fā)布現(xiàn)場(chǎng),百度公司首席架構(gòu)師、度秘事業(yè)部首席技術(shù)官朱凱華說(shuō),“我們永遠(yuǎn)免費(fèi)授權(quán)”,“百度在這里不是希望賺錢(qián),我們也不是為了商業(yè)化而開(kāi)始,是希望能夠和所有的合作伙伴一起把這個(gè)事情做大”。
3月27日,2017新智元開(kāi)源·生態(tài)AI技術(shù)峰會(huì)上,百度度秘事業(yè)部總經(jīng)理景鯤發(fā)表了演講《對(duì)話式人工智能的應(yīng)用與未來(lái)》。景鯤不僅全面解讀百度對(duì)話式的人工智能操作系統(tǒng) DuerOS,還坦承分享了很多經(jīng)驗(yàn)教訓(xùn),以及百度在人工智能方面的儲(chǔ)備和戰(zhàn)略。
抓住了產(chǎn)業(yè)鏈上的核心環(huán)節(jié),All in 對(duì)話式人工智能操作系統(tǒng),能讓百度成為世界級(jí)企業(yè)嗎?
百度 All in AI:定戰(zhàn)略、聚人才、儲(chǔ)技術(shù)、找場(chǎng)景
演講內(nèi)容很多,在這里首先提煉一些重點(diǎn)金句:
1. 我們看一個(gè)公司在人工智能上是否真的投入,應(yīng)該看組織架構(gòu),組織架構(gòu)是影響人工智能執(zhí)行效率的。如果是一家大公司,一定要判斷它是不是把人工智能作為一項(xiàng)業(yè)務(wù)來(lái)發(fā)展。只有作為一項(xiàng)業(yè)務(wù)發(fā)展,而且是一個(gè)獨(dú)立事業(yè)部時(shí),組織效率才會(huì)高。
2. 人工智能人才現(xiàn)在非常昂貴,同時(shí)現(xiàn)在的人才也不是很多。我們需要抓住top的人才,這些人主要分布在中國(guó)和美國(guó)。從百度的角度,人工智能相對(duì)top的人才都已經(jīng)聚集在百度,從中國(guó)到美國(guó)。
3. 除了懂算法、懂?dāng)?shù)據(jù),會(huì)機(jī)器學(xué)習(xí)的頂尖人才,還有一種人才非常稀缺,就是AI的產(chǎn)品經(jīng)理。
4. 我們?nèi)绻胍腥胍粋€(gè)好的場(chǎng)景,要儲(chǔ)備很長(zhǎng)時(shí)間才能把這個(gè)場(chǎng)景搶過(guò)來(lái)。這是培育期,就是獲得足夠的數(shù)據(jù),讓系統(tǒng)足夠聰明。
5. 把一個(gè)通用對(duì)話能力放到一個(gè)小場(chǎng)景里能解決什么問(wèn)題?能做到什么效果?做通用的人工智能太難了,但如果放到一個(gè)具體的場(chǎng)景里就很簡(jiǎn)單。
6. 在對(duì)話式人工智能推進(jìn)的過(guò)程中關(guān)鍵的是端到端的用戶需求滿足。很多人并不需要語(yǔ)音識(shí)別,他們需要端到端的需求滿足,比如是否能夠播音樂(lè),查天氣,查股票價(jià)格,這才是用戶真正關(guān)心的。
以下為度秘事業(yè)部總經(jīng)理景鯤的演講。
景鯤:我會(huì)在分享中介紹我們?cè)谘邪l(fā)過(guò)程中遇到了什么困難,如何一步步走到未來(lái)。同時(shí),也與大家交流一下我們的儲(chǔ)備和戰(zhàn)略。
大家可能看過(guò)這個(gè)叫《HER》的電影,“Her”是一個(gè)人工智能,主人公通過(guò)一個(gè)耳機(jī)和一個(gè)手機(jī),就能跟Her進(jìn)行溝通。我今天演講的主題是“對(duì)話式人工智能”。如何定義對(duì)話式人工智能?在很多科幻片里我們會(huì)看到這樣一些對(duì)話式人工智能,有時(shí)候是機(jī)器人,有時(shí)候是計(jì)算機(jī)、耳機(jī),甚至是無(wú)處不在的虛擬物質(zhì)。這是老百姓心目當(dāng)中的對(duì)話式人工智能,我們的愿景也正是研發(fā)出這樣的對(duì)話式人工智能。
第三代人工智能操作系統(tǒng),百度的賭注是對(duì)話式 AI
那么,我們距離愿景是不是已經(jīng)很近了?
以前,我們學(xué)習(xí)計(jì)算機(jī)語(yǔ)言,學(xué)習(xí)拼音、五筆,那時(shí)我們以機(jī)器的語(yǔ)言與計(jì)算機(jī)交流?,F(xiàn)在,我們用語(yǔ)音的方式與計(jì)算機(jī)交互,計(jì)算機(jī)解決的問(wèn)題就是讓機(jī)器學(xué)會(huì)人的語(yǔ)言,讓機(jī)器用人的語(yǔ)言與人溝通。對(duì)話式人工智能就是希望讓機(jī)器學(xué)會(huì)人的語(yǔ)言,用自然的方式與人進(jìn)行溝通。
我們看整個(gè)科技的發(fā)展,每一個(gè)時(shí)代,從PC時(shí)代到無(wú)線時(shí)代到AI時(shí)代,人類(lèi)都在用不同的方式與機(jī)器進(jìn)行溝通。例如第一代我們用鼠標(biāo)、鍵盤(pán)產(chǎn)生的機(jī)器語(yǔ)言與計(jì)算機(jī)進(jìn)行溝通,代表的操作系統(tǒng)是 Windows;第二代我們用手指與機(jī)器進(jìn)行互動(dòng),代表的操作系統(tǒng)是iOS和安卓;第三代是人工智能操作系統(tǒng),我們希望用戶以對(duì)話的方式與設(shè)備進(jìn)行溝通。
每一代操作系統(tǒng)都是用戶交互方式的變革,它們都有趨同性,也即交互方式變得越來(lái)越自然,從原來(lái)的機(jī)器語(yǔ)言到半機(jī)器語(yǔ)言,后到機(jī)器學(xué)人的語(yǔ)言,使用的門(mén)檻越來(lái)越低。
我們希望降低第三代系統(tǒng)的門(mén)檻。百度的使命是讓人平等便捷地獲取信息,找到所求。什么是平等?平等就是讓每個(gè)人用自然的方式,隨時(shí)隨地能夠獲得信息,找到所求。
百度人的看法:推進(jìn) AI 有 4+1 件事情一定要做對(duì),若不提出來(lái)很多人可能會(huì)忽略
為什么我們要做對(duì)話式人工智能?這里有數(shù)據(jù)可以跟大家分享一下。大家如果打開(kāi)今天的手機(jī)百度,在手機(jī)百度下面我們放了一個(gè)很長(zhǎng)的大按鈕,可以按著說(shuō)話。我們發(fā)現(xiàn)人類(lèi)運(yùn)用自然語(yǔ)言跟設(shè)備進(jìn)行溝通的需求越來(lái)越強(qiáng),過(guò)去一年百度語(yǔ)音的日活增長(zhǎng)率為100%,而且這種增長(zhǎng)已經(jīng)持續(xù)幾年。
事實(shí)證明,用戶已經(jīng)可以用語(yǔ)音與設(shè)備進(jìn)行對(duì)話,這個(gè)浪潮正在到來(lái)。那么,對(duì)話式人工智能如何來(lái)落地?下面我想分享一些看法。
若想真正推進(jìn)人工智能,有幾件事情一定要做對(duì),而且這些事情如果不提出來(lái)可能很多人會(huì)忽略。今天在座的有創(chuàng)業(yè)者,有大公司,也有很多投資人。從我們百度人的角度來(lái)看,有哪幾件事情才能推進(jìn)人工智能落地呢?
一是定戰(zhàn)略。這個(gè)事情很容易被忽略,我們看一個(gè)公司在人工智能上是否真的投入,應(yīng)該看組織架構(gòu),組織架構(gòu)是影響人工智能執(zhí)行效率的。你看百度的組織架構(gòu),再看其他人工智能公司的組織架構(gòu)。如果是一家創(chuàng)業(yè)公司,創(chuàng)業(yè)公司的組織架構(gòu)很清晰,all in AI;如果是一家大公司,一定要判斷它是不是把人工智能作為一項(xiàng)業(yè)務(wù)來(lái)發(fā)展。只有作為一項(xiàng)業(yè)務(wù)發(fā)展,而且是一個(gè)獨(dú)立事業(yè)部時(shí),組織效率才會(huì)高。隨著陸奇加入百度,我們成立了獨(dú)立的度秘事業(yè)部來(lái)開(kāi)展人工智能。
二是聚人才。人工智能人才現(xiàn)在非常昂貴,同時(shí)現(xiàn)在的人才也不是很多。我們需要抓住top的人才,這些人主要分布在中國(guó)和美國(guó)。從百度的角度,人工智能相對(duì)top的人才都已經(jīng)聚集在百度,從中國(guó)到美國(guó)。除了懂算法、懂?dāng)?shù)據(jù),會(huì)機(jī)器學(xué)習(xí)的頂尖人才,還有一種人才非常稀缺,就是AI的產(chǎn)品經(jīng)理,我覺(jué)得這種人才必須要有分裂式人格。一方面他非常堅(jiān)信未來(lái)就是這樣;另一方面他一定知道現(xiàn)在落地有多困難,AI的落地多困難,AI的現(xiàn)狀與用戶的期望差異有多大。只有這種對(duì)愿景滿懷期待且有技術(shù)能力的人才,才能推進(jìn)AI的業(yè)務(wù)。
三是技術(shù)。其實(shí)AI相關(guān)技術(shù)真的沒(méi)那么容易。整個(gè)百度AI技術(shù)從基礎(chǔ)的機(jī)器學(xué)習(xí)的平臺(tái)到PaddlePaddle,到語(yǔ)音技術(shù),自然語(yǔ)言處理,圖像技術(shù),用戶畫(huà)像,每一項(xiàng)技術(shù)都需要儲(chǔ)備五六年以上,所以如果想把對(duì)話式人工智能做好,必須要把相關(guān)的技術(shù)儲(chǔ)備好。
例如我們的語(yǔ)音,在2016年麻省理工科技評(píng)論評(píng)出的10大突破型技術(shù)中排名第二,我們的OCR技術(shù)獲得了很多榮譽(yù),我們的PaddlePaddle是國(guó)內(nèi)首個(gè)開(kāi)源機(jī)器學(xué)習(xí)平臺(tái),所以百度在技術(shù)方面儲(chǔ)備深厚。
四是找場(chǎng)景。這是關(guān)鍵的,很多企業(yè)都死在找場(chǎng)景,AI要做好一定要找一個(gè)能落地的場(chǎng)景。通用的對(duì)話式AI很難做,因此需要分場(chǎng)景突破。
好的場(chǎng)景有幾個(gè)特點(diǎn):第一、它是要符合用戶交互習(xí)慣——如果用戶在這個(gè)場(chǎng)景上已經(jīng)養(yǎng)成鍵盤(pán)或觸摸式的交互習(xí)慣,其實(shí)很難改變用戶場(chǎng)景;第二、場(chǎng)景需要適合當(dāng)下技術(shù)的應(yīng)用,只有技術(shù)成熟,才能做出比較好的產(chǎn)品;第三、對(duì)話式人工智能要滿足用戶對(duì)話式的需求。
今年1月份,我們?cè)诿绹?guó)拉斯維加斯正式推出了DuerOS對(duì)話式人工智能操作系統(tǒng)。對(duì)話式操作系統(tǒng)的演進(jìn)是一個(gè)漫長(zhǎng)的過(guò)程,需要儲(chǔ)備比較長(zhǎng)的時(shí)間。我們大概在2014年7月份正式推出了對(duì)話式人工智能助理,到2015年首次發(fā)布,這是我定義的第一個(gè)時(shí)期,初創(chuàng)期。
其次,如果對(duì)話式人工智能團(tuán)隊(duì)說(shuō)想攻克難關(guān),都要要打一個(gè)問(wèn)號(hào),看這個(gè)團(tuán)隊(duì)在這一領(lǐng)域是否有足夠的儲(chǔ)備。例如,我們?nèi)绻胍腥胍粋€(gè)好的場(chǎng)景,要儲(chǔ)備很長(zhǎng)時(shí)間才能把這個(gè)場(chǎng)景搶過(guò)來(lái)。這是培育期,就是獲得足夠的數(shù)據(jù),讓系統(tǒng)足夠聰明。
原來(lái)在搜索上我們得到的絕大部分與關(guān)鍵詞有關(guān)的數(shù)據(jù),和平時(shí)溝通說(shuō)話的數(shù)據(jù)不一樣,我們溝通的時(shí)候用的是口語(yǔ)交互。當(dāng)你加了語(yǔ)音搜索時(shí),用戶會(huì)傾向用自然語(yǔ)言的方式與設(shè)備進(jìn)行交互,這些都是以前搜索引擎沒(méi)有見(jiàn)到的數(shù)據(jù)。只有找到這些數(shù)據(jù),把機(jī)器大腦培育好之后,才進(jìn)入第三個(gè)階段——在一個(gè)場(chǎng)景里加速突破。
所以,DuerOS戰(zhàn)略的過(guò)程很簡(jiǎn)單,當(dāng)我們的能力足夠強(qiáng)大之后,要分場(chǎng)景突破,把能力和具體設(shè)備、場(chǎng)景相結(jié)合,賦予這些設(shè)備和場(chǎng)景以能力。很多設(shè)備和場(chǎng)景已經(jīng)有對(duì)話式需求,只是我們之前沒(méi)有想到。我舉個(gè)具體例子。我們近做了很多的活動(dòng),發(fā)布了很多產(chǎn)品。我爸眼睛不太好,說(shuō)你做了這么多設(shè)備和產(chǎn)品,為什么不做空調(diào)?空調(diào)可以語(yǔ)音交互多好。他給我講了具體需求,他每次出差去賓館,由于眼花根本看不清楚空調(diào)上冷熱除塵這些小的圖標(biāo),所以每次都打電話讓服務(wù)員來(lái)調(diào)整。這就是場(chǎng)景里面用戶的實(shí)際需求。所以每一個(gè)小場(chǎng)景,每一個(gè)設(shè)備都有對(duì)話式需求,把這個(gè)對(duì)話式需求找出來(lái)就能解決用戶的痛點(diǎn)。
如果我們把一個(gè)通用對(duì)話能力放到一個(gè)小場(chǎng)景里能解決什么問(wèn)題?能做到什么效果?剛才我已經(jīng)說(shuō)過(guò),做通用的人工智能太難了,但如果放到一個(gè)具體的場(chǎng)景里就很簡(jiǎn)單。這是用對(duì)話的方式找飯店,是我們一年前做到的效果。
還有一個(gè)觀點(diǎn)是,在對(duì)話式人工智能推進(jìn)的過(guò)程中技術(shù)是基礎(chǔ),關(guān)鍵的是端到端的用戶需求滿足。很多人并不需要語(yǔ)音識(shí)別,他們需要端到端的需求滿足,比如是否能夠播音樂(lè),查天氣,查股票價(jià)格,這才是用戶真正關(guān)心的。所以,就對(duì)話式人工智能產(chǎn)品而言,功能性、性能、體驗(yàn)都是用戶端到端一體的需求。
就百度而言,我們也希望把這種優(yōu)勢(shì)提供給合作伙伴,把我們豐富的信息和服務(wù)生態(tài)開(kāi)放給合作伙伴,讓所有人都在這一基礎(chǔ)之上做比較好的、通用的、場(chǎng)景化的對(duì)話式人工智能。百度本來(lái)就是以搜索起家的公司,我們?cè)谛畔⑸鷳B(tài),服務(wù)生態(tài)方面的能力很強(qiáng)。這些能力都會(huì)分場(chǎng)景地提供給不同設(shè)備。同時(shí),海量的數(shù)據(jù)非常重要,用戶要的是端到端的滿足。百度對(duì)數(shù)據(jù)的整合能力,接下來(lái)也會(huì)開(kāi)放提供給所有的合作伙伴。
后一點(diǎn)是用戶認(rèn)知,什么時(shí)候讓老百姓覺(jué)得這個(gè)產(chǎn)品好用,甚至沒(méi)有把它當(dāng)成一個(gè)人工智能產(chǎn)品,我們才算是真正跨過(guò)了這個(gè)坎。希望大家能夠一起推動(dòng)市場(chǎng),推動(dòng) to C端,讓用戶認(rèn)知到人工智能產(chǎn)品的體驗(yàn)很好。不同的合作伙伴,比如芯片和模組方、開(kāi)發(fā)者、企業(yè)應(yīng)用,內(nèi)容資源方等,都要一起推動(dòng)產(chǎn)業(yè)的發(fā)展。
3月30日,我們會(huì)與ARM和RDA一起發(fā)布DuerOS智能芯片,我們會(huì)把基礎(chǔ)的語(yǔ)音能力集成到很多設(shè)備里面,搭建一個(gè)平臺(tái)讓合作伙伴在這上面做相應(yīng)的對(duì)話式人工智能工作。同樣,我們也希望能賦予更多合作伙伴更多的可能。
總結(jié)而言,對(duì)話式人工智能的挑戰(zhàn)非常大,除了技術(shù)、數(shù)據(jù)、人才之外,是否能夠推動(dòng)用戶的認(rèn)知也非常重要。在這個(gè)過(guò)程中,我們?cè)敢夥窒硭械慕?jīng)驗(yàn)給大家,也希望把百度的能力開(kāi)放給大家,讓大家把對(duì)話式人工智能做得更好。
我們會(huì)對(duì)產(chǎn)品進(jìn)行全免費(fèi)授權(quán),大家可以免費(fèi)地用百度的能力,我們會(huì)提供端到端的滿足能力,大家可以直接拿到百度所有的信息和服務(wù)內(nèi)容。我們也會(huì)提供商業(yè)化變現(xiàn)的方式。我們會(huì)將第三代操作系統(tǒng)推薦給大家,以推動(dòng)對(duì)話式人工智能的發(fā)展。
今天很高興跟大家分享,謝謝!
官方微博
官方微信公眾號(hào)
官方百家號(hào)