智慧搜索數(shù)據(jù) 支撐“般若”平臺(tái)
“般若”一詞,是梵語(yǔ)Prajna的音譯,意為“終極智慧”、“辨識(shí)智慧”,專(zhuān)指如實(shí)認(rèn)知一切事物和萬(wàn)物本源的智慧。在紛繁復(fù)雜的現(xiàn)象中辨識(shí)萬(wàn)物的本源,這是般若的本意,也是百度金融大數(shù)據(jù)風(fēng)控平臺(tái)的寓意:在紛繁的世界中,幫助更多金融機(jī)構(gòu)和合作伙伴,共同建立一個(gè)持續(xù)共贏的成長(zhǎng)生態(tài)。百度金融“般若”大數(shù)據(jù)風(fēng)控平臺(tái)的辨識(shí)能力首先來(lái)自于百度的“智慧”數(shù)據(jù)。
通常來(lái)說(shuō),電商數(shù)據(jù)主要包括銷(xiāo)售數(shù)據(jù)、用戶(hù)購(gòu)買(mǎi)行為數(shù)據(jù)、商品數(shù)據(jù)、客戶(hù)咨詢(xún)數(shù)據(jù)、售后服務(wù)數(shù)據(jù)、推廣投放數(shù)據(jù)、營(yíng)銷(xiāo)活動(dòng)數(shù)據(jù),以及網(wǎng)站整體運(yùn)營(yíng)數(shù)據(jù)等,其優(yōu)點(diǎn)是便于商品運(yùn)營(yíng)、用戶(hù)運(yùn)營(yíng)和產(chǎn)品運(yùn)營(yíng),相較搜索大數(shù)據(jù)來(lái)說(shuō),維度少,數(shù)據(jù)特征相對(duì)集中。社交數(shù)據(jù)則擁有群體性、關(guān)系性特征,擁有整體社交用戶(hù)的90%,日均集納流量超過(guò)160億,優(yōu)點(diǎn)是可以對(duì)群體動(dòng)態(tài)具有較為準(zhǔn)確的預(yù)測(cè)性等,社交數(shù)據(jù)的缺陷在于存在一定的風(fēng)險(xiǎn)和漏洞,如容易被人為操作,數(shù)據(jù)單一維度的造假容易,代價(jià)低。
BAT的數(shù)據(jù)各具特色,相比阿里巴巴在消費(fèi)領(lǐng)域具有較強(qiáng)數(shù)據(jù),騰訊在社交領(lǐng)域占據(jù)優(yōu)勢(shì),百度具有海量的搜索數(shù)據(jù)。由于百度擁有中國(guó)互聯(lián)網(wǎng)領(lǐng)先的流量資源,百度搜索大數(shù)據(jù)的特征是高維、稀疏的,數(shù)據(jù)涵蓋人口屬性、興趣關(guān)注、消費(fèi)場(chǎng)景、常駐位置、信用評(píng)分、APP行為等,擁有豐富的維度可以做更精準(zhǔn)的用戶(hù)畫(huà)像。
智慧服務(wù) 提供場(chǎng)景化一體化解決方案
在AI時(shí)代,金融業(yè)的痛點(diǎn)包括獲客難、技術(shù)升級(jí)快、風(fēng)控成本高等。在基礎(chǔ)數(shù)據(jù)上,金融領(lǐng)域普遍面臨樣本集群不大導(dǎo)致的數(shù)據(jù)高維、稀疏、小樣本的難題。
從行業(yè)面臨的痛點(diǎn)和挑戰(zhàn)上看,“般若”平臺(tái)通過(guò)百度獨(dú)有的數(shù)據(jù)特征和算法,提出了整體解決方法:百度的“般若”風(fēng)控平臺(tái),可一一破解難題:百度的梯度增強(qiáng)決策樹(shù)可以聚合大數(shù)據(jù)高維特征,可以實(shí)現(xiàn)高維數(shù)據(jù)降維、增加風(fēng)險(xiǎn)區(qū)分度;百度的深度學(xué)習(xí),將特征嵌入,利用關(guān)聯(lián)挖掘等解決數(shù)據(jù)稀疏問(wèn)題?!皬?000+降維至400維,可將行為的風(fēng)險(xiǎn)區(qū)分度有效提升5%+”,而基于百度數(shù)億級(jí)用戶(hù)數(shù)據(jù),通過(guò)圖計(jì)算,可將信用標(biāo)簽傳遞,豐富信貸樣本。
通過(guò)AI技術(shù),百度金融對(duì)大數(shù)據(jù)進(jìn)行處理、歸類(lèi),梳理出很多數(shù)據(jù)特征。例如,通過(guò)Boosting算法,對(duì)大量的數(shù)據(jù)觀測(cè)后進(jìn)行學(xué)習(xí),通過(guò)函數(shù)表達(dá),在這些高維的數(shù)據(jù)中可以總結(jié)出一些特征。有了這些特征,就基本可以定義一個(gè)用戶(hù),無(wú)需把數(shù)據(jù)全部都集中在一起了。在數(shù)學(xué)上,這樣的表達(dá)也可以描述為,這些數(shù)據(jù)都被分類(lèi)在各個(gè)分類(lèi)器里面,只要掌握了分類(lèi)器的函數(shù)表達(dá),每一個(gè)分類(lèi)器里面的數(shù)據(jù)差異就可以忽略了。
百度金融技術(shù)負(fù)責(zé)人許冬亮在2017年百度世界智能金融分論壇上展示了”般若”的成績(jī)單:在信用領(lǐng)域,央行征信數(shù)據(jù)加百度數(shù)據(jù)可以將客群的風(fēng)險(xiǎn)區(qū)分度提升13%;在反欺詐領(lǐng)域,百度已擁有百億節(jié)點(diǎn)、五百億邊的關(guān)聯(lián)網(wǎng)絡(luò),可以提升識(shí)別騙貸團(tuán)伙的成功率。
許冬亮表示,百度智能金融的目標(biāo)是成為一家真正意義的金融科技公司,在實(shí)現(xiàn)初心的道路上,“般若”通過(guò)釋放百度金融的科技的能力,不斷實(shí)踐,讓它有能力逐步涉足到傳統(tǒng)金融機(jī)構(gòu)受制于風(fēng)控水平而無(wú)法涉足的領(lǐng)域,擴(kuò)寬金融服務(wù)邊界,讓更多人享受到更優(yōu)質(zhì)、安全、高效的金融服務(wù)。
官方微博
官方微信公眾號(hào)
官方百家號(hào)