在許多人看來(lái)搜索引擎只是一個(gè)檢索工具,就像其他冷冰冰的科技產(chǎn)品一樣。實(shí)際上,搜索引擎正在成為人人依賴(lài)的智能助手。它在擁有感知環(huán)境和自我學(xué)習的能力后,隨著(zhù)歲月流逝將不斷地將信息轉化為知識,再將知識沉淀為智慧,被賦予“生命”價(jià)值。
Online Learning ,讓搜索引擎“活起來(lái)”
Online Learning(在線(xiàn)學(xué)習)便是讓搜索引擎“活起來(lái)”的關(guān)鍵技術(shù),它讓搜索引擎擁有更強大的學(xué)習能力進(jìn)而越來(lái)越聰明。
理論上來(lái)說(shuō),一個(gè)用戶(hù)使用搜索引擎越多,搜索引擎就愈發(fā)了解這個(gè)用戶(hù)和整體熱度變化,推薦精準度會(huì )越來(lái)越高。根據用戶(hù)特征不斷調整算法提高準確度就是學(xué)習過(guò)程。在Online Learning技術(shù)之前,搜索引擎的學(xué)習是離線(xiàn)完成的,定時(shí)進(jìn)行數據模型和排序及推薦算法的更新,但不會(huì )做到在用戶(hù)每一次反饋之后都更新算法。Online Learning則讓“學(xué)習”更加具有時(shí)效性,粒度細化到每個(gè)用戶(hù)。它可以隨時(shí)根據用戶(hù)的下載、點(diǎn)擊、停留時(shí)間、鼠標移動(dòng)這些行為去理解用戶(hù)進(jìn)而動(dòng)態(tài)調整排序和推薦算法,給用戶(hù)想要的。
在技術(shù)上Online Learning只需要對當前用戶(hù)相關(guān)的數據進(jìn)行計算即可,增量學(xué)習的方式節省了計算資源同時(shí)增強了時(shí)效性,因為它可以一邊學(xué)習一邊預測、推薦和排序,這可以做到對推薦的動(dòng)態(tài)調整進(jìn)而確保推薦效果。
在這種快速迭代的基礎上,Online Learning能夠采取比離線(xiàn)預測更為靈活的策略,如Bandit策略,它能夠降低信息的冗余,緩解馬太效應,給了資源更多更平等的機會(huì ),可以說(shuō)形成一種“百花齊放”的狀態(tài),在短時(shí)間內迅速定位優(yōu)質(zhì)資源。
Online Learning 或將迎來(lái)大規模應用
在百度的搜索引擎結果中,右側知心中,App助手推薦,多媒體搜索結果中,在線(xiàn)學(xué)習系統已被大規模應用,相關(guān)測試表明Online Learning可大幅提升推薦點(diǎn)擊率和用戶(hù)滿(mǎn)意度?,F在你搜索“雙層床”右側不會(huì )只出現相關(guān)結果,而是根據之前用戶(hù)搜索類(lèi)似關(guān)鍵詞后的反饋,推薦了小戶(hù)型裝修等服務(wù)。
Online Learning即在線(xiàn)機器學(xué)習,目前業(yè)界只有百度進(jìn)行了大規模的商業(yè)化應用。Yahoo和Google進(jìn)行了一些嘗試,但集中在實(shí)驗、調研或者論文層面。Online Leaning技術(shù)與百度正在深耕的深度學(xué)習、百度大腦以及大數據業(yè)務(wù)有著(zhù)千絲萬(wàn)縷的聯(lián)系,接下來(lái)必將得到更大的提升和應用機會(huì ),據說(shuō)百度已經(jīng)在為與之相關(guān)的技術(shù)已經(jīng)在申請專(zhuān)利。
好比一個(gè)兒童在早期說(shuō)法、寫(xiě)字、走路都需要有大人刻意訓練一樣,這時(shí)候它并無(wú)“在線(xiàn)學(xué)習”能力,而是“監督學(xué)習”;到了一定階段它可以根據環(huán)境反饋和個(gè)人經(jīng)驗自己掌握一些技能,譬如在不斷跌倒和騎行過(guò)程中自學(xué)自行車(chē),下水喝了幾次水之后自然習得游泳技術(shù),這時(shí)候就是“在線(xiàn)學(xué)習”模式??梢哉f(shuō),人腦本身就是一個(gè)基于反饋在線(xiàn)學(xué)習的系統,Online-learning就是人腦接收環(huán)境和外界對于人的“反饋”,以使得人不斷調整自己行為的過(guò)程,這種學(xué)習機制是人類(lèi)不斷自我進(jìn)步和自我發(fā)展的源動(dòng)力。
Online Learning 讓搜索引擎擁有生命
今年李彥宏曾對外透露“百度大腦”的智力水平已接近3歲嬰兒,我們尚不知道這個(gè)項目究竟做了什么看得見(jiàn)的東西,沒(méi)有科技媒體能夠走進(jìn)這個(gè)項目深入了解它。百度對此介紹只有寥寥數字:利用計算機技術(shù)模擬人腦。百度大腦還出現在了百度推出的世界首個(gè)大數據引擎中,百度大腦發(fā)揮的作用就是讓大數據引擎能夠在數據挖掘的基礎上,形成“如何挖掘數據”的學(xué)習能力。
現在看來(lái)所有技術(shù)都是互聯(lián)互通的,百度大腦與Online Learning相似之處都是讓搜索引擎“活起來(lái)”,擁有學(xué)習能力和智力水平,最終越來(lái)越聰明。
近年來(lái)越來(lái)越多科技巨頭開(kāi)始關(guān)注科技與人類(lèi)和諧共處的問(wèn)題,蘋(píng)果讓科技與人文和藝術(shù)更加緊密的結合,可穿戴設備讓科技穿戴或植入人體隱秘存在,Nest則讓科技具有感知環(huán)境和自我學(xué)習能力,百度則是讓搜索引擎愈發(fā)聰明,理解人,與人自然對話(huà)。未來(lái)所有這些科技都會(huì )融為一體:手機、智能硬件、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)服務(wù),無(wú)處不在的科技最終讓人們感受不到科技的存在,科技與世界已經(jīng)渾然一體,水乳相融。
作者微博@互聯(lián)網(wǎng)阿超,微信SuperSofter
相關(guān)閱讀