大數據最初是指多到無(wú)法去進(jìn)行統計和分析的數據集,后來(lái)被衍生成——通過(guò)某種方式和方法去分析海量數據,從中獲得我們需要的具有巨大價(jià)值利益的服務(wù)內容。
這是一種逐漸被重視的形式,分析這些數據有難度,存儲這些數據一樣有難度,也需要使用一些前所未有的方式,現在國內大部分采用的是Hadoop這樣開(kāi)源的分布式數據集群,來(lái)滿(mǎn)足各種數據統計的需求。
由于海量數據中可以分析出具有巨大價(jià)值利益的細分數據,所以很多網(wǎng)站都進(jìn)行大數據戰略,特別是在電商行業(yè)和視頻行業(yè)。
不過(guò)更具有挑戰性和代表性的應該是針對視頻網(wǎng)站的大數據挖掘,畢竟電商對于大數據來(lái)說(shuō)還是有很多優(yōu)勢的,比如電商的用戶(hù)無(wú)論如何挑選,最終還是會(huì )選中某一款產(chǎn)品,然后注冊、登陸、支付,無(wú)形中就將自己最重要的信息資料全盤(pán)托出。而視視頻網(wǎng)站絕大部分用戶(hù)都是不注冊的,如何在這種無(wú)法記錄用戶(hù)信息的情況下如何做到大數據分析呢?
最近有一部Netflix的自制劇《紙牌屋》被大家所關(guān)注,據說(shuō)是Netflix根據數據推論出《紙牌屋》成功的關(guān)鍵要素:喜歡BBC劇集的用戶(hù)、大衛·芬奇的表現風(fēng)格、凱文·史派西的表演刻畫(huà)。最終事實(shí)證明,基于大數據分析出來(lái)的結論非??孔V,《紙牌屋》在美國和其他40多個(gè)國家引起了觀(guān)劇熱潮,為此Netflix獲得了巨大成功。
大數據誰(shuí)做的最好?
由此我們產(chǎn)生一個(gè)疑問(wèn),視頻行業(yè)有人在做大數據嗎?誰(shuí)家做得最好呢?
是Netflix么?在技術(shù)層面來(lái)說(shuō),我覺(jué)得并不是。
Netflix之所以成功還是在于它的數據是可被挖掘的,Netflix是一家在線(xiàn)DVD租賃網(wǎng)站,通過(guò)用戶(hù)直接的租賃數據,可以得知用戶(hù)喜歡BBC的劇集,喜歡大衛·芬奇導演的影片對社會(huì )問(wèn)題的另類(lèi)表達,和凱文·史派西在刻畫(huà)各種陰險狡詐的反派人物時(shí)那出神入化的演技,于是成功的推出了《紙牌屋》這部備受矚目的優(yōu)質(zhì)美劇。
而在匿名用戶(hù)大數據中做得最好的莫過(guò)于Youtube了,在我接觸過(guò)這家神奇的視頻網(wǎng)站后,不僅折服于他精準的推薦算法,更欽佩他們對于數據的開(kāi)放性,只要你想統計和分析,Youtube會(huì )將幾乎所有視頻的數據都提供給你,這應該歸功于他們依附著(zhù)Google強大的技術(shù)支持。
在Youtube所有的大數據信息,都圍繞著(zhù)單部視頻節目所進(jìn)行,第一次訪(fǎng)問(wèn),第一次分享,第一次評論,都展現在你面前,包括時(shí)間和URL一一列出,這是一種多么開(kāi)放的胸懷。
國內也有幾家針對視頻做大數據的視頻網(wǎng)站:優(yōu)酷網(wǎng)、搜狐(數據比較全);酷6網(wǎng)、土豆、56(提供部分數據);奇藝、樂(lè )視、騰訊(有統計但未提供);它們也都將成為視頻網(wǎng)站大數據的角逐者。
大數據的本土化應用
大數據分析的益處就是有求必應,按需索??;針對國內視頻網(wǎng)站的盈利模式,有哪些領(lǐng)域可以產(chǎn)生價(jià)值呢?
內容推薦算是最基本的應用了,為用戶(hù)提供更多符合胃口的視頻,提高點(diǎn)擊率,獲得更多的廣告曝光,是最直接的獲利形式。這也是最簡(jiǎn)單,最容易實(shí)現,也是各大視頻網(wǎng)站普遍使用的方法,但取決于算法的精準程度。很多網(wǎng)站簡(jiǎn)單的用切詞、標簽等形式,為用戶(hù)視頻推薦就認為是精準推薦了,并為其冠名“推薦算法”四個(gè)字,我們也不能議論什么,畢竟基于大數據的推薦算法不是簡(jiǎn)單的工程。
其次是基于數據將用戶(hù)按條件篩選后,以不同維度進(jìn)行盈利性?xún)热萃茝V;如影視作品的網(wǎng)絡(luò )宣傳推廣,內容預熱報道,付費視頻的推薦點(diǎn)播等。通過(guò)用戶(hù)群的細分后,產(chǎn)生的轉化效果較高;但是為其配套的基礎服務(wù)也比較繁多。如會(huì )員系統、支付系統、計費系統、影視內容加密方式,和模糊推薦的功能,都需要一段時(shí)間開(kāi)發(fā),相對的要投入較多人力和開(kāi)發(fā)成本。
可復制的商業(yè)模式?
是否還有其他行業(yè)基于大數據的盈利模式已經(jīng)被驗證,并且模式可以被復制、套用到視頻網(wǎng)站中呢?
Netflix已經(jīng)為我們提供了一個(gè)很好的實(shí)例,分析用戶(hù)的喜好來(lái)挑選導演和演員,這種方式可以完美的復制到國內。2013年優(yōu)酷、奇藝都押寶在自制劇集方面。前兩年,國內也有幾部成功的微電影系列,如《青春期》系列,還有后來(lái)幾部比較火爆的《干爹》、《上位》、《媽咪》大多是以吸引眼球的方式去博得用戶(hù)關(guān)注。如果可以通過(guò)大數據分析,成功拍攝出真正在品質(zhì)和品味上達到廣電水準的自制劇,在國內也創(chuàng )造一次成功案例,將有可能奠定其霸主地位。
另一個(gè)案例就是復制百度的競價(jià)廣告模式,通過(guò)為用戶(hù)及廣告營(yíng)銷(xiāo)方提供大數據的分析支持,讓其自主投放廣告;讓廣告主發(fā)掘自己覺(jué)得有價(jià)值的視頻,投放廣告,生成一個(gè)自主營(yíng)銷(xiāo)的生態(tài)環(huán)境,將有利于網(wǎng)站和行業(yè)的發(fā)展。
無(wú)價(jià)值的視頻沒(méi)有廣告的投放價(jià)值,有價(jià)值的視頻被廣告主相繼競價(jià)爭搶?zhuān)ㄟ^(guò)視頻自身的內容提高原創(chuàng )作者的經(jīng)濟收入,可謂是雙贏(yíng)的法則;不僅可以鼓勵原創(chuàng )作者的積極性,也可以讓網(wǎng)站的視頻的內容質(zhì)量不斷提高,形成難以超越的價(jià)值高度。
相關(guān)閱讀