語(yǔ)音識別領(lǐng)域的明星創(chuàng )業(yè)公司云知聲正在經(jīng)歷一場(chǎng)隱秘的高層架構調整。
騰訊科技獨家獲悉,云知聲CEO梁家恩不再擔任CEO一職,轉而專(zhuān)注負責技術(shù)領(lǐng)域。公司CEO由黃偉擔任,正式上任已一周有余。
云知聲的官方網(wǎng)站側面印證了該消息的真實(shí)性。云知聲在公司內部的新聞稿通報,云知聲榮獲中國最具投資價(jià)值企業(yè)50強的稱(chēng)號,云知聲CEO黃偉出席了本次大會(huì )并領(lǐng)獎,新聞稿并配了黃偉領(lǐng)獎的照片。
在外界看來(lái),這似乎是空降兵式的調整。在語(yǔ)音識別業(yè)內的知情者看來(lái),則是語(yǔ)音識別產(chǎn)業(yè)核心人物的回歸。
“黃偉終于回歸了,終于從幕后走向了前臺”。一位語(yǔ)音識別的業(yè)內人士這樣感慨。
黃偉是誰(shuí)?作為語(yǔ)音識別領(lǐng)域的領(lǐng)軍人物,他先就職于摩托羅拉和盛大創(chuàng )新院,建立了盛大創(chuàng )新院語(yǔ)音分院,后隨著(zhù)盛大整體戰略的調整,他于2012年離職選擇創(chuàng )業(yè)。
對于黃偉創(chuàng )業(yè)的說(shuō)法不一。盛大創(chuàng )新院?jiǎn)T工表示,黃偉是盛大創(chuàng )新院高管中最早離開(kāi)創(chuàng )新院的,他去創(chuàng )辦了云知聲。但在此前,云知聲官方否認黃偉在這個(gè)團隊中。
今年10月,云知聲確認完成啟明創(chuàng )投的A輪融資,金額達1億人民幣,此時(shí),云知聲公司成立剛過(guò)500天。云知聲的迅速躥紅也引起了業(yè)內人士對它的關(guān)注,也牽出了黃偉與云知聲的聯(lián)系:“黃偉不是明面上的公司創(chuàng )始人,更多的是和云知聲私下里的關(guān)系。雖然沒(méi)有確切的證據表明兩者的關(guān)系,但實(shí)際上千絲萬(wàn)縷,兩者走的非常近。”一位知情人士透露。
騰訊科技獲悉,此次黃偉正式擔任CEO,與其從盛大離職后的競業(yè)禁止協(xié)議解禁有關(guān)。“云知聲這一年的飛速成長(cháng),與黃偉的幕后操盤(pán)緊密相關(guān)。”上述人士表示。
對此安排,有知情人士透露,黃偉對資本方等較為熟悉,更容易掌控全局。梁家恩是典型的技術(shù)型人才,專(zhuān)注技術(shù)更為適合。“在盛大創(chuàng )新院時(shí)黃偉是梁家恩的領(lǐng)導,創(chuàng )業(yè)后先由梁家恩擔任CEO,黃偉在幕后。條件許可后,黃偉再走到前臺,這很順利成章。”
作為創(chuàng )業(yè)公司,云知聲一年的成長(cháng)有目共睹。“在語(yǔ)音識別領(lǐng)域,百度已經(jīng)做了一年多,云知聲也做了一年多,但是云知聲的識別技術(shù)比如識別的準確度已經(jīng)比百度高出一大截。”一位語(yǔ)音識別的從業(yè)人士這樣評價(jià),“在語(yǔ)音識別的創(chuàng )業(yè)公司中,云知聲是做的最好的。”
梁家恩把創(chuàng )業(yè)的階段性成功歸因于強大的核心技術(shù)團隊和平臺技術(shù)團隊,能夠在一年時(shí)間里,實(shí)現上市公司需要3-5年才能構建的語(yǔ)音識別服務(wù)平臺。“一年來(lái),語(yǔ)音識別錯誤率下降60%,識別速度提高3倍以上。”云知聲CEO梁家恩對騰訊科技表示。
在這個(gè)節點(diǎn)上,在語(yǔ)音識別領(lǐng)域的大爆發(fā)的前夜,復盤(pán)云知聲一年的黑馬式崛起,頗有一番意味。
語(yǔ)音識別產(chǎn)業(yè)大爆發(fā)
“所有手機制造商都在投資語(yǔ)音、拓展語(yǔ)音技術(shù)領(lǐng)域的投資,打造更優(yōu)雅的設計并 將其深入集成到手機中。”美國最大的語(yǔ)音識別技術(shù)公司Nuance高級副總裁邁克爾•湯普森這樣說(shuō)。
在推出Siri應用兩年后,今年蘋(píng)果在麻省理工大學(xué) (MIT)附近組建神秘辦公室,用以做Siri 語(yǔ)音識別技術(shù)的研發(fā)。微軟正在研發(fā)代號為“Cortana”自有語(yǔ)音個(gè)人助手軟件,并計劃在下一個(gè)Windows Phone平臺大升級中推出,以抗衡Google Now及Siri。至此,蘋(píng)果、谷歌、微軟、英特爾等國際巨頭均重金投入語(yǔ)音識別技術(shù)。
在中國市場(chǎng)上,語(yǔ)音識別技術(shù)公司也有幾大派別較力:
第一派來(lái)自互聯(lián)網(wǎng)巨頭在語(yǔ)音識別技術(shù)上的布局,比如騰訊、百度、搜狗等圍繞自己的產(chǎn)品生態(tài)系統做語(yǔ)音技術(shù),用來(lái)為產(chǎn)品服務(wù)。微信的語(yǔ)音對講應用已經(jīng)成為人們日常聯(lián)絡(luò )的必備。360也有意進(jìn)軍語(yǔ)音識別領(lǐng)域,曾傳出與科大訊飛談合作事宜,但至今未有明確信息。
第二派來(lái)自專(zhuān)業(yè)的語(yǔ)音語(yǔ)義識別公司在移動(dòng)互聯(lián)網(wǎng)上的延伸。比如科大訊飛去年專(zhuān)門(mén)成立移動(dòng)互聯(lián)網(wǎng)事業(yè)部做移動(dòng)應用,美國的Nuance在上海也設立辦事處拓展以多語(yǔ)種語(yǔ)音識別應用為主的中國市場(chǎng)。
第三派來(lái)自于新興的創(chuàng )業(yè)公司,如云知聲、思必馳等,具有互聯(lián)網(wǎng)公司的基因,長(cháng) 勢兇猛。還有一派專(zhuān)做部分語(yǔ)音語(yǔ)義技術(shù)的應用,比如擅長(cháng)語(yǔ)義解析的蟲(chóng)洞(獲微軟首期云加速器項目支持)、智能360(周鴻祎做天使投資),以及做微信語(yǔ)音 生活搜索的出門(mén)問(wèn)問(wèn)(前谷歌語(yǔ)音識別技術(shù)員工李志飛創(chuàng )辦),他們自己做語(yǔ)音語(yǔ)義識別應用的一部分,另一部分技術(shù)會(huì )借助科大訊飛等廠(chǎng)商的技術(shù)來(lái)完成。
剛剛過(guò)去的幾個(gè)月,基于語(yǔ)音識別技術(shù)的角力進(jìn)入前所未有的白熱化階段。 9月7日,創(chuàng )業(yè)公司思必馳宣布重新定義人機交互體驗的方向,高調推出基于語(yǔ)音識別和語(yǔ)義理解的人機對話(huà)。9月中旬,老牌語(yǔ)音技術(shù)公司科大訊飛宣布自主研發(fā)的離線(xiàn)語(yǔ)音聽(tīng)寫(xiě)引擎將于9月下旬正式發(fā)布,將應用于“訊飛輸入法”等產(chǎn)品。10月19日,云知聲在確認融資消息的同時(shí),也發(fā)布了離線(xiàn)語(yǔ)音聽(tīng)寫(xiě)技術(shù),并發(fā)布了語(yǔ)義云。今年10月28日,科大訊飛語(yǔ)音云發(fā)布三周年,訊飛語(yǔ)音輸入法用戶(hù)超過(guò)1億。
黃偉的故事
在這輪語(yǔ)音識別技術(shù)熱潮中,有個(gè)身影本該成領(lǐng)頭羊但卻落寞四散缺席,那就是盛大。
與科大訊飛相比,盛大當年的語(yǔ)音識別技術(shù)并不弱。曾經(jīng)領(lǐng)導盛大的語(yǔ)音識別團隊的核心人物是黃偉。同劉慶峰一樣,黃偉畢業(yè)于中國科學(xué)技術(shù)大學(xué),2004年加入摩托羅拉中國研究中心(MCRC)擔任資深研究員。在摩托羅拉工作期間,他帶隊開(kāi)發(fā)出世界上首個(gè)手機聲紋認證系統,并完成多項語(yǔ)音交互產(chǎn)品研發(fā)。但在金融危機期間,摩托將整個(gè)語(yǔ)音識別團隊出售給Nuance。
黃偉拒絕被Nuance收編,于2009年7月加入盛大網(wǎng)絡(luò )旗下的創(chuàng )新院,2010年10月創(chuàng )建了語(yǔ)音分院,力圖將語(yǔ)音識別技術(shù)與盛大旗下的互動(dòng)娛樂(lè )系統相結合,延展到用戶(hù)端。
2010年,盛大語(yǔ)音團隊在美國國家標準技術(shù)署(NIST)舉辦的聲紋識別評測(SRE)大賽中,力壓麻省理工、斯坦福研究中心、IBM等眾多名校、名企,在在9個(gè)單項任務(wù)中獲得5個(gè)單項第一,整體綜合指標第一。
梁家恩畢業(yè)于中國科學(xué)技術(shù)大學(xué),隨后進(jìn)入中科院自動(dòng)化所工作,2011年加入 盛大創(chuàng )新院,在盛大語(yǔ)音分院工作,擔任高級研究員一職。不過(guò),隨著(zhù)2012年盛大創(chuàng )新院的戰略調整,語(yǔ)音團隊從創(chuàng )新院剝離到盛大掌門(mén)科技,由陳大年掌管。語(yǔ)音團隊的成員開(kāi)始各尋出路。
盛大語(yǔ)音團隊的幾個(gè)人選擇了創(chuàng )業(yè),同樣做語(yǔ)音識別,定名為“云知聲”。但云知聲更傾向于強調自己的技術(shù)積累來(lái)自于中科院自動(dòng)化所,而非之前曾工作過(guò)的盛大。
黃偉在其中的角色耐人尋味。
2012年夏天,盛大創(chuàng )新院離職員工QQ群里,傳來(lái)了黃偉創(chuàng )辦云知聲的消息。一位前盛大創(chuàng )新院?jiǎn)T工表示,“黃偉是盛大創(chuàng )新院高管中最早離開(kāi)創(chuàng )新院的,他去創(chuàng )辦了云知聲。”
但云知聲官方否認黃偉在云知聲團隊中。
來(lái)自云知聲的官方消息顯示,公司創(chuàng )始人有兩位,一位是梁家恩,擔任公司CEO,另一位是康恒,擔任公司CTO,負責平臺業(yè)務(wù)部。
對于黃偉與公司的關(guān)系,騰訊科技曾向云知聲市場(chǎng)負責人求證此事。該負責人表示,“黃偉和我們公司沒(méi)有什么關(guān)系。”但他也表示,黃偉和梁家恩是師兄弟關(guān)系,也會(huì )指導云知聲的業(yè)務(wù)。
云知聲的內部人士透露,黃偉離開(kāi)盛大研究院后創(chuàng )辦了移動(dòng)互聯(lián)網(wǎng)應用音樂(lè )雷達,和云知聲團隊在同一座大廈辦公。網(wǎng)站信息顯示,兩家公司都在北京海淀區財智國際大廈C座,云知聲在15層,音樂(lè )雷達在19層。
音樂(lè )雷達的一家合作伙伴的負責人證實(shí)黃偉是音樂(lè )雷達的創(chuàng )始人之一,并和黃偉談過(guò)音樂(lè )方面的合作。對于外界對黃偉和云知聲之間關(guān)系的猜疑,他表示,“不出面創(chuàng )立公司,但可能通過(guò)代持的方式運營(yíng)公司,這在圈里也比較正常。”
互聯(lián)網(wǎng)的節奏
對云知聲而言,過(guò)去一年來(lái),以快取勝、唯快不破的節奏在語(yǔ)音識別領(lǐng)域快速擴張業(yè)務(wù),打造知名度。在與其他公司的語(yǔ)音技術(shù)解決方案不相上下的情況下,云知聲采取先搶占市場(chǎng)后再優(yōu)化的策略。
去年11月,云知聲和搜狗語(yǔ)音助手達成合作,今年3月,和錘子科技達成合作,5月和樂(lè )視TV達成合作,8月又和inwatch、易信達成合作。云知聲和科大訊飛比肩一道出現在在小米、聯(lián)想、智能360語(yǔ)音助手等很多合作伙伴的語(yǔ)音識別方案中。
梁家恩透露,從和搜狗團隊見(jiàn)面到第一個(gè)產(chǎn)品模型出來(lái)只花了兩個(gè)星期,而這個(gè)時(shí)間可能其他公司連商務(wù)條款還談不下來(lái)。樂(lè )視電視的合作也類(lèi)似,從第一次和樂(lè )視團隊接觸到內部系統跑通到在發(fā)布會(huì )上發(fā)布只用了1個(gè)月的時(shí)間。
還有一個(gè)合作客戶(hù)——錘子科技。CEO羅永浩出了名的挑剔。今年,錘子ROM發(fā)布會(huì )前一周,老羅在抱怨語(yǔ)音識別方案遲遲未出,當晚云知聲公司CTO已經(jīng)將產(chǎn)品集成和錘子科技團隊進(jìn)行對接。最終,云知聲和科大訊飛同時(shí)入圍錘子ROM的語(yǔ)音解決方案。
與之前的課題研究迥然不同,梁家恩發(fā)現,創(chuàng )業(yè)一年來(lái),團隊一直糾結技術(shù)層面的東西,他認為和實(shí)際業(yè)務(wù)結合更關(guān)鍵,也更重要。“做成也是技術(shù)好,做失敗也是技術(shù)好”。
自去年發(fā)布語(yǔ)音識別公有云以來(lái),平臺上已經(jīng)有1000個(gè)開(kāi)發(fā)者加入。通過(guò)該開(kāi)放平臺,“可以把門(mén)檻降得足夠低,開(kāi)發(fā)者無(wú)需懂具體的語(yǔ)音語(yǔ)義技術(shù),只需要調用云知聲的服務(wù),就可做應用創(chuàng )新。”
在開(kāi)放平臺背后,隱藏著(zhù)云知聲的商業(yè)模式邏輯:通過(guò)語(yǔ)音語(yǔ)義平臺將各家的App聯(lián)通,用戶(hù)數據也會(huì )集中到平臺上,將各個(gè)環(huán)節貫通從而實(shí)現廣告等商業(yè)價(jià)值。
梁家恩把它比擬為一種類(lèi)似Google adsense的模式,雖然每家的量很小,但是通過(guò)聚合可以產(chǎn)生商業(yè)利益,各個(gè)參與方可以分成。
互聯(lián)網(wǎng)的創(chuàng )業(yè)節奏讓云知聲嘗到了甜頭,接下來(lái)也有風(fēng)險和挑戰。
一個(gè)是來(lái)自平臺化的風(fēng)險。“騰訊、百度做語(yǔ)音識別都是圍繞自己的主營(yíng)來(lái)設計,在生態(tài)系統內來(lái)做,也會(huì )進(jìn)行開(kāi)放平臺的建設。”上述語(yǔ)音識別的從業(yè)人士認為,相比較其他已經(jīng)有穩定商業(yè)模式的公司涉足語(yǔ)音識別應用而言,初創(chuàng )公司做平臺的風(fēng)險更大。
對云知聲而言,另一個(gè)隱憂(yōu)是尚未有核心的移動(dòng)互聯(lián)網(wǎng)產(chǎn)品。目前來(lái)看,云知聲嘗試做語(yǔ)音輸入法插件,但主要業(yè)務(wù)是從語(yǔ)音識別解決方案切入,走技術(shù)驅動(dòng)路線(xiàn)。“創(chuàng )業(yè)公司必須有自己的產(chǎn)品和服務(wù),沒(méi)有產(chǎn)品,很難承載用戶(hù)數據,商業(yè)利益挖掘更難。”
相關(guān)閱讀