“隱形巨頭”聲網:實時音視頻技術支持者浮出水面
多年以後,2020年會從許多切面上被定義為變革的一年。其中之一是,實時音視頻技術徹底變成了一項基礎設施級別的能力。一年的時間裡,成熟的視頻會議模式出現,在線教育在爭議中成為共識,新的實時語音聊天風靡一時。人們的生活越來越多地基於實時音視頻服務展開,更多人也開始關注支撐這些應用場景背後共通的底層技術。
文/油醋
一家叫做聲網(Agora)的幕後技術支持者也終於浮出水面。
神秘的技術公司
成立於2013年的聲網是一家專注於音視頻實時互動的的雲服務商。以ToB業務為主的聲網主要以提供應用編程接口(API)的模式與開發者合作,後者得到即插即用的技術支持,而聲網則向開發者收取服務費用。許多炙手可熱的在線教育公司以及實時音頻社交媒體都是聲網的客戶。
2020年疫情之下,全球範圍內對於實時音視頻技術的爆發式需求在一定程度上促成了聲網在服務規模上的質變。一年內聲網的實時音視頻月均用量超過400億分鐘,累計純RTC(real-time communication)的PaaS實時音視頻分鐘數超10,000億分鐘。公司也在去年6月奔赴納斯達克上市,到現在為止,其股價已經從IPO發行價的單股20美元漲到57.33美元。
從開發者到資本市場都在持續看好這家公司,光亮之下,其濃重的技術基因也越發顯眼。
從2014年在矽谷成立開始,聲網的核心團隊就在音視頻領域有著非常強的技術能力。
CEO趙斌在2005年從矽谷回國創辦泥巴網,幾年後以CTO身份加入YY語音,帶著包括後來出任YY技術委員會主席的陶思明(後擔任聲網CTO現已離職)在內的技術團隊重寫了底層技術後,直接在2012年將YY語音提升為一個月活6600萬人以上的現象級語音產品。YY語音在2012年就實現了4000 億分鐘的語音通話服務,這個產業所蘊含的巨大前景也成為趙斌離開YY語音創辦聲網的原因。
聲網首席科學家鐘聲也背景堅實,曾任海信芯片總經理、博通資深主任科學家、華亞微電子技術副總裁。在美國擁有50餘項技術專利,在中國擁有超過20項技術專利。同時鐘聲也曾是MPEG/JVT (H.264)與INCITS主要成員,IEEE成員,並發表了30餘篇論文,內容覆蓋了模式識別、視頻編解碼、計算機視覺等技術領域。
鐘聲
團隊中的首席視頻科學家樓劍則是前摩托羅拉首席研究科學家,後曾作為前蘋果公司視頻架構師,參與蘋果公司第一、二、三代視頻編解碼器的算法研究和開發,參與的產品和功能包iPhone,iPad和Mac上的FaceTime,AirPlay,視頻錄像和視頻轉碼等。擁有22項美國專利授權和18項中國專利授權。
這種技術特質也更直觀的體現在研發投入上。財報顯示,聲網在2020財年的研發投入達到4950千萬美元,連續三年的投入漲幅都在100%以上。而2020年同比增長了109.5%,高於總營收107.3%的漲幅。
聲網在財報中解釋其研發投入的增長主要來自充實研發團隊所致的人員成本增加,而在上個財年末尾,聲網研發人員總數達282人,占到總數的57%。
聲網走向“聲場”
聲網成立之初,國內在移動端實時音視頻互動這方面鮮有服務商玩家。直到聲網在去年實現實時音視頻分鐘數月均用量(1600億分鐘)同比4倍增長,大家才意識到它已經是一個強大的技術平台公司。
越來越多的人關注到這家公司,質疑也隨之而來。
由於業務擴大帶來的帶寬與託管成本增加,以及服務器等設備的折舊費用增加,聲網在2020年第四季度的淨虧損和毛利率都有所下降。並且在2020年度財報中,聲網依靠實時音視頻服務的收入佔比仍然高達98.2%,延續了過去兩年佔比高於98%的情況。
作為一家上市公司,收入結構單一總不免讓人擔心。在招股書中被聲網作為競爭對手提及的美國公司Twilio,雖然主要營收也來自開發者的服務費用,但其同時也推出短信驗證碼、短信通知等服務來分散收入結構單一化帶來的風險。
同樣的發展路徑聲網無法複製,圍繞服務儘早佈局生態可能是另一條路。
趙斌曾表示2017年以前的聲網“實際上沒人用,也不知道誰需要”,而從聲網最近的一些收購行為來看,曾經模糊的應用方向現在逐漸清楚——在線場景和即時通訊。
今年1月28日,聲網發佈公告稱完成了對在線互動白板公司Netless的全資收購,同時在一季度內將會完成對軟件服務提供商環信的收購。前者是一家專攻在線教育、在線會議以及其他協作辦公場景的互動白板服務商,後者則是國內領先的即時通訊雲和客服雲服務商,阿里、騰訊、猿輔導等用戶體量巨大的互聯網公司都是其客戶。
兩筆收購的指向性明確,使得聲網在兩個確定方向上作為一站式解決方案的服務能力進一步提升,也正在實現自己從RTC向RTE(Real-Time Engagement )——即將包括IM,白板等在內的豐富技術組合搭載於RTC之上——的轉變。與此同時,這個將自己定義為開發者社區的公司也還不急於走到台前,此刻更像一個手裡攥著技術找項目的投資人角色。
在前日“聲網Agora創業支持計劃”的發布會上,聲網Agora市場運營副總裁曹璐提到了“聲場”這個概念。曹璐表示,未來的競爭不在技術或者產品層面,而在生態。在一個以語音作為底層技術的場域裡,聲網的生態圈正在形成。
“在之前很長一段時間之內,我們的生活都依賴著在線遠程的方式推進,有的人會說既然這個時期已經結束了,會不會回到從前?我們的觀察是,已經回不去了。因為大家會發現線上跟線下的結合,往往能夠拓寬到更多的場景,讓大家的體驗更加多維。”
隨著實時音視頻技術的未來空間已經不再是“遠見”,聲網所面臨的另一個憂慮在於當更多具備研發實力的大廠強勢入場,聲網在技術能力上的優勢能否保持。
阿里巴巴與騰訊都在2018年發布了RTC的解決方案,騰訊會議更是在9個月內將用戶數量提升一億。大廠很容易依靠自己生態內的巨大流量對行業內的頭部公司形成顛覆。
於是對於聲網來說,儘早將技術優勢兌現到生態佈局上形成護城河顯得十分重要。而避開與大廠燒錢競爭的正面戰場,尋找那些賽道切入點更小但對行業理解很深的初創公司,對於聲網來說是更有收益的選擇。
語音社交軟件Yalla近日發布了2020年財報,年營收增長了113%,股價相比發行價上漲219%;線上活動平台Airmeet則在去年單季度用戶增長了2000%。兩家歸屬實時互聯網概念下的出海公司在同一時期迎來了數據增長,而Yalla和Airmeet也是典型的聲網生態圈內的公司。
“A輪以前的初創公司會是聲網投注最多關注的對象。”曹璐表示。
聲網“聲場”概念的核心,在於依靠實時互動的技術來搭建以API為合作模式的生態。對於開發者,聲網會贈送每年100萬的音視頻分鐘數,預計未來累計贈送的音視頻分鐘數將超過10億。當下的風口期逐漸縮短,抓住機遇的空檔轉瞬即逝,這使得一些具備潛力的產品可以免去一部分底層技術的開發時間成本,更快速的在市場裡跑起來。
聲網表示,100萬的分鐘數基本足夠讓一個產品馬上可以進入上線階段,並且找到痛點。也足夠驗證這家公司能否被市場接受。
許多初創公司已經通過這條路徑成為細分領域裡的獨角獸公司,甚至完成上市。狼人殺App在2017年爆紅後模仿者不絕,但至今仍然是社交遊戲類榜單中最熱門的幾款社交遊戲之一;而前面提到的Yalla已經在去年9月登陸美股,如今股價穩定在單股25美元。而在開發者方面,截止2020年末,聲網全球註冊應用已經超27.2萬。
在2020年聲網三季度財報電話會議中,摩根士丹利研究員向趙斌問起如何看待行業日益激烈的競爭,趙斌表示擁有業內最大的開發者社區也是聲網保持自身競爭優勢的底牌之一。
美國投資機構Mangrove Capital Partners在《2019年語音技術報告》中預測,語音經濟在2025年的規模將達到1萬億美元,超過移動應用經濟。雖然眼下與實時音視頻有關的產品已經種類繁多,但相關技術和整個行業仍然處於發展早期,聲網對於自身生態的打造也還播種大於收穫。而可以預計的是,這家隱形巨頭在未來會有更多故事可講。