3月29日,喜馬拉雅在港交所更新招股書。高盛、摩根士丹利和中金為聯(lián)席保薦人,騰訊、閱文、百度、小米、好未來、索尼音樂為戰(zhàn)略投資者。主要財務投資者包括美國泛大西洋投資集團、摯信資本、高盛、興旺投資、創(chuàng)世伙伴資本等。
招股書顯示,喜馬拉雅2019年-2021年的營業(yè)收入分別為26.8億元,40.5億元和58.6億元。2021年財年,喜馬拉雅總營收同比增長43.7%,業(yè)績呈穩(wěn)健增長態(tài)勢。全場景平均月活躍用戶達2.68億,同比增長24.4%。
目前,喜馬拉雅已擁有多元化變現(xiàn)渠道,付費訂閱、廣告、直播成為平臺變現(xiàn)的三大支柱。內(nèi)容生態(tài)健康持續(xù)發(fā)展,逐步形成以內(nèi)容生產(chǎn)、主播孵化、內(nèi)容分發(fā)為主的音頻生態(tài)圈,全鏈條生態(tài)布局正在形成。
據(jù)灼識咨詢數(shù)據(jù),就2021年的平均 MAU、總移動收聽時間和總收入而言,喜馬拉雅是中國領先的在線音頻平臺?!?021中國網(wǎng)絡視聽發(fā)展研究報告》顯示,喜馬拉雅的用戶滲透率達到67.1%,牢牢占據(jù)著在線音頻行業(yè)第一梯隊的地位,持續(xù)引領著“耳朵經(jīng)濟”蓬勃發(fā)展。
招股書顯示,2021年,喜馬拉雅的研發(fā)開支為人民幣10.27億元,同比增長64.6%占同期總收入的17.5%,技術和研發(fā)人員占比近40%??蒲屑夹g投入不斷增加,夯實了基礎設施能力,強化了AI和大數(shù)據(jù)的建設,是面向長期可持續(xù)價值的投入。
一方面,喜馬拉雅利用專有的人工智能和大數(shù)據(jù)技術對數(shù)據(jù)進行深度學習,建立了基于人工智能的發(fā)現(xiàn)和推薦機制和智能標簽系統(tǒng),以提高內(nèi)容分發(fā)的準確性和效率以及用戶體驗。
另一方面,專有技術也可以幫助內(nèi)容創(chuàng)作者更好地制作高質量的音頻內(nèi)容。例如,最先進的文字轉語音(TTS)技術能夠有效地將新聞、文章和書籍中的大量文本轉換為音頻。
近年來,喜馬拉雅的AI語音技術落地成果頗豐。喜馬拉雅布局AI是極具前瞻性的戰(zhàn)略動作之一,這為喜馬拉雅在下一個階段的發(fā)展提供了強力推進器。
技術革新撬動內(nèi)容生產(chǎn)升級
近年來, AIGC(AI-Generated Content,AI生成虛擬內(nèi)容)橫空出世。技術發(fā)展也改變著音頻領域的內(nèi)容思維,以TTS技術(Text-to-speech,語音合成)為代表的AIGC新技術產(chǎn)品正在一步步走向成熟,喜馬拉雅已在該領域潛心鉆研多年,助推AIGC從實驗室邁向AI合成音、AI演播、智能新聞播報等更多應用場景。
隨著音質傳輸?shù)纳墶⒅悄芙换サ纳罨?、終端場景的拓寬,在線音頻內(nèi)容消費時長伴隨著技術升級正在加速駛入發(fā)展快車道。根據(jù)易觀分析數(shù)據(jù)顯示,2021年中國“耳朵經(jīng)濟”市場的活躍用戶規(guī)模已達到8億人次,其中在線音頻細分市場的月活躍人數(shù)穩(wěn)定在3億人次,且呈現(xiàn)出穩(wěn)步上漲的態(tài)勢。
消費需求的增加亟需擴大內(nèi)容生產(chǎn)規(guī)模,提高內(nèi)容生產(chǎn)質量和效率一直是行業(yè)發(fā)展的重要問題。上個時代,軟硬件的技術發(fā)展推動了UGC成為了內(nèi)容生產(chǎn)的重要模式。今年將迎來十周年的喜馬拉雅是這個時代跑出來的“內(nèi)容生態(tài)前行者”,其擁有的完善的UGC內(nèi)容創(chuàng)作者生態(tài),通過給用戶更便捷的音頻創(chuàng)作工具及拓展更多音頻品類(如播客)來激勵普通用戶參與創(chuàng)作、分享音頻,從而增加平臺上長尾內(nèi)容。
UGC模式在技術助力下拓寬對于“內(nèi)容生產(chǎn)者”的界定,通過抹平內(nèi)容生產(chǎn)和消費的嚴格劃分、釋放內(nèi)容生產(chǎn)力。但這種技術的應用歸根到底是基于對于人的使用,當內(nèi)容生產(chǎn)者和消費者的生產(chǎn)潛力都被消耗殆盡,內(nèi)容消費需求的缺口又能由什么來填補?
答案就是AI。人工智能未來將催生新的內(nèi)容生產(chǎn)形式,當生產(chǎn)不局限于人的時候,生產(chǎn)力也將迎來空前解放。
AIGC——音頻內(nèi)容革命的下一站
年初,喜馬拉雅自研的跨語言語音合成創(chuàng)新技術論文,及其與中國科學技術大學合作的說話人日志技術研究論文,均被世界頂級學術會議“2022年IEEE國際音頻、語音與信號處理會議”(2022 IEEE International Conference on Acoustics, Speech, and Signal Processing,ICASSP 2022)收錄,并受邀于今年5月在新加坡舉辦的會議上向全球展示相關技術成果。
ICASSP 2022是ICASSP 第47屆會議,會議主題為“以人為本的信號處理”,“以人為本”這一理念也是喜馬拉雅技術發(fā)展的驅動力之一。喜馬拉雅CTO姜杰表示,我們在技術的創(chuàng)新和應用中很重視觀察人和AI交互協(xié)同能產(chǎn)生什么全新的價值增量。音頻內(nèi)容呈現(xiàn)更智能化的趨勢背后,將是AIGC對于喜馬拉雅原有的UGC+PGC+PUGC的音頻生態(tài)的進一步豐富。
l 以AIGC延展PGC,AI合成音精準還原單田芳先生“云遮月”嗓音
相比于機器人來說,人最大的差別就在于個體化之間的不可復制性,杰出的音頻內(nèi)容生產(chǎn)方被消費者選擇也恰恰是因為他的獨特性。例如我國著名評書藝術表演大師單田芳先生,善以聲音塑造角色,其標志性的“云遮月”嗓音成為了獨一無二的內(nèi)容符號,在民間有著“凡有井水處,皆聽單田芳”的說法。
如果能將單田芳先生的聲音解碼,再進行重新編碼,就能突破內(nèi)容創(chuàng)作的局限性,實現(xiàn)原音重現(xiàn),讓人們享受到更多單田芳先生的優(yōu)秀作品,喜馬拉雅已在2021年實現(xiàn)了這一點。喜馬拉雅智能語音實驗室利用TTS技術,并自主設計了單獨的韻律提取模塊,并將其融入到 HiTTS 技術框架中,讓單老的AI合成音仿佛本尊再現(xiàn)。
目前,喜馬拉雅上已有80多部運用還原自單田芳先生聲音的AI合成音制作的專輯,這些專輯在喜馬拉雅也一直深受用戶喜愛,多張評書專輯長期位列喜馬相聲評書熱播榜前列,例如《臥虎藏龍》《蜀山劍俠傳》等。
不僅如此,喜馬拉雅被ICASSP 2022收錄的自研跨語言語音合成技術,甚至在未來可以讓我們聽到單田芳先生的“聲音”來播講英文內(nèi)容。也許在不久的將來,“單田芳英文聲音重現(xiàn)”將與此前官方授權的“單田芳評書” 和“單田芳聲音重現(xiàn)”共同構成全新的“單田芳IP”矩陣。
AIGC正在成為人類PGC的延伸,以立體、真實的方式突破助力PGC突破空間、時間的局限,使PGC內(nèi)容體系化得到了一次質變的提升發(fā)展。
l 以AIGC創(chuàng)造PUGC,“AI續(xù)寫+AI主播”閉環(huán)生產(chǎn)展現(xiàn)廣闊前景
隨著技術的發(fā)展,AI不僅是一種技術載體,也逐漸成為了一種人格象征。喜馬拉雅基于自研的TTS框架,并采集頭部主播“喜道公子”的真聲打造了AI主播“喜小道”,而基于大規(guī)模語言模型自研的自然語言處理模型的續(xù)寫應用“彩云小夢”已經(jīng)可以實現(xiàn)小說故事的AI創(chuàng)作,只需要給她一個1-1000字的開頭,它就能為你續(xù)寫出后面的故事。
借助自己AI智能技術有聲化的優(yōu)勢,喜馬拉雅的AI主播“喜小道”與彩云小夢續(xù)寫AI合作,打造了首個從故事創(chuàng)作到演播均由AI完成的AI電臺。據(jù)了解,彩云小夢入駐為喜馬拉雅旗下網(wǎng)文創(chuàng)作平臺奇跡文學的寫手,將其作品經(jīng)AI主播“喜小道”有聲化后,發(fā)布在喜馬拉雅平臺。
“AI續(xù)寫+AI主播”的方式證明了AIGC已經(jīng)擁有了自己形成完整生產(chǎn)閉環(huán)的能力,更誕生了一種全新的以“AIGC”功能為基礎的“PUGC”,展現(xiàn)了AIGC及AI技術賦能創(chuàng)作廣闊前景。
l 當AIGC遇上UGC,想象力與算力碰撞后的指數(shù)增長
目前,AIGC由于技術成本和規(guī)格限制,更多集中在對于PGC和PUGC的加持上,未來如果AIGC成為每個UGC手中的工具時,AIGC強大的算力思維和UGC的蓬勃的內(nèi)容創(chuàng)作活力將在提升創(chuàng)作效率的同時,進一步豐富內(nèi)容的多樣性
相關行業(yè)專家表示,在無監(jiān)督學習、深度強化學習、遷移學習、生成對抗網(wǎng)絡等算法深入研究的基礎上,AI的算力將越發(fā)強大,其背后自運算與強適應的特征能夠完美匹配每一個內(nèi)容生產(chǎn)者,指數(shù)級釋放UGC內(nèi)容創(chuàng)作的活力,帶來多樣且生動的內(nèi)容創(chuàng)作光譜,有著非常大的想象空間。
當每一個人都擁有一個可以幫你定制化解決問題的“大白”,每一個內(nèi)容創(chuàng)作者都將可以擁有一座自己的“喜馬拉雅”。
技術勢能釋放商業(yè)價值新想象
對于消費者來說,AIGC是對于內(nèi)容的加持是一次成功的探索。艾媒咨詢《2021年中國耳朵經(jīng)濟發(fā)展專題研究報告》顯示,超過六成受訪用戶認為AI合成音頻比普通音頻節(jié)目更有趣,55.4%和48.5%的用戶認為合成技術能增加內(nèi)容豐富度和提高現(xiàn)有的音頻節(jié)目質量。
在AIGC對于內(nèi)容如此強大的增益背后,對于國內(nèi)音頻產(chǎn)業(yè)而言,技術越來越成為行業(yè)的重要競爭維度。易觀報告顯示,2021年,以喜馬拉雅為代表的主流平臺不斷投入技術研發(fā),通過提升工業(yè)化水平,助力創(chuàng)作者實現(xiàn)更優(yōu)質的內(nèi)容表達。喜馬拉雅等頭部音頻平臺憑借自身的技術、團隊、資金等優(yōu)勢深耕有聲書、有聲劇等賽道,豐富內(nèi)容樣態(tài)。
商業(yè)規(guī)模帶動技術創(chuàng)新,技術創(chuàng)新反哺市場選擇,形成了一種喜馬拉雅商業(yè)規(guī)模和技術發(fā)展雙驅動之下的良性網(wǎng)絡。據(jù)了解,喜馬拉雅已在AI語音技術領域潛心鉆研多年,并在內(nèi)部專門成立了喜馬拉雅智能語音實驗室這一核心部門,長期專注于語音合成、識別、語音信號處理、編解碼以及智能音效的研究和開發(fā)。喜馬拉雅智能語音實驗室盧恒表示,未來,喜馬拉雅將持續(xù)投入語音技術的研發(fā)升級,不斷創(chuàng)新和突破,進一步打開對于聲音的理解和想象,讓技術加持聲音、讓聲音服務生活。
這種價值的轉化不僅體現(xiàn)在平臺本身,更在平臺對于合作伙伴的價值外溢上。2021年,眾多主流媒體加速入駐喜馬拉雅,借助喜馬拉雅TTS技術加速制作新聞類音頻節(jié)目,快捷地實現(xiàn)了文字報道向音頻的轉化。智能化、無人化的播報正在實現(xiàn),極大降低了運行成本和操作門檻,批量化處理的語音合成技術保障了內(nèi)容生產(chǎn)與播報的及時性。相關行業(yè)從業(yè)者表示,這種播報方式也開辟了音頻新媒體的新賽道,讓優(yōu)質報道有了觸達用戶的新方式,突破了內(nèi)容傳播的閾值,為傳統(tǒng)廣播媒體行業(yè)帶來新變革。不止是新聞播報,艾媒咨詢報告顯示,在線音頻行業(yè)應用TTS技術產(chǎn)出高質量仿真語音,快速完成文本到語音的轉化過程,極大加速了網(wǎng)絡文學到音頻內(nèi)容的生產(chǎn)能力,擴充了內(nèi)容傳播的渠道??梢灶A見,在音頻平臺頂流的小說領域,喜馬拉雅將會實現(xiàn)多音色自動識別朗讀,在音頻技術上進行突破。
AIGC不僅代表了一種技術價值的想象,其背后更是商業(yè)價值的全新拐點。報告顯示,超過七成受訪用戶對AI技術在在線音頻領域的發(fā)展前景看好。艾媒咨詢分析師認為,隨著AI智能產(chǎn)品的普及以及用戶需求持續(xù)攀升,在線音頻行業(yè)的創(chuàng)新內(nèi)容仍具有較大的潛力和發(fā)展空間。喜馬拉雅如何進一步利用AIGC的“智能大腦”助力內(nèi)容創(chuàng)作,值得期待。