把國產劇賣到非洲,80后小伙衝進福布斯榜
來源:倍可親(backchina.com)5月,2025福布斯中國人工智慧科技企業TOP50榜單發布,「趣丸科技」在其中的顯眼,不單單因為它是廣州唯一一家上榜的企業,還因為它很「臉生」。搜索這家公司,它更被熟悉的身份,是以興趣(遊戲)社交、電競為招牌的一家網際網路「中廠」。
實際上,趣丸科技在AI領域動作頻頻。
去年,趣丸先後推出「音頻大模型」MaskGCT和「音樂大模型」天譜樂,兩個模型初步證明了趣丸的AI能力。今年,趣丸在社交大模型上也有所探索,預備在「AI+社交」的賽道上拿出「殺手鐧」。
AI領域高手如雲,一家多年耕耘細分領域的網際網路公司何以闖入,以至「榜上有名」?
趣丸科技/受訪者供圖
南風窗近日專訪了趣丸科技創始人宋克,他講述的,不只是一個網際網路公司「轉型」的故事,更是一個有十多年履歷的創業老兵對AI時代的理解與思考。
不難發現,趣丸推出的模型,針對的依然是細分領域,音頻、音樂、社交等等。比起那些高呼生產力、揚言要「顛覆底層邏輯」的大模型公司或者「AI原生」公司,似乎是不務正業。宋克告訴南風窗,這背後關係到對AI能力及其商業化邏輯的思考,趣丸的「玩物喪志」,是有意而為。
AI必然要改變世界,但改變的方式還不一定。風起至今,「小龍」「小虎」們幾起幾落,市場冷靜后,發現追求「革命性的顛覆」既非坦途,也不是唯一的路。
從X到AI
中國大部分AI創企的故事,要從2023年前後、也即ChatGPT「出圈」后講起,但趣丸的「轉型」時間更早。
2021年,在「語音+社交」領域站穩的趣丸,一度陷入焦慮。「我們在移動網際網路的新產品,都敗了。」宋克直白地說,那個時期,公司發現不管哪一個賽道,都已經有巨頭把持,難再入局。因此,趣丸內部開會探討,要做一家怎樣的公司並持續創新?
宋克平頭,微胖,「80后」,曾經是個「網癮少年」。趣丸做興趣(遊戲)社交,擁有四支電競隊伍,用他的話說,是「把興趣做成了事業」。
追問他自認為的高光時刻,他說出兩個,都與遊戲相關:一個是在2013年9月到10月,他剛到廣州創業一兩個月,在第一個月賺到29萬,「真的是(靠)打遊戲賺到了錢啊」,他加重語氣強調;另一個仍是創業初期,那是趣丸的遊戲社交應用「TT語音」用戶達到30萬人的一刻,從此團戰叫人不再麻煩,也不用多花簡訊費用,「太開心了」,宋克講道。
TT語音曾經的品牌代言人為楊超越
有這樣的經歷,宋克把「興趣創造價值」作為了趣丸的價值主張;他也會在公司里強調,時下年輕人流行什麼,大家就一定要去研究和嘗試,「用好奇心保持活力」。
回到2021年,趣丸內部討論過後,成立了一個叫「X」的項目組。宋克說,這是個探索技術的團隊,對他們沒有KPI及任何的考核,也不設置盈利目標,任務只是去調研市場上最新的技術,項目組有十幾個人,「不能說是技術很牛的人,但一定是對技術很有興趣和追求的人」。
宋克的想法是,既然用戶的需求已經被解決了,那麼趣丸能做的,是找到新的技術再「反攻」。這表明,趣丸針對的還是「老的」網際網路市場,只是在探索過程中,發現一些需求只能由AI來滿足,或者AI能夠更好地滿足。
2021年,OpenAI的GPT-3已經震驚AI圈內,但大模型還不是一門顯學。趣丸一開始的探索,也不是沖著AI去的。
OpenAI的GPT-4o模型評估
「大事都是從一個很小的點開始。」宋克說。趣丸拿住了語音賽道,但短視頻明顯正在升溫,宋克想到,很多聲音好聽的人,不一定希望以真人形象出鏡,「我們當時想到直播時,把主播的臉換成動漫臉這樣的技術」。2021年、2022年,「換臉」還不像今天這樣普遍。
但是技術攻克下來,產品上線以後,用戶不買賬。用戶會覺得,換臉的主播一定不好看,不然為什麼換臉呢?於是,這項技術就被擱置起來。
2023年,元宇宙爆火,讓宋克靈光一閃。元宇宙打造的「數字孿生」,把真人數字化,實質也是換臉,只不過是把真人臉換成同一張數字人臉。「我們儲備好了這項能力,甚至所有工程都不用再開發。」宋克說,於是趣丸快速切入,成為美團數字人直播的第一家技術提供商。
入局以後,關於聲音的技術問題自然浮出。
數字人直播早期,可選音色少,語音複製也很粗糙,更關鍵的是,虛擬的聲音「機器味」太重,「說話沒有人味」,觀眾自然不愛看。
數字人直播早期並不受歡迎
此時,大模型已憑藉對自然語言的理解能力大為火熱,宋克想到,越過「恐怖谷」的最好辦法,可能是將大模型對文本的理解與輸出能力,平移到語音領域。
這就是趣丸「音頻大模型」MaskGCT的序章,也是趣丸轉型AI的脈絡。如今的X項目組改名為人工智慧事業部。宋克在採訪中一直強調,趣丸不是為了AI而AI,而是在發現用戶需求與解決問題的邏輯下,順其自然。
AI前後,同與不同
宋克還記得ChatGPT帶來的震撼,它把AI分出前後兩個時代。趣丸最開始做數字人的時候,用的是傳統建模技術,「特別麻煩」。宋克說,過程中用到很多相機,對一個人拍個半天,這人還要說很多的話,才能做出來。
類似的效果,在大模型時代只需說一句話。
ChatGPT以前也有AI,「那時候演演算法+規則,我們就叫AI了」。宋克用趣丸旗下產品「唱鴨」的歌麴生成為例,「演演算法+規則」時期,和今天一樣輸入歌詞,也能得到一首歌,但「生成」過程由編程好的規則來定,什麼曲風,用什麼調,供用戶挑選,「真的是人工加智能」。宋克笑道。
接觸了ChatGPT不久,宋克認為,生成式AI是未來最大的一個機會,趣丸要變了。
生成式AI將會是未來最大的一個機會
「生成式AI不是每一首歌都比演演算法+規則機制的好,但是它的上限很高、下限很低,這是最大的不同。」宋克說。趣丸意識到,趣丸一定要變化,一定要開始去積累數據,要自己下手訓大模型。
公司一把手的「行動力」和「決心」,要從預算上來體現。宋克介紹,趣丸並不是一家激進的公司,主營業務的成本很高,但這成本投下去,看得到營收。「平時團隊花錢是很摳門的,預算的審批也很慢。」他坦言道。
但他這次變了風格。「我當時逼著團隊報預算。」宋克回憶說,每個部門都要報預算,要多少張卡、多少機器,「一次性批掉」,接著公司去找各個雲算力廠商談檔期,爭取算力。
因為反應快,2023年後一段時間顯卡與算力的緊張,沒對趣丸造成什麼影響。
宋克列舉了一項數據,「2024年,花在(訓模型)這方面的預算就有1.45億」,這對趣丸來說是一筆很大的花銷。
趣丸科技數字人/受訪者供圖
砸下重金,宋克看中的是大模型與應用的先發優勢。數字人直播賣貨,其效果受制於它的數據積累。「大家都做數字人直播,技術很快就能追平,但是我的數字人已經賣了幾年的貨,數據積累多,銷售數據高,對一個商家來說該選擇誰,這是很明顯的。」宋克說。
數據的「護城河」,疊加強化學習帶來的先發優勢,是AI與移動網際網路時代的一大區別。宋克表示,在過去,產品可以直接抄襲,比拼財力、規模,比講故事的能力,但這在AI時代就不一定行得通了。
下了決心,不代表沒有煎熬。作為「創業老兵」的宋克,也不住地感嘆創業難。訓模型需要時間,做產品也需要時間,而且加起來時間不短,「重金」砸下去了,聽不見響。
「又激動又焦慮,(創業)就是這個狀態。」模型能不能訓出來,訓出來后好不好用,應用側能不能掙到錢……沒有答案。趣丸作為老牌「中廠」,天然傾向於確定性高的事情,但宋克認為:「闖入AI,一切是未知的,可能會死。但你自己知道,如果不去做,你將來就等死。」
把國產短劇搬到非洲
2024年,趣丸的音頻大模型MaskGCT和音樂大模型 「天譜樂」問世。宋克說,趣丸是幸運的,訓出的模型能用、好用,如天譜樂,在當時已經十分接近行業領先的Suno的模型能力。
在MaskGCT項目立項前半年,2024年初,宋克已經想好模型的定位,七個字「情感情緒多語種」。這七個字的意思是,模型輸出的聲音有感情,能理解並表現情緒,而「多語種」是考慮到未來的出海,比如短劇的出海,把中文改為多語種,更適應海外傳播。
宋克沒有把這解釋成自己的洞見,他解釋說,這背後其實是老老實實的網際網路思維——去發現用戶的需求。七個字代表的,就是他們當時看到的用戶痛點。
而創業有未知的風險,也有未知的驚喜。宋克介紹,有在非洲做影視發行的中國商人找上來,表示有一個需求,在當前的中國其他公司可能解決不了。在非洲通用兩個語種,英語和法語,但是非洲人愛看韓劇,於是發行人把韓劇「搬」到非洲,中間還需要跨越韓語到中文,中文再翻成英、法文,效率不高,成本不低。
非洲人愛看韓劇和中國短劇
剛好,這事兒MaskGCT能做。
「他們也沒想到,把韓語台詞直接改為英語、法語的需求,居然可以由一家中國公司解決。」宋克說。
強調解決需求的「產品力」,超過了強調大模型的能力,是趣丸與一眾AI公司的不同。這可能跟趣丸的 「出身」是網際網路有關。
天譜樂大模型就是一個典型例子。去年9月,趣丸推出天譜樂,公司高層介紹時,對天譜樂的一句話生成、圖片及視頻生成配樂等「普通人玩法」面面點到,但更大篇幅介紹的是MidiRender,一種針對音樂人嚴肅創作的「專業玩法」。
宋克介紹天譜樂時也提到MidiRender,它能以音樂人創造的旋律為底本,在生成時接受嚴格控制,並且是在音軌、音階、採樣率等方面的精細化控制。效果上,「音樂人可能以前要用一個月製作的歌,現在一個小時可能就出來了」。
天譜樂AI
宋克的邏輯清楚明了:「小白要玩音樂,天譜樂的能力也是有的、可以滿足,但普通人更多是嘗鮮玩下,嘗過以後就算了,是低頻的。對音樂人來說,這是他的工作,他才是高頻用戶。」宋克解釋,因此在商業化的角度,應該圍繞音樂人、創作者去打造產品。
了解用戶是誰、發現用戶需求,再去為他們提供輔助、解決問題,這是宋克的思維習慣。
這習慣的另一面是,他對一款應用是否是「AI原生」,或者趣丸是不是一家AI公司的問題,並無執著。
作為網際網路創業者,宋克懂得「行規」,一些酷炫的概念或材料,比如「超強AI」「原生AI」,又或是「勤於打榜」,前綴定語很長的某個「第一」,其實目的很「複雜」。他特別提到,「很多早期的模型公司,我很不認可他們講的這個那個模型的能力有多強,就能夠掙多少多少錢」。
模型能力與盈利收入不一定成正比
講模型能力的有很多,但很少有人講的是,這個產品是給誰、提供了什麼樣的價值,以及基於這個價值的商業化該怎麼做,那麼,其實「從模型到所有的前置設定,都是不成立的」。
模型能力與價值、商業化,混為一談是不行的,這是宋克作為商人的基本嗅覺。
價值主張上,趣丸團隊也有明顯的不同,即不追求「AI替代人類」。從天譜樂到MaskGCT的主打功能上,其實不難發現這一取向。宋克承認了這一點,並稱一位趣丸同事的話很讓他認同,這句話是「AI時代,演演算法是犀利,但重要的是人,因為洞察與熱愛永遠不會被替代」。
在硬科技領域,這句話顯得「雞湯」,但是不妨一嘗。
元年之年
AI會怎樣改變人類社會呢?宋克也想知道答案。
對於趣丸的定位,他想得很清楚,「趣丸是一家擁有AI能力的公司」,以人的需求為核心,提供輔助,也提供娛樂消遣。度過了網際網路時代,對趣丸能否在AI時代「活下來」的問題,他倒回答得很豁達,自稱對過程在意,對結果不在意。無論結果,「至少不要在30年之後,說什麼當年我要是去幹了AI會怎麼怎麼樣這樣的話題」。
AI圈內喜歡「元年」的說法。2023年是「大模型元年」,2024年是「智能體元年」,2025年則被稱為「應用元年」。今年元旦,宋克是在美國矽谷度過的,他笑道,當天喝了點酒,他也發了個「應用元年」云云的朋友圈。
「應用元年」過半,AI元年真的遍地開花了嗎?宋克認為,是的。他的依據是,當下大模型概念已經足夠普及,其實圈內也不會再在模型層面去強調能力了。人們已經在大量地使用AI工具和產品,而這一趨勢正在擴大AI公司的營收。
AI音樂創作秀《譜夢行》通過「天譜樂AI」與兩位唱作型歌手ICE楊長青、上上的精彩合作/受訪者供圖
應用元年的關鍵,在於怎麼理解 「應用」。宋克的思維並不 「守舊」,他認為,「應用」在AI時代並不是指APP,「應用元年」的意思是,AI的能力真的被拿到各行各業、並且被大量的人使用。這個角度上,應用元年已經成了。
一個明顯趨勢是,使用AI的人越來越多。宋克帶有玩笑性質地說,到2026年,可能是應用爆發年,各家做成了產品商業化的公司,開始有更多的收入,布局更多的場景,良性循環起來。
這樣的元年是宋克所期待的。此次採訪的第一個問題是,「福布斯中國」的榜單上,趣丸何以成為唯一上榜的廣州公司?宋克回答,不是趣丸做得多好,是廣州創業者的氣質相對務實,所以在強調大模型的時期顯得低調。
但是,「應用端慢慢爆發的時候,廣州上榜的企業會越來越多,因為我們這裡做的事更偏向於用戶端、應用端,務實的事情。我覺得這個時間窗口已經非常臨近了」。