多樣的音樂創(chuàng)作玩法、不斷優(yōu)化的模型效果,讓音樂大模型成為今年垂直大模型賽道的一大亮點(diǎn)。
今年3月,音樂生成模型Suno V3面世,被一些業(yè)界人士稱為音樂行業(yè)的“ChatGPT時(shí)刻”。最近,Suno發(fā)布V4版本,允許用戶生成音質(zhì)更高、更好聽、時(shí)長達(dá)4分鐘的音樂。這意味著,AI可以創(chuàng)作一首完整的歌曲。
不僅是Suno,國內(nèi)AI音樂領(lǐng)域的資深“玩家”們也紛紛入局。在Suno V3發(fā)布后,國內(nèi)大模型廠商紛紛上線類似產(chǎn)品,形成“群雄逐鹿”的格局。
產(chǎn)品層出不窮
記者梳理發(fā)現(xiàn),目前國內(nèi)AI音樂大模型企業(yè)主要有三類:以字節(jié)跳動豆包旗下海綿音樂為代表的大型科技公司,以昆侖萬維旗下的天工SkyMusic為代表的新興大模型廠商,以及以趣丸科技旗下的天譜樂為代表的垂直賽道公司。
海綿音樂主打利用AI技術(shù)幫助用戶生成個(gè)性化音樂作品。用戶只需輸入一句靈感或上傳一張圖片,即可生成專屬音樂作品。相比Suno,海綿音樂生成的中文歌曲吐字清晰度和演唱流暢性更高,曲風(fēng)更符合國人喜好。
天工SkyMusic基于昆侖萬維“天工3.0”超級大模型打造,能夠生成多種風(fēng)格的音樂作品。它采用音樂音頻領(lǐng)域類Sora模型架構(gòu),支持生成80秒44100赫茲采樣率雙聲道立體聲歌曲。
天譜樂于今年7月發(fā)布,是一個(gè)多模態(tài)配樂大模型。它集成圖片理解算法、旋律生成算法、視頻理解算法、配器識別算法等技術(shù)。值得注意的是,天譜樂不僅支持文生音樂、音頻生音樂,還具備圖片、視頻生成音樂的功能。
此外,騰訊音樂和網(wǎng)易云音樂也推出了相關(guān)產(chǎn)品。
落地場景廣泛
業(yè)內(nèi)普遍認(rèn)為,與全球巨頭同場競技,AI應(yīng)用是國內(nèi)人工智能企業(yè)的優(yōu)勢所在。國內(nèi)市場需求大、可落地的商業(yè)化場景多,為國產(chǎn)大模型進(jìn)化提供了堅(jiān)實(shí)基礎(chǔ)。
在趣丸科技副總裁賈朔看來,“降低門檻讓普通用戶體驗(yàn)音樂創(chuàng)作的樂趣”是自研產(chǎn)品的出發(fā)點(diǎn),而這樣的策略也的確奏效。數(shù)據(jù)顯示,目前已有4600萬人注冊使用趣丸科技旗下的唱鴨App或天譜樂官網(wǎng),累計(jì)創(chuàng)作近1000萬首AI歌曲。
影視制作等專業(yè)從業(yè)者的應(yīng)用,也為音樂大模型落地提供了更多商業(yè)化場景。一方面,音樂大模型可以幫助專業(yè)音樂人提升創(chuàng)作效率,讓快速創(chuàng)作和試驗(yàn)新的音樂構(gòu)想成為可能;另一方面,在短視頻浪潮下,音樂大模型正在輔助短視頻創(chuàng)作者創(chuàng)造出更符合視頻內(nèi)容的背景音樂,提升內(nèi)容質(zhì)量和受眾體驗(yàn)。
推廣遭遇挑戰(zhàn)
盡管音樂大模型在以前所未有的速度“狂飆”,但推廣應(yīng)用尚面臨一些難題。
高質(zhì)量的音樂生成模型依賴高質(zhì)量的音樂音頻數(shù)據(jù)進(jìn)行訓(xùn)練,但這些音樂音頻數(shù)據(jù)的版權(quán)問題不容忽視。今年6月,環(huán)球音樂集團(tuán)、索尼音樂集團(tuán)和華納音樂集團(tuán)等多家唱片公司對Suno等AI音樂公司發(fā)起訴訟,稱它們未經(jīng)授權(quán)使用版權(quán)音樂來訓(xùn)練AI模型并對外提供服務(wù)。對此,Suno進(jìn)行回?fù)?,指?zé)唱片公司濫用版權(quán)訴訟,企圖借此維護(hù)自己在AI音樂市場的主導(dǎo)地位。如何在法律框架內(nèi)實(shí)現(xiàn)高質(zhì)量音樂音頻數(shù)據(jù)的運(yùn)營和商業(yè)化,是AI音樂公司未來必須思考的問題。此外,音樂大模型生成的音樂作品是否享有版權(quán)保護(hù),其版權(quán)歸屬如何界定,尚無明確的法律規(guī)定,這給音樂大模型的應(yīng)用帶來了不確定性。
賈朔認(rèn)為,可以利用技術(shù)手段規(guī)避一些紛爭。比如在產(chǎn)品側(cè),當(dāng)用戶在使用AI創(chuàng)作時(shí),可利用相關(guān)技術(shù)判斷其是否有模仿現(xiàn)有藝術(shù)家作品的主觀意圖,并視情況做出彈窗提示。
同時(shí),音樂的創(chuàng)意與情感是否可以被大模型實(shí)現(xiàn)也有待驗(yàn)證。如何提升大模型的創(chuàng)意能力,使其能創(chuàng)作出更具個(gè)性和創(chuàng)新性的音樂作品,是當(dāng)前音樂大模型需要突破的方向之一。
此外,AI音樂“演唱者”的聲音距離真人也有一定距離,解決這一問題需要相應(yīng)的技術(shù)手段。昆侖萬維董事長方漢說,天工SkyMusic通過自研模型技術(shù),實(shí)現(xiàn)樂器、人聲、旋律、音量、音符的一體化端到端生成,在人聲合成、情感表達(dá)等方面具有一定優(yōu)勢。(記者 崔爽)
轉(zhuǎn)自:科技日報(bào)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀