環(huán)球熱頭條丨讓網友沉迷的影視劇剪輯,正在“殺死”一個職業(yè)?
隨著網絡的發(fā)展,尤其是近年來短視頻的火爆,不斷衍生出了很多周邊配套軟件,比如智能剪輯、AI配音等,似乎一切都可以用軟件來完成。
不知道從什么時候起,魏然發(fā)現(xiàn)自己常刷的短視頻APP中,出現(xiàn)頻率最高的聲音從各種洗腦神曲變成了影視劇剪輯。
而且很多比如XX影視、XX電影說這些粉絲上千萬的賬號,擁有一個共同點——旁白配音高度相似。
(資料圖片)
魏然一度疑惑,真的有人有這么多精力給數(shù)量如此龐大的短視頻配音嗎?直到后來有一次在和一個做短視頻的朋友聊天時,將這個疑問拋給朋友。
“你真的不知道這些都是配音軟件合成的聲音嗎?”對方笑他孤陋寡聞,他也恍然大悟。
在他有限的認知里,軟件語音不就是類似于天貓精靈、Siri那種效果嗎?機械、僵硬、古怪,一聽就是機器人的聲音。但是短視頻中的配音卻聲音流暢、音色出眾,幾乎和真人無異,兩者完全不是一個檔次。
這究竟是怎么回事?
01 短視頻配音的秘密
想了解這些聲音是怎么來的,魏然采取了追根溯源的辦法,去找這些影視大V們的供應商,結果發(fā)現(xiàn)其實不少賬號都是一家名為“魔音工坊”配音軟件的客戶。
官方資料介紹,魔音工坊是一款短視頻達人聯(lián)袂推薦的AI配音神器,能一鍵將文本轉換為音頻。它能幫助用戶快速、高效制作高質量的音頻,從而給短視頻、有聲書等高效配音。
在其官網上也列舉了幾十個粉絲過百萬的抖音影視劇大V客戶。
相比魔音工坊,其背后的一家公司在科技圈很多人都不會陌生,它就是出門問問。這是一家由Google投資的人工智能公司,前幾年也是人工智能行業(yè)的當紅炸子雞之一,主要的產品是智能手表、智能音箱等硬件產品。
出門問問是其對標Google NOW,亞馬遜Alexa創(chuàng)業(yè)的一家公司,魔音工坊是2020年由出門問問推出AI語音系列產品。
2020年前后是出門問問最艱難的時刻,創(chuàng)始人李志飛提到這是他人生的至暗時刻,此前出門問問突破10億美元估值后開始瘋狂擴張,很快遭遇巨大的虧損,出門問問開始急剎車,大幅裁員、砍門店,從千人規(guī)模精簡到500人、線下門店全部關掉??梢圆孪肽б艄し痪褪浅鲩T問問為了挽救公司困局而推出來的一款產品。
魔音工坊的原理很簡單,以AI語音技術模擬具有清晰性格特征的真人語音,進行AI音頻內容創(chuàng)作。簡單的來說就是先找一些音色出眾的配音人錄制一些聲音,然后用機器學習的手段訓練獲得聲音的特征。用戶使用的時候,只需要導入一段文字,然后略微調整重音、停頓等問題,就可以生成一段和配音人相似的聲音片段了。
這里面需要用到一個關鍵技術叫做Deepfake Voice,也稱為語音克隆或合成語音,其目的是使用AI生成一個人的語音。
業(yè)內人士介紹,初代的人工智能語音,干澀、生硬、機械感格外強。但是在Deepfake Voice(聲音克隆)技術加持下,AI生成的語音如今已經可以近乎完美復刻真人的聲音。傳統(tǒng)的語音合成通常使用兩種基本技術,即拼接合成和共振峰合成。
而深度學習和人工智能的出現(xiàn)將TTS(語音合成)技術帶到了新的高度,可以在音調和相似度上非常精確地復制人聲的地步,也就促成了我們聽到的近乎以假亂真的人工智能語音出現(xiàn)。
不過出門問問把自己的技術稱之為MeetVoice (Mobvoi End-to-End TTS Voice) ,也就是采用基于神經網絡的聲碼器 Meet-Vocoder,可以實現(xiàn)高度接近真人的聲音素質。
有了這門技術,一門生意就出現(xiàn)了。為了讓這些聲音變現(xiàn),魔音工坊建立了聲音商店,用戶可以按天/月/年付費。
02 蓬勃發(fā)展的“機器音”
隨著抖音視頻魔性的聲音在大街小巷響起的時候,短視頻配音產業(yè)也迎來了眾多玩家的入局。
眼下短視頻配音領域可以有三大陣營的玩家:
第一類是來自人工智能公司,包括出門問問、微軟、科大訊飛,這些公司在人工智能語音上都有多年的積累,做短視頻配音屬于降維打擊。由于功底扎實,推出的產品品質較高,大多采取付費使用的模式。
第二類同樣是采用付費模式的是一些小型創(chuàng)業(yè)公司或者工作室,這些公司大多名不見經傳,搜索引擎一搜一大票,產品良莠不齊。
第三類是短視頻平臺自己推出的帶有配音功能的剪輯軟件,比如抖音的剪映、騰訊的智影等等特點就是使用免費。
玩家蜂擁而來,瞄準的就是處于高速增長階段的短視頻配音市場,近年來“X分鐘看完XX”等這類視頻大受歡迎,很多創(chuàng)作者有了配音的需求,訊飛和出門問問爭搶的就是這類客戶。
實際上不光是在中國,AI語音在全球都有著廣闊的市場空間,除了短視頻之外還包括影視劇、廣告、游戲等眾多使用場景,根據(jù)Verified Market Research,僅電影配音市場的價值從2020年就開始以5.6%的復合年增長率增長,到2027年可達36億美元。
因此AI語音行業(yè)在國內外都處于高峰發(fā)展的階段。今年2月份韓國語音和視頻合成初創(chuàng)公司Neosapience獲得2150萬美元的B輪融資,該公司于2017年成立,其語音視頻合成平臺Typecast使用戶能夠將文字轉化為AI合成的語音和視頻,擁有170名說韓語和英語的配音員,大多數(shù)用戶是創(chuàng)作者和企業(yè)客戶。
今年6月音樂流媒體平臺Spotify宣布收購人工智能語音初創(chuàng)公司Sonantic,后者是一個動態(tài)的人工智能語音平臺,通過AI技術可將文本轉換為逼真的聲音。Spotify表示,高質量的語音對增加Spotify的收聽市場份額非常重要。
03 AI會殺死人工配音嗎?
在UP主和短視頻創(chuàng)作者熱烈歡迎AI配音技術的同時,也有一些群體對于這門技術充滿擔憂,其中就包括被AI配音直接沖擊的人工配音行業(yè)。
相對于人工配音,Ai配音最大的優(yōu)勢就是成本低廉。
淘寶上面人工配音商家的價格標準大約是30-60元/100字;京東上面的配音商家的價格標準大約是40-80元/100字。而魔音工坊等配音軟件沒有字數(shù)要求,按照時長來付費,每天不到2元錢。
其次,AI配音相比人工配音在效率和準確度上也有很大的優(yōu)勢。傳統(tǒng)人工配音耗時費力、專業(yè)設備要求高、在配音的過程中也容易出現(xiàn)準確度不夠等問題。但AI人工智能技術產量更高,而且可以做到100%準確。
AI配音還有一點是傳統(tǒng)配音所無法企及的,那就是它可以依靠人聲合成技術復原逝者的聲音,或者讓很多先天語言障礙的聾啞人通過技術的合成擁有自己的聲音。中央電視臺在2018年播出了紀錄片《創(chuàng)新中國》是世界上第一部利用人工智能模擬人聲的紀錄片,就是利用已故知名播音員李易。
英國演員工會對430個會員進行了一項調查,發(fā)現(xiàn)93%的配音演員都覺得人工智能對自己的工作機會產生威脅。比如2021年7月份知名游戲《巫師 3:狂獵》發(fā)生了一次ai配音風波,有游戲 Mod 開發(fā)者發(fā)布了自己制作的全新《巫師 3》 額外任務包并且利用ai進行配音,在聲優(yōu)們中引發(fā)軒然大波。配音演員 Natalie Winter表示,“如果 AI 的聲音變得足夠好,可以被廣泛使用,那么(真人聲優(yōu)的)機會只會進一步減少。”
不過類似于魔音工坊這樣的AI語音短期內真的能大殺四方嗎?
也未必。
有人認為,目前ai配音取代人工配音還為時尚早,畢竟人工在配音感情更為充沛,而且相對于機器更具有主觀能動性,語氣輕重急緩,風格變化多樣。
而且魔音工坊這類配音工具來說,未來發(fā)展本身面臨天花板。
青年配音演員李盛仁則對此持樂觀態(tài)度,他表示,科技的進步最大的好處就是解放了人類的雙手,但是人類的情感是科技無法替代的,無論科技發(fā)展到哪一步,這一點始終不會變,因為科技不可能像人類一樣擁有感情。李盛仁畢業(yè)于中原工學院學習播音主持專業(yè),2016年出道,曾為騰訊視頻紀錄片《料理的秘密》解說,其配音的廣告作品《品品香》在CCTV-1新聞聯(lián)播黃金時段播出,今年還成立了公司后,建立了配音工作室。
“這個行業(yè)最大的問題就是行業(yè)比較小眾,在短視頻爆發(fā)之前,配音在國內是一個非常小眾的行業(yè)。普通用戶了解最多的就是影視配音?!庇行袠I(yè)人士認為,配音依然是一個非常細分的需求,因此難免陷入工具化的困局。
他舉例認為,魔音工坊這樣的短視頻配音平臺,未來處境可能和天眼查這種個人與企業(yè)信息查詢工具所面臨的處境一樣,“解決的問題非常窄,市場不夠大,未來能夠存活的玩家其實很有限。”
標簽: