跳至內容

英文维基 | 中文维基 | 日文维基 | 草榴社区

草稿:15.ai

維基百科,自由的百科全書
15.ai
網站類型
人工智能, 語音合成, 生成式人工智能
語言英語
創立者15
網址15.ai
商業性質
註冊
推出時間2020年3月,​4年前​(2020-03
現狀已停止運營

15.ai是一個免費的非商業化網絡應用程式,利用人工智能生成熱門媒體中虛構角色的文本轉語音[1]由一位在麻省理工學院期間名為15的人工智能研究員開發,該應用允許用戶讓電子遊戲電視節目電影中的角色以定製文本進行情感化語音表達,其生成速度比實時還快。[a][2]該平台因其使用極少的訓練數據就能生成逼真的語音而聞名——"15.ai"這一名稱即源於開發者聲稱只需15秒的音頻即可克隆出語音。這是人工智能熱潮初期生成式人工智能應用的早期示例。

15.ai於2020年3月推出,[3]在2021年初因在YouTubeTwitter社交媒體平台上爆紅而廣受關注,並迅速在互聯網粉絲群體中流行,包括《我的小馬駒:友誼就是魔法》、《軍團要塞2》以及《海綿寶寶》的粉絲群體。[4][5]該服務通過支持表情符號表達情感語境以及通過音標轉錄實現精準發音控制而脫穎而出。15.ai被認為是首個在迷因和內容創作中普及人工智能語音克隆(音頻深度偽造)的主流平台。[6]

15.ai在數據高效語音合成和情感表達方面的創新對後續的AI文本轉語音技術發展產生了深遠影響。2022年1月,Voiceverse NFT爆出爭議,因其與聲優Troy Baker合作的公司被發現盜用了15.ai的工作成果。最終,該服務於2022年9月下線,其停運促使之後幾年中各種商業替代品的湧現。

歷史

[編輯]

背景

[編輯]

人工語音合成領域因深度學習方法的引入而經歷了顯著變革。2016年,DeepMind發表了具有里程碑意義的論文《WaveNet: A Generative Model for Raw Audio》,標誌着語音合成向基於神經網絡的方法的重要轉變。WaveNet通過直接對波形建模,展現了前所未有的音頻質量。它採用擴張因果卷積,直接處理每秒16,000採樣點的原始音頻波形,建模每個音頻採樣在給定所有之前採樣條件下的概率分佈。在此之前,主流的語音合成方法是拼接合成,這種方法通過拼接預先錄製的人類語音片段生成語音,但通常會產生機械人般的聲音,並在片段邊界處出現明顯的音質瑕疵。

Tacotron與其改進版本的注意力(對齊)對比圖

兩年後,Google AI於2018年推出了Tacotron,展示了神經網絡可以生成高度自然的語音合成,但需要大量的訓練數據——通常需要數十小時的音頻——才能達到可接受的質量。Tacotron採用了編碼器-解碼器架構,並結合注意力機制,將輸入文本轉換為梅爾頻譜圖,然後使用單獨的神經網絡聲碼器將其轉換為波形。在較小的數據集上訓練時,例如2小時的語音,輸出質量有所下降,但仍能保持可理解的語音;而僅使用24分鐘的訓練數據時,Tacotron無法生成可理解的語音。[7]

HiFi-GAN模型架構,包括一個生成器和兩個判別器。HiFi-GAN發佈後,基於GAN的聲碼器實現變得廣泛應用。

2019年,微軟研究院推出了FastSpeech,解決了像Tacotron這樣的自回歸模型在速度上的局限性。[8]FastSpeech採用了非自回歸架構,實現了並行序列生成,大大減少了推理時間,同時保持了音頻質量。其具有長度調節的前饋Transformer網絡允許一次性預測完整的梅爾頻譜序列,避免了先前方法中的順序依賴瓶頸。[9]同年,HiFi-GAN作為一種基於生成對抗網絡(GAN)的聲碼器出現,提升了波形生成的效率,同時生成了高保真語音。[10]隨後,Glow-TTS引入了一種基於流的方式,既能快速推理,又具備語音風格遷移的能力。[11]

中國科技公司也在該領域做出了重要貢獻。百度字節跳動開發了專有的文本轉語音框架,進一步推動了技術的進步,儘管其具體技術細節大多未公開。[12]

開發、發佈與運營

[編輯]
[...]該網站有多種用途。它不僅是一個概念驗證平台,使任何人都可以創建內容,即使他們無法聘請人來為項目配音。

它還以更具吸引力的方式展示了我研究的進展——通過實際使用模型,你可以發現一些連我自己都沒意識到的功能(比如通過在某些音素之間添加逗號,讓角色發出喘息或呻吟聲)。

它也讓我無法挑選最佳結果,只展示那些成功的例子[...]能夠無過濾地與模型互動,允許用戶直觀地評估當前工作的質量。
15,Hacker News[13]

15.ai的構思始於2016年,是一位名為"15"的開發者在麻省理工學院(MIT)大一期間作為深度學習語音合成研究項目的一部分而啟動的。[14]該項目是MIT本科生研究機會計劃(UROP)的內容之一。[15]這位開發者受DeepMind WaveNet論文的啟發,並在隨後的學習過程中持續開發,Google AI於次年發佈了Tacotron。到2019年,該開發者在MIT展示了使用比以往少75%的訓練數據複製WaveNet和Tacotron結果的能力。[12]"15"這個名字源於開發者聲稱只需15秒的數據即可克隆語音的說法。[16]

開發者原本計劃基於本科研究攻讀博士學位,但在他們的創業公司於2019年被Y Combinator加速器錄取後,選擇進入科技行業工作。2020年初離職後,開發者重返語音合成研究,並將其實現為一個網絡應用程式。他們沒有使用LJSpeech等常規語音數據集,這些數據集包含簡單、單調的錄音,而是尋找更具挑戰性的語音樣本,以展示模型處理複雜語音模式和情感語調的能力。"小馬保存計劃"——一個源於4chanMy Little Pony板塊/mlp/的粉絲倡議——在實現過程中發揮了關鍵作用。[12]該項目的貢獻者手動修剪、去噪、轉錄並標註了《小馬寶莉:友誼是魔法》中每一行的情感標籤——這是當時粉絲社區中前所未有的工作,尤其是在這些任務能夠自動化之前完成。這一經過精心策劃的高度情感化數據集,為15.ai的深度學習模型提供了理想的訓練材料。[12][17]

多說話者嵌入的示例。神經網絡將預測的時間戳映射到編碼說話者信息的掩碼嵌入序列。

15.ai於2020年3月推出,最初僅提供了一些角色的語音,包括《小馬寶莉:友誼是魔法》和《軍團要塞2》的角色。[3][18]隨後的幾個月里,網站不斷新增語音。[19]2020年底,該平台在技術上取得了一項重要突破——深度神經網絡中引入了多說話人嵌入技術,使多個語音能夠同時訓練,而無需為每個角色語音創建單獨的模型。[12]這不僅使語音庫從最初的八個角色迅速擴展到超過五十個角色,[17]還使模型能夠識別跨角色的常見情感模式,即使某些角色的訓練數據中缺少某些情感。[20]

2021年初,該應用在TwitterYouTube上迅速走紅,人們利用其生成的熱門遊戲和節目中的語音創作短劇、迷因和粉絲內容,這些內容在社交媒體上獲得了數百萬次觀看。[21]內容創作者、YouTuberTikToker也將15.ai作為視頻配音的一部分使用。[22]在其巔峰時期,該平台每月運營成本高達12,000美元,主要用於支持每天數百萬次語音生成所需的AWS基礎設施;儘管有公司提出收購15.ai及其底層技術的意向,但該網站始終保持獨立運營,其資金來源於開發者此前創業的個人收益。[12]當時,這位開發者年僅23歲。[17]

Voiceverse NFT爭議

[編輯]

2022年1月14日,一場爭議爆發——人們發現視頻遊戲和動漫配音演員Troy Baker宣佈合作的Voiceverse NFT公司在其營銷活動中不當使用了15.ai生成的語音。[23]這一事件發生在15.ai開發者於2021年12月明確表示對將NFT納入其工作沒有興趣後不久。[24]日誌文件顯示,Voiceverse生成了《小馬寶莉:友誼是魔法》中角色的音頻,並通過調高音調使其與原始語音不同,以推銷自己的平台,這違反了15.ai的服務條款。[25]

Voiceverse聲稱,他們的營銷團隊中有人未經適當授權使用了15.ai的語音;對此,15在推特上回應道"去你媽的",[26]該推文迅速走紅,在Twitter上獲得了數十萬次轉發和點讚,支持開發者的聲音不斷。[12]在持續的反對聲浪和抄襲事件曝光後,Baker承認他最初的聲明推文中以"你可以憎恨,也可以創造。你會選擇什麼?"結尾可能顯得"挑釁",並於2022年1月31日宣佈終止與Voiceverse的合作關係。[27]

停運

[編輯]

2022年9月,15.ai因涉及人工智能和版權的法律問題而被下線。[28][12]開發者曾暗示未來可能會推出一個更好地解決版權問題的版本,儘管截至2025年,網站仍處於停運狀態。

功能

[編輯]

該平台是非商業性的,[29]並且無需用戶註冊或賬戶。[30]用戶通過輸入文本並選擇角色語音來生成語音,可以選擇添加情感上下文和語音轉錄的可選參數。每次請求會生成三個具有不同情感表現的音頻變體,按信心評分排序。[14]可用的角色包括《絕地要塞2》和《小馬寶莉:友誼是魔法》中的多個角色;《傳送門》系列中的GLaDOS、Wheatley和Sentry Turret;《海綿寶寶》中的海綿寶寶;《HuniePop》中的Kyu Sugardust,《Persona 4》中的Rise Kujikawa;《達莉亞》中的Daria Morgendorffer和Jane Lane;《Aqua Teen Hunger Force》中的Carl Brutananadilewski;《史帝芬宇宙》中的Steven Universe;《Undertale》中的Sans;《Celeste》中的Madeline和其他多個角色;《Doctor Who》中的第十任博士;《史丹利的寓言》中的旁白;以及《2001太空漫遊》中的HAL 9000[31]在超過五十個[17]可用語音中,三十個是來自《小馬寶莉:友誼是魔法》的角色。[32]某些"無聲"角色,如Chell和Gordon Freeman,可以作為玩笑選擇,當任何文本被提交時,它們會發出無聲的音頻文件。[33]

DeepMoji模型生成的表情符號概率分佈。這些表情符號分佈作為技術指標和圖表的一部分在15.ai上展示。[34]

深度學習模型的非確定性特性導致語音輸出出現變化,每次生成的語音具有不同的語調,類似於配音演員在錄製不同版本時的表現。[35]15.ai引入了情感上下文功能,讓用戶通過引導短語指定生成語音的情感基調。[12]該情感上下文功能使用了DeepMoji,這是由MIT媒體實驗室開發的情感分析神經網絡。[36]DeepMoji於2017年推出,處理了來自2013至2017年間12億條推文的表情符號嵌入,分析情感內容。測試顯示,該系統能比人工評估員更準確地識別情感元素,包括諷刺。[37]如果輸入內容包含附加上下文(通過豎線分隔),則豎線後面的內容會作為情感上下文被使用。[34]例如,如果輸入為"Today is a great day!|I'm very sad.",所選擇的角色將以表達"I'm very sad."時的情感說出"Today is a great day!"這句話。[38]

將文本"daisy bell"轉換為語音的示例,從英語正字法開始。英語單詞首先解析為ARPABET音素字符串,然後通過音高預測器和梅爾譜圖生成器生成音頻。

該應用程式使用了來自牛津詞典API、維基詞典和CMU發音詞典的發音數據,[39]其中CMU發音詞典基於ARPABET,這是一套英語音標符號,最初由1970年代的高級研究計劃署(ARPA)開發。對於現代和互聯網特有術語,系統還包含了來自用戶生成內容網站的數據,如RedditUrban Dictionary4chanGoogle[39]支持輸入ARPABET音標,允許用戶糾正發音錯誤或在異名詞(拼寫相同但發音不同的單詞)之間指定所需的發音。用戶可以通過在輸入框中將音素字符串括在大括號中來調用ARPABET音標(例如,{AA1 R P AH0 B EH2 T}用來指定"ARPABET"這個詞的發音(/ˈɑːrpəˌbɛt/)。[40]界面會用顏色編碼顯示解析後的單詞,以指示發音的確定性:綠色表示單詞已存在於發音查找表中,藍色表示手動輸入的ARPABET發音,紅色表示發音需要通過算法預測。[34]

15.ai的後續版本引入了多語者功能。不同於為每個聲音訓練獨立模型,15.ai使用了一個統一的模型,通過語者嵌入(即學習的數值表示,捕捉每個角色獨特的聲音特徵)同時學習多個聲音。[12][17]結合DeepMoji提供的情感上下文,這種神經網絡架構使模型能夠學習不同角色的情感表達和講話風格中的共享模式,即使個別角色的訓練數據中缺乏某些情感上下文的例子。[20]

該界面包括了技術指標和圖表,[34]根據開發者的說法,這些內容突出了網站的研究性質。[17]到了2021年9月發佈的v23版本,界面顯示了全面的模型分析信息,包括單詞解析結果和情感分析數據。之前版本中引入的流式生成對抗網絡(GAN)混合vocoder和去噪器也進行了簡化,去除了手動參數輸入。[34]

評價

[編輯]

評論界的評價

[編輯]

評論家普遍認為15.ai易於使用,且能夠令人信服地復刻角色聲音,但在某些情況下效果參差不齊。[41]PC Gamer的Natalie Clayton寫道,儘管海綿寶寶的聲音復刻得很好,但在模仿The Stanley Parable中的旁白時遇到了困難,她表示:"算法根本無法捕捉Kevan Brighting那種幽默詼諧的語調。[42]Kotaku的Zack Zwiezen報道說,"[他的]女朋友堅信這是來自GLaDOS配音演員Ellen McLain的新台詞。"[43]AI電子報Towards Data Science的Rionaldi Chandraseta觀察到:"具有大量訓練數據的角色會產生更自然的對話,語氣的起伏和單詞間的停頓更加清晰,尤其是在較長的句子中。"[38]台灣的《聯合報》也突出了15.ai復刻GLaDOS機械聲音的能力,並稱讚其廣泛的角色聲音選項。[44]Yahoo! News台灣指出,"Portal中的GLaDOS幾乎能完美地發音",但也批評了一些不完美之處,如"字數限制和語調控制,某些詞彙的發音仍然有些怪異。"[45]AI電子報Byteside的Chris Button稱,能夠僅憑15秒數據克隆聲音"非常驚人",但也稱讚這項技術"令人印象深刻"。[46]該平台的語音生成能力經常在My Little Pony: Friendship Is Magic(《我的小馬駒:友情是魔法》)的粉絲新聞網站Equestria Daily上被報道,包括更新、粉絲創作和新角色聲音的添加。[47]在介紹15.ai新角色添加的一篇帖子中,Equestria Daily的創始人Shaun Scotellaro——在線暱稱"Sethisto"——寫道:"由於缺乏樣本可供參考,某些角色的聲音並不完美,但即便如此,許多聲音仍然相當令人印象深刻。"[32]

多個其他評論家也指出,字數限制、韻律選項和僅支持英語的特點並不完全令人滿意。[5][45]動漫和超級英雄新聞網站Anime Superhero News的Peter Paltridge認為:"語音合成技術已經發展到一個程度,那些昂貴的技術幾乎無法與真實人類的語音區分開",但也指出,"在某些方面,SAM仍然比這更先進。你可以通過特殊字符來影響SAM的語調,並隨意改變他的音高。而在15.ai中,你只能接受隨機的語調變化。"[48]相反,Rock, Paper, Shotgun的Lauren Morton稱讚了發音控制的深度——"如果你願意深入挖掘"。[49]同樣,西班牙新聞網站Qore.com的Eugenio Moto寫道,"最有經驗的用戶可以改變參數,例如重音或語調。"[50]Den Fami Nico Gamer的Takayuki Furushima強調了"平滑的發音",AUTOMATON的Yuki Kurosawa也提到其"豐富的情感表達"作為一大特點;兩位日本作者均指出該平台不支持日語。[51]巴西遊戲新聞網站Arkade的Renan do Prado和西班牙遊戲網站LaPS4的José Villalobos指出,儘管用戶在葡萄牙語和西班牙語中可以創造有趣的結果,但該平台在英語中表現最佳。[52]中國遊戲新聞網站GamerSky稱該應用"有趣",但也批評了字數限制和語調問題。[5]韓國視頻遊戲網站Zuntata寫道:"讓人驚訝的是,15.ai僅憑30秒的數據,就能實現接近100%的發音準確率。"[53]機器學習教授Yongqiang Li在他的博客中寫道,他驚訝地發現該應用是免費的。[54]

倫理問題

[編輯]

配音演員對15.ai的能力反應不一。儘管一些業內專業人士承認其技術創新,但也有人對這一技術對他們職業的影響表示擔憂。[55]當配音演員Troy Baker宣佈與Voiceverse NFT合作,後者未經授權使用了15.ai的技術時,這一事件在配音行業引發了廣泛爭議。[56]批評者擔心自動化配音可能會減少配音演員的就業機會,存在聲音冒充的風險,以及可能被用於不當內容的潛在濫用。[57]圍繞Voiceverse NFT的爭議及隨後的討論突顯了行業對AI語音合成技術的廣泛擔憂。[58]

雖然15.ai將其使用範圍局限於虛構角色,並未復刻真人或名人的聲音,[59]計算機科學家Andrew Ng指出,類似技術也可能被用於模仿真實人物的聲音,包括用於不良目的。[3]在他2020年對15.ai的評估中,他寫道:

"聲音克隆可能具有巨大的生產力。在荷里活,它可能徹底改變虛擬演員的使用。在卡通片和有聲讀物中,它可以讓配音演員參與更多的製作。在在線教育中,孩子們可能會更專注於由他們最喜愛的個性聲音傳遞的課程。還有多少YouTube的教學視頻製作者希望由合成的摩根·弗里曼為他們的劇本配音?"

然而,他也寫道:

"...但在沒有得到同意的情況下合成一名演員的聲音,可以說是不道德的,甚至可能是非法的。這項技術將成為深度偽造者的誘餌,他們可能會從社交網絡上抓取錄音,冒充私人個體的聲音。"[3]

影響

[編輯]

15.ai是音頻深度偽造的早期先驅之一,推動了2020年AI熱潮初期基於AI語音合成的迷因的出現。[60]15.ai被認為是第一個在互聯網迷因和內容創作中普及AI聲音克隆的主流平台,尤其通過其能夠實時生成令人信服的角色聲音的能力,無需大量技術專長。[61]該平台的影響力在粉絲社區中尤為顯著,包括《小馬寶莉:友誼的魔法》、《傳送門》、《團隊要塞2》和《海綿寶寶》粉絲群體,在這些社區中,15.ai使得病毒性內容的創作成為可能,並在Twitter和YouTube等社交媒體平台上獲得了數百萬次觀看。[62]《團隊要塞2》的內容創作者還使用該平台,通過Source Filmmaker製作短視頻迷因和複雜的敘事動畫。[63]粉絲創作包括小品和新的粉絲動畫,[64]跨界內容——例如Game Informer記者Liana Ruppert演示的結合《傳送門》和《質量效應》對話的內容,[65]病毒視頻的重製(包括臭名昭著的Big Bill Hell's Cars汽車經銷商惡搞視頻[66]),使用AI生成角色聲音改編的同人小說,[67]音樂視頻和新音樂作品——例如限制級的Pony Zone系列[68]⸺以及角色唱海洋民謠的內容。[69]一些粉絲創作引起了主流媒體的關注,例如2021年1月CNN白天節目中播出的一個病毒剪輯,將《小鬼當家2:迷失在紐約》中的當勞·特朗普客串替換為重型武器男的AI生成聲音。[70][71]一些用戶將15.ai的語音合成與VoiceAttack(一種語音命令軟件)結合,創建了個人助手。[35]

儘管15.ai已不再運營,其影響力仍被後來的技術發展所延續,[72]多個商業替代平台如ElevenLabs[b]和Speechify等應運而生,填補了這一空白。[28]當代的生成語音AI公司都承認15.ai的開創性作用。PlayHT將15.ai的問世稱為"文本轉語音(TTS)和語音合成領域的突破"。[22]Speechify的創始人兼CEO Cliff Weitzman稱15.ai"通過成為第一個提供來自粉絲群體的流行現有角色的語音克隆,令AI語音克隆在內容創作中變得流行"。[74]

在停運之前,15.ai確立了多個技術先例,影響了後續的AI語音合成技術發展。其集成DeepMoji進行情感分析,展示了情感感知語音生成的可行性,而其對ARPABET音標轉錄的支持則為公共語音合成工具中精確發音控制設立了標準。[12]該平台的統一多說話人模型,使得不同角色的聲音能夠同時進行訓練,這一方法尤其具有影響力。這種方法使系統能夠識別不同角色之間情感表達的共性,即使某些情感在單一角色的訓練數據中不存在。例如,如果一個角色有快樂語音示例但沒有憤怒示例,而另一個角色則有憤怒但沒有快樂示例,系統仍能通過理解情感如何影響語音的共同模式,生成這兩種情感的表達。[20]

15.ai還在減少語音合成訓練數據需求方面做出了重要貢獻。早期的系統,如Google AI的Tacotron和Microsoft Research的FastSpeech,需要數十小時的音頻才能生成可接受的結果,並且在訓練數據不足24分鐘時無法生成清晰的語音。[7][9]相比之下,15.ai展示了使用顯著更少的訓練數據生成語音的能力——具體來說,"15.ai"這一名稱來源於創始人聲稱只需15秒的數據就能克隆一個人的聲音。[75]這種數據效率的做法影響了後續AI語音合成技術的發展,因為15秒的標準成為後續語音合成系統的參考點。OpenAI在2024年證實了這一原始聲明,即僅需15秒的數據即可克隆人類的聲音。[76]

參見

[編輯]

註釋

[編輯]
  1. ^ 語音合成中的"比實時更快"一詞意味着系統生成音頻的速度超過了實際講話的時長——例如,生成10秒鐘的語音時間不到10秒鐘,就被視為比實時更快。
  2. ^ 使用"11.ai"作為其網站域名的合法別名[73]

參考資料

[編輯]

註腳

[編輯]
  1. ^ 遊戲 2021; Yoshiyuki 2021.
  2. ^ Kurosawa 2021; Ruppert 2021; Clayton 2021; Morton 2021; Temitope 2024.
  3. ^ 3.0 3.1 3.2 3.3 Ng 2020.
  4. ^ Zwiezen 2021; Chandraseta 2021; Temitope 2024.
  5. ^ 5.0 5.1 5.2 GamerSky 2021.
  6. ^ Speechify 2024; Temitope 2024; Anirudh VK 2023; Wright 2023.
  7. ^ 7.0 7.1 Google 2018
  8. ^ Ren 2019; Temitope 2024.
  9. ^ 9.0 9.1 Ren 2019.
  10. ^ Kong 2020.
  11. ^ Kim 2020.
  12. ^ 12.00 12.01 12.02 12.03 12.04 12.05 12.06 12.07 12.08 12.09 12.10 Temitope 2024.
  13. ^ Hacker News 2022
  14. ^ 14.0 14.1 Chandraseta 2021; Menor 2024.
  15. ^ Chandraseta 2021; Temitope 2024.
  16. ^ Chandraseta 2021; Button 2021.
  17. ^ 17.0 17.1 17.2 17.3 17.4 17.5 15.ai的過去和未來. Twitter. [2024-12-19]. (原始內容存檔於2024-12-08). 
  18. ^ 關於. fifteen.ai (官方網站). 2020-02-19 [2024-12-23]. (原始內容存檔於2020-02-29). 2020-02-19: 網頁應用程式尚未完全準備好 
    • 關於. fifteen.ai (官方網站). 2020-03-02 [2024-12-23]. (原始內容存檔於2020-03-03). 
  19. ^ Scotellaro 2020a; Scotellaro 2020b.
  20. ^ 20.0 20.1 20.2 Kurosawa 2021; Temitope 2024.
  21. ^ Zwiezen 2021; Clayton 2021; Ruppert 2021; Morton 2021; Kurosawa 2021; Yoshiyuki 2021.
  22. ^ 22.0 22.1 Play.ht 2024.
  23. ^ Lawrence 2022; Williams 2022; Wright 2022; Temitope 2024.
  24. ^ Lopez 2022.
  25. ^ Phillips 2022; Lopez 2022.
  26. ^ Wright 2022; Phillips 2022; fifteenai 2022.
  27. ^ Lawrence 2022; Williams 2022.
  28. ^ 28.0 28.1 ElevenLabs 2024a; Play.ht 2024.
  29. ^ Williams 2022.
  30. ^ Phillips 2022.
  31. ^ Zwiezen 2021; Clayton 2021; Morton 2021; Ruppert 2021; Villalobos 2021; Yoshiyuki 2021; Kurosawa 2021.
  32. ^ 32.0 32.1 Scotellaro 2020b.
  33. ^ Morton 2021; 遊戲 2021.
  34. ^ 34.0 34.1 34.2 34.3 34.4 www.equestriacn.com 2021.
  35. ^ 35.0 35.1 Yoshiyuki 2021.
  36. ^ Kurosawa 2021; Chandraseta 2021.
  37. ^ Knight 2017.
  38. ^ 38.0 38.1 Chandraseta 2021.
  39. ^ 39.0 39.1 Kurosawa 2021.
  40. ^ www.equestriacn.com 2021; Kurosawa 2021; Temitope 2024.
  41. ^ Clayton 2021; Ruppert 2021; Moto 2021; Scotellaro 2020c; Villalobos 2021.
  42. ^ Clayton 2021.
  43. ^ Zwiezen 2021.
  44. ^ 遊戲 2021.
  45. ^ 45.0 45.1 MrSun 2021.
  46. ^ Button 2021.
  47. ^ Scotellaro 2020a; Scotellaro 2020b; Scotellaro 2020c; Scotellaro 2020d; Scotellaro 2020e; Scotellaro 2020f.
  48. ^ Paltridge 2021.
  49. ^ Morton 2021.
  50. ^ Moto 2021.
  51. ^ Yoshiyuki 2021; Kurosawa 2021.
  52. ^ do Prado 2021; Villalobos 2021.
  53. ^ zuntata.tistory.com 2021.
  54. ^ Li 2021.
  55. ^ Phillips 2022; Temitope 2024; Menor 2024.
  56. ^ Lawrence 2022; Phillips 2022; Wright 2022.
  57. ^ Phillips 2022; Menor 2024.
  58. ^ Phillips 2022; Lawrence 2022.
  59. ^ fifteenai 2020; Menor 2024.
  60. ^ MrSun 2021; Anirudh VK 2023.
  61. ^ Temitope 2024; Morton 2021.
  62. ^ Scotellaro 2020c; 遊戲 2021; Kurosawa 2021; Morton 2021; Temitope 2024.
  63. ^ Clayton 2021; Zwiezen 2021; Morton 2021.
  64. ^ Morton 2021; Kurosawa 2021.
  65. ^ Ruppert 2021.
  66. ^ Zwiezen 2021; Morton 2021.
  67. ^ Scotellaro 2020d.
  68. ^ Scotellaro 2020e.
  69. ^ Zwiezen 2021; Ruppert 2021.
  70. ^ Clayton 2021; CNN 2021.
  71. ^ The Heavy on CNN. Reddit. 2021年1月19日 [2024年12月31日]. 
  72. ^ Wright 2023.
  73. ^ ElevenLabs 2024b.
  74. ^ Speechify 2024.
  75. ^ Chandraseta 2021; Button 2021; Temitope 2024.
  76. ^ OpenAI 2024; Temitope 2024.

參考文獻

[編輯]

Category:生成式人工智能 Category:深度偽造 Category:語音合成 Category:網絡應用程式 Category:2020年代潮流與趨勢 Category:2020年代網絡文化 Category:2020年網絡文化 Category:2020年軟件 Category:2020年建立的網站