跳转到内容

英文维基 | 中文维基 | 日文维基 | 草榴社区

草稿:15.ai

维基百科,自由的百科全书


15.ai
网站类型
人工智能, 语音合成, 生成式人工智慧
语言English
创立者15
网址15.ai
商业性质No
注册None
推出时间2020年3月,​4年前​(2020-03
现状Inactive

15.ai 是一款免費的非商業性網頁應用程式,它使用人工智能技術,為流行文化中的虛構角色生成語音合成文字轉語音)聲音。[1] 該應用程式由一位在麻省理工学院學習時化名為 15 的人工智能研究員創建,允許用戶讓電子遊戲電視節目電影中的角色以自定義文本和情感語調說話,且生成速度比實時更快。[a][2] 該平台以使用最少的訓練數據生成逼真的語音輸出而聞名⸺“15.ai”這個名字指的是創建者聲稱只需 15 秒的音頻即可克隆一個聲音。它是人工智能热潮初期生成式人工智慧應用的一個早期例子。

15.ai 於 2020 年 3 月推出,[3] 並在 2021 年初在YouTubeTwitter等社交媒體平台上病毒式傳播而受到廣泛關注,並迅速在網絡粉絲圈中流行起來,包括我的小马驹:友谊就是魔法絕地要塞2海綿寶寶的粉絲圈。[4][5] 15.ai通過表情符號支持語音生成中的情感表达,以及通過音標精確控制發音而脫穎而出。15.ai 被認為是第一個將 AI 語音克隆(音頻深度偽造)推廣到網絡迷因內容創作中的主流平台。[6]

15.ai 在語音合成和情感表達方面採用了高效的數據方法。这种方法影响了后来 AI 文本转语音技术的发展。2022 年 1 月,Voiceverse NFT 公司因被發現盜用 15.ai 的成果而引發爭議,該公司此前曾與配音演員特洛伊·貝克合作開發語音平台。該服務最終於 2022 年 9 月下線。它的關閉導致隨後幾年出現了各種商業替代品。

歷史

[编辑]

背景

[编辑]

隨著 深度學習 方法的引入,人工 語音合成 領域經歷了一次重大變革。2016 年,DeepMind 發表了開創性論文“WaveNet: A Generative Model for Raw Audio”,標誌著基於 神經網絡 的語音合成向著直接波形建模、實現前所未有的音頻質量的關鍵轉變。 WaveNet 以每秒 16,000 個樣本的速度直接對原始音頻波形進行運算。它使用擴張因果卷積,對每個音頻樣本在給定所有先前樣本的情況下的條件概率分佈進行建模。此前,拼接合成(通過將預先錄製的人類語音片段拼接在一起來工作)是生成人工語音的主要方法,但它通常會產生聽起來像機器人的結果,並且在片段邊界處有明顯的瑕疵。

Tacotron 和 Tacotron 的修改變體之間的對齊(注意力机制)的比較

兩年後,Google AI 於 2018 年推出了 Tacotron,它證明了神經網絡可以產生高度自然的語音合成,但需要大量的訓練數據(通常是數十小時的音頻)才能達到可接受的質量。 Tacotron 採用了帶有 注意力机制編碼器-解碼器 架構,將輸入文本轉換為 梅爾頻譜圖,然後使用單獨的神經 聲碼器 將其轉換為波形。當在較小的數據集(例如 2 小時的語音)上進行訓練時,輸出質量會下降,但仍能保持清晰的語音;而僅使用 24 分鐘的訓練數據,Tacotron 就無法產生清晰的語音。[7]

HiFi-GAN 模型架構,由一個“生成器”和兩個“鑑別器”組成。在 HiFi-GAN 發佈後,基於 GAN 的 聲碼器 實現變得普遍。

2019 年,微軟研究院 推出了 FastSpeech,它解決了 Tacotron 等 自回歸模型 的速度限制。[8] FastSpeech 利用了非自回歸架構,該架構支持並行序列生成,在保持音頻質量的同時顯著減少了推理時間。它的帶有長度調節的 前饋 Transformer 網絡允許 一次性預測 完整的梅爾頻譜圖序列,避免了先前方法中造成瓶頸的序列依賴。[9] 同年出現了 HiFi-GAN,這是一種基於 生成對抗網絡 (GAN) 的聲碼器,它提高了波形生成的效率,同時產生了高保真語音。[10] 接下來是 Glow-TTS,它引入了一種 基於流 的方法,允許快速推理和語音風格轉換功能。[11]

中國科技公司也對該領域做出了重大貢獻。 百度字節跳動 開發了專有的文本轉語音框架,進一步推動了技術發展,儘管其實現的具體技術細節在很大程度上仍未公開。[12]

開發、發佈和運營

[编辑]
[...] 該網站有多種用途。它作為一個概念驗證平台,允許任何人創建內容,即使他們無法聘請專人為其項目配音。

它還以一種更具吸引力的方式展示了我的研究進展⸺通過能夠使用實際模型,您可以發現一些連我自己都沒有意識到的東西(例如通過在某些音素之間放置逗號來讓角色發出喘息聲或呻吟聲)。

它也不允許我挑選最佳結果並只炫耀那些有效的結果 [...] 能夠無需過濾地與模型交互,允許用戶從表面上判斷當前工作的質量。
15, Hacker News[13] 

15.ai 由一位化名為“15”的人工智能研究員在 麻省理工學院 (MIT) 學習期間構思於 2016 年,作為 MIT 本科生研究機會計劃 (UROP) 的一部分,[14] 當時他 18 歲,[15]  正在讀 大一[16] 該項目是一個 深度學習語音合成 研究項目。這位開發者受到了 DeepMindWaveNet 論文的啟發,並在 Google AI 於次年發佈 Tacotron 後繼續進行開發。到 2019 年,這位開發者在 MIT 展示了他們使用比以前所需少 75% 的訓練數據複製 WaveNet 和 Tacotron 結果的能力。[12] 名字“15”指的是創建者聲稱只需 15 秒的音頻即可克隆聲音。[17]

這位開發者最初計劃根據他們的本科研究攻讀 博士學位,但在他們的 初創公司 於 2019 年被 Y Combinator 加速器錄取後,選擇了在 科技行業 工作。在 2020 年初離開後,這位開發者回到了他們的語音合成研究,並將其作為 網頁應用程式 實現。他們沒有使用包含簡單、單調錄音的傳統語音數據集(如 LJSpeech),而是尋找更具挑戰性的語音樣本,這些樣本可以證明模型處理複雜語音模式和情感色彩的能力。[12] 小馬保存計劃(Pony Preservation Project)⸺項起源於 /mlp/(4chan 的“彩虹小馬”版塊)的粉絲計劃,[12] 該計劃彙編了“我的小馬駒:友誼就是魔法”中的語音片段⸺在實施過程中發揮了至關重要的作用。該項目的貢獻者手動修剪、去噪、轉錄和標記了節目中的每一行台詞的情緒⸺這在當時的粉絲社區中是前所未有的工作,尤其是在此類任務可以自動化之前就完成了。這個精心策劃的高情感數據集為 15.ai 的深度學習模型提供了理想的訓練材料。[12][15]

多說話者嵌入的示例。神經網絡將預測的時間戳映射到編碼說話者信息的掩碼 嵌入 序列。

15.ai 於 2020 年 3 月發佈,最初只包含了“我的小馬駒:友誼就是魔法”和“絕地要塞2”等作品中的角色。[3][18] 在接下來的幾個月中,網站上添加了更多聲音。[19] 2020 年底,深度神經網絡中多說話者 嵌入 的實現帶來了一項重大的技術進步,它允許同時訓練多個聲音,而不是為每個角色聲音都需要單獨的模型。[12] 這不僅允許角色聲音從 8 個快速擴展到 50 多個,[15]  還允許模型識別角色之間的共同情感模式,即使某些角色的訓練數據中缺少某些情緒。[20]

2021 年初,該應用程式在 TwitterYouTube 上瘋傳,人們使用來自流行遊戲和節目的聲音生成短劇、迷因 和粉絲內容,在社交媒體上累積了數百萬次觀看。[21] 內容創作者、YouTuberTikTok 用戶也將 15.ai 用作其視頻中的 旁白[22] 在其巔峰時期,該平台每月在 AWS 基礎設施上產生 US$12,000 的運營成本,以處理每天數百萬次的語音生成;儘管收到公司 收購 15.ai 及其底層技術的邀約,但該網站仍保持獨立,並由開發者(當時 23 歲)[15]  此前的初創公司收益提供資金。[12]

Voiceverse NFT 爭議

[编辑]

2022 年 1 月 14 日,在發現電子遊戲和 動畫 配音 配音員 特洛伊·貝克 宣布與之合作的公司 Voiceverse NFT 盜用了 15.ai 生成的語音線路作為其營銷活動的一部分後,引發了一場爭議。[23] 這是在 15.ai 的開發者在 2021 年 12 月明確表示他們無意將 NFT 納入其工作之後不久發生的。[24] 日誌文件 顯示,Voiceverse 使用 15.ai 生成了“我的小馬駒:友誼就是魔法”中角色的音頻,並提高了音調,使它們聽起來與原始聲音不同,以推銷自己的平台⸺這違反了 15.ai 的服務條款。[25]

Voiceverse 聲稱其營銷團隊中的某個人使用了該語音,但沒有適當地標註 15.ai 的功勞;作為回應,15 在推特上發文“去你媽的”,[26] 這條推文迅速走紅,在 Twitter 上獲得了數十萬次轉發和點贊,以支持這位開發者。[12] 在持續的反彈和抄襲事件曝光後,貝克承認他最初的公告推文以“你可以恨。或者你可以創造。你會怎麼做?”結尾可能具有“對抗性”,並於 2022 年 1 月 31 日宣布他將終止與 Voiceverse 的合作關係。[27]

停用

[编辑]

2022 年 9 月,由於圍繞 人工智能與版權 的法律問題,15.ai 被下線。[28] [12] 創建者暗示了未來可能出現的版本,該版本將從一開始就更好地解決版權問題,儘管截至 2025 年該網站仍处于非活動狀態。[12]

功能

[编辑]

該平台是非商業性的,[29] 並且無需用戶註冊或帳戶即可運行。[30] 用戶通過輸入文本和選擇角色聲音來生成語音,並可選擇使用情感上下文和語音轉錄的參數。每個請求都會產生三個帶有不同情感表達的音頻變體,並按 可信度 分數排序。[14] 可用角色包括“絕地要塞2”和“我的小馬駒:友誼就是魔法”中的多個角色;“傳送門”系列中的 GLaDOS、Wheatley 和 哨兵砲塔;海綿寶寶;“HuniePop”中的 Kyu Sugardust、“女神異聞錄4”中的 久慈川理世;“Daria” 中的 Daria Morgendorffer 和 Jane Lane;“Aqua Teen Hunger Force”中的 Carl Brutananadilewski;“史蒂芬宇宙”中的 史蒂芬宇宙;“Undertale”中的 Sans;“蔚藍”中的 Madeline 和多個角色;第十任博士“史丹利的寓言”中的旁白;以及“2001太空漫遊”中的 HAL 9000[31] 在 50 多個[15]  可用聲音中,有 30 個是“我的小馬駒:友誼就是魔法”中的角色。[32] 某些“沉默”角色,如 Chell 和 高登·弗里曼,可以作為玩笑被選中,並且在提交任何文本時都會發出無聲的音頻文件。[33]

DeepMoji 模型生成的示例表情符號概率分佈。這些表情符號分佈顯示在 15.ai 上,作為其技術指標和圖表的一部分。[34]

深度學習模型的非確定性特性會導致語音輸出的變化,每次生成都會產生不同的語調,類似於 配音演員 產生不同的演繹方式。[35] 15.ai 引入了“情感上下文”的概念,允許用戶通過引導短語指定生成語音的情感基調。[12] 情感上下文功能利用了 DeepMoji,這是一個由 MIT媒体实验室 開發的情感分析神經網絡。[36] DeepMoji 於 2017 年推出,它處理了 12 億條推特帖子(2013 年至 2017 年)中的 表情符號 嵌入,以分析情感內容。測試表明,該系統可以比人類評估者更準確地識別情感元素,包括諷刺。[37] 如果 15.ai 的輸入包含額外的上下文(由豎線指定),則豎線後面的額外上下文將用作情感上下文。[34] 例如,如果輸入是 今天是美好的一天!|我非常傷心。,則所選角色將以人們期望從說“我非常傷心”這句話的人那裡聽到的情感說出“今天是美好的一天!”這句話。[38]

將文本“daisy bell”轉換為語音的示例,從 英語正字法 開始。英語單詞被解析為一串 ARPABET 音素,然後通過音調預測器和 梅爾頻譜圖 生成器生成音頻。

該應用程式使用了來自 牛津詞典 API、維基詞典 和 CMU 發音詞典 的發音數據,[39] 其中最後一個基於 ARPABET,這是一套最初由 高級研究計劃局 在 20 世紀 70 年代開發的英語語音轉錄。對於現代和網路特定的術語,該系統整合了來自 用戶生成內容 網站的發音數據,包括 RedditUrban Dictionary4chanGoogle[39] 同時支持輸入 ARPABET 轉錄,允許用戶更正錯誤發音或指定 同形异义词(拼寫相同但發音不同的詞)之間的所需發音。用戶可以通过在输入框中将音素字符串括在花括号中来调用 ARPABET 转录(例如,{AA1 R P AH0 B EH2 T} 指定单词“ARPABET”(/ˈɑːrpəˌbɛt/ 的发音)。[40] 界面显示已解析的单词,并使用颜色编码来指示发音的确定性:绿色表示在现有发音查找表中找到的单词,蓝色表示手动输入的 ARPABET 发音,红色表示必须通过算法预测发音的单词。[34]

15.ai 的後期版本引入了多說話者功能。 15.ai 没有为每个声音训练单独的模型,而是使用了一个统一的模型,该模型通过说话者 嵌入(学习到的捕获每个角色独特声音特征的数字表示)同时学习多个声音。[12][15]  除了 DeepMoji 赋予的情感上下文之外,这种神经网络架构使模型能够学习不同角色情感表达和说话风格的共享模式,即使个别角色在其训练数据中缺乏某些情感上下文的示例。[20]

界面包含技术指标和图表,[34] 据开发者称,这突出了网站的研究方面。[15]  截至 2021 年 9 月发布的 v23 版本,界面显示了全面的模型分析信息,包括单词解析结果和情感分析数据。早期版本中引入的 生成對抗網絡 (GAN) 混合 聲碼器降噪 經過了簡化,去除了手動參數輸入。[34]

評價

[编辑]

評論界的評價

[编辑]

評論家認為 15.ai 易於使用,並且通常能夠惟妙惟肖地複製角色聲音。 但偶爾效果不一。[41]PC Gamer”的 Natalie Clayton 寫道,海綿寶寶 的聲音複製得很好,但指出模仿“史丹利的寓言”中 旁白 的挑戰:“該算法根本無法捕捉 Kevan Brighting 異想天開的枯燥語調。”[42]Kotaku”的 Zack Zwiezen 報導說“[他的] 女朋友確信這是 GLaDOS 配音演員 埃伦·麦克莱恩 的新台詞”。[43] 人工智慧新聞通訊“Towards Data Science”的 Rionaldi Chandraseta 觀察到“具有大量訓練數據的角色會產生更自然的对话,詞語之間的語調和停頓更清晰,尤其是對於較長的句子”。[38] 台灣報紙“聯合報”也強調了 15.ai 重現 GLaDOS 機械聲音的能力,以及其多樣化的角色聲音選項。[44]Yahoo奇摩新聞”台灣報導稱““傳送門”中的 GLaDOS 幾乎可以完美地發音台詞”,但也批評“仍然存在許多不完美之處,例如字數限制和語調控制,在某些詞語中仍然有些奇怪”。[45] 人工智慧新聞通訊“Byteside”的 Chris Button 稱只需 15 秒的數據即可克隆聲音的能力“令人驚奇”,但也稱其背後的技術“令人印象深刻”。[46] 該平台的語音生成能力經常出現,例如 “Equestria Daily”(一個致力於“我的小馬駒:友誼就是魔法”及其後續世代的粉絲網站)就記錄了 15.ai 的更新、粉絲創作和新角色聲音的添加。[47] 在一篇介紹 15.ai 中新增角色的文章中,“Equestria Daily”的創始人 Shaun Scotellaro(也以其網路暱稱“Sethisto”而聞名)寫道“由於缺乏可供借鑒的樣本,[其中一些聲音] 並不好,但無論如何,許多聲音仍然令人印象深刻”。[32]

其他多位評論家也發現該應用程式的字數限制、韻律選項和僅限英語的特性並不完全令人滿意。[5][45] 動畫超級英雄 新聞媒體“Anime Superhero News”的 Peter Paltridge 認為“語音合成已經發展到更昂貴的成果與實際人類語音幾乎無法區分的程度”,但也表示“在某些方面,SAM 仍然比這更先進。可以使用特殊字符影響 SAM 的語調,以及随意更改其音調。使用 15.ai,您只能聽任隨機的語調。”[48] 相反,“Rock, Paper, Shotgun”的 Lauren Morton 讚揚了發音控制的深度⸺“如果您願意深入了解它的細節”。[49] 同樣,西班牙新聞網站“Qore.com”的 Eugenio Moto 寫道“最有經驗的 [用戶] 可以更改重音或語調等參數”。[50] “Den Fami Nico Gamer”的 Furushima Takayuki 強調了“流暢的發音”,“AUTOMATON”的 Kurosawa Yuki 則指出其“豐富的情感表達”是一項主要功能;兩位日本作者都提到了缺乏日語支持。[51] 巴西遊戲新聞媒體“Arkade”的 Renan do Prado 和西班牙遊戲媒體“LaPS4”的 José Villalobos 指出,雖然用戶可以分别用葡萄牙語和西班牙語創造有趣的結果,但生成效果最好的是英語。[52] 中國遊戲新聞媒體“游民星空”稱這款應用程式“很有趣”,但也批評了文本的字數限制和缺乏語調。[5] 韓國電子遊戲媒體“Zuntata”寫道“15.ai 令人驚訝的是,[對於某些角色],只有大約 30 秒的數據,但它的發音準確度接近 100%”。[53] 機器學習教授李永強在他的博客中寫道,他很驚訝地看到這款應用程式是免費的。[54]

倫理方面的擔憂

[编辑]

配音員 對 15.ai 的能力反應不一。儘管一些行業專業人士承認了技術創新,但也有人對該技術對其職業的影響表示擔憂。[55] 當配音演員 特洛伊·貝克 宣布與盜用了 15.ai 技術的 Voiceverse NFT 合作時,這在配音行業引發了廣泛的爭議。[56] 批評者擔心自動配音可能會 減少配音演員的就業機會,存在 聲音模仿 的風險,以及 在色情內容中被濫用 的可能性。[57] 圍繞 Voiceverse NFT 的爭議以及隨後的討論突出了業界對 AI 語音技術的更廣泛擔憂。[58]

雖然 15.ai 將其範圍限制在虛構角色,並且不複製真人或名人的聲音,[59] 但計算機科學家 吳恩達 指出,類似的技術可以用於這樣做,包括用於邪惡目的。[3] 在他 2020 年對 15.ai 的評估中,他寫道:

“聲音克隆可能會帶來巨大的生產力。在 好萊塢,它可能會徹底改變虛擬演員的使用。在卡通和有聲讀物中,它可以讓配音演員參與更多作品。在線上教育中,孩子们可能会更加关注由他们最喜欢的角色的声音所教授的课程。有多少 YouTube 教學視頻製作者希望由合成的 摩根·弗里曼 來旁白他們的腳本?”

然而,他也寫道:

“...但在未經同意的情況下合成人類演員的聲音可以說是不道德的,而且可能是非法的。而且这项技术将对深度伪造者极具吸引力,他们可以从社交网络上抓取录音来冒充私人。”[3]

影響

[编辑]

15.ai 是音頻深度偽造的早期先驅,引領了 2020 年 人工智慧熱潮 初期基於人工智慧語音合成的迷因的出現。[60] 15.ai 被認為是第一個將人工智慧語音克隆應用於 網路迷因 和內容創作的主流平台,尤其因為它能夠實時生成令人信服的角色聲音,而無需大量的技術專業知識。[61] 該平台的影響在粉絲社區中尤為顯著,包括 “我的小馬駒:友誼就是魔法”、“傳送門”、“絕地要塞2”和“海綿寶寶”的粉絲圈,它使得在 TwitterYouTube 等社交媒體平台上產生了數百萬次觀看的病毒式內容。[62]絕地要塞2”的內容創作者也使用該平台,通過 起源引擎電影編輯器 製作了簡短的迷因和複雜的敘事動畫。[63] 粉絲創作包括短劇和新的粉絲動畫,[64] 跨界內容⸺例如“Game Informer”作家 Liana Ruppert 在她對該平台的報導中演示了結合“傳送門”和“質量效應”的对话[65]⸺病毒式影片的重製(包括臭名昭著的 Big Bill Hell's Cars 汽車經銷商的戲仿影片)[66],使用人工智慧生成的角色聲音改編 同人小說[67] 音樂影片和新的音樂作品⸺例如 色情 的“Pony Zone”系列[68]⸺以及角色朗誦 船夫號子 的內容。[69] 一些粉絲創作獲得了主流媒體的關注,例如一個病毒式的剪輯將 唐納·川普 在《小鬼当家2》中的客串鏡頭替換為 重裝兵 的人工智慧生成的聲音,該剪輯於 2021 年 1 月在 CNN 的日間節目中播出。[70][71] 一些用戶將 15.ai 的語音合成與語音命令軟件 VoiceAttack 結合起來,創建個人助理。[35]

在它停止運營後的幾年中,它的影響力得到了關注,[72] 並出現了幾個商業替代品來填補空白,例如 ElevenLabs [b] 和 Speechify。[28] 當代生成式語音人工智慧公司已經承認了 15.ai 的先驅作用。 PlayHT 稱 15.ai 的首次亮相是“文本轉語音 (TTS) 和語音合成領域的突破”。[22] Speechify 的創始人兼首席執行官 Cliff Weitzman 認為 15.ai“通過率先 [...] 使用來自粉絲圈的流行現有角色,使人工智慧語音克隆在內容創作中流行起來”。[74]

在關閉之前,15.ai 建立了幾個影響人工智慧語音合成後續發展的技術先例。它整合 DeepMoji 進行情感分析證明了整合情感感知語音生成的可能性,而它對 ARPABET 語音轉錄 的支持為面向公眾的語音合成工具中的精確發音控制設定了標準。[12] 該平台的統一多說話者模型允許同時訓練不同的角色聲音,這被證明具有特别重要的影響力。這種方法允許系統識別不同聲音的情感模式,即使某些情感在單個角色訓練集中不存在;例如,如果一個角色有快樂語音的例子,但沒有憤怒的例子,而另一個角色有憤怒的例子,但沒有快樂的例子,系統可以通过理解情感如何影響語音的共同模式來學習為兩個角色生成兩種情感。[20]

15.ai 也為降低語音合成的訓練數據需求做出了重要貢獻。早期的系統,如 Google AI 的 Tacotron 和 微軟研究院 的 FastSpeech,需要數十小時的音頻才能產生可接受的結果,並且使用少於 24 分鐘的訓練數據就無法生成清晰的語音。[7][9] 相比之下,15.ai 展示了使用更少訓練數據生成語音的能力⸺具體來說,名稱“15.ai”指的是創建者聲稱只需 15 秒的數據即可克隆聲音。[75] 這種數據效率方法影響了人工智慧語音合成技術的後續發展,因為 15 秒的基準成為了後續語音合成系統的參考點。只需 15 秒的數據即可克隆人類聲音的原始說法在 2024 年得到了 OpenAI 的證實。[76]

參見

[编辑]

註釋

[编辑]
  1. ^ 語音合成中的“比實時更快”指的是系統生成音頻的速度比語音的實際持續時間更快,例如,在不到 10 秒的時間內生成 10 秒的語音就被認為是比實時更快。
  2. ^ 它使用“11.ai”作為其網路域名的法定別名[73]

參考資料

[编辑]

註腳

[编辑]
  1. ^ 遊戲 2021; Yoshiyuki 2021.
  2. ^ Kurosawa 2021; Ruppert 2021; Clayton 2021; Morton 2021; Temitope 2024.
  3. ^ 3.0 3.1 3.2 3.3 Ng 2020.
  4. ^ Zwiezen 2021; Chandraseta 2021; Temitope 2024.
  5. ^ 5.0 5.1 5.2 GamerSky 2021.
  6. ^ Speechify 2024; Temitope 2024; Anirudh VK 2023; Wright 2023.
  7. ^ 7.0 7.1 Google 2018
  8. ^ Ren 2019; Temitope 2024.
  9. ^ 9.0 9.1 Ren 2019.
  10. ^ Kong 2020.
  11. ^ Kim 2020.
  12. ^ 12.00 12.01 12.02 12.03 12.04 12.05 12.06 12.07 12.08 12.09 12.10 12.11 12.12 Temitope 2024.
  13. ^ Hacker News 2022
  14. ^ 14.0 14.1 Chandraseta 2021; Menor 2024.
  15. ^ 15.0 15.1 15.2 15.3 15.4 15.5 15.6 15.ai 的過去和未來. Twitter. [2024-12-19]. (原始内容存档于2024-12-08). 
  16. ^ Chandraseta 2021; Temitope 2024.
  17. ^ Chandraseta 2021; Button 2021.
  18. ^ 關於. fifteen.ai (官方網站). 2020-02-19 [2024-12-23]. (原始内容存档于2020-02-29). 2020-02-19: 網頁應用程式尚未完全準備好 
    • 關於. fifteen.ai (官方網站). 2020-03-02 [2024-12-23]. (原始内容存档于2020-03-03). 
  19. ^ Scotellaro 2020a; Scotellaro 2020b.
  20. ^ 20.0 20.1 20.2 Kurosawa 2021; Temitope 2024.
  21. ^ Zwiezen 2021; Clayton 2021; Ruppert 2021; Morton 2021; Kurosawa 2021; Yoshiyuki 2021.
  22. ^ 22.0 22.1 Play.ht 2024.
  23. ^ Lawrence 2022; Williams 2022; Wright 2022; Temitope 2024.
  24. ^ Lopez 2022.
  25. ^ Phillips 2022; Lopez 2022.
  26. ^ Wright 2022; Phillips 2022; fifteenai 2022.
  27. ^ Lawrence 2022; Williams 2022.
  28. ^ 28.0 28.1 ElevenLabs 2024a; Play.ht 2024.
  29. ^ Williams 2022.
  30. ^ Phillips 2022.
  31. ^ Zwiezen 2021; Clayton 2021; Morton 2021; Ruppert 2021; Villalobos 2021; Yoshiyuki 2021; Kurosawa 2021.
  32. ^ 32.0 32.1 Scotellaro 2020b.
  33. ^ Morton 2021; 遊戲 2021.
  34. ^ 34.0 34.1 34.2 34.3 34.4 www.equestriacn.com 2022.
  35. ^ 35.0 35.1 Yoshiyuki 2021.
  36. ^ Kurosawa 2021; Chandraseta 2021.
  37. ^ Knight 2017.
  38. ^ 38.0 38.1 Chandraseta 2021.
  39. ^ 39.0 39.1 Kurosawa 2021.
  40. ^ www.equestriacn.com 2022; Kurosawa 2021; Temitope 2024.
  41. ^ Clayton 2021; Ruppert 2021; Moto 2021; Scotellaro 2020c; Villalobos 2021.
  42. ^ Clayton 2021.
  43. ^ Zwiezen 2021.
  44. ^ 遊戲 2021.
  45. ^ 45.0 45.1 MrSun 2021.
  46. ^ Button 2021.
  47. ^ Scotellaro 2020a; Scotellaro 2020b; Scotellaro 2020c; Scotellaro 2020d; Scotellaro 2020e; Scotellaro 2020f.
  48. ^ Paltridge 2021.
  49. ^ Morton 2021.
  50. ^ Moto 2021.
  51. ^ Yoshiyuki 2021; Kurosawa 2021.
  52. ^ do Prado 2021; Villalobos 2021.
  53. ^ zuntata.tistory.com 2021.
  54. ^ Li 2021.
  55. ^ Phillips 2022; Temitope 2024; Menor 2024.
  56. ^ Lawrence 2022; Phillips 2022; Wright 2022.
  57. ^ Phillips 2022; Menor 2024.
  58. ^ Phillips 2022; Lawrence 2022.
  59. ^ fifteenai 2020; Menor 2024.
  60. ^ MrSun 2021; Anirudh VK 2023.
  61. ^ Temitope 2024; Morton 2021.
  62. ^ Scotellaro 2020c; 遊戲 2021; Kurosawa 2021; Morton 2021; Temitope 2024.
  63. ^ Clayton 2021; Zweizen 2021; Morton 2021.
  64. ^ Morton 2021; Kurosawa 2021.
  65. ^ Ruppert 2021.
  66. ^ Zweizen 2021; Morton 2021.
  67. ^ Scotellaro 2020d.
  68. ^ Scotellaro 2020e.
  69. ^ Zweizen 2021; Ruppert 2021.
  70. ^ Clayton 2021; CNN 2021.
  71. ^ The Heavy on CNN. Reddit. 2021年1月19日 [2024年12月31日]. 
  72. ^ Wright 2023.
  73. ^ ElevenLabs 2024b.
  74. ^ Speechify 2024.
  75. ^ Chandraseta 2021; Button 2021; Temitope 2024.
  76. ^ OpenAI 2024; Temitope 2024.

參考文獻

[编辑]

Category:生成式人工智能 Category:深度偽造 Category:語音合成 Category:网络应用程序 Category:2020年代潮流與趨勢 Category:2020年代网络文化 Category:2020年网络文化 Category:2020年軟體 Category:2020年建立的网站