倍可親

回復: 0
列印 上一主題 下一主題

「傾聽」1分鐘 就能開口模仿人類「講話」

[複製鏈接]

185

主題

197

帖子

1081

積分

一星貝殼精英

Rank: 4

積分
1081
跳轉到指定樓層
樓主
逐風攬月 發表於 2017-5-6 20:53 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
「傾聽」1分鐘 就能開口模仿人類「講話」
據《科學美國人》雜誌網站2日報道,加拿大新創公司琴鳥(Lyrebird)發布了新款人工智慧(AI)語音系統,其能通過分析講話錄音和對應文本以及兩者之間的關聯,在1分鐘內模仿人類「講話」,比如,模仿特朗普、奧巴馬和希拉里三個人的聲音展開一段對話。
  讓聲音聽起來更自然,是計算機程序在將文字轉換成語音過程中面臨的核心挑戰,即使目前最好的語音助手,如蘋果公司的Siri和亞馬遜公司的Alexa,一發聲給人的第一感覺仍然是,「哇!這是計算機。」背後原因在於這些語音助手系統的工作原理:根據預錄的聲音文檔整理出辭彙,再通過另一個新的音頻文檔將這些辭彙拼湊在一起發聲。
  而琴鳥公司的AI使用了一種全新的語音合成系統,能在「傾聽」過程中「掌握」每個人說話時字母、音位和單詞的發音特點,通過推理並模仿這個人聲音中的情感和語調,「說」出全新的語句。
  新系統使用模仿人腦思維的演算法創建出一種人工神經網路,能利用深度學習技術將所聽到的轉換成語音,並僅靠任何人1分鐘講話內容,就能完全模仿這個人說話。其市場前景非常廣闊,可用來改進個人人工智慧助手、音頻書籍以及殘疾人語音系統等。
  開發該系統的蒙特利爾大學學習演算法實驗室博士后亞歷山大•布瑞比森表示,在學會並模仿了幾個人的聲音后,再模仿任何一個新對象的語音就會變得更快,因此新語音系統不需太多信息,1分鐘足以捕獲某個人聲音的核心特點。
  但美國卡內基梅隆大學語言技術研究所教授迪莫•鮑曼表示,琴鳥的語音系統和真正的人聲之間還有差距。「我仔細聽過琴鳥系統的發聲,其帶有背景噪音,以及微弱的機器人特徵。而且,它還不能模仿人們在講話中的呼吸和唇部運動,因此仍然能聽出其計算機語音特徵。」鮑曼說。他認為,語音系統真正令人信服地複製人聲,還需再等幾年。

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-4 12:04

快速回復 返回頂部 返回列表