倍可親

回復: 0
列印 上一主題 下一主題

人工智慧可從嘈雜聲中分辨特定聲音

[複製鏈接]

1萬

主題

2萬

帖子

3萬

積分

貝殼精神領袖

Rank: 6Rank: 6

積分
35927
跳轉到指定樓層
樓主
華盛頓人 發表於 2017-11-2 09:07 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  2017-11-02 08:23

  人工智慧(AI)設備已經能處理來自獨立個人的請求,但跟我們一樣,它們在嘈雜的雞尾酒會上或幾個人同時發言的情況下,也會感到「糾結」。《新科學家》雜誌官網近日文章稱,美國劍橋三菱電機研究實驗室的研究人員開發出的聲音識別AI設備,能實時分離多個聲源,大大提升了自動語言識別能力。

  這項技術首次在日本東京先進技術綜合展覽會上公開展示,被團隊稱為「深度聚類」機器學習,可識別多個聲源「聲紋」中的獨特功能。然後,將每個演講者聲音的不同特徵組合在一起,允許它從多個聲音中將特定特徵的聲音選出來,最後重建每個人的話語。智能技術使用了多名人士講的英語進行了培訓和學習,即便說話人是日本人,也能輕鬆地分辨出來。

  據介紹,傳統識別語音的方法,利用兩個收音器模擬聽眾兩耳朵的位置,只能達到51%的準確性,形成的「雞尾酒會效應」困擾了AI研究幾十年。

  新智能系統可以將兩個人的語音成功分離,而且,重建單人語音的精確度高達90%,新技術可幫助家庭和汽車更好地執行智能任務,一次可分離多達5個人的聲音,可用於電梯、空調機組和家用產品的智能操控。(記者房琳琳)

時代小人物. 但也有自己的思想,情感. 和道德.
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-10-3 14:43

快速回復 返回頂部 返回列表