倍可親

回復: 0
列印 上一主題 下一主題

對話景鯤:DuerOS要做語音交互時代的安卓 有戲嗎

[複製鏈接]

4364

主題

9732

帖子

1萬

積分

七級貝殼核心

Rank: 5Rank: 5

積分
17462
跳轉到指定樓層
樓主
非常時期 發表於 2018-2-18 12:09 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
    編者按:本期對話嘉賓為百度度秘事業部總經理、人工智慧產品委員會主席景鯤,他如何看待語音交互技術的發展,如何打造DuerOS這款語音交互系統?又如何看待語音交互技術的落地應用與使用場景?

  2017-08-03 · 網易智能

  

  本文系網易智能工作室(公眾號 smartman 163)出品,此篇為《AI英雄》專訪第26期。聚焦AI,讀懂下一個大時代!

  作者 | 小羿

  急速轉型、All in AI的背景下,百度已將寶押在了創立僅半年的對話式人工智慧系統DuerOS上面。

  在百度COO陸奇的整體規劃下,百度大腦+百度智能雲已經成為了百度AI戰略的兩大支柱,這其中,DuerOS又成為了百度大腦的最重要組成部分。

  DuerOS創立於今年1月,歸屬度秘事業部,由總經理景鯤直接負責。依據百度的戰略思路:iOS與Android是觸摸交互時代的霸主,而語音交互會成為下一個人機交互時代,在這個新時代同樣需要一個基於語音的人機交互界面,不同於觸摸交互,語音交互受到了不同語言的制約,而百度要搶佔中文語音交互系統的戰略高地。

  被百度寄予厚望的DuerOS,目標是要打造一個基於語音交互的全新開放平台,這個平台通過API、SDK為合作夥伴提供創新技術工具,輸出AI技術能力,一起合作共贏。

  近日,網易採訪了DuerOS的直接負責人景鯤,他作為微軟前首席研發總監、度秘事業部總經理、人工智慧產品委員會主席,分享了語音技術的發展情況,以及如果讓語音交互技術落地和發展應用場景。

  

  All in AI,DuerOS首要解決聽清、聽懂的問題

  在景鯤看來,語音交互技術首先要解決的是聽清和聽懂的問題。

  在聽清的問題上,百度主要做了麥克風陣列、回聲消除、語音喚醒、遠場識別幾項技術。其中,自定義語音喚醒技術可能是百度收購KITT.ai以後具備的最大技術優勢。

  但目前的現實情況普遍是,雖然很多企業宣稱其語音識別準確率達到了97%以上,降噪和遠場識別做的也足夠好,實驗室數據足夠亮眼,但在實際的應用場景中,還是會出現無法喚醒的情況。DuerOS同樣面臨著這些問題,如景鯤所說,近場語音已經基本上成熟,但是遠場語音識別在不懂的環境下需要逐漸被攻克。

  在聽懂的問題上,景鯤宣稱百度可能是國內唯一能解決聽懂問題的。景鯤的理由是,解決自然語言理解的問題,關鍵是要做數據訓練,而DuerOS藉助百度搜索有了數據上的優勢。"在人機交互的過程當中,其實就跟原來人們用百度搜索一樣的,從關鍵字變成了自然語言,都是表達和需求之間的一個契合。「景鯤說到。也就說,如果DuerOS依託百度搜索,就可以調用十億級的知識圖譜實體、語音調用和音頻數據、千億的圖片和網頁等數據,這是DuerOS的最大優勢所在。

  即便如此,百度依然不能忽視人才的作用。今年以來,百度先後收購了渡鴉、KITT.AI等AI技術公司,以彌補自身技術上存在的不足。景鯤說,百度收購技術公司的思路基本上是,與自己技術有互補性,或者客戶有特彆強的需求但百度還不具備,我們就會考慮收購。據悉,渡鴉在人機交互方面有很多創意產品和應用,而KITT.AI在開源自定義上(如自定義語音喚醒詞)有著很強的實力。

  起步階段:要想成為平台,首先讓用戶對語音交互有認知

  根據景鯤的說法,DuerOS的目標是成為人工智慧時代的Android。「在時代的變革過程中,Android從底層消費層入手,解決了基礎的門檻,讓很多人更容易進入這個行業來開發自己的手機,他們可以定義自己的手機,在解決一些基礎應用需求的同時,也讓整個市場更加豐富。我們希望DuerOS也扮演一樣的角色。」

  據景鯤透露,截止目前DuerOS的生態合作夥伴已經達到120家(包括硬體、晶元、方案、內容等領域廠商),但距離平台的數量級還差得很遠,畢竟僅運營了半年時間。景鯤說,「我們希望一起打造高端的Case,一方面讓他們自己的產品更好,另外一方面我們也能夠覆蓋越來越多的長尾。」

  面對需求千差萬別的開發者和廠商,DuerOS在普適性上似乎還有很長的路要走。作為平台,DuerOS如何去權衡廠商和個人開發者使用服務的完成度和自由度?對此問題,景鯤表示,不管開發者和廠商是直接拿來使用,還是進行二次開發,DuerOS都要提供一個至少能夠完成基本服務的系統。

  「百度正在抱著開放的心態來做這件事,比如很多合作夥伴希望把自己的內容和服務放到DuerOS的後台去支撐,後者僅提供聽清和聽懂的能力就可以了,這時候DuerOS也同樣要支持。」景鯤說。

  在DuerOS的內容服務接入上,景鯤認為不同產品、不同用戶對語音內容服務的要求不一樣,但用戶的需求跟原來的搜索具有很強的聯繫。「我們希望DuerOS是一道門,用戶通過它去獲取原來百度搜索上已經連接的信息服務。」景鯤說。

  對於目前的平台運營以及如何選擇合作夥伴,景鯤說,目前來講我們不會去挑客戶,就算是一些個人開發者,百度也會去支持。「我們在官網上開發了很多不同的套件和解決方案,其實是希望每個小企業、大企業還有個人開發者都能夠開發這樣的設備。」

  關於平台的商業化方面,景鯤告訴網易智能,目前DuerOS不會考慮商業化,現在最大的問題是怎麼讓普通消費者知道語音對話設備,讓語音對話交互將成為一個標配。未來,新的人機交互模式勢必會帶來大量的商業機會和新的模式。「但是現在來講,最主要的還是用戶體驗和用戶認知。」

  落地應用:看好家庭和車載等場景 智能音箱和電視需求或井噴

  語音交互是一個全新的交互方式,使用場景和落地產品也在不斷摸索中。陸奇曾說,人工智慧落地最關鍵的是找到場景和商業模式,做出極致體驗,並快速迭代。

  基於這種思路,DuerOS首先將使用場景的重點落在了家庭、車載、手機等能夠快速迭代的場景中。景鯤認為,這三個成精對語音的需求是逐漸的升溫的,家庭和車載的需求是從0到1,手機上的語音助手以前就有,後續它的角色會越來越重要。據IDC預測,到2020年51%的智能汽車企業、68%的智能手機與穿戴設備企業都將在產品中採用對話式人工智慧系統。

  據景鯤介紹,DuerOS已經接入了120多家企業的應用和產品,比較重要的有,與國安廣視合作推出的智能機頂盒,在長沙、石家莊等地都有開展機頂盒免費換的活動,直接打入普通家庭生活中。另外,百度與小魚在家合作推出了分身魚陪伴機器人,還與極米合作推出的激光無屏電視,都內置了DuerOS系統支持語音交互。

  

  在產品品類上,景鯤認為智能音箱的需求將是井噴的。據景鯤透露,百度為深圳做智能音箱的方案集成商,尤其是給亞馬遜Alexa提供解決方案的廠商提供了一種盒殼,只要把開發套件放進去,就可以很容易做出一款智能音箱。但是,景鯤並不認為這會造成大量同質化的產品流入國內,他認為外觀、聲腔、喇叭的不同,都可以做成不同的產品。景鯤希望這些品牌商和方案商,藉助DuerOS直接將為Alexa生產的硬體帶到中國來。在他們看來,如果系統門檻越低,集成越方便越便利。景鯤說,「對於這一部分的用戶,我們是開創了一扇很容易進入中國市場的大門。」

  其次,景鯤認為,智能語音產品已經成為傳統家電廠商新的增長點,所以不管消費者是否接受,下一代的電視、空調、洗衣機可能都會帶語音交互。在這其中,景鯤特別看好智能電視,「電視絕對是屬於一個未來語音交互的重要載體」。景鯤還稱,有語音的能力之後,用戶跟設備的交互黏性以及活躍度會急劇提高。但具體的數據如何,景鯤稱現在還不方便透露。

  要想成為超級平台,還有很長的時間和很長的路要走

  不久前,百度公布了2017年第二季度未經審計的財報。財報顯示,Q2百度營收為208.74億人民幣,同比增長14.3%,凈利潤44.15億人民幣,同比增長82.9%。百度將這些增長歸功為DuerOS帶來的開放生態。實際上,語音交互的落地應用還處於早期,不管是在技術、內容服務還是場景打造上都還有很多的問題要解決。

  景鯤認為,DuerOS想要成為語音交互時代的Android,首先要跨越技術的門檻。在Android和iOS出來之前,那個時候也有觸屏,但是電阻屏很不方便。在那個時代,Android和iOS解決了屏幕的問題,解決了手觸摸的問題,解決了這兩個核心的技術問題之後,整個手機產業開始騰飛。

  「我覺得本質是一樣的,在現在也要解決聽清、聽懂這幾個核心技術問題,這幾個核心技術問題如果不解決,是不可能讓整個產業有一個大爆發的。」景鯤表示,我覺得在現在這個時代,是一個技術的瓶頸期,攻克了技術瓶頸之後,語音交互的發展本質上跟Android時代是一樣的。

  面對語音交互領域國內外巨頭的競爭和布局,景鯤稱,大家看到的是一樣的方向,就說明這是一個巨大的機會,而百度又是中文領域最大的搜索引擎,可以利用自己的優勢做出最基礎的生態。

  就像陸奇所說,長期來看DuerOS對於百度意味著巨大的機會,但目前的工作重點是要打造好產品,以及健康的生態系統,這也是一大挑戰。

格外小心
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2024-4-24 04:49

快速回復 返回頂部 返回列表