倍可親

回復: 0
列印 上一主題 下一主題

亞馬遜在蘋果、谷歌前找到了語音識別的答案,它是怎麼做到的?

[複製鏈接]

4364

主題

9732

帖子

1萬

積分

七級貝殼核心

Rank: 5Rank: 5

積分
17462
跳轉到指定樓層
樓主
非常時期 發表於 2017-7-22 06:49 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  分析師:杜會堂 2016-08-16

  1. 智能手機和它帶來的「APP經濟」的增長正在放緩,人工智慧被認為是下一個科技浪潮,科技公司在加快對人工智慧的布局;

  2. 亞馬遜智能音箱Echo比對手更晚來到市場,但獲得更大成功。它的取勝之匙是:圍繞語音交互設計產品;找對產品的消費環境;開放系統,為產品贏來源源不斷的第三方服務。

  序 · Fire Phone失敗了,但Echo成功了

  

  兩年前,亞馬遜經歷了一場戲劇性變化——被寄予厚望的智能手機Fire Phone在上市遭遇慘敗,幾個月後推出的智能音箱Echo卻大獲成功。亞馬遜沒有花費太多時間思考,很快作出決定:放棄Fire Phone,押注Echo。一年之後,它收到了Echo結出的成功果實:

  - 據研究機構CIRP的統計,Echo上市一年多后,銷量已經突破300萬台。僅僅是2015年暑假,亞馬遜就賣出超過100萬台Echo;

  - 2015年3月-12月,Echo的用戶認知度從20%提升至47%。今年6月公開的新銷售計劃顯示,亞馬遜計劃在2017年賣出第1000萬台Echo。

  難能可貴的是,Echo在實現高銷量的同時還保持著出色的口碑——它在亞馬遜的頁面下擁有超過40000條用戶評論,評分達到4.4星。讚美之詞不勝枚舉。

  一 · 語音識別:亞馬遜「后發制人」

  Echo不是一台傳統音箱,亞馬遜在裡面注入了最新的語音識別助手「Alexa」。除了聽音樂,用戶還能用Echo叫外賣、打車、安排日程、查詢天氣——你只需對著它說出命令即可。

  智能手機的故事已經基本講完,行業將迎來人工智慧的高速發展。蘋果、谷歌、微軟……人們熟知的矽谷巨頭都在調轉船頭,發力人工智慧。

  語音識別被認為是人工智慧的核心應用之一。蘋果在亞馬遜三年前就推出了智能語音產品;谷歌稍晚,但也比亞馬遜早兩年。然而現在亞馬遜憑藉Echo實現「后發制人」,谷歌已經成為它的模仿者。

  它是怎麼做到的?

  二 · 只提供一種交互,迫使用戶使用語音

  如何讓用戶使用語音服務?蘋果和谷歌採用了相同的方案。它們將語音服務整合進手機系統內,通過高使用頻率的手機來帶動用戶對語音服務的使用。

  但問題是,智能手機擁有成熟的輸入方案——文字輸入法比語音更便捷、更高效,語音服務缺乏足夠的使用理由。研究機構Creative Strategies的調查顯示,62%的安卓用戶表示很少或偶爾使用語音助手,iPhone對應的比例為70%。

  為了「迫使」用戶使用語音,亞馬遜Echo只提供語音一種交互方案。除了揚聲器和麥克風,Echo沒有其它交互介面。

  Echo對交互的限制,保證了語音交互的純粹性和持續性:用戶只能使用語音,不會被其它輸入方式帶走。當習慣養成后,他們會持續不斷地用語音與設備互動。

  三 · 定位於家庭,緩解與機器對話的尷尬

  只提供語音交互並非Echo成功的唯一因素。如果沒有解決用戶不願使用語音的根本問題,這樣做可能會帶來另一個問題——用戶放棄使用產品。亞馬遜顯然不願看到這樣的結果。

  Echo成功的另一因素在於它定位於家居,而非個人助理。

  Siri和Google Now定位於個人助理,於是它們依附於手機,期待通過手機的高頻使用普及服務。但手機作為個人設備,多數情況下在公開場合下使用。在公開場合下用語音對手機發號施令,使用者很容易陷入尷尬。

  Creative Strategies調查了300名手機用戶在公開場合下使用語音助手的比例。結果顯示,安卓用戶中,只有12%會在公開場合下使用語音助手;iPhone的比例更低,只有3%。

  產品和使用場景沒有恰當匹配,造成了Siri和Google Now的使用尷尬。

  Echo採用了不同的產品定位,巧妙地避開了用戶使用語音助手的尷尬。它從一開始就定位於家庭設備——體積較大,不宜隨身攜帶;沒有獨立電池,必須連接室內電源才能使用。儘管對著機器說話依舊怪異,但家庭環境緩解了用戶的使用壓力。用戶面對的是熟悉的家人而非公共環境下的陌生人。

  四 · 提供針對性軟、硬體優化,適時開放產品

  在明確Echo的交互方式和產品定位之後,亞馬遜對它進行了針對性的硬體和軟體優化。

  為了能讓用戶在家中的任何位置都能喚醒Echo,亞馬遜設計了一個名為ARS的自動語音識別處理系統。ARS由七個麥克風和一個音頻信號過濾系統構成。七個麥克風組成的列陣能讓Echo捕捉到環境中的細微聲音,音頻信號過濾系統過濾掉環境噪音,從而辨別出人聲。使用ARS后,即使用戶在25英尺(7.62米)之外發出命令,Echo也能夠準確識別。

  

  (Echo的麥克風陣列)

  識別之後,如何理解用戶的語音命令?亞馬遜又設計了「關鍵詞識別」系統。Echo收到的語音命令被系統拆分為多個欄位,它們與雲端儲存的關鍵詞模型逐一比對,匹配度最高的部分被認為是用戶發出的語音命令。

  在先後增加對多款智能家電的支持之後,2015年6月,亞馬遜推出了語音服務「Alexa」開發包,正式開放Echo。兩家為Echo開發音樂播放和家電控制服務的公司還獲得了亞馬遜提供的1億美元資金。

  開放策略收效顯著。2015年,Echo整合的第三方服務只有14項,今年已經上升至950項。目前這個數字在持續增長。

  今年3月,亞馬遜又推出了兩款面向中、低端市場的智能音箱:Tap和Dot。Echo家族的設備和服務在不斷壯大。

  結語 · 手機紅利消失,人工智慧將啟航

  2007年,第一代IPhone推出。在接下來的近十年裡,它和安卓至少帶動了硬體銷售、移動通訊、電商、手機遊戲四個領域的發展。移動網際網路風生水起。

  但高速發展之後,智能手機和它所帶動的相關產業都陷入了發展瓶頸。代表性的變化是,iPhone在今年第三季度的銷量下降15%,營收同比下滑23%。移動通訊、O2O、手機遊戲等領域的格局也已基本確定,市場被大公司把持。

  人工智慧被認為是下一個科技熱潮。語音、圖像識別,深度學習等技術將大大拓寬現有技術的應用邊界,工業、農業、醫療等網際網路化程度低的產業都將被重新改造。

  作為核心技術之一,智能語音能夠應用於汽車、通訊、企業服務等多個領域,它可以讓車主在駕車時與汽車互動,也可以改善智能手錶等小屏設備的輸入體驗……人機交互將因此改變。

  Echo讓智能語音的發展再進一步。過去幾年,蘋果、谷歌都推出了自己的語音助手,但它們更多是手機的輔助,目的是讓手機更好用。Echo則不同,它完全為語音設計、不依賴手機,同時成功地趕上了物聯網繁榮的時期。Echo的成功歸功於亞馬遜對產品定位、使用場景和市場前景的準確判斷,這些經驗會讓亞馬遜在未來人工智慧的競爭中走得更加從容。

格外小心
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-12-13 21:17

快速回復 返回頂部 返回列表