掌握人工智慧主導權就是在全球處於價值鏈高端

小康人家 · 發表於 2016-2-24 09:18

專訪劉慶峰、胡郁：掌握人工智慧主導權就是在全球處於價值鏈高端
發表時間：2015-12-23 15:42:37

12月21日，科大訊飛在北京國家會議中心開了場以「AI復始，萬物更新」為主題的科技大會。於1998年創辦的這家民營企業目前不僅擁有中國市場70%的語音交互應用市場，更擊敗老牌計算機企業的語音交互研發團隊，在全球語音交互及人工智慧（英文簡稱AI）領域處在領先地位。會後，科大訊飛的兩位「帶頭大哥」——科大訊飛董事長劉慶峰和訊飛研究院院長鬍郁接受觀察者網採訪，分享科大訊飛作為人工智慧的後起之秀如何在微軟、IBM、谷歌等強手林立的世界語音交互應用市場站穩腳跟，更佔有中國70%的市場份額。

科大訊飛董事長劉慶峰（左）和訊飛研究院院長鬍郁（右）

觀察者網：訊飛從1998年幾個大學生創業到今天IBM、微軟、谷歌等巨頭環視的情況下佔中國語音交互市場70%的份額，更在全球與這些企業進行競爭，在這些年的發展與競爭中訊飛做對了什麼？

劉慶峰：訊飛做對了三件事。第一件事情就我們選准了方向和切入點，如果說人工智慧今天貿然介入，神經網路演演算法都是從美國開始起步，有些在加拿大、多倫多那些頂級科學家。我們做的中文語音合成，後來做了多語種語音合成。又開始做語音識別，我們在寶馬評測中全球第一。後來做評測，英語評測中唯一能夠代替人工。現在開始做自然語言理解，就是超腦。從產學研體系，後台研究員管理前端聯合實驗室，加上後台我們的語音平台開發部門，形成完整產業研發體系。訊飛這麼多年堅持頂天立地產業發展，核心技術全球領先，大規模產業化，形成自我造血和迭代，這是關鍵。路徑我們選擇對了，切入點對。正是因為我們看到了我們在語言中，過去我們從中文拿第一，這是應該。國際巨頭在2000年的時候中文市場也是他們掌握，都是IBM、微軟，現在他們對訊飛評價很高。

第二件事情就是我們真的把一些有報復和夢想的人專註在語音和人工智慧領域，這些科學家不是在國際上拿圖靈獎的那種學界明星，但他們三四十歲是最年富力強的年紀，又受到全球最好的專業訓練，他們回到中國，有的在北京，甚至在合肥中國科技大學。在合肥股權期權，他根本不是為了錢，是為了夢想。所以說每天他會非常勤奮的去工作，已經解決了個人所謂的財務自由，以後為夢想奮鬥，誰都挖不走。他也不會為了做任何其他的事，他就想干這個事，有一幫這樣的科學家。我覺得這是我們訊飛非常幸運的地方。我們也看到跟國際巨頭比，我們看到很多科學家過去，並沒有把這個事情當成自己的事情來看，也是打工心態。沒有對這麼強的產學研推廣到大規模應用的使用。

第三我們選擇了很好的產業化的路徑，他們只做語音的合成技術不停往前走，我們在最恰當的技術推出語音雲平台，積累十億人次的訪問，快速迭代。雲平台的基礎上，開始切入到教育，未來在行業中最有可能形成成功在各個行業BAT，在教育最有期望，客服領域。我們把我們方案延伸專業領域，不是只做解決方案，只做2B，是具有2B和2C的雙輪驅動能力。教育給了老師和學校，汽車電子賣給車場，隨後圍繞語音車聯網進行服務。又實時走到了人工智慧平台，訊飛不斷往前拓展。

概括起來，訊飛做對了什麼？第一我們選擇了非常正確的以企業為主體產學研合作的創新道路，自己本身是懂行，都是干這個出身的。我們可以承擔企業主體作用。第二就是我們在這個過程中有一批非常優秀的科學家我們更專註，把它當成自己的人生夢想做。第三就是我們選擇的產業路徑。
所以說人工智慧以語音和語言的交互為切入，是認知計算的必由之路。我們在這裡走向了全球前面。

我們有海量用戶支撐我們做這個事情，這是單純做科研院所沒有的，有了這兩條，未來訊飛走在前面我們非常有信心。今天這些階段性成果，都是依賴我們這些優勢。中國找不到第二家可以做出來。

談企業與競爭：任何一個企業都要保持敬畏之心

劉慶峰：科大訊飛未來真正要對的是國際巨頭，真正在人工智慧上花巨資，真的有頂尖科學家把它當夢想去做，不是簡單通過它賺錢，通過資本併購。

始終任何一個企業都要保持敬畏之心，上面有更有錢的大佬，通過流量優勢和資金投入有可能去追趕。怎麼樣保證訊飛的基因，從六個在校學生創辦科大訊飛，怎麼樣把創新的活力和主人積極鬥志保持，這是挑戰。

第三塊更重要因為人工智慧不是像一般的產業，中國現在做移動網際網路，做O2O是燒錢。你做人工智慧比如說考試必須比人好，才能用到真正的考試中。你上課讀的效果沒有人好，怎麼教你讀英語、漢語。

訊飛不是說通過市場迅速，忽悠大家引發消費衝動購買，更多選擇是強技術，2B首先是具有技術剛需，達到應用門檻使用。2B具有海量2C應用能力，我們現在看到很多公司。很多網上熱播視頻經不起細推，很多有問題。我們要一步一個腳印，就像矽谷，他們其實比中國很多創業者更加踏實。

美國矽谷很多大公司比中國很多大公司內心崇尚技術，不是簡單挖幾個人，簡單併購。我特別希望看到華為的成功，他是回歸技術、產品、研發本質，做最好的產品成功。從事物發展規律，紛紛擾擾浮躁這幾年，未來回歸科技的規律上，訊飛是走到正道上。

胡郁：搞研發有點像余敏搞氫彈

胡郁：公司最終目的就是給了你一個體制可以搞到錢和人做你想做的事情。你想做什麼，你想賺更多錢，還是真正的像美國有錢人講的，他說是推動科技進步。訊飛我們為什麼要學華為，我們當然要賺更多錢，賺非常多的錢，搞最好的人，最終目的不是去收購別人或者是幹什麼，我們最終目的是推動科技進步，這是我們最終目的。

像中國造氫彈，原子彈到氫彈過程非常快。中國有人作出非常突出的貢獻，就是中國的氫彈之父余敏。地球上做出氫彈就是兩種構型，一個是美國發明，還有法國抄寫美國的。還有中國。神經網路的東西，我剛剛講的響應時間，你必須重新構造自己能解決的，我們具備這樣的能力。你找出這種構型，找到這種解決方案是不是最好，能不能達到最好的效果，這個最好是在變化，過一段時間還會發生變化。
超腦就是要讓機器真正像人一樣思考

小康人家 · 發表於 2016-2-24 09:19

本帖最後由小康人家於 2016-2-24 09:20 編輯

超腦就是要讓機器真正像人一樣思考

胡郁：我們的目標是要讓機器真正像人一樣思考。看上去像人一樣聰明的智能，並不一定能夠讓機器真正的思考。如果你想要真正的思考，更好的要學習腦科學，腦科學借鑒更多的東西。有兩種辦法，有一些人相信把每一個人腦的分子結構和動態過程搞清楚，超級計算及模擬他，就可以得到人工智慧。不需要了解核心機理是什麼，我插上羽毛也可以飛，其實鳥能飛是空氣動力學。我們不用完全模擬他是怎麼回事。神經拓撲結構。我們做的有可能比人腦還要好。我把這個詞歸納成為智能動力學，讓大家更好相對於空氣動力學更容易理解。

我在研究人的智能，智能是加算數題，可以寫文章，可以知道北美大陸相對南美大陸是什麼關係，叫做智能。有一個測試就是IQ。人還有一種能力，不管聰明還是笨會有情緒，有求生欲，會有善惡，這種東西在我們自然界包括人從來沒有分離過。你會發現很有意思，你需要一定的自我意識，他必須有一定的智能，必須會交互。不會交互，就什麼都談不上。反過來這個就有意思了，我只想讓它算算數，知道北美大陸哪，他是不是真的要有（英文）呢，這不一定。我們從來沒見過一個東西，高級智能，知道北美洲和南美洲什麼關係。有一個黑天鵝理論，天鵝都是白的，沒有見過黑天鵝，黑天鵝出現才知道有黑天鵝。自然界不存在的東西不代表不會被製造出來。

也許他們是可以分開，通過我們對人腦的研究。問題來了，你能把它分開，當然可以把它合在一起。既然可以分開，為什麼不可以把它合在一起呢。這個取決於需要，如果我們能通過那部分，根據需要可以把它組合在一起。

情感陪護是一個具體的業務目標，實現業務目標有不同的路徑。如果用現在我講的工業界的人工智慧或者是弱人工智慧辦法可以達到情感陪護目標，讓大家覺得好象有情感一樣，並不是真的有情感，這個目標達到了。情感陪護機器人可以做到，能夠陪伴人情感機器人和自己有情感的機器人，這肯定不能完全等同認為是一個東西。這是我的觀點。

我們中國以後不會缺企業家

胡郁：戰略合作關係和資本合作關係分不開，很緊密。當你有了錢有了槍，有了人之後，你要考慮，你第一把技術做的最好。第二給開發者是不是能給他們越來越好的東西。訊飛底下有十幾萬開發者，也許這中間70、80%，這會還是不行。現在國家講雙創，創新創業，很多人講創新創業70、80%還是交學費，這裡最強的能力是什麼？就是我們中國的企業家精神，我們中國以後不會缺企業家。但你看日本人，日本人不敢創業。我們技術可以起到輔助作用。所有創業者其實是在支持中國的創業，因為大家想想人工智慧這個領域你想在這上面獲得足夠技術積累，把你產品做的能用。我想到五到十年，創業時間不可能有那麼長時間積累。訊飛正是因為這麼多年慢慢積累，經過九死一生過來。我們幫助短期上來的企業可以給他們幫助，這是一點，很重要的。

人工智慧在未來五到十年內會發展成什麼樣？

胡郁：人工智慧會不會像前一波地下去，這是很多人問的事。我覺得我們當前這個時代，人工智慧前面已經60年了，你會發現很有意思。前面30年是大型機、中型機、小型機、個人電腦。87年以後進入網際網路、移動網際網路、物聯網，將來這30年，後面又是新的30年的開始。將來30年我們可以看到有哪幾個東西的發展，一個是網路連接會更快，帶寬越來越大。

第二就腦科學，腦科學進展很慢，隨著偵測技術、探測設備，包括對基因也有突破。所以腦科學進展非常快，我的理解還是從兩方面來講，一個是從研究領域來講，我覺得我們有可能在一條因為有大數據、雲計算，本身它會有持續不斷往上提升。同時因為有腦科學的進展，我們甚至可能在一些領域獲得突破性進展，也是有可能。我覺得我對這方面的信心非常足。我們的進展會比以前更快更大。

在應用上我覺得大家會看到剛才講的網際網路和移動網際網路的需求，大家對需求拉上來了，需求是產生最好的拉力的地方。會有更多更新的我們現在想象不道德地方會提出這種需求，也會為我們創造很好的條件。

劉慶峰：五到十年一個預測有兩件事情會普及，一件事情就是機器人，會非常廣泛的進入我們社會生活很多領域，從工業到服務，這是一個。大家真的在五年以後會在我們發布會的現場，會在各個飯館酒店，會在越來越多的地方可以看到機器人的身影為我們服務。第二就是虛擬現實會大規模的普及，我們一種是從實物形態機器人，從虛擬形態通過3D、4D的呈現，對人類大腦解除合反饋更深入的研究，使我們足不出戶體會到更多的虛擬現實的樂趣，我覺得這是兩個大趨勢。

從目前科大訊飛已經看到的人工智慧現代的技術水平，我們今天發布這些產品，如果在配合現在的大數據、物聯網發展，即便沒有在腦科學上全新的突破。未來五到十年可以使得我們機器人大規模的進入到我們的身邊，使得我們虛擬現實給我們帶來更多的不光是快樂，而且在實用上再去逛商場，可以多個緯度看，穿在身上。不像現在在網上挑這些衣服，點菜可以感覺到它的味覺，有越來越多的虛擬現實東西出來，這是實實在在發生的事情。

如果出現先天把人體大腦解剖學，腦科學和我們數字信號處理和大規模的神經網路這些主要是計算數學家們和數據處理專家們做，兩個融合起來，還有更大一波的技術突破。

以下是劉慶峰在訊飛年會上的講話（全文），觀察者網特別刊發以饗讀者：

小康人家 · 發表於 2016-2-24 09:23

以下是劉慶峰在科大訊飛年會上的講話（全文），觀察者網特別刊發以饗讀者：
尊敬的劉利民部長、郭傳傑書記、吾守爾院士、各位領導、各位來賓，女士們、先生們大家下午好！今天是周一，又恰逢聖誕節和元旦即將到來之際，這麼多的來賓能夠在百忙之中抽空參加我們的發布會，還有非常多的朋友通過高清視頻直播和圖文直播在觀看我們的現場直播。充分表達了大家對人工智慧的一下內容關注，對科大訊飛的信任和期待，在此我要代表科大訊飛公司對各位的到來表示衷心的感謝和熱烈的歡迎！
我們經常說到人工智慧讓機器具備像人一樣的智能，應該說是人類在科技和產業界最偉大的夢想之一。而要把這個夢想照進現實除了有激情有堅定不移的長期的激情堅守之外，還需要腳踏實地一步一個腳印踏踏實實的科技創新，和與之相匹配的各個階段令人尖叫的產品。
那麼科大訊飛我們在2010年，首次發布了科大訊飛的語音雲平台，宣告手機的語音聽寫時代開始來臨。過去5年中，隨著我們技術的不斷進步，到了2015年，到了這個月我們每天的日訪問在訊飛語音雲平台上已經有10億人次之多。那麼，圍繞訊飛僅僅是一個輸入法，就有2.8億的用戶、每天5000萬人在使用。越來越多的輸入法，越來越多的移動app的工具開始使用我們的語音技術。
在輸入的同時，很多的朋友都在問，說在輸入法中你們已經做到了95%的準確率，甚至達到98%，能不能在這樣的一個大會的過程中、在老師講課的講堂上能夠同步的把語音也給轉成文字，便於大家事後檢索與學習。但是我想告訴大家，這樣一個技術其實是很有難度的。為什麼？因為手機是近講，是我們對著機器的說話方式、同時噪音也不是很大。但這樣的幾千人的會場，這樣激情澎湃的演講再加上環境背景的回聲噪音等等，在業界要把它做到實用是非常難的問題。但是今天我想給大家的第一個驚喜就是科大訊飛在全球率先突破了這一技術。所以，我們今天的全程演講，請大家看兩邊的大屏幕，都是同步實時轉寫出來的。
好，我們回歸到今天的發布會的主題，其實我們在談到了人工智慧60年的發展之後，現在面臨著全新的發展機遇。那麼今天我們的發布會我想一方面要跟各位嘉賓包括網上直播的各位朋友們，我們來分享科大訊飛對於人工智慧產業發展的全景性的思考。對於未來人工智慧究竟在哪些關鍵領域要取得突破而不是單點技術系統性的成長，哪些是最關鍵的方向以及我們今天的三大年度新產品的發布。
首先我要向60年以前在達特茅斯會議上正式提出人工智慧概念的這些前輩專家們表達我們的敬意。當年，就是因為麥卡錫第一個提出了人工智慧的概念，使AI成為了人工智慧行業的名稱，而且發布了第一個人工智慧的系統語言。那麼在此基礎上我們看到計算機的人工智在五六十年代就已經能夠證明數學原理里的38項。那麼在此基礎上另外一位計算機大師也是圖靈獎獲得者明斯基，他明確的提出了一套演演算法，能夠證明第一代神經網路到底能夠干哪些事情，又有什麼樣的缺陷。所以我想人工智慧絕不僅僅是人類大腦的冒出來的一個，突然的空幻的夢想，而是有著嚴謹的數學理論做支撐，有著計算機的頂級專家共同推動的。還有兩位大師我們可以看到，在人類歷史上可以說非常耀眼的一個跨學科的專家，既獲得諾貝爾獎也獲得了圖靈獎的西蒙。還有資訊理論的創始人，也是現在通訊技術的奠基人香農。就是這些專家，我們可以看到，從計算機，從數學，從經濟學，從通訊，從資訊理論的角度聯合的產業跨界，共同的創新，才推出了人工智慧的橫空出世。才有了我們今天在這樣一個全新的時點上來探討，60年之後，人工智慧究竟能給我們帶來什麼樣的驚喜和什麼樣的挑戰。

小康人家 · 發表於 2016-2-24 09:23

本帖最後由小康人家於 2016-2-24 09:24 編輯

任何事物都是波浪式發展，那麼從人工智慧1956年第一次提出來，當第一次的人工智慧的演演算法語言和第一次人工智慧可以證明數學原理之後，明斯基在1970年非常興奮的宣告說未來3到8年計算機的智能就可以達到人類的平均水平。那麼顯然是非常的樂觀的，但也正是因為他提出這樣一個設想，所以他開始證明說人工智慧是不是真的可以。結果它通過在感知論中證明了第一代神經網路是有缺陷的。也是這樣一個極力鼓吹人工智慧的人最後發現了科學的缺陷最後導致第一代人工智慧到1980年出現第一個低潮，可以看到這些大師們求真務實的精神。

第一次低潮過後，1982年，大家可以看到這個圖上的霍普菲爾德網路的，出現到1986年BP演演算法的出現，使得大規模神經網路的訓練成為可能人們再次看到了神經網路人工智慧的希望。因此日本雄心勃勃的推出來第五代計算機的計劃，希望未來能夠推出人工智慧計算機。大家知道計算機從電子管到晶體管到集成電路到大規模集成電路第五代就希望做人工智慧計算機。但是隨後我們認為事物確實發展都不是一帆風順的，由於這些演演算法計算機的運算能力的限制和演演算法的難以收斂導致了直接到2000年第二次AI冬天的到來。第五代計算機宣告失敗DARPA削減投入。那麼，再往後，一直到2006年深度學習的概念被正式提出來，首次證明用這種方法可以進行大規模深度神經網路的學習。學習能力有了，那麼有了這個學習能力之後一系列的演演算法包括在深度神經網路方面的卷積神經網路遞歸神經網路等等辦法，不斷地在語音合成語音識別方面取得突破。

稍後我們訊飛研究院院長還會給大家分享我們科大訊飛在核心源頭技術方面我們做了哪些創新。正是神經網路的不斷的創新，再加上今天移動網際網路時代大數據雲計算的興起，再加上無線網際網路可以使數10億的用戶的數據源源不斷的匯聚到後台供我們的神經網路進行學習和訓練。所以大家都認為，人工智慧在經歷了60年一甲子之後經歷了兩次起伏現在已經進入到真正的爆發的前夜。而我們覺得非常幸運的是，前60年中國人基本上絕大部分時間是缺席全球人工智慧這個盛宴的。但是今天，有了科大訊飛有了我們一批的合作夥伴，以產學研用相結合的方式我們開始在很多領域走在了全球的風口浪尖之上。

我們在這可以看一下，不光是科大訊飛這樣認識，當前的一些大師們都怎麼看？著名的矽谷的思想家凱文凱利，寫了失控這本書，最近又寫了必然這本書。他就明確說，如果你問我未來20年最重要的技術是什麼？毫無疑問，我會告訴你就是人工智慧。霍金這位大科學家除了科學研究和思考幾乎什麼都不幹，但是霍金說人工智慧可能在接下來的100年之中將人類取而代之。一方面對人工智慧未來的前景充滿信息，另外一方面給大家拋出另外一個話題，人工智慧對人類是喜還是憂，會不會替代掉我們人類，甚至會在未來主宰我們人類。

今天的全球首富孫正義，在今年提出的一個著名的公式叫孫正義公式。他認為未來決定一個國家的GDP排名的不是人口。軟銀一家就要有3000萬個機器人。未來機器人的數量和智能化程度，決定了GDP的全球排名。所以日本把人工智慧提到了非常高的高度。今天人工智慧真的已經關乎到絕不是一個企業或者一個產業的事，而是國家全局性的戰略任務。在移動網際網路時代，掌握住人工智慧的主導權，我們就在全球處於價值鏈的高端，如果丟失掉，我們會繼續像前30年一樣淪為最低端的製造。

小康人家 · 發表於 2016-2-24 09:26

我們可以看一下人工智慧因此而開始上升為各個國家的國家戰略。美國奧巴馬政府明確提出大腦活動圖譜計劃，把他列到跟人類基因組計劃一樣的高度，歐盟也推出了同樣的計劃。中國在去年啟動了人工智慧的重大專項之後，正在積極醞釀準備啟動中國腦計劃。那麼應該說這樣一個國家戰略已經在全世界範圍內被越來越多的科技界企業界和政府認同。
那麼我們今天要問，在這樣一個戰略的基礎上，我們人工智慧到底是機器具備什麼樣的智能，怎麼樣劃分？大家五花八門想到的各種類型怎麼樣對它進行界定？其實科大訊飛，在去年8月20號我們訊飛超腦計劃的首次發布時，我們就對人工智慧做了一個清晰的分割和界定，把它分成3個層面。第一個層面運算智能，讓機器具備了能存會算的能力。那麼這能存會算呢，剛剛我們在這個短片中看到了，在1997年，計算機下象棋超過了人類象棋大師。因為它的運算能力強，所有能便利結果的東西機器已經超過人工了。第二個，感知智能，讓機器能聽會說能看會認。我們知道人類的視覺看到是可見光，但是機器現在可以到紅外可以到紫外。我們的聽覺20赫茲到2萬赫茲，但機器可以聽超聲波可以聽次聲波。
今天科大訊飛的語音合成在英文中已經達到4.2分，超過了普通人4.0的水平。在中文達到4.5分，機器在合成在識別在很多方面也已經達到人工的水平。這叫感知智能的發展。但是最有挑戰性的，也是我們人區隔於動物的最大的能力，就是我們的認知智能。認識和知道能理解會思考。這樣一個能力，今天我們怎麼來突破它？
那麼突破人工智慧特別是認知智能切入點應該是什麼？其實呢，當年人工智慧在60年前提出來，我認為就本身帶著對人類本身發展的站在原點上的一些哲學思考，那我們今天考慮人類發展。
《人類簡史》最近在各大主流媒體和科技界，考古學家和歷史界都在傳誦。這本書上提到了，類人生命，200萬年前誕生。但是今天主宰地球的，智人的誕生，是在7萬年前。七萬年前是什麼因素，導致了我們目前的智能，我們的祖先，能夠在這個大路上，能夠在地球上一統天下呢？考古學發現，各方面的證據都匯在一起，語言使得我們能夠反饋周邊的環境信息，因為有了語言才使得我們能夠反饋環境信息更上的社會信息，才使得我們可以虛構概念可以有理想可以有主意可以有組織可以有夢想。那麼這是沒有語言的廣泛使用就沒有人類的交流就沒有智慧的碰撞和產生就沒有今天我們人類自身的認知智能。
因此我們認為人工智慧發展有一條必由之路，就是由語音和語言為入口的認知智能的革命。這是我們今天所面臨的機會，也是我們已經找到的路徑。
那麼在這個路徑上我們可以看到今天我們有幸的是，科大訊飛為代表的中國科技產業界我們在語音和語言上已經有了哪些非常好的積累。科大訊飛九九年創業九八年開始籌備創業，我們的語音合成技術中文就是業界第一名。那麼隨著我們的發展，那麼在2006年我們第一次獲得了全球英文大賽的第一名，更到2012年讓英語合成我們在全世界首次超過了真人說話水平，今天呢我們英語比美國人英國人做的英語要好。我們的印地語印度人說話的印地語，剛剛的2014年底和2015年的比賽結果科大訊飛代表中國超過了印度人做的印地語。目前我們已經有了26個主要語種的語音合成。

小康人家 · 發表於 2016-2-24 09:26

語音評測，讓機器可以評測我們的普通話，我們的英語發音是否標準，錯在什麼地方，怎麼改正，進而現在對音樂唱歌都能進行評價。這項技術我們不僅在2006年，超過了國家級測試員的水平，現在已經大規模的在普通話等級考試，在海外漢語口語考試，包括在我們高考改革現在的英語考試中廣泛使用，有效地推動我們的高考改革。
2008年第一次在全球說話人識別大賽中獲得第一名，2010年我們首次發布了圍繞雲計算和移動網際網路的訊飛語音雲平台。那剛才我說到截止到現在用戶日訪問量去年這個時候不到5億人次。7月10號我們給李克強總理彙報的時候7.6億人次，而今天，突破了10億人次，可以看到快速發展的態勢。
有了嘴巴有耳朵還要有個語言的理解。這個理解技術，在2010年開始成功應用到電信和金融行業。今天已經可以替代掉中國移動，中國聯通和電信的客戶服務30%的人工，是全行業獨家可以真正用機器代替人工的。同樣支撐了我們靈犀助手的幾十種不同的應用。而這樣的自然語言理解，又使得我們在2014年底和一五年初的，兩次全球最著名的國際翻譯大賽，漢語和英語，英語和漢語的評比，以及美國國家標準技術研究院組織歷史的國際測試，都是全球第一名。大家知道嗎？2014年底之前，國際這兩項比賽，漢語到英語的翻譯比賽，是日本人全球第一，英語到漢語的翻譯比賽是美國人全球第一。但是伴隨著訊飛自然語言理解的進步，到2014年底我們改寫了這個歷史。
那麼有了上述的語音和語言技術的不斷的突破和發展，我們還有一個支撐我們未來做認知計算的非常重要的基礎就是我們海量用戶的誕生。我們可以看到今天的訊飛輸入法已經擁有了2.8億用戶，是業界口碑最好的輸入法。我還想告訴大家一個秘密，就在一個月前我們推出來了中間的叫做隨聲譯的功能。說漢語同步可以出英語，所以很多大學生和高中生現在寫英語文章變得非常之簡單，受到很大的歡迎。
那麼，在靈犀中我們有1.2億用戶可以打電話發簡訊問天氣航班股票還可以閑聊，那麼大家知道最近有很多語音助手推出來，但是我想告訴大家在中國移動做的官方統計12個主流應用商店的下載中，我們靈犀一家超過了前5名中另外4家的總和。
那麼，這是我們自己的輸入法和靈犀的移動網際網路產品，但科大訊飛就像當年劉利民部長支持我們大學生創業一樣。那麼我們教育部支持我們學生創業，我們今天也把我們的語音雲開放給所有的創業者。那麼這個創業者呢正在蓬勃發展，尤其趕上中國的雙創大眾創業萬眾創新。我們可以看到去年這個時候，我們的用戶數是4個多億，到了今天已經達到7個億。這個用戶數4.4億現在到7億，這個數據是什麼呢？總下載量已經超過了10個億了。那麼，我們考慮因為正常手機使用壽命18個月，所以只算前18個月的，一共是現在有7個億的用戶，增長60%。但是現在有很多應用號稱用戶數很大忽悠的概率很高，沒有人每天真的用那這就是個問題。每天的訪問人次才是關鍵，所以大家可以看到，我們今天和去年同期相比都是11月底的數據。從4.8億人次，每人用一次算一個人次，漲到了10億人次，上漲109%。而圍繞我們語音雲的開發夥伴呢，從4.3萬家增長到了11萬家，增長了156%。這個數據另外能看到一個什麼趨勢呢？

小康人家 · 發表於 2016-2-24 09:27

總用戶增加，日訪問人次比總用戶增加快，說明我們的使用頻率越來越高。而我們的開發夥伴數增加比日訪問人次提高的快說明有越來越多的合作夥伴正在開發還沒有推向市場。未來的量會增長更快，潛力更在後面。所以這就是為什麼我們說在萬物互聯時代以語音為主以鍵盤和觸摸為輔住的人機交互時代正在到來。那我們再看在車載領域的應用，對吧，大家知道馬上也月份又要開全球消費類電子展。去年的拉斯維加斯消費電子展最火的參加最熱烈的不是手機也不是電腦是汽車廠商。大家都認為隨著無人駕駛汽車智能汽車的發展，在車內打電話發簡訊不用手，然後導航直接說話，聽音樂一說歌曲馬上調出來本地沒有從後台幾百萬首歌曲去調取。那麼這樣的應用是剛需因為汽車未來越來越會成為一個移動的娛樂和辦公的平台。
但是在車內，語音的應用難度非常之大，因為有噪音輪胎噪音車窗噪音空調噪音，再加上我們坐在座位上設備放在方向盤或者後視鏡有一定的距離，所以很難做到實用。但我很高興的告訴大家就在今年的4月份，歐洲的頂級車廠，寶馬汽車的國際比賽，我們是全世界唯一達到實用。因為85%是大家認為可用的門檻，大家看到這個比賽結果科大訊飛是百分之八十六點幾，而全世界第二名，美國公司才75%。所以，為什麼有這麼多的國際頂尖車廠都在用我們的技術。奧迪、賓士、寶馬、沃爾沃、福特包括最近日系的雷克薩斯最高端的人也都要上，當然我們跟國內的從吉利江淮奇瑞以及長安等越來越多的國內車廠也在開始進行展開深入合作，這個技術我們已經走在全球最前面。
伴隨前面這些進步，我們也開始做軟硬體一體化的產品。在今年的，第三季度末，我們推出了，帶語音遠場識別控制，並且不光能聽音樂，還可以操控家居的叮咚音箱。這個叮咚音箱一出來，就在整個中國WIFI音箱銷量中排名第一。不僅如此，它的銷量超過了后9名的總和。然後我們又在年底，推出了業界第一款，能夠全程用語音控制，而且還可以給孩子講故事、可以翻譯、可以詩歌對答、可以算數等等陪伴功能的兒童手錶。大家可以看到這個圖上，這就我們最新的產品。這些呢，都是表明了科大訊飛把我們的技術推動，到我們老百姓耳熟能詳的身邊的一個目標。我們也會跟我們的合作夥伴，做更多的有益的嘗試。
通過我們的語音和語言技術再加上我們的大數據和人工智慧我們實現的從教育的評價到考試到課堂教學到課後的練習已經有8000萬的老師和學生。剛剛我們的總書記到了新加坡。大家知道嗎？新加坡教育這麼發達的國度，94%的中小學都裝了科大訊飛的系統，不僅是教漢語，還有英語和其他學科。

小康人家 · 發表於 2016-2-24 09:27

正是因為有了我們前面所說的，語音和語言技術的核心技術突破，有了我們每天10億人次的訪問所帶來的機器可學習的數據來源，使得我們今天科大訊飛在2014年的八月份我們可以正式發布，中國第一個，叫中國超腦計劃；承擔了科技部人工智慧領域，第一個示範性的標準的重大項目，叫類人答題機器人的項目。這個項目中我們訊飛超腦的目標就是要讓機器，能聽會說到能理解會思考，真正的要開啟認知計算全新的大門。我們前面已經提到了認知計算，以語音和語言為入口的認知計算，是我們當前必由的道路，也是我們非常重要的切入點。那麼在這樣一個切入點中，到底認知計算未來我們能做到什麼程度？現在有很多的各種各樣的單點技術突破，也有很多人從各個角度說，我的系統很牛，到底怎麼比？今天呢其實我們可以看到在全世界的人工智慧專家都看到了另外一個比較的方式，就是你不要在某個單點要比就放在高考這個點。我們都很討厭高考，但我想在座的很多人都是由高考選拔出來的優秀人才。那麼因為高考這個點是最公平的，是最能看到你對知識的綜合表達能力，你的學習能力和推理能力的，因此大家說不要說人工智慧在設定了某個領域能幹什麼事，是告訴我在開放式的高考中跟人PK到底會怎麼樣。所以我們可以看到全球的科學家們，在美國華盛頓大學的圖靈中心，圖靈中心現在已經升格為叫AI實驗室，它的目標是什麼？
讓計算機未來高考要通過美國的生物學的大學入門考試。而日本機器人，他的目標是未來機器要考上大學，甚至希望在2021年機器能夠考上東京大學。那麼我們中國啟動的科大訊飛總牽頭的人工智慧計劃類人答題機器人目標也是3到5年之內讓機器高考能考上一本。什麼概念?機器高考考及格很容易,因為它有很強的記憶能力。而機器高考要能考上三本，比50%人強就很難。我們的目標是未來機器要能跟100個學生，機器要考前20。不僅僅是在考試這個點，關鍵是相關技術成果它可以在過程中對我們的學習起到非常大的幫助，而同樣成果可以用在醫療用在客服用在越來越多的領域，它這個核心源頭技術和演演算法的突破。那麼關鍵要解決的知識的表達推理和學習的能力。
那麼今天呢，我們在前面已經看到了，訊飛超腦我們要做的事情。我們認為未來的認知革命最核心的三大基礎能力，第一個我們可以看到，就是人機交互能力。只有有了人機交互，才可以使得人類的智慧不斷的送到後台，才能使得我們後台能力不斷服務人類。第二個知識管理。只有把海量的知識，網際網路上大量的甚至是垃圾信息，變成結構化變得有用，才能夠獲得智慧的源源不斷的來源。只有在這基礎上，真的自己有推理和學習，才能形成我們認知革命的基本部分。我們今天看到很多人從各個層面去做，而我們認為基本的人工智慧的邏輯關係，就是這3塊：人機交互，知識管理，推理學習。我們的所有關鍵技術都圍繞這3個基礎點來展開。

小康人家 · 發表於 2016-2-24 09:28

那麼，剛才講了這麼多，下面就進入到我們今天的正式發布環節。那麼我們怎麼樣圍繞剛才3個最基本的能力來展開我們的研發？而在2015年年底之際，在中國人工智慧元年之際，我們給大家有一個什麼樣的答案什麼樣的答卷。
首先我們看看，我們給大家提出來什麼叫做真正最自然的人機交互？面向萬物互聯，面向越來越多的機器人，到底我們新的技術是怎麼展現的？
很有趣的一段視頻，那麼應該說呢，在今年的春節很多人在傳這個視頻，對吧。也有很多人問我說是不是科大訊飛做的，我說我們的技術比這樣好，但是也不能解決所有問題。這裡面的方言口音，在過程中的多輪交互上下文語義的理解，那麼很多很多的關鍵技術，都是在2015年年初所沒有解決的。我們現在看到在手機中輸入法按一下我們開始說話，在各種各樣的助手中，大家按一下屏幕，然後跟他說話，然後他結束再按一下才可以。就沒有上下文的理解沒有多輪交互更不支持你隨時打斷他。那麼這個中間呢看到一個有趣的視頻，可是跟我們的技術如果展開來它主要包括哪些方面呢？首先我們再看一個場景。
這是我們一個典型的，我們說現在的人工智慧。下一步要進入到智能家居，它要解決哪些問題？我們可以看到，如果在我們的廚房，你要用語音來操控整個廚房的家居，必須要有雜訊抑制功能。如果面對電視，或者我們的音響，我們要說話，一定要解決回聲消除問題，因為它自己本身就在大聲說話。當我們要遠距離操控，我坐在沙發上要控制空調的時候，我們要五米到八米的遠場識別。另外呢，當我坐在沙發上，也可以在其它的位置，站在陽台上隨時說話，它都能聽見，需要360度的精確定位。這幾項技術，如果不解決，我們就沒有辦法進入到我們的智能家居的，真正的實用場合。
那麼還有方言，對吧。目前呢，我們的方言其實已經有17種語言了，那麼已經有了3種主要的少數民族語言，維語。我們吾守爾院士在，我們在新疆大學就是跟吾守爾院士共建聯合實驗室，有藏語有維語。有7億用戶每天提供各種方言來跟我們的系統學習和訓練，所以說沒有方言支撐，我們買一個最酷的機器人回家陪伴我們的父母親陪伴我們的爺爺奶奶，他有時候真的搞不定對吧。所以方言那我們現在已經有了全行業，大家看各種輸入設備只有科大訊飛提供了方言，而且十幾種了。那麼還有，一些非常需要突破的技術，我給大家再看一個簡單的對話，就我們人跟人之間是怎麼完成一次相互的溝通的？
大家可以看，這樣一個簡單的，我們的秘書或者助手辦理事情的過程涉及到這麼多的關鍵技術。主動提問、插話打斷、背景知識長時記憶，然後持續聆聽、上下文理解等等，只有這些才真正解決了，我們說人工智慧時代或者萬物互聯時代，我們的語音才真的可以進入到我們的億萬家庭。因為今天，沒有屏幕了，我們離設備又很遠，假如還是在PC中的鍵盤滑鼠，還是在手機中的多點觸控和語音為輔，解決不了當前萬物互聯時代的需求。為此過去一年我們做了非常多的創新，請大家看我們現在真實版本的演示。
有請工作人員我們要演示的具體一個設備，就是我們已經在市面上銷售的DingDong音箱。以它為載體，可以聽音樂、可以操控家居、還可以幫助我們完成我們想要完成的各種助理的事物。
好有請我們同事為大家演示。好，大家可以看到，它不光完全這些功能，它還能聽懂我是它的主人，所以我說話他優先就響應，也不問你是誰。

小康人家 · 發表於 2016-2-24 09:29

有了我們真正最新的語音和語言技術，它就可以真的像一個聰明的助手，要幫助我們完成我們所需要的各種工作。那麼在這裡面我們再給大家看一下，其實我們原來的所有交互，可以說我們今天在市場上所看到的所有的助手類的都是單工單輪為主的。單工就是摁一次才能操作，雙工是他隨時隨地在聽你你可以隨時打斷。那麼單輪就是上下文，我問一次比如說北京明天天氣，然後下面再問你可以問他上海明天天氣，而現在我可以問北京明天天氣你可以直接說上海的呢，他馬上就知道上下文相關，那麼這個就是要多輪交互和對話。那麼通過我們的基於人工智慧全新的交互控制的演演算法，我們在業界首次真正實現了全雙工多輪交互系統。
在萬物互聯在新的機器人的交互情況下，如果是單工系統，識別準確率完成只有40%，而做到全雙工就可以達到90%。其實我們最近看到了不少由於人工智慧的蓬勃發展，在網際網路上有很多視頻在流傳。我想告訴大家今天看到的是第一個真實版的全雙工對話，那一些都是有人在後台操控的。那麼有人要不在後台編輯，表面上他一定要在手機和近講，結果在嘈雜下是有人在後台輸入，然後輸入文字前端回答。甚至我們最近在機器人大會上看到有個美女機器人的視頻，其實就是躲在另外一個房間，是另外一個美女在回答問題。但是它的形態，今天機器人的軀幹，外形已經很好了，最缺的就是理解和預測思考的大腦。而訊飛我們把這個變成了現實，所以大家才可以看到在深圳高交會，在北京的機器人世界大會上，基本上最有名最有特色的機器人全是科大訊飛的合作夥伴。
那麼我想告訴大家，通過訊飛技術的進步，我們可以看到，在萬物互聯時代，什麼叫做真正的能夠實現人機交互？因為你碰不到屏幕了，離你很遠，不方便用手和鍵盤來操控的時候。第一個就是遠場降噪，第二個方言識別，第三全雙工，隨時隨地在聽，第四個自動糾錯，主動糾錯，你可以打斷它，然後多輪對話，上下文相關。只有這些都具備，我們認為，才是萬物互聯時代真正的人機語音交互系統。所以今天我可以很自豪的告訴大家，是中國人重新定義了萬物互聯時代，真正的人機語音交互！
那麼在這個基礎上我們又進一步以語音為主把圖像把視覺把手寫，大家知道我們在輸入法中的手寫識別也是業界最好的，整個的更多的人工智慧的功能集成在一起，推出了業界首個人工智慧的用戶交互界面：AIUI。
那麼這個AIUI呢，一方面通過統一的交互介面，我們可以讓各種各樣的人工智慧的能力，非常方便的被我們的用戶和我們已經有的11萬個開發夥伴、未來更多的開發夥伴來使用。統一簡潔的交互介面，然後靈活的能力搭配，可以有離線的，可以是在線的也可以是各種各樣的類型的人工智慧，而且具備很強的服務拓展的功能。未來最新的人工智慧成果，都可以放到AIUI的統一界面下。
我們可以看到我們怎麼樣能夠讓這樣一個思路能夠變成現實？
有3個關鍵：
第一是軟硬體一體化，我們的智能家居我們的機器人可以直接採購訊飛的各種類型的麥克風陣列，使它360度使它五到八米之外都可以方便的來操控這個設備，所以首先是軟硬體一體化。其次是雲和端一體，什麼概念呢？有越來越多的家電設備智能家居它不聯網，那麼能聯網我們的能力在後台，如果不能聯網或者我們要節約後台運算資源可以直接有端的解決方案。就像我們在輸入法中第一次這個提供了業界最好的輕量級的手機的輸入法，不需要聯網直接說話就可以變成文字。那麼第三個是技術服務一體化，通過這個AIUI的界面我們可以給各個開發夥伴各種應用差異化的定製，可以定製不同聲音。就像我們定義了林志玲的聲音對吧，我們可以訂今年又推出郭德綱的聲音。
我在今年兩會在中央人民廣播電台竟然有個小夥子真實版的故事，因為我們做了林志玲的事情他以為是真的，結果當天買了導航系統回家，到家門口他也沒停車繼續開了幾十公里，就是為了想聽志玲姐姐說前方多少米左轉右轉。那麼這是一個真實的故事，大家可以去考證，在央視今年的兩會我去做了節目，還有其他的網際網路大佬就他們這個裡面的，這個一個真實的小帥哥。那麼，當然4我們也可以各種語音識別的場景，包括後台的語義定製可以實現技術服務一體化。在這3個基礎上我們提供了統一的AIUI的標準，就真正的定義人工智慧時代的人機交互的標準，有了這個統一的標準未來在我們平台上的各種各樣的設備，各種各樣的服務，都是可以互聯互通相互分享支持相互去碰撞去學習的。

小康人家 · 發表於 2016-2-24 09:30

這個AIUI呢其實也非常方便，很容易被大家使用。聽起來很高大上的概念，用起來就4個簡單步驟。第一步，一鍵獲取方案，第二步安裝麥克風陣列，第三步，集成我們SDK，然後再申請，如果不需要就通用，也可以申請差異化的定製。有了之後，我們的設備就可以跟人一樣。這個就是，大家非常簡單的，可以來使用我們的平台。就分這四步，那麼這個AIUI呢現在可以支持穿戴式設備，可以支持智能家居，可以支持機器人，可以支持我們各種智能硬體的設備。那麼應該說句都具備非常強的普適性和非常方便的調動性，那麼AIUI呢，應該是人工智慧時代，我們終於有了一個專門針對人工智慧和萬物互聯的人機交互的專門的界面。
這是我們今天的第一個發布。那麼，今天的第二個發布是高效的知識管理。我們剛才說了首先有了人機交互，語音和語言作為入口，我們才可以獲得了無窮無盡的知識，那麼，但是這些入口之後我們的知識該如何管理？隨著無線網際網路4G的發展大量的數字音視頻錄音的材料在網上流行，但是很多時候這些數據在這，可是我們取不到，因為它是非結構化的，因為轉寫一小時的錄音的內容，專業人士我們的媒體記者平均需要7個小時。所以很多錄音，假如今天沒有我們現場轉寫，有可能大家在會場會錄一段聲音，但是回去以後我相信一放可能幾個月不會再去看他，因為你重新去檢索它實在太困難。那麼我們再給大家看一段視頻。
事實上呢，這個中間有幾個關鍵痛點，大家可以看到。對於一個文字工作者或者每一個用戶來說，語音轉寫，工作量太大。回聽我們的錄音，我們要想去重新提取和學習，沒有字音同步，所以沒法檢索。兩小時錄音，必須聽完才知道我感興趣的那一段，關於最新人工智慧的演示是在第1小時20分鐘。沒有能夠自動幫你做要素提取，因為它全是非結構化的。今天呢我們要通過語音技術，真正的能夠解決這些問題，就首先要進行混響降噪，能夠把中間的混響，把噪音去掉。我們要解決人和機器交談準確率比較高，可是人跟人自由交流、閑聊對話、開會討論、吵架的過程中，各種各樣的口音怎麼解決？還有怎麼樣把2萬字的內容，變成200字的摘要。看完以後根據興趣，我再看後面內容。這些就是我們今天的第二個發布，如何進行高效的知識管理。
那麼，首先可以看一下三大技術難題，混響降噪。其實我們有非常多的現在有的音頻內容是通過原來的手機或錄音筆錄下來的，當然包括視頻裡面的都是單麥克風的。現在慢慢的有些手機有雙麥克風，單麥克風陣列的錄下來的聲音一般來說，語音轉寫準確率只有多少呢，40%多一點。所以根本沒法給你使用，10個字錯6個，主要內容可能都沒了。那麼通過我們最新的單麥克風的這個解混響的技術，那麼我們可以把它的準確率提升到87.9%。那麼如果說10個字有將近9個字對，基本上我們做檢索做摘要做字音同步就已經差不多可以用。那如果用我們專門的多麥克風陣列又可以把它做到90%以上，那麼這是一個我們在混響降噪方面的進步。
那麼還有呢？通過我們對口語交談的文本，在篇章。更大的這個域，不是一個字也不是一個句，而是整個篇章的理解，然後再加上口語化的建模，我們可以對口語化的轉寫有個很大的提升。再經過我們的文本后處理，對標點預測，內容的順滑，把不相關的內容去掉，還可以做摘要。這樣我們可以看到多場景的轉寫，演講已經達到93.2%，就像我今天這樣。其實我想在座的很多人，口音都比我標準。比我們喝長江中下游水長大，nl不分卷翹舌不分等等。然後即興發言接近90%，自由討論也能將近80%。這樣就使得我們真的人類所產生的這麼多寶貴的資料，內容不再是垃圾內容，而是可以被結構化被分析被處理。
那麼在這個基礎上我們推出了今天的第二個要發布的產品，是一個組合。有手機上的軟體，叫我們的錄音寶；有專門的硬體，我們的專門的聽見錄音筆；也有專門提供服務的網站。
我們的手機錄音寶，雖然說推出時間很短，現在已經有了100多萬的用戶。在這個中間，第一，這個錄音寶在手機中錄下來的聲音，比其他的錄音軟體要明顯的，音質要好。第二，很容易，什麼叫容易聽？你錄完以後，用我們的工具，馬上就可以把聲音和文字做對應。你去重新去聽，重新回去以後去整理，所以就出來了。然後，把他送到我們的網際網路平台上，聽見網站馬上就可以把文字轉給你。今天我們開完會，回到家裡吃完飯，兩三個小時以後文字就給你了。這是我們的錄音寶的軟體。

小康人家 · 發表於 2016-2-24 09:31

那麼還有一個一款神奇的錄音筆，這個錄音筆首先是音質很好，第二個同樣具備了我們剛才講的手機軟體的自動的音字對齊，同時也可以提交服務到我們的網站上。那買這個錄音筆的硬體設備的可以獲得很多的VIP的網站的服務。
第三個，就是我們的網站訊飛聽見網站。可以做到聲文編輯，自動的聲音和文字對應的編輯，字音同步索引。然後視頻字幕。我們一段視頻拍下來，馬上可以自動給你產生字幕，可以對應。這個是我們利明部長，我專門邀請他，一定要到現場來給我們指導。因為在中小學，一，有非常多的現在一思一優課，一課一名師。需要把老師上課的內容跟字幕對應，讓孩子可以有針對性的去挑選，對應的知識點來聽取。然後語音秒轉成文字，同時我們可以雙屏，一邊是原始錄音，一邊是整理的界面，快速的編輯。然後這個就是我們現在的訊飛聽見的網站，這3塊組成了我們要發布的，今天的第二個產品。另外我還想告訴大家，因為今天，我們剛剛開場的時候給大家的驚喜這樣，我們在全球第一次在這樣幾千人的會場上大會的我們的演講，大會的產品發布，可以同步的語音自動轉寫，然後在大屏上顯示。這一套方案，就放在這裡已經成型了。如果你在意你的服務的質量，你希望未來大會的報告能夠被更多的人當場分享或者事後獲取，那麼只要你願意花錢方案就在這裡。關於我們的內容服務的第二大創新，有了交互的入口，回來的這麼多數據我又有了內容來進行給他快速的整理，當然訊飛聽見，這句話我認為非常好，是給聲音插上文字的翅膀。因為聲音原來是不能看只能聽到，現在一小時聲音5分鐘讓你看就可以。
那麼第三個我們智能的推理和學習，我在前面已經給大家報告到了，說科技界人工智慧界現在說我們的人工智慧認知計算到什麼程度，非常重要的一個點就是在高考這個點機器跟人相比。那麼我想跟大家說的是高考包括了很多學科，數學物理化學等等歷史地理語文英語。那麼在這個中間，其實由於現在的神經網路的主要演演算法是基於數學統計建模的，因此我們的計算機在高考中考上數學物理化學這些相對比較容易。所以在日本的高考機器人在數學和物理的填空題和選擇題上已經達到學生的平均水平。最難的是什麼？自然語言理解。你要理解題目意思，所以他沒法做大的應用題，那麼在作文在政治歷史題問答中是最難的。而科大訊飛所承擔的中國科技部第一個人工智慧的重大項目，高考機器人，我們首先就把它放在了最難的自然語言處理方面。
那麼下面我就會告訴大家，我們在這方面有什麼成果？而這些成果呢，不僅僅目標是奔著3到5年考大學。更重要的是這些成果今天已經可以為我們的教育，帶來巨大的革命。我們可以看一下現在教育的大趨勢。在座的很多教育界的領導和專家。我簡單看一下，其實現在強調的就是如何以學習者為中心，如何因材施教，如果真的實現個性化？我們都知道老師上課，一個班同學。因為基礎教育，義務教育是普惠的。如果要讓全班同學70%同學能夠聽的比較適度的話，一定有10%到20的同學吃不飽，10%到20同學聽不懂。沒辦法兼顧了高端，可能一大半人都聽不懂。兼顧了低端，所有人都浪費時間，所以只能普惠。怎麼樣把老師的能力延伸，人工智慧才可以真的做到，對每一個人單獨的提供幫助。另外，聽說讀寫能力。伴隨著高考改革大家對英語教學一直有很多爭論。確實覺得中國孩子學英語花的時間太多，而最後我們的英語口語的表達能力又偏弱。
其實如果用一個好的機器，營造真正的英語聽說讀寫的環境，可以使我們孩子的英語學習時間，至少減輕一半以上。那要釋放掉中國未來多少寶貴的聰明智慧，用在鍛煉身體，用在開放他的啟髮式思維能力。在這兩個能力上，我們再看，今天我們能做哪些事？
那麼大趨勢上我們看到了還有一個現狀也是這樣。老師上課，他在講課過程中講解到一個知識點之後他不知道同學們是不是掌握了，那麼如果繼續重複聽懂的同學就會很煩，而繼續往下講沒聽懂的同學又覺得前面一個知識點沒掌握，這是老師的痛點。那麼甚至今天布置完作業等我明天上課的時候我不知道同學們昨天作業今天早晨交過來他到底完成的怎麼樣，所以我不知道應該重點講昨天的講課中哪幾個知識點。只能等到第二天晚上改完後天上午才知道如何再進行複習，所以教學的反饋它是割裂的。
可能我們大家都是高考走過來的，至少高三這一年80%的訓練是無效和重複的。當年我的數學老師就跟我跟我們班同學說，說今天一天如果你們做的所有題目都對了，千萬別高興，因為你這一天白過了，一點進步都沒有。我們有多少同學被這樣的重複訓練耽誤了時間，而還有些同學如果他這一題是附加題根本花兩天都做不會，他就沒必要去學去做，做了打擊他信心浪費他時間，應該讓他做跳起來夠得著的題目。所以這個就是我們今天說課後作業，怎麼樣給大家更好的幫助。沒有這一些，只能是學校一本教輔，家長又找第二本第三本第四本讓孩子們整個的課餘時間全部被壓掉。那麼當然口語學習非常重要的是沒有課後環境。

小康人家 · 發表於 2016-2-24 09:31

今天用我們的兩項關鍵技術，可以把這個問題得到歷史性的突破。第一個關鍵的問題，就是我們怎麼樣真的知道每個孩子，在上課的過程中，課後的作業以及每一次考試和訓練過程中，他的知識掌握情況？怎麼樣把數據匯聚上來？匯聚上來以後，怎麼樣能夠自動的評閱，分析出他的知識薄弱環節？這是兩個關鍵的點。這個關鍵點中，我們再看我們怎麼解決的。第一個自動手寫識別。在業界大家知道嗎？學生像這個塗改這麼多的英語或者語文作文，我的字就寫得很差。
我估計機器現在的自動的識別因為我們要讓機器分析他的薄弱環節，對知識點進行習得順序的分析，首先要把它的這些東西數據把匯聚上來。而這種平均學生的作業和考試的手寫準確率，行業只有70%平均準確率。只有做到95%以上甚至98%才能試用。那麼不光是語文，對於數學理科也是。版面分析相對簡單，更重要的是高清晰度的手寫體識別。那麼今天呢科大訊飛的ocr識別在業界已經獨家率先達到實用。這個實用不是我們說的，是經過了專門在中考和高考的畢業會考中，幾萬份幾十萬份的試卷，機器跟人的對比中得到的結論。
那麼第二個就是，我們要能夠自動的評分。
數據上來了，機器能不能自動評分？自動評分，就涉及到我剛才講的自然語言理解。我們可以看到這兩個非常重要的數據。
一個是我們在安徽，今年7月份，在合肥和安慶，兩個教育非常發達的地方，做得針對初三學生的，漢語和英語的作文。由老師按照傳統方法來打分，然後機器再來改分。機器改分有兩條，先自動ocr掃描識別，然後再用我們人工智慧再判分。結果出來大家看到，機器評分跟人比，無論是一致性還是準確性上。一致性代表了公平性，準確性代表了精確性。機器都排第一。
統計數據上，人改完卷子以後由機器再改，兩者有差距的，再由人工專家組評議最終結果是80%多，機器比人要准。當然現在，人已經是比較准，能夠滿足教育的要求。但是機器比人還要更加的公平可信。這個是一個極大的進步。更重要是通過他的評價，我們機器就可以隨時隨地反饋實現我們的已測數據。智能評測也是這樣。在廣東高考15分的英語口語，不光是翻譯的標準化程度，連學生開放式口語作文，在今年廣東高考都是我們機器打分超過了廣東最好的口語老師。所以在廣東高考，已經由機器代替老師進行口語開放式作文的評分。大家知道，每一分都決定孩子未來。能不能上清華北大科大一分都決定你,那麼一定要機器比人准。
我們是經過了跟各種各樣的國際技術比賽，只有我們獨家能使用。有了這些技術，我們就能通過自動閱卷，給出孩子分析的薄弱環節。再往下，我們的知識圖譜分析一個知識的習得順序，然後就可以給孩子有針對性的推薦了。比如說我們看中間這個圖，如果一個孩子一元二次方程沒掌握，或者他可能是二次根式就沒掌握，如果你只跟他講一元二次方程，這個孩子怎麼練他都沒用，老師怎麼講他還是學不會。要分析出他的前端的二次根式他是沒太掌握的，有理數化運算掌握了一點點，那麼有理數運算也有點沒太熟。要順藤摸瓜，把他的基礎環節給他做出給他不斷的培訓他才能夠不斷地往前進。因為知識的學習是有規律的，而這個知識點的習得順序，可以說以前我們沒有看到任何一家公司去做。
因為訊飛有了真正的能夠採集到學生的數據，有了人工智慧自動判卷使我們有了基礎來做知識圖譜和學情的診斷。那麼這些技術的出現，就會使我們剛才講的個性化學習上課的課堂教學的提升真的成為可能。那麼下面我們請大家簡單看一下我們的具體的技術產品的演示。那麼在我們剛才講到的這些技術突破的技術上，我們今天已經給大家呈現了兩個已經具體可用的產品，而且已經在一線的老師和學生的使用中已經取得了初步成效。一個是智學網讓學生的學習變得更加智慧。分析診斷，提供一個學習的平台。一個是E聽說，就是我們的英語聽說的智能教學系統。

小康人家 · 發表於 2016-2-24 09:32

我們分別看一下那麼智學網中，首先可以進行自動的分析智能診斷，從過程化的作業或者單元訓練或者考試中能夠給老師在備課在課中授課中提供非常多的這個依據。同學們如果說大約90%都了解老師上課就不用說了，錄一個簡單微課讓個別學生回家去看。小於30%的正確率大部分人沒掌握較重點備課，這是一個簡單的示意。
課中老師每講完一個知識點，同學們可以通過我們的答題器或者Pad或者手機上傳數據，自動分析然後給出來他需不需要，在這個過程中這個知識點再講一遍，需不需要這個直接講下一個知識點。等到下課的時候他就知道針對全班同學怎麼樣布置不同的有針對性的作業。那麼孩子回到家也可以自主性的去學習，那麼這樣的一套方法從理論走到實踐我們已經看到。
現在已經比如說合肥一中我給大家舉個例子，這就是提高老師課堂效率的。同樣一個老師教數學課，在高二下學期，就是我們剛剛做的驗證。因為合肥一中是安徽綜合實力最好的學校，它的年級有幾十個班級，30多個班級。這個老師帶著有個班數學是第12名，用了半學期到了高三，就是全年級第一名。
我們再看蚌埠二中，今年安徽高考的狀元是蚌埠二中的。他在高考成績還沒出來之前，教育部在那邊開現場會，他們的校長就說，我用了科大訊飛的智學網，原本一個課堂的習題和訓練講解，45分鐘，現在只要15分鐘，剩下30分鐘來進行啟髮式拓展性教學。所以我們學生的學習效率大幅提升。不光是在安徽，在深圳中學，在越來越多的城市。現在全國已經有12個省120個城市的，超過3000所學校，在持續的應用深化。我們越來越多的成果，將真的能夠推動，我們孩子學得更愉快，花的時間更少，知識掌握的還更加牢固。
那麼另外呢我們E聽說——是教孩子學英語的，在廣東高考中已經開始用第一個用，在江蘇中考也所有的學生都在用。那麼可以通過，專家和我們的人工智慧系統相互之間的校驗和分析給出了專門的訓練。然後在訓練基礎上有針對性的給出學生的口語練習，根據他的興趣圖譜他感興趣他會學的更快。根據它的因為我們可以推薦各種不同的大片，他的薄弱環節來練習，最終使得學生在趣味性的訓練中口語能力得到了提升。那麼這個我們可以給大家看一下，目前已經有這麼多地方，其實全國已經有幾十個省市，開始在試點應用
。在廣東省，就在今年高考前，因為廣東英語口語考試是4月份。在廣州市天河區一個區的同學，通過我們的平台訓練了一個多月，平均成績提高了將近20%。這個充分看到，新技術手段給大家帶來的幫助。那所以我就告訴大家的就是我們新推出的智學網和E聽說，可以為我們少年兒童真正的開心成長開心學習和快樂成長提供最好的人工智慧技術的保障。那麼我們教育部有了非常好的教育改革發展的理念。那麼所有家長和孩子都有的期待，但是沒有好的技術做支撐，這些理念是很難落到實處的。今天我非常高興的給我們在座的各位教育部的領導教育口的專家和老師們彙報，今天科大訊飛在這裡我覺得又邁出了堅實的一步。
其實我們在前面的這些分析中，剛剛就已經介紹完了我們今天的三大發布。都是圍繞著人工智慧認知計算三大最核心的能力：交互，知識的管理，學習和推理。我覺得隨著這些技術的進步，我們可以明確做一些判斷。第一，在萬物互聯的浪潮下，以語音為主，以鍵盤觸摸為輔的人機交互時代已經到來。我們在手機上，因為有屏，因為有近講，可是在未來3到5年，我們周圍的90%的設備，將不是手機，而是穿戴式設備、智能家居以及可能是服務機器人。這時候沒有屏幕離你很遠，不可能觸摸它，而語音為主的時代正在到來。今天我們已經做好了準備。那麼第二個，人工智慧未來一定會像水和電一樣無所不在，廣泛而深入到影響到我們每一個人生活。我們甚至認為在未來5年之內在這樣的會場，一定會有機器人在給大家端茶倒水，否則大家會覺得這樣一個發布會實在是太沒有科技含量。那麼第三，就是以語音和語言為入口的認知革命，將推動人工智慧夢想成真，這是一條人工智慧走認知計算的必由之路。而非常幸運的是，中國企業和科技界，以科大訊飛為代表，我們在語音和語言技術上，已經做到了全球最領先。
所以我想在今天的結束之前想還跟大家做一個分享，那麼今天呢我們人類正站在了一個全新的起點上。人工智慧專家一直在討論和分析，說人工智慧究竟是替代掉我們人類，是將來要主宰這個地球，還是說人工智慧是為我們人類服務的。
我們科大訊飛作為這個產業中最前沿的科技產學研合作的典型代表，我們堅定不移地認為人工智慧一定是為人類服務的，是用來延展我們人類的能力的。那麼隨著我們人類的能力通過萬物互聯時代的語音和語言交互，使我們的智慧可以在後台進行碰撞進行比對相互啟發獲得靈感，我們人類的群體智慧會上一個巨大的台階。
到那個時候不是奇點臨近，不是人類末日的到來，而是人類一個全新時代的開始。因為人類本身就不是出生為了工作的，我們有理由要把我們的更多的寶貴的時間和精力在我們最黃金的工作時間用來思考更偉大的事情，用來探索更幸福更美好的未來。我想科大訊飛就是要跟各位一道來開啟用人工智慧改變世界的全新的征程。謝謝大家！

nierdaye · 發表於 2016-2-26 10:48

great one. thanks for sharing!

掌握人工智慧主導權就是在全球處於價值鏈高端

瀏覽過的版塊