倍可親

回復: 0
列印 上一主題 下一主題

「非著名」中國AI初創公司,獲全球頂級學術大會唯一最佳論文

[複製鏈接]

781

主題

1119

帖子

5174

積分

二級貝殼核心

Rank: 5Rank: 5

積分
5174
跳轉到指定樓層
樓主
紅遍大地 發表於 2017-2-28 12:25 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  2017-02-27 07:55 6

  世界頂級FPGA會議——FPGA2017在落幕之時傳來消息:來自中國的初創公司深鑒科技的ESE語音識別引擎的論文獲得了本次會議唯一的最佳論文(Best Paper Award)。

  

  FPGA2017 最佳論文證書

  作為FPGA領域最具影響力、歷史最悠久的學術會議,FPGA國際大會始終引領著整個FPGA工業界的技術創新。

  在深度學習浪潮席捲全球的今天,FPGA 2017特別增設了一個環節:The Role of FPGAs in Machine Learning(FPGA在機器學習領域所扮演的角色),並邀請了兩家公司,英特爾與深鑒科技,共同致會議Tutorial。成立不足一年,深鑒科技已得到FPGA學術界的高度認可。

  FPGA(現場可編程門陣列,Field-Programmable Gate Array)。簡而言之,這是一種程序驅動邏輯器件,就像一個微處理器,其控制程序存儲在內存中,加電后,程序自動裝載到晶元執行。

  相比CPU和GPU,FPGA憑藉比特級細粒度定製的結構、流水線并行計算的能力和高效的能耗,在深度學習應用中展現出獨特的優勢,在大規模伺服器部署或資源受限的嵌入式應用方面有巨大潛力。此外,FPGA架構靈活,使得研究者能夠在諸如GPU的固定架構之外進行模型優化探究。

  

  深鑒科技開發的「雨燕」深度學習處理平台

  去年5月,DT君作為首家媒體,對剛成立不久的深鑒科技進行了專題報道。創始人兼CEO姚頌表示,現在有很多公司在做各種各樣的演算法,包括ADAS(高級駕駛輔助系統)或者機器人等應用,因為演算法是最快的切入方式。

  但演算法最終要落地,無論是在CPU上運行,還是在GPU上運行,都會受限於性能、功耗和成本等因素。深鑒科技的產品將以ASIC級別的功耗,來達到優於GPU的性能,可把它稱作「深度學習處理單元」(Deep Processing Unit,DPU)。

  

  深鑒科技首席科學家韓松在大會做關於高效深度學習的Tutorial

  在本次FPGA大會的演講中,深鑒科技首席科學家韓松從演算法、硬體、訓練、推理四個維度,對於深度學習演算法的訓練與應用兩方面如何變得更加高效進行了闡述。韓松提出的「先壓縮、再加速」的深度學習推理方案,比「訓完即用」的推理方案更快、更節約功耗。

  

  上圖:傳統的「訓完即用」的機器學習推理方案;下圖:韓松提出的「先壓縮、再加速」的機器學習推理方案

  在本次會議上,深鑒科技的論文《ESE: Efficient Speech Recognition Engine withSparse LSTM on FPGA》得到錄用並最終被評選為本次大會的唯一最佳論文。該項工作聚焦於使用LSTM進行語音識別的場景,結合深度壓縮以及專用處理器架構,使得經過壓縮的網路和未經壓縮的網路相比實現6倍的性能提升。本文所描述的ESE語音識別引擎也是深鑒科技RNN處理器產品的原型。

  

  最佳論文頒獎

  更為難得的是,此篇論文不僅僅停留在模擬與模擬結果階段,而是落在了實實在在的演示系統上。

  會場外,基於ESE語音識別引擎的深鑒語音識別平台進行了現場展示,得到了參會教授與工業界人士的極大關注——使用Xilinx KU060 FPGA與NVIDIA GTX 1080 GPU運行一個實際應用的LSTM現場對比,深鑒FPGA方案穩定的保持了超過GPU六倍以上的性能。

  這就意味著,處理相同的語音識別任務,處理延遲大大降低,用戶體驗能有明顯的提升。測試結果表明,深鑒能夠基於業界領先的商用的語音識別演算法模型與數據,實現模型壓縮,提升硬體性能。

  

  深鑒科技CTO單羿(左圖)與CEO姚頌(右圖)現場向與會專家展示深鑒語音識別平台

  深鑒科技雖成立於2016年3月,但早在2013年,來自清華大學和斯坦福大學的幾位公司創始人就開始了深度學習相關的學術研究。

  2015年深度學習頂級會議NIPS上,斯坦福大學在讀博士、深鑒科技首席科學家韓松提出利用剪枝和權重共享的方式對目前的深度神經網路在不損失網路精度的前提下大幅度降低計算和存儲資源消耗。

  公司技術團隊聚焦於稀疏化神經網路處理的技術路線,提出的「深度壓縮」(Deep Compression)演算法可以將模型尺寸壓縮數十倍大小而不損失預測精度,並結合專用的深度學習處理架構來實現加速。

  ICLR 2016和FPGA 2017兩篇最佳論文的獲獎,再次證明了這家中國技術型初創公司所聚焦的稀疏化技術路線,已越來越得到深度學習界的認可。

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-8 15:47

快速回復 返回頂部 返回列表