倍可親

回復: 0
列印 上一主題 下一主題

中國超算跑得快性能好,可軟體和生態還有差距

[複製鏈接]

6224

主題

1萬

帖子

3萬

積分

貝殼精神領袖

Rank: 6Rank: 6

積分
30731
跳轉到指定樓層
樓主
瘋瘋顛顛 發表於 2017-8-2 08:54 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  2017-08-01 08:24:23 來源: 科技日報社-中國科技網 (北京)

  

  「神威·太湖之光」超級計算機。 視覺中國 資料

  何亮

  近日,中國自主研發的超級計算機「神威·太湖之光」在2017國際高性能計算大會上再次蟬聯世界超算冠軍,拿下了中國國產超算系統在世界計算機冠軍寶座上的首個三連冠,再加上之前天河二號六次奪冠的輝煌歷史,中國超算在世界舞台十分耀眼。

  但是,聚光燈下的超算雖然「跑」得快、性能好,在應用上卻有短板。

  「借船出海」不是常勝之策

  在「神威·太湖之光」橫空出世之前,中國超算天河二號曾是世界高性能計算領域的「霸主」。它六次問鼎世界TOP500,廣泛應用於天氣氣候、生物醫藥、新材料等科研領域。但卻也遭受「詬病」,天河系列的處理器來自美國——天河一號是英特爾的CPU加上英偉達的GPU;天河二號是英特爾的GPU加上英特爾的眾核處理器。

  「買來的晶元技術成熟、作用發揮快,雖不失為一種發展的策略,但是技術的自主可控無法實現。」清華大學計算機系博士后甘霖7月28日在接受科技日報記者採訪時表示,2015年美國宣布對華核心處理器禁運的一系列措施也直接導致天河系裡的發展受阻。

  「天河二號通過『借船出海』超越美國的泰坦等超級計算機,但是在涉及國防安全等關鍵領域,國家對自主可控已經提出明確的要求。」甘霖表示,關鍵技術受制於人,雖然可以「師夷長技」,卻在應用層面大打折扣。

  中國芯讓超算絕地「反擊」

  中國超算在「神威·太湖之光」問鼎世界後為何備受振奮?背後的原因是,面對美國禁售的單方「制裁」,中國超算全面採用自主研製的中國芯——「申威26010」異構眾核處理器實現絕地「反擊」,公眾的認識也從「單純以速度取勝」轉化為「自主可控、峰值速度、持續性能、綠色指標、應用等方面實現了全面突破」。

  國家計算流體力學實驗室利用基於「神威·太湖之光」開發的「航天飛行器統一演演算法數值模擬」軟體,完成了多組天宮一號飛行器隕落飛行狀態的大規模并行計算。使用16384個處理器(太湖之光整機的1/8)在20天內完成常規需要12個月的計算任務,計算結果與風洞實驗結果符合較好。而且,與航天領域息息相關的材料學也需要通過模擬計算哪些元素的加入能達到最有效果。

  現在,太湖之光的峰值運算性能達到每秒12.54億億次。這意味著,太湖之光1分鐘的計算能力,相當於全球72億人同時用計算器不間斷計算32年。顯然,中國超算的硬體能力並非「徒有虛名」,那麼,如此超強的能力究竟有沒有用武之地?

  「中層斷檔」限制應用擴增

  2016年,在太湖之光上「奔跑」著的一個應用項目獲得「戈登·貝爾」獎,實現了我國在世界高性能應用領域29年來零的突破。

  該項目「千萬核可擴展全球大氣動力學全隱式模擬」是使用了超過一千萬個核來完成一次氣候的數值模擬。其特殊之處在於演演算法——一個新的「全隱式」計算方法,這個演演算法的計算效率比當前國際上同類問題最高水平提升了近一個數量級。「戈登·貝爾」獲獎團隊負責人、中科院軟體所研究員楊超曾表示,演演算法和性能是團隊獲獎的主要原因。

  高性能計算實現應用的落地絕非超級計算機的一己之力就能完成。它更像是一個鏈條,由中間層的軟體串聯起上游的應用場景和下游的機器硬體。清華大學教授、國家超級計算無錫中心主任楊廣文在接受科技日報記者採訪時表示,從事計算機研究的人因為不熟悉應用而設計不出更好的演演算法及應用軟體,而做軟體應用的人因為欠缺計算機能力而造不出高質量的軟體……即便技術成熟、需求旺盛,只要軟體缺乏,超算的能力就無法施展。

  而且,中國面臨更大的問題在於,不只是軟體落後,軟體生態與國外也有一定的差距。甘霖舉例說:太湖之光的眾核處理器相當於1000萬隻螞蟻在協調一致、同時拉動重物,如果一隻螞蟻「犧牲」了,這隻螞蟻的任務量就需要軟體分配給其他仍在工作的螞蟻,以保證計算合理進行。這個看似簡單的步驟需要通用軟體來控制,形成容錯和糾錯的機制。雖然中國也有,但不及國外成熟的軟體。在太湖之光上運行的大部分程序,先前都需要針對太湖之光的硬體特點進行代碼修改以實現優化,這種調優的過程要依靠軟體工具。

  「雖手握『戈登·貝爾』獎,但要全面提升我國超算應用水平仍任重道遠。」楊廣文講得很直接。這類似於剛剛脫離實驗室,功效可以預見,實施仍待檢驗。楊廣文認為,要做好超算的應用,需要科研人員有「工匠精神」。

  從硬體到軟體,中國奮起直追,不斷發力,從跟跑追到並跑。在國家層面,國家重大科技專項中多個項目都在資助超算支持下的領域應用,投入持續加大。楊廣文表示,系統的政策、項目與人才支持會促使超算的研發反哺產業發展,促進國家產業轉型與升級。

  量子計算與超算不存在競爭關係

  在「2017年國際大數據與E級計算研討會」上,楊廣文曾透露,「神威·太湖之光」新一代百億億次超算的研製已經列入國家「十三五」規劃,目前高性能計算重點專項支持了「神威」「天河」「曙光」三台原型機的研製,有望在2020年左右推出首台國產百億億級次超級計算機。

  從十億億級提高到百億億級面臨著巨大挑戰。楊廣文向科技日報記者表示,計算能力的提升導致功耗越來越大,採用低功耗晶元設計、高效的製冷技術、對整個系統管理的優化管理是目前正在著手攻克的難題。

  與新興的量子計算機相比,甘霖認為,下一代超級計算機與其在幾十年內不存在競爭關係。相較於傳統計算機1比特只能由0或1的兩種表示,量子計算機依靠量子的不確定性,實現量子表示的多態表達,比如量子比特可能有多種狀態的表達,有可能使量子計算機在同一規模下比傳統計算機的能力要強很多,但成型時間的不確定性就給這種可能性增加了更多未知數。

  「量子計算機要想成熟起來,肯定要有一個成熟的演演算法,而且這個演演算法得能夠模擬應用,與量子不確定性匹配起來,才能產生期望的效果。」甘霖表示,這也導致只有特定的應用領域是量子計算機適合的。

  「在下一代超算的發展與競爭中,中國不僅要贏得速度之戰,更重要的是贏得應用之戰!」楊廣文說,國產應用軟體的滯后和人才的缺乏,嚴重製約了超算的發展。以「致用」為終極目標,「神威·太湖之光」團隊將進一步組織國內外優勢力量,共同打造國產晶元生態環境,加強應用軟體開發,特別要在氣象氣候服務、先進位造、生命健康、大數據分析等重點應用領域做足功課,突破應用瓶頸,補齊中國超算應用短板。

世人皆醉我獨醒
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-11 18:43

快速回復 返回頂部 返回列表