倍可親

回復: 0
列印 上一主題 下一主題

美國伯克利國家實驗室「極簡機器學習演算法」可利用極少的數據分析圖像

[複製鏈接]

4364

主題

9732

帖子

1萬

積分

七級貝殼核心

Rank: 5Rank: 5

積分
17462
跳轉到指定樓層
樓主
非常時期 發表於 2018-3-2 11:50 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
  2018-03-02 10:18數據分析

  美國能源部勞倫斯伯克利國家實驗室(以下簡稱「伯克利實驗室」)的數學家們研發了一種用於實驗性成像數據的新型機器學習方法。典型的機器學習方法通常依賴數萬或數十萬的圖像,而這種新方法可以更快地學習且所需的圖像要少得多。

  

  ▲ 小鼠淋巴細胞樣的圖像: a為原始數據,b是相應的手動分割,c是具有100層的MS-D網路的輸出。

  研究背景

  隨著實驗設施以更高速度生成更高解析度的圖像,科學家需要費力地對結果數據進行管理與分析。賽斯安於2014年在伯克利實驗室成立了綜合性、跨學科的能源研究應用高等數學中心(CAMERA),旨在開發和提供利用美國能源部科學辦公室用戶設施的實驗研究結果所需的新型基礎數學方法。CAMERA是該實驗室計算研究分部的一部分。

  賽斯安表示,許多科學應用通常需要大量的體力勞動來註釋和標記圖像。對於傳統的機器學習方法來說,這些手工繪製的圖像遠遠不夠。為應對這一挑戰,CAMERA的數學家們用非常有限的數據解決了機器學習的問題。以「利用更少的數據做更多的事情」為出發點,研究人員計劃研究如何建立一套可以大大減少參數數量的高效數學「運算符」。這些數學運算符可能自然地包含關鍵的約束條件,如包含對科學合理的形狀和模式的要求來幫助甄別。

  「混合比例密集卷積神經網路」

  機器學習演算法

  CAMERA的丹尼爾·佩爾特和詹姆斯·賽斯安領導此項研究工作,研究出「混合比例密集卷積神經網路」(MS-D)的方法,從而徹底改變了機器學習的方法。與傳統方法相比,新方法所需參數更少,聚集更快,並且能夠從一個非常小的訓練集中「學習」。這種新方法已經被用於從細胞圖像中提取生物結構。預計該方法還將提供一個重要的新型計算工具,用於分析各種研究領域的數據。

  針對成像問題,許多機器學習應用都使用深度卷積神經網路(DCNN)。在該網路中,輸入圖像和中間圖像被卷積在大量的連續層中,使得網路可以學習高度非線性的特徵。為了獲得精確的圖像處理結果,DCNN通常依賴於其他操作和關係,例如增加縮小和放大操作以捕獲各種圖像比例下的特徵。為了訓練更深入和更強大的網路,通常需要額外的層類型和關係。最後,DCNN通常會使用大量的中間圖像和可訓練參數(通常超過1億)來解決棘手的難題。

  

  ▲左:常見DCNN體系結構的示意圖; 右圖:w=2和d=3的MS-D網路的示意圖;彩色線代表3×3擴張卷積,每種顏色對應不同的膨脹:所有特徵圖用於最終輸出計算。

  然而,新型「混合比例密集」網路體系結構避免了這些複雜情況,並將擴張卷積作為縮放操作的替代,以捕獲各種空間範圍內的特徵,在單一層內採用多種比例並密集連接所有中間圖像。這種新演算法幾乎不需要中間圖像和參數就能夠獲得精確的結果,從而不再需要調整超參數和增加圖層或連接進行訓練。

  荷蘭國家數學與計算機科學研究所計算成像組的成員佩爾特表示,能夠取得這一突破性研究成果是因為認識到用於捕獲各種圖像比例情況下不同特徵的縮小和放大操作可由數學卷積所取代,這種方法可以在單層內處理多種比例。

  該演算法的詳細信息發表在2017年12月26日美國《國家科學院院刊》中。

  研究背景

  為了讓廣大研究人員能夠使用該演算法,伯克利團隊建立了一個「分段標記圖像數據引擎」(SlideCAM)門戶網站。它是美國CAMERA工具套件的一部分。

  

  ▲使用1024個投影(a)和120個投影(b)重建的纖維增強微型複合材料的斷層圖像。在(c)中,顯示了具有圖像(b)作為輸入的MS-D網路的輸出。

  研究生物細胞內部結構

  一個有前景的應用是了解生物細胞的內部結構。研究人員利用MS-D方法,只需要7個細胞的數據就能確定細胞結構。國家X射線斷層成像中心主任兼加利福尼亞大學教授卡羅琳表示,此項研究旨在了解細胞結構和形態如何影響或控制細胞行為。研究人員花費大量時間手動分割細胞,以提取結構並甄別健康與病患細胞之間的差異。他表示,MS-D方法有可能徹底改變人類對疾病的認識能力,並且它也是他們所開展的 「人類細胞圖集」項目的關鍵工具。該項目是一個繪製並描繪健康人體中所有細胞的全球合作項目。

  甄別自然圖像

  智能手機和感測器已產生大量圖片,許多被標上了用於甄別內容的相關信息標籤。利用交叉參考圖像龐大的資料庫、卷積神經網路和其他機器學習方法已經徹底改變了人們快速甄別自然圖像的能力。

  利用低解析度輸入生成高解析度圖像

  經過「混合比例密集」網路處理的一小部分訓練圖像集使利用低解析度輸入產生高解析度圖像成為可能,例如纖維增強微型複合材料的層析重建的降噪。在論文描述的實驗中,使用獲得的1024個X射線投影來重建圖像以獲得雜訊相對較低的圖像,然後利用128個投影重建來獲得同一對象的雜訊圖像。訓練輸入是雜訊圖像,在訓練期間將相應的無雜訊圖像用作目標輸出。經訓練的網路能夠有效地處理雜訊輸入數據並重建更高解析度的圖像。

  其他應用

  佩爾特和賽斯安正在將他們的方法應用到許多新領域,例如快速實時分析來自同步加速器光源的圖像以及生物重建,例如細胞和腦映射的重建問題。

  佩爾特表示,這些新方法可以使機器學習來解決更多種成像問題。通過減少所需訓練圖像的數量和增大可處理的圖像的尺寸,新的體系結構可用於解答許多研究領域的重要問題。

  來源:勞倫斯伯克利國家實驗室網站/圖片來自互聯網

  軍事科學院軍事科學信息研究中心 申淼

  如需轉載請註明出處:「國防科技要聞」(ID:CDSTIC)

  人工智慧

  陸軍

  海軍

  空軍

  航天

  網路空間

  電子信息

  核武器

  精確打擊

  新概念武器

  基礎科學

  技術

  與能源

  與製造

格外小心
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-10-5 14:46

快速回復 返回頂部 返回列表