倍可親

趙國棟:美國政府大數據計劃的中文譯稿

作者:sujie_alex  於 2013-1-11 09:16 發表於 最熱鬧的華人社交網路--貝殼村

作者分類:學而|通用分類:政經軍事

今天,奧巴馬政府宣布 「大數據的研究和發展計劃。」通過提高我們從大型複雜的數字數據集中提取知識和觀點的能力,承諾幫助加快在科學與工程中的步伐,加強國家安全,並改變教學研究。

這個計劃里,六個聯邦政府的部門和機構宣布新的2億美元的投資,提高從大量數字數據中訪問、組織、收集發現信息的工具和技術水平。了解更多正在進行的聯邦政府的計劃,解決所大數據所帶來的機遇和挑戰,可通過大數據表來了解大數據革命。

我們還計劃與工業界、大學研究界、非營利性機構與管理者一起利用大數據所創造的機會。顯然,不能單單依靠政府,需要我們總統所呼籲的「眾人拾柴火焰高」這樣的努力。

一些相關的公司已經贊助大數據相關的比賽,並給大學提供這方面的研究資助。大學里也開始開設一門全新的研究型課程,培養下一代的「數據科學家」。一些無國界的組織幫助非營利性機構對公益性服務的數據進行採取、分析和可視化處理。白宮科技政策辦公室將會非常有興趣支持建立一個跟大數據相關論壇,包括最新的公私組織之間的合作。

美國政府的大數據計劃

亮點:為應對大數據革命帶來的機遇,聯邦政府制定計劃,推進相關研究機構進一步進行科學發現和創新研究。

國防部 (DOD)

國防部高級研究計劃局(DARPA)

多尺度異常檢測(ADAMS)項目解決大規模數據集的異常檢測和特徵化。項目中對異常數據的檢測指對現實世界環境中各種可操作的信息數據及線索的收集。最初的ADAMS應用程序進行內部威脅檢測,在日常網路活動環境中,檢測單獨的異常行動。

網路內部威脅(CINDER)計劃,旨在開發新的方法來檢測軍事計算機網路與網路間諜活動。作為一種揭露隱藏操作的手段,CINDER將適用於將對不同類型對手的活動統一成「規範」的內部網路活動,並旨在提高對網路威脅檢測的準確性、和速度。

Insight計劃主要解決目前情報,監視和偵察系統的不足,進行自動化和人機集成推理,使得能夠提前對時間敏感的更大潛在威脅進行分析。該計劃旨在開發出資源管理系統,通過分析圖像和非圖像的感測器信息和其他來源的信息,進行網路威脅的自動識別和非常規的戰爭行為。

Machine Reading 項目,旨在實現人工智慧的應用和發展學習系統的過程中對自然文本進行知識插入,而不是依靠昂貴和費時的知識表示目前的進程,並需要專家和相關知識工程師所給出的語義表示信息。

Mind's Eye 項目,旨在為機器建立視覺的智能。傳統的機器視覺研究的對象選取廣泛的物體來描述一個場景的屬性名詞,而Mind's Eye旨在增加在這些場景的動作認識和推理需要的知覺認知基礎。總之,這些技術可以建立一個更完整的視覺智能效果。

Mission-oriented Resilient Clouds 項目通過技術進行檢測,診斷並對攻擊作出響應,有效地建立了「社區衛生服務系統」的雲,以解決雲計算固有的安全挑戰。該方案還旨在開發新技術,使雲應用和基礎設施受到攻擊時能夠繼續運行。只要整體能夠有效的運行和保存,可以允許個別主機和任務損失。

對加密數據的編程計算(PROCEED)的研究工作旨在開發實用的方法,相關現代化計算編程語言,使數據加密時仍然能使用雲計算環境,以克服信息安全的重大挑戰。使用戶能夠不需首次解密的情況下能夠操縱加密的數據,它將使得對手攔截信息更加困難。

在視頻和圖像的檢索和分析工具(VIRAT)計劃旨在開發一個系統能夠利用軍事圖像分析員收集的數據進行大規模的軍事圖像分析。VIRAT如果成功,將使分析師能夠在相關活動發生時建立警報。VIRAT還計劃開發工具,能夠以更加準確率和召回率的去從大量視頻庫里進行視頻內容的檢索。

XDATA項目計劃旨在開發用於分析大量的半結構化和非結構化數據的計算技術和軟體工具。最核心的挑戰是,可伸縮的演演算法在分散式數據存儲應用、如何使人機交互工具能夠有效的迅速定製不同的任務,以方便對不同數據進行視覺化處理。對開源軟體工具包的靈活使用,使得能夠處理大量國防應用中的數據。

國土安全部(DHS)

卓越研究中心和可視化數據分析(CVADA),羅格斯大學和普渡大學(以及另外三個夥伴大學)的研究人員之間進行協作,通過對大量的異構數據進行研究,使得急救員可以發現人為或自然災害、恐怖事件,需要執法的邊境安全問題,網路威脅的爆炸物。

能源部 (DOE)

科學辦公室

高級科學計算研究辦公室(ASCR)提供數據管理,可視化和數據分析的社區,包括數字化保存和社區訪問。套件程序里包括廣泛使用數據管理的技術,如開普勒科學的工作流程系統;存儲資源管理標準;各種數據存儲管理技術,如BeSTman,大容量數據移動器和適應式的IO系統(ADIOS); FastBit數據索引技術(雅虎使用)和兩個主要的科學可視化工具,ParaView 和 VisIt。

高性能存儲系統(HPSS)是對磁碟和磁帶系統上PB級數據進行管理的數據管理軟體。 由美國能源部和IBM開發的HPSS在世界各地的大學和實驗室的使用,用在數字圖書館,國防應用和包括納米技術,基因組學,化學,磁共振成像,核物理,計算流體力學,氣候在內的一系列學科,以及諾斯羅普·格魯門公司,美國國家航空航天局(NASA)和美國國會圖書館。

對千萬億次的數據分析處理從龐大的科學數據集提取信息,發現其主要特徵,並理解其間的關係。研究領域包括機器學習,數據流的實時分析,非線性隨機的數據縮減技術和可擴展的統計分析技術,廣泛適應於從能源部到電網,包括宇宙學和天氣數據,感測器數據等。

下一代網路方案支持工具,使得合作研究在能夠進行重大發現,包括2001年的Globus中間件項目大量數據的移動和使用, 2003年的GridFTP的數據傳輸協議, 2007年的地球系統網格(ESG)的工具。今天的GridFTP的伺服器開放科學網格,ESG,和生物社區的科學數據每月超過1 PB的移動。 Globus中間件也被得克薩斯大學,軟體公司,石油公司利用並一起合作,培養學生能夠使用先進的石油工程方法和集成的工作流程。

基礎能源科學辦公室(BES)

BES的科學用戶設施支持旨在協助用戶數據管理和分析大數據,可每天從一個單一的實驗數據大容量化(1012位元組)努力。例如,加速數據採集,處理和分析(ADARA)項目解決了數據的散裂中子源(SNS)的數據系統提供實時分析,實驗控制的工作流程需要,以及已經建立X射線影像資料庫,以最大限度地提高數據的可用性和更有效地利用同步加速器光源。

在2011年10月,由生物工程學會和ASCR的基礎能源科學的數據和通信研討會將確定實驗數據的需求,這可能會影響的科學發現。

生物和環境研究計劃(BER)大氣輻射測量(ARM)氣候研究設施是一個多平台的科學用戶設施,提供重要的大氣現象的精確觀測研究,大氣過程的認識的進步需要國際社會的基礎設施和氣候模型。 ARM的數據是可以進行應用的,並以其作為文章發表在一個超過100年歷史的雜誌。正在處理收集和展示的高時間解析度和光譜信息,從數百文書相關的挑戰,以滿足用戶的需求。

系統生物學知識庫(Kbase)是一個社區驅動的軟體框架,對微生物,植物和環境條件下的生物群落功能的數據驅動的預測。 kbase是一個開放式的設計與開發,以提高演演算法的開發和部署效率,並增加從異構數據源的實驗數據的獲取和集成。 kbase是不是一個典型的資料庫,而是一種手段,以解釋缺少的信息成為實驗設計預測工具。

聚變能源科學辦公室(FES)

通過FES和高級科學計算研究(ASCR)辦公室高級計算合作的(SciDAC)科學發現在在聚變能的科學計算和實驗研究大數據存在的挑戰。 ASCR-FES開發的數據管理技術,包括高性能的輸入/輸出系統,先進的科學的工作流程和出處框架,可視化技術解決獨特的融合需求,已經吸引了歐洲一體化建模的努力和國際熱核實驗堆,一個國際核核聚變研究和工程項目的關注。

高能物理辦公室(HEP)

高能物理計算計劃經過了全球數百名科學家的努力,支持大量的分析研究,複雜的實驗數據集,以及大量的模擬數據。協作企業進行大數據管理,包括生產和分散式分析PanDA(產品分散式分析)工作量管理系統和XRootD,一種高性能,快速,可擴展訪問多種數據存儲庫的容錯軟體。

核物理辦公室(NP)

美國核數據計劃(USNDP)是一個多方面努力,涉及7個國家實驗室和兩所大學的項目,提供跨越多個領域,核物理,編譯和交叉檢查,對所有原子核的重要性質的相關實驗結果,維護和廣泛使用的專用資料庫。

科學和技術信息辦公室(OSTI)

OSTI,唯一的DataCite美國聯邦機構成員(全球領先的財團科學和技術信息的組織)中發揮了關鍵作用,在塑造實踐的政策和技術實現數據的引用,這使得可以跟蹤數據的影響,使有效的重用和數據核查和學術結構的表彰和獎勵數據生產商可設立。

退伍軍人管理部(VA)

醫療保健信息研究所(CHIR)開發自然語言處理(NPL)工具,能夠對在VA以文本形式存儲的大量數據進行信息解鎖。

VA正在努力通過保護作戰人員使用文字處理演演算法捕獲公共衛生事件(ProWatch),正在開發一個的生產透明,重複性好,可重複使用的各種安全相關的事件監控軟體探測,以研究為基礎的監控程序,能夠跟蹤,測量與軍事部署相關的健康條件。

AViVA是VA的下一代就業人力資源系統,將業務應用程序和基於瀏覽器的用戶界面分開的資料庫。分析工具已經被建立在此基礎上研究,最終決定在對病人進行支持。

醫學成果觀察項目設計用來比較各種安全監測分析方法的有效性,可行性和性能。

企業數據倉庫(CDW)是VA的項目,組織和管理從各種渠道傳遞的個人和群體的疾病和??治療的完整視圖的數據。

健康資料庫是衛生保健提供者的數據格式規範的數據,尤其是VA和國防部之間,讓CDW集成的數據。

基因組信息系統綜合科學(GenISIS)計劃,通過個性化醫療,提高退伍軍人的醫療保健。 GenISIS通過接觸獲得電子健康記錄和遺傳數據,可以跨VA進行的臨床試驗,基因試驗和成果研究的臨床研究。

萬美元老將計劃招募退伍軍人自願的血液樣本的基因分型和基因測序。這些基因樣本支持GenISIS,將歸於「型」在個別老將的了解遺傳疾病狀態的健康記錄。

VA的信息和計算基礎設施提供的分析大型數據集,現在在VA,促進合作研究,在VA的網路上的任何地方,分析工作區和工具。

 

衛生和人類服務部(HHS)

疾病控制和預防中心(CDC)

生物感測2.0是第一個考慮到區域和國家協調的情況下,通過互操作的網路系統對公眾健康意識的可行性分析的系統,其建立在現有的國家和地方的能力之上。生物感測2.0移除許多單片物理結構相關的成本,同時還對最終用戶透明的分散式系統方面,以及作出適當的分析和報告的數據訪問。

疾病預防控制中心的特別細菌學參考實驗室(SBRL)的使用細菌和疫情ID網路生物學技術從有效,迅速爆發中檢測未知的細菌病原體。譜系基因組學,比較整個基因組DNA序列的系統發育分析,將帶來基於序列識別的概念,以全新的水平,在不久的將來對公眾健康產生深遠的影響。發展一個新的物種鑒定SBRL基因組管道將允許多個分析一個新的或迅速崛起的病原體在幾小時內進行,而不是數天或數周。

醫療保險和醫療補助服務中心(CMS)

正在開發的基於Hadoop的一個數據倉庫將支持對醫療保險和醫療補助要求的分析和報告。一個主要目標是建立一個支持,可持續的,可擴展的設計,可容納在數據倉庫中進行積累,並補充現有的技術。

正在評估使用XML資料庫技術,支持保險交流事務密集型環境,並且支持對應資格及報名流程。 XML資料庫可能可以容納大表規模的數據,事務的性能進行了優化。

醫療保險和醫療補助服務中心CMS具有當前設置與橡樹嶺國家實驗室,涉及的數據可視化工具,平台技術,用戶界面選項和高性能計算技術的評估試點項目 - 旨在使用行政索賠數據(醫療保險)來創建有用的信息產品引導和支持各種CMS高優先方案改進決策。

食品與藥物管理局(FDA)

虛擬實驗室環境(VLE),將結合現有的資源和能力,使虛擬實驗室數據網路,先進的分析和統計工具和功能,在人群中分析,預測和促進公眾健康的文檔管理支持技術,使臨場感能力在世界範圍內的合作,使任何地點在一小時內就同一個虛擬實驗室的功能。

國家檔案和記錄管理(NARA)

為十億電子記錄(CI-BER)的網路基礎設施是一個聯合機構主辦的測試平台,這個多機構主辦的網路基礎設施,對國家檔案館87萬多樣化的數字記錄的文件和信息的收集,可稱為計算研究所的文藝復興。這個試驗台將評估技術和方法,超大規模數據收集,以支持可持續的訪問。

國家航空和航天局(NASA)

美國宇航局的先進的信息系統技術(AIST)獎,旨在降低美國宇航局信息系統的風險和成本,以支持未來的地球觀測任務,並轉化成美國航空航天局氣候中心的地理信息。一些AIST的方案尋求成熟的大數據的能力,以減少地球科學部空基和陸基信息系統的風險,成本,規模和開發時間,提高科學數據的獲取和實用。

美國國家航空航天局的地球科學數據和信息系統(ESDIS)項目,持續超過15年,曾處理,歸檔和分發地球科學衛星數據和數據從空中和現場活動。注意用戶滿意度,努力確保科學家和公眾對數據的訪問,以便從太空對地球的研究,推動地球系統科學,以滿足氣候和環境變化的挑戰。

全球地球觀測系統(GEOSS)通過國際之間努力合作進行地球觀測數據共享和整合。美國宇航局已經與美國環境保護署(EPA),美國國家海洋和大氣管理局(NOAA),其他機構和國家的力量強強聯手,整合衛星、地面監測和建模系統,評估環境條件和預測包括人為和自然的森林火災,人口增長和其他方面的結果。研究人員將在短期內,整合了各種複雜的空氣質量信息,更好地了解和解決空氣質量對環境和人體健康的影響。

由美國宇航局和Cray公司訂立的太空行動協議,讓「大數據」系統的發展和低延遲的應用為中心的一個或多個項目上進行合作。特別是,該項目測試的混合計算機系統的實用程序,使用一個高度集成的非SQL資料庫作為數據傳輸的一種手段,以加速執行建模和分析軟體。

美國宇航局的行星數據系統(PDS)是美國宇航局行星的任務,這已經成為了世界各地的科學家的基本資源檔案數據產品。所有的PDS生產的產品通過同行評審,進行歸檔,並很容易通過一個由行星學科舉辦的在線目錄系統進行訪問。

太空望遠鏡科學研究所(MAST),美國宇航局的分散式空間科學數據服務的一個組成部分,提供多任務存檔的支持,各種天文數據檔案,和相關的科學數據,包括光學、紫外線、近紅外光譜等光學相關的科學數據。MAST支持多種工具,對各種光譜圖像數據進行訪問。

地球系統電網聯邦公共檔案,是一個公共的數據存檔,預計將支持由國際小組的研究將在2014年完成基礎對氣候變化的第五次評估報告(如同第四次評估報告的存檔一樣)。美國宇航局聯合會通過與美國能源部合作,促進觀測數據和模型的輸出。

國家人文基金會(NEH)

數據挖掘的挑戰旨分析大數據的變化對人文社會科學的影響,在這種新的計算為基礎的研究方法都需要搜索,分析和理解大量的材料,如數字化的書籍和報紙資料庫,從網路搜索,感測器和手機記錄交易數據。在NEH的領導下,這個挑戰是由美國和8個國際組織在四個國家中進行。

 

國家衛生研究院(NIH)

美國國家癌症研究所(NCI)

癌症成像存檔(TCIA)是一個圖像數據共享服務,促進在醫療成像領域科學的開放。 TCIA的目的,提高了效率和成像癌症的檢測和診斷的重複性,利用影像,提供治療反應的客觀評估,並最終進行影像資源的開發,從而提高成像的使用,並對今天的癌症研究和臨床實踐提供決策支持。

癌症基因組圖譜(TCGA)項目進行全面和協調努力,通過包括大規模基因組測序基因組分析技術的應用,以加速癌症的分子基礎的認識。 TCGA項目將隨著大規模基因組技術的快速發展,到2014年將積累的幾個PB的原始數據。

國家心肺和血液研究所(NHLBI)

心血管病研究所的網格(CVRG)和集成數據的分析,匿名共享(iDASH)是兩個由NHLBI提供的安全數據存儲,整合,資源分析信息源,在盡量減少對用戶的負擔下,協作支持信息資源共享。 CVRG提供心血管研究社區資源共享的數據和分析工具。 iDASH產生隱私保護技術,發展和培養一個綜合的數據共享和分析環境。

國家生物醫學成像和生物工程研究所(NIBIB)

由NIBIB研究所主導的互操作性和策劃的納米材料登記的發展和計劃,旨在建立納米材料的註冊表,其主要功能是提供表徵生物納米材料、相互作用的環境,以及相關出版物的鏈接,建模工具,計算結果和對生產指導的一致策劃信息。註冊表有利於對錶征納米材料,以及生物相互作用的信息建設一致的標準。

為基於網際網路的網路控制病人的醫學圖像分成合同,解決了通過圖像共享模型,測試醫院、影像中心和醫生行為怎樣進行跨企業的文件共享、圖像傳輸和圖像報告的可能性。

作為一個複雜的生理信號的研究資源,PhysioNet 提供免費網頁訪問記錄生理信號(PhysioBank)和相關的開源軟體(PhysioToolkit)大集合。每個月,全世界約45000遊客使用PhysioNet,留下約4 TB的數據檢索。

影像學信息工具和資源信息中心(NITRC)是NIH的藍圖項目,促使影像信息工具的傳播,共享,和演化,通過提供訪問、信息和社區互動的論壇數據,提供影像學數據。。超過450名的軟體工具和數據集上NITRC註冊;該網站自2007年推出已經有超過30.1萬的點擊率。

擴展影像學檔案工具箱(XNAT)的是一個開放源碼的影像信息平台,由華盛頓大學神經信息學研究組開發,並廣泛應用於世界各地的研究機構。 XNAT促進共同管理,生產力及品質保證任務的影像和相關數據。

計算解剖學和多維建模的資源有幾部分組成。洛杉磯神經影像實驗室(LONI)設有資料庫包含從從MR、PET、遺傳學、行為學、人口統計其其他數據形式的圖像數據。阿爾茨海默氏病影像學倡議(ADNI)是一個收集來自美國各地的收購站點的項目數據的很好的例子,它使得數據匿名,隔離,待質量控制(經常做立即)和使得它的下載提供世界各地的用戶在各種不同的格式。

電腦輔助的功能性神經外科資料庫通過方法和技巧,以協助安置和用於治療帕金森氏症和其他運動障礙的腦深部電刺激器(DBSs)。范德比爾特大學(VU)與俄亥俄州立大學和維克森林大學合作,通過多個站點的數據,開發了中央資料庫。由於不同醫院的臨床工作流程和立體框架可以有改變,手術規劃軟體已經更新並測試成功。

經過十年,國立衛生研究院生物信息科學與技術倡議(BISTI)的聯盟已經加入美國國立衛生研究院研究所和中心,以促進在生物信息學和計算生物學(BICB)的研究,促進了程序發布,並資助了超過十億美元的研究。此外,NIH促進的合作活動,包括採用現代的數據和軟體共享,使研究成果在研究界得到很好的傳播。

 

國家衛生研究所 藍圖

神經科學信息框架(NIF)是一個基於Web的動態庫存神經科學的資源:數據,材料和任何連接到網際網路上可以訪問的工具。由國家衛生研究院(NIH)倡議了神經科學研究的藍圖,即NIF主導的進步神經科學研究,通過開源資料、網路環境,使得能夠在世界範圍內發現和訪問公共研究數據和工具。

美國國立衛生研究院的人力Connectome項目雄心勃勃,通過努力,計劃在人類大腦功能的基礎,並分享有關人類大腦的結構和功能連接的數據映射神經通路。該項目將使我們理解是什麼使我們人類能創造出重大進展,並會為未來在許多神經和精神疾病的異常腦迴路研究建立一個新階段。

國家衛生研究所 共同基金

國家生物醫學計算中心(NCBC)的計劃在生物信息學和計算生物學上成為國家基礎設施的一部分。這八個中心創建創新的軟體程序和其他工具,使生物醫學界能夠整合,分析,建模,模擬和共享對人類健康和疾病的數據。

病人報告結果測量信息系統(PROMIS)是一個高度可靠,有效,靈活,準確,反應迅速,措施病人報告健康狀況的評估工具系統。核心資源是評估中心,它提供的工具和資料庫,以幫助研究人員收集,存儲,分析病人的健康狀況有關的數據。

全國全科醫學科學研究所:

傳染病代理研究模型(MIDAS)是一個努力開發計算和分析快速逐漸增長傳染病信息的方法,並提供在地方上、州上、國家層面上進行政策模擬的建模結果。而需要在全球範圍內收集和整合細粒度的信息,因為公共衛生政策在本地實施,需要進行數據訪問、管理、分析和存檔。

結構基因組計劃通過發現,分析和傳播的蛋白質的三維結構,RNA和其他生物大分子結構,展現自然界的多樣性,以促進在生物學,農業和醫藥的基本認識和應用。全球性的努力,包括美國國立衛生研究院資助的蛋白質結構倡議,傳染病結構基因組學中心,在斯德哥爾摩的結構基因組學協會和在日本的理化學研究所系統結構生物學中心。通過努力,由結構生物學知識庫在TargetDB主辦的中心資料庫,協調他們的順序目標選擇。

全球蛋白質數據銀行(wwPDB),是一個收集,歸檔和高品質的大分子結構數據的庫,在這個基礎上能及時進行科學界的自由分配,代表在生物學方面的研究和教學實驗測定大分子結構信息,和進行生物、生物化工,醫藥教學的卓越數據源。美國部分的項目 (RCSB PDB)由能源部的五個研究院, NIH/ BER和NSF聯合英國和日本的參與者共同出資。單一資料庫現在包含為80,000大分子結構的實驗結構和相關的註釋。該網站收到來自140個不同國家每月211000個的獨立訪問者。網站每月大約有1 TB的數據轉移。

生物醫學信息研究網(BIRN),屬國內首創,通過數據共享和協作推進生物醫學研究,提供了一個用戶驅動軟體為基礎的框架,研究團隊之間能夠在不同地理和不同類型計算機系統上快速、安全的共享數據,給不同的研究團隊服務。

美國國家醫學圖書館

集成生物學及內部的信息(i2b2),旨在創造能夠整合和交換醫療保健和生物醫學研究數據的方法和工具。通過i2b2開發的軟體工具整合、挖掘和表示的數據,能夠通過共享開源和開源管理下,在全球50多個組織進行使用。

行為與社會科學辦公室(OBSSR)

國家老化計算機化數據存檔(NACDA) 通過在老齡上的研究,幫助研究人員從有開發潛力廣泛數據集上獲得利潤。NACD保存和提供美國老齡最大的電子圖書數據。

人口研究的數據共享(DSDR)提供的數據歸檔,保存,傳播和其他數據的基礎設施服務。 DSDR朝著一個統一的法律,技術和實質性框架工作,在其中分享人口科學的研究數據。

NIH – NSF聯合項目

在計算神經科學的合作研究(CRCNS)是一個NIH-NSF聯合支持的項目,幫助合作研究項目之間的計算科學家和神經科學家促進對神經系統的結構和功能,神經系統紊亂機制和神經系統所使用的計算戰略機制的認識。近年來,德國聯邦教育和研究部還加入了在德國的方案,並支持研究。

 

美國國家科學基金會(NSF)

推進大數據科學與工程的核心技術(BIGDATA)是一個NSF和NIH之間新的聯合招標項目,旨在促進管理、分析、可視化和從大量多樣分散異構的數據集中提取有用信息的核心技術。具體來說,將會支持對數據的管理、數據分析、與電子科學的合作,幫助在科學、工程、醫學技術和工具的開發和評估方面取得突破性的研究和創新,使美國在基礎技術上未來保持幾十年的競爭力。

用於21世紀科學與工程學的網路基礎設施框架(CIF21)開發,整合,協調,充分利用了一套先進的網路基礎設施方案,通過整個國家科學基金會的努力,創造有意義的網路基礎設施,以及一體化水平的數據和工具,以支持科學和教育。

NSF通過聯合計劃,建立一個新的CIF21對綜合研究生教育和研究培訓實習生的跟蹤計劃(IGERT)。目的是新一代的研究人員能夠解決基本的大數據有關的核心技術和技術的挑戰,能夠在跨學科進行網路基礎設施的教育和支持。

引文數據,能夠提供 透明和可持續使用和引用的數據集,由一封聯邦政府工作人員發起的信中開始進行資助,反映了聯邦政府在基金資助研究數據的管理和可持續發展。

數據和軟體保護的開放科學(DASPOS)第一次嘗試建立一個來自大型強子對接機和費米實驗室的理學家與,數字保管、異構存儲系統、大規模計算機系統方面專家之間的正式合作。其目的是制定和執行緊集的定義,參賽者大型活動所依據的大規模,長期的計劃,以及各學科之間的共性指標。EarthCube支持引導社區網路基礎設施的發展,將數據集成到一個框架,加快地質科學知識的傳遞。 NSF的剛剛宣布CIF21框架內第一輪EarthCube獎項,通過探索性研究(EAGER的)機制的早期概念資助,第一步是在地學行為研究上打下基礎。

計算先行者已經資助在加州大學伯克利分校的一個研究小組,深入整合演演算法,機器和人,以解決大數據的研究挑戰。在分析,新系統的基礎設施基本創新的結合有利於從雲和集群計算和採購人群的可擴展性的資源,人類活動和情報將沒有今天的自動化的數據分析技術,提供可以解決問題的方案。

隨機網路模型的重點研究組的研究人員正在開發一種統一的理論框架為原則的統計方法,可伸縮的網路模型演演算法,以區別隨機性的網路知識。生物學和數據的合作者們通過學習大量報紙數據中單詞和短語之間的關係,提供自動化和可擴展性的媒體分析工具。

國家科學基金會發布一封給同事的信,宣布成立一個思想實驗室,將徵求跨學科參與,產生變革的想法,使用大型數據集,以提高教學和學習環境的成效。

信息集成和信息處理 解決可伸縮的問題和挑戰,涉及到傳統科學研究數據的移動,到非常大的異構數據,比如新數據類型模型的整合和表示,以及相關的數據路徑、信息生命周期管理和新平台的數據。

計算和數據處理的科學和工程(CDS&E)和數學和統計科學(CDS&E-MSS),由美國國家科學基金會的數學部門(DMS)和基礎設施辦事處(OCI)設立,成為一個獨特的學科包括數學和統計基礎和計算演演算法。目前這個項目的建議正在審查中,將在2012年7月頒布新的獎項。

一些研究訓練組(RTG)和通過轉型的關鍵點的指導(MCTP)涉及到大數據。在加州大學戴維斯分校的RTG的項目涉及對從天文學、計算機科學、神經科學等領域多種形式的圖像、函數、圖表和樹型的對象數據進行分析。大學生將通過圖像和可視化技術的培訓,處理複雜的數據、軟體包、和計算機模擬來評估模型的有效性。與大氣、圖像重建、網路安全和癌症相關的學生網站也在發展當中。

激光引力波干涉觀測站(LIGO)通過以前不能觀察形式的輻射,在宇宙中打開一個可以進行引力波探測的窗口。只有通過利用世界各地大型計算設施、和77家機構超過870名研究人員,和Einstein@Home項目,才能對這些大量湧現的數據進行處理。

開放科學網格(OSG),使得全世界超過8000名的科學家合作進行發現,包括尋找希格斯玻色子。在瑞士的歐洲核子研究中心(CERN)的大型強子對撞機,超過100計算設施,每年通過高速網路散布超過15 PB的實時數據。美國計算機領域的科學家和電腦設施提供數據傳輸分析服務、工作規範和執行、安全和管理、在物理、生物、納米技術、天體物理學等學科進行數據共享。

理論和計算天體物理學網路(TCAN)計劃,旨在最大限度地發現潛在的大規模的天文數據集,通過推進解釋這些數據所需要的基本理論和計算方法,團結協作網路跨越體制和地域的研究劃分,培訓未來理論和計算的科學家。

美國國家安全局(NSA)

警惕網路:競爭網路防禦規模的情境意識的培養和測試 將探索數據可視化的網上競賽,從開始與識別此類事件設計與最佳執行方法上,進行龐大計算機網路防禦上的數據可視化開發。

情報共同體(IC),通過與整個美國政府、學術界和工業界各種各樣的合作夥伴確定了一套協調、宣傳和活動方案。將網路安全與大數據相結合,使其學術界了解其觀點。

NSA/ CSS的商業解決方案中心(NCSC)通過供應商的能力演示,展示了新的商業技術的發展,滿足NSA/ CSS的戰略需求和國家安全社區。

美國地質調查局(USGS)

USGS約翰韋斯利鮑威爾分析及合成中心剛剛宣布了傳輸大數據集和為科學發現有關的地球科學理論有關的八項新的研究項目。中心的科學家合作利用全面、長期的數據來進行最先進的合成。

原文鏈接:http://www.whitehouse.gov/blog/2012/03/29/big-data-big-deal


高興

感動

同情

搞笑

難過

拍磚

支持
1

鮮花

剛表態過的朋友 (1 人)

評論 (0 個評論)

facelist doodle 塗鴉板

您需要登錄后才可以評論 登錄 | 註冊

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2024-5-2 01:16

返回頂部