<em id="3dxbf"></em>

    <form id="3dxbf"><form id="3dxbf"><th id="3dxbf"></th></form></form>

    <em id="3dxbf"><form id="3dxbf"><th id="3dxbf"></th></form></em>

    首都科學講堂第681期《神機妙算:超級計算機都在算什么》

    信息來源:北京科學中心      發布時間:2021-02-07

      2021年2月6日,首都科學講堂線上開講,本次首都科學講堂邀請了北京應用物理與計算數學研究所研究員、高性能計算中心主任徐小文 ,為大家帶來題為《神機妙算:超級計算機都在算什么》的精彩講座。

      

      神機妙算:超級計算機都在算什么

      和我們使用的普通計算機不同,超級計算機在科技創新和產業發展中,起著“頂天立地”的支撐作用。在大飛機與航天器設計、新材料新能源、藥物研發、基因工程、氣候氣象等領域,超級計算機更是已經成為了創新研究的必備工具。目前,全球最快超級計算機的運算速度已達到每秒53億億次。過去10年,我國超級計算機“天河二號”和“神威·太湖之光”曾連續5年排名世界第一。在世界超算TOP500最新排名中,我國超級計算機臺數占43%。

      第一講 神機篇:認識超級計算機

      每個人每天基本上都在用計算機,但對于超級計算機,你可能聽過,卻不一定用過,甚至都可能沒有見過真實的它。那么,超級計算機到底長什么樣,名為“超級”的它,真的名副其實嗎?

      國際上專門給計算機排名的TOP500組織,每年都會選出全球最快的500臺超級計算機。1993年至今,以一年兩期的頻率,已發布了56期排行榜。在2020年11月發布的最新一期榜單上,日本富岳計算機被評為全球最快的超級計算機。計算機每秒能夠計算的浮點運算次數,一般用來衡量計算機的速度,那么,“富岳”快到什么程度?

      我們平時使用的筆記本電腦運算速度大概是每秒100億次的浮點運算,“富岳”的運算速度為50億億次的浮點運算,相差5000萬倍,差距非常大。超級計算機本質上是一個并行計算機——是由很多可以并行執行的處理單元組合在一起的。比如說“富岳”實際上包括730萬個CPU核,常用的筆記本電腦只包括幾個CPU核。

      超級計算機的造價和使用起來也都非常貴。“富岳”造價將近60億元人民幣。它的能耗也非常高,普通筆記本只消耗30瓦左右的電力,“富岳”在全功率下,能耗高達30兆瓦,相差了100萬倍。如果按照一塊錢一度電來計算,“富岳”每年的電費就超過2億元人民幣。

      另外,超級計算機需要一個專門的機房來擺放,就是我們常說的超算中心。超算中心需要專門的供電系統和輔助設備,建筑的體量一般都很大。

      中國超算的發展速度是非常快的。1983年,首臺并行機“銀河-I”計算機在長沙研制成功,運算速度達到1億次每秒。而在過去十年內,TOP500全球排行第一的機器共8臺:美國3臺、日本2臺、中國3臺。其中,中國有六年時間共11次排名世界第一,而且近兩年,進入TOP500的機器數量中國也是最多的。

      目前我國最快的兩臺超級計算機,第一是“神威·太湖之光“,裝在國家超級計算無錫中心,運算速度接近11億億次每秒。第二是國家超級計算廣州中心的”天河二號“,運算速度達6億億次每秒。“神威·太湖之光“目前全球排名第四,”天河二號“全球排名第六。同時,過去十年,我國建了八個國家超級計算中心,裝載的都是全球運算速度非常快的機器,成為國家科技創新的一個新基建。

      下一個超級計算機的里程碑,也是目前各個國家競相爭奪的制高點,是百億億次計算機(1018 次/秒,下稱“E級機“)。百億億次計算機什么時候能出現?

      2019年,有一個預測時間表,推測第一臺百億億次計算機會在近兩年出現。但由于各種原因,這個機器目前還沒有出來。

      在2016年,美國能源部和美國國家核安全局啟動了一個百億億次計算的攻關計劃,要求全面推進機器及應用、軟硬件的協同研發,來確保當時預估在今年前后實現的國家戰略安全的百億億次計算。當然,目前來看,這個節點可能會再往后推。隨后,美國能源部在2019年又簽訂了三臺E級機的采購合同。特朗普在位的時候,曾砍掉了很多科學領域的預算,但始終未砍掉超級計算的預算。

      我國對超級計算機的發展也非常重視。2018年,我們就研制了三臺E級計算的原型機,皆基于國產處理器,但真正的E級機什么時候出來,還存在不確定性。

      E級機的研發,存在著非常大的挑戰,為什么?

      首先是能耗。日本“富岳“50億億次的計算,能耗已在30兆瓦。如果按照百億億次擴展,能耗很難控制在我們想要的40兆瓦內。即使按照40兆瓦的能耗約束,造出來后,每年電費也近3億元人民幣。

      其次是應用。機器造出后,應用軟件能不能駕馭硬件也是一個很大的問題。“富岳“包含了730萬個CPU核,那么E級機肯定會超過1000萬、甚至數億個并行處理單元。應用軟件該如何去駕馭,使這么多的處理單元能同時高效工作,這是一個非常大的挑戰。

      E級機是人類追求計算能力方向上的一個里程碑,各個國家都在為之努力。美國能源部還聯合美國超級計算機公司Cray宣布把每年的10月18日定為美國的百億億次計算日。

      為什么是10月18日?因為百億億次計算是10的18次方。美國把10月18日作為一個節日來慶祝,也側面說明它對追求百億億次計算的決心是非常大的。但E級機到底什么時候誕生,由哪個國家先造出來,現在還存在著很大的不確定性。  

      第二講 應用篇:超級計算機在算什么

      超級計算機造價這么高,電費也這么貴,造出來到底有什么用呢?超級計算機平常都在算什么?

      讓我們先看看世界上第一臺通用電子計算機,它叫ENIAC,1946年2月14日在美國的賓夕法尼亞大學研制成功,當時每秒的運算速度是5000次,現在看起來是很慢的。

      ENIAC是為了二戰需要而制造的。戰爭時期設計新型炮彈,需要計算炮彈軌跡,然后據此調整炮彈的威力。另外在歐洲戰場,它也被用于加密和解密工作。今年正好是第一臺通用電子計算機誕生75周年,是一個非常值得紀念的年份。

      我們國家第一臺計算機103機,在1958年8月1日研制成功。當時它每秒的運算速度僅30次,非常慢。1959年的升級版本104機,運算速度已達到每秒10000次。這些計算機也主要用于國防尖端科技領域。

      實際上,超級計算自誕生始,就是為了尖端研究研制的。它提供了比普通計算機更為強大的算力,加速了作為科研計算手段的發展。不過最近十年,超級計算機與我們的日常生活聯系得也是越來越密切了。

      讓我們先看看,世界上最快的這三臺計算機在干什么。

      排行榜第三名是在美國能源部勞倫斯利弗莫爾國家實驗室的Sierra,性能是每秒11億億次。這臺機器應用比較單一,主要應用領域集中在國家安全方面,比如核武器的研制、庫存武器的有效性、聚變能源的探索等。

      排在第二名的機器是2018年部署在美國能源部橡樹嶺國家實驗室的Summit,性能是每秒20億億次。這臺機器應用范圍比較廣,包括天體物理、生物能源、新材料制造和生命科學等。

      第一名的機器就是日本的“富岳“。這臺機器實際上是2020年新部署的,安裝在日本理化研究所。這臺機器明確了九大應用領域:災害預測、氣象和環境、基因醫療、藥物開發、制造、新材料、新能源、能源儲藏、宇宙科學等。去年4月,新冠肺炎疫情全球暴發的時候,它也被應用于與新冠肺炎疫情相關的研究,比如新藥物的篩選和病毒傳染模型的計算等方面。

      看完全世界最快的三臺計算機,下面看看我國的超級計算機。據2020年中國高性能計算機性能TOP100數據,我國超級計算機領域的應用是非常廣泛的。

      這些領域大致可以分為兩類,一類是傳統的科學工程應用,比如能源、電力、工業制造、教育和科研。另外一類主要是近幾年興起來的新型應用,比如云計算、大數據、視頻制作、動畫渲染,以及互聯網、人工智能。

      從這個榜單可以看出來,雖然普通人直接用不到超級計算,但實際上,超級計算與我們日常生活的關系是越來越密切了。

      首先,超級計算在工程和工業設計里,發揮著非常重要的作用。舉個例子,湖南有座橋叫做赤石大橋,漂亮宏偉,而且有七個“世界第一“。這座橋2014年設計完工,準備通車的時候發生了火災,設計單位就對它進行了修復,修復后就需要評估橋梁的安全性能。當時為了作這個評估,使用很多超級計算機進行了非常多的計算,包括采用了一些先進算法,確認修復后的橋梁強度沒有損害,確保2016年橋梁順利通車。

      再看一個發動機的例子。發動機的設計是非常復雜的,研制也非常困難。2016年,我國專門成立了中國航空發動機研究院。傳統發動機設計必須經過多次試驗,研制周期非常長,大概10-15年,研究經費50億美元。為了造一臺發動機,需要至少40-50臺實驗發動機。而現在基于超級計算,已經大大地減少了試驗的次數。基于超級計算的數值模擬,可以把研制周期減少4-7年,節省十多億美元的經費。傳統的基于實驗的發動機設計,便轉向于一種基于科學的預測設計,大幅度地縮短了研制周期,促進了工業的發展。

      另外,我國從上世紀50年代起就開始用數值天氣預報,所以,基于超級計算來作數值天氣預報,是現在各個國家氣象預報的一個主要手段。

      第三講 妙算篇:怎么用好超級計算機

      超級計算好不好用,主要是說真正用它來做研究的時候,能不能高效地發揮它應有的算力。超級計算機最主要的就是應用軟件,因為所有的東西都是通過應用軟件來計算的。

      應用軟件面臨著“四道墻”的挑戰:編程墻、性能墻、產出墻和可靠墻。

      下面我簡單地介紹一下這“四道墻”。“編程墻”就是說,應用軟件能不能很快地研制出來,涉及到并行編程和軟件架構。在一個普通的計算機上,做編程是相對容易的,但想用好超級計算機,必須要做并行編程。超級計算機應用軟件非常復雜,代碼量非常高,可能是幾萬行、幾十萬行,甚至是上百萬行。在這種情況下,如果不能很快地研制軟件,就不能充分發揮超級計算機的效率。

      假設軟件研制出來了,那么應用軟件能不能高效地執行,涉及到并行算法和性能優化。比如,并行執行的處理器是否能同時工作,很多處理器是否能同時解決一個問題。如果數據劃分或任務劃分不均衡的話,就會影響它的并行效率。這一系列的問題都需要解決,叫做“性能墻”。

      “產出墻”就是說,軟件研制出來了,性能也很高,但用的時候好不好用?用戶使用軟件做設計的時候,是不是很快就能拿到結果。這涉及到軟件界面、人機交互,包括通過超算得到的海量數據可視化。

      等這“三道墻”都解決了以后,還有最后一道墻是“可靠墻”。可靠墻是指超級計算機本身的可靠性問題。超級計算機包含的計算部件非常多,運行過程中難免出現故障。實際上,一臺超級計算機每隔幾個小時,某些局部就會出現一次故障。假設程序正好處于故障節點,程序就要“掉下來”。所以,怎么確保超級計算機穩定可靠地運行,是超級計算領域的一個共性難題,需要做很多系統的運行優化和管理。

      如何破除這“四道墻”?需要一種先進的軟件研發模式,跟上硬件發展速度,并能與應用軟件快速匹配,并且直接受益于超級計算機的快速發展。

      這里介紹一種模式,叫做平臺模式。采用平臺模式,可以把某領域內與高性能計算相關的一些共性內容封裝在一個中間件的平臺。這樣,只需要再加入一些個性部分,就能夠很快地研發出相應的應用軟件,由中間件去同步超級計算機的演化。當然,不同的應用領域可以研制不同的中間件。

      基于這么一個模式,我們研制了在科學工程計算里具有普適性的框架,分別是JASMIN、JAUMIN、JCOGIN。基于這些框架,應用軟件進行編程的時候,實際上只需要做四步,這四步都不需要和超級計算機打交道,就可以實現應用軟件的自動并行。另外,這樣一來,由框架去匹配超級計算機的性能優化,程序效率實際上可以自動提升,用戶用起來非常方便。可以很方便地使用超級計算機,應用軟件可以自動地獲得超級計算機的算力。

      整個中間件的發展,經過了十多年,2004年,我們開發了第一個框架,后續2013年,我們構建了整個中間件平臺。目前我們已具備十億億次計算能力,下一步要匹配國家百億億次計算機的發展。現在這套中間件,已在我國很多核心行業中發揮著很重要的作用,支撐了近百套超算軟件的快速研發,取得了很好的效果。

      第四講 機遇篇:發展自主軟件與核心算法

      對于超級計算機,應用軟件的自主研發非常重要。以我國兩大超算中心廣州和天津為例,從2018年兩個超算中心統計的數據可見,我國自主研發的軟件缺失嚴重,目前使用的大部分仍是一些國外開源軟件。

      國外進口軟件有什么問題?一個最主要的問題是,進口軟件的實際性能和我國超級計算機的峰值性能差距非常大。基本上可以低到1-2個,甚至更多的量級。進口軟件一般會限制CPU核數等,反正就是不讓你用那么高的性能。一方面,造成我國超級計算機峰值性能的巨大浪費,另一方面,用這些軟件去做設計的時候,總是存在著“天花板”。另外還有一個風險是,它也受限于出口管控。

      核心算法是自主研發超級計算機軟件的一個重要方面。2020年,我國科技部成立了首批13個國家應用數學中心,我認為,主要目的是建立數學界和工業界的一個橋梁。從這個角度來講,應用驅動的算法研究應該大有作為。所以,怎么針對具體的實際應用提出更有效的算法,應該是現在超級計算的軟件需要迫切解決的一個問題。

      目前的算法在很多實際應用里,還無法滿足我們的需求。我舉幾個例子給大家分享。

      第一個例子是關于集成電路的優化設計和性能的驗證。2016年,三星公司的Note 7手機發生多起爆炸,導致全球召回。主要原因是手機的集成電路功率——電源和散射結構設計有缺陷。手機集成電路設計,需要通過數值模擬的手段,進行仿真。然后基于這個仿真的結果來進行各種設計,包括布局,集成電路線的布局,以及信號完整性的分析和一些網絡的優化,還有一些射頻的參數優化。目前為止,計算能力還無法滿足真實設計的需求,導致設計上有各種缺陷,這是一個很典型的例子,這就需要很強的算法。

      第二個例子是關于大壩的結構力學分析。我國有全世界最多的水壩。一個很重要的問題是,這些大壩安全嗎?要對它的安全性進行評估,主要是對大壩做結構力學的分析,在數學上是非常復雜的。在水利工程里,是非常具有挑戰性的問題,因為常常牽涉到很多復雜的環境。比如,廣西隆林天生橋的一個水壩到了夏天的時候,壩體經常會發生一些破損。隨著超級計算機性能的發展,我們可以做一些仿真計算,來評估這些大壩的安全性。

      這個水壩涉及的計算規模超過了10億,“天河二號”花了不到37分鐘的時間就把它算了出來。它首次使用數值模擬的手段,定量地分析和證實混凝土的升溫膨脹效應就是導致壩體夏天經常破裂的原因。并且通過仿真數據可以得知,溫差到了多少度的時候,它會發生怎樣的破裂。這樣一來,就可以定量地把它刻劃出來,這是目前商用軟件做不了的,這是一個典型的超級計算服務于設計的例子。

      第三個例子,關于激光聚變,這也是非常有意思的一個應用。激光聚變可能大家不一定知道,但聚變能源大家肯定在一些科幻電影里聽過。比如,《流浪地球》里的行星發動機,《鋼鐵俠》里的反應堆,都提到聚變能源。聚變能源有望一勞永逸地解決人類的能源問題,是一個非常宏大的設想。

      但目前可控的聚變在地球上還沒有實現,原因是什么?因為挑戰非常大。要發生氘和氚聚變反應,必須在上十億攝氏度的高溫下才能夠發生,釋放能量。太陽的溫度頂多是上億攝氏度,這個溫度的要求比太陽實際溫度還高。

      氫彈爆炸實際上發生的就是這種聚變反應,但那是不可控的。我們現在的要求是,在實驗室里面做可控的聚變。其中,激光聚變就被認為是未來實現聚變能源最有潛力的途徑之一。激光聚變的全稱叫做“激光驅動的慣性約束聚變”,它的原理非常有意思。

      即在實驗室的環境下,利用一個高功率的激光作為驅動源。然后這個激光在氘、氚燃料的球狀靶丸表面,驅動這個靶丸,使得它往里壓縮到一定程度,靶丸處于極高的密度和溫度,達到點火條件,實現一個熱核的反應和燃燒,釋放能量后再把能量收集起來。

      這樣整體分為四個步驟:激光輻射、內爆壓縮、聚變點火和聚變燃燒。如果這四個步驟成功了,聚變能源就有希望了。激光器實際上是1960年發明的,發明了以后,實際上蘇聯、美國,包括我國的王淦昌先生都提出過這個設想。到1970年代時,美國科學家,包我國的于敏先生都提出過完整的聚變方案。但目前為止,地球上還沒有哪個國家實現這個聚變反應。最主要的困難是需要高功率的激光裝置,并且要在實驗室環境下,創造一種類似于太陽能量密度的環境。

      目前世界上最大的激光器是美國的國家點火裝置,叫做NIF。這個裝置1997年動工,2008年建成, 2010年開始做實驗,共有192束激光。

      激光聚變中的靶丸實際上非常小,直徑只有1微米。四個過程都將在直徑1微米的靶丸中發生。但為了驅動這個微小的靶丸,卻需要一個很大的裝置。首先靶丸要放在一個直徑1厘米的黑腔里面,黑腔要放在一個直徑達10米的圓形靶室里,球面上有很多的孔,這些孔就是激光的入射孔。靶丸等于處于靶室的最中間,所有的192束激光,最終都要匯聚在微小的靶丸表面來驅動它內爆壓縮。整個NIF裝置需要安裝在一個3個足球場大小的大型建筑里面。

      實際上,類似俗語里的“高射炮打蚊子“,聚變反應需要一個非常大的裝置去瞄準一個非常小的目標,所有能量都要聚焦在微小的一個點上。在科學工程、技術和工業上都是非常精細的一個實驗。正是因為這個實驗實現的難度非常高,它的物理設計必須定量地理解和精確地控制每一個環節。

      另外,還有一點需要告知大家,靶丸上發生的四個步驟,必須在100納秒內全部完成,所以,數值模擬計算是目前主要的實現手段。做實驗之前,要在計算機上做很多模擬。美國實際上從2012年開始做實驗,但目前依然沒有點火成功,這個挑戰非常大。目前的算法和計算能力都沒有辦法滿足需求,這也是一個典型例子。

      前面講了很多例子,我主要是想告訴大家,目前是我國從事超算軟件的研發和算法研究的一個最好的時代,因為有很多的需求,也有很多的挑戰。我以去年Science上的一篇文章作為結語。計算機的內容很少在出現在Science上,但這是一篇將近10頁的綜述性文章。主要是討論后摩爾時代,如何進一步提升計算能力的問題。因為隨著摩爾定律放緩,半導體工藝已經到了物理極限,靠底層的半導體工藝提升性能的時代結束了,可能要有其他的一些新途徑出來。所以,在應用和計算機里面,軟件和算法怎么做結合,空間是非常大的。

      我來自于高性能數值模擬軟件中心,目前在我們國家專門從事這種自主軟件研發的中心很少,它的主要目標就是基于我們的超級計算,自主研發我們的一些工業軟件,來使得這個超級計算真正成為我們國家的利器。如果大家對超算研究,特別是對軟件研發和算法研究感興趣的話,歡迎關注我們的軟件中心。

    一女被多男玩喷潮视频 - 在线 - 视频观看 - 影视资讯 - 宅男网 Produced By 大漢網絡 大漢版通發布系統