音頻科普:“天河”系列超級計算機(上)
發(fā)布時間:2020-11-10
瀏覽次數(shù):1542
?音頻科普:“天河”系列超級計算機(上)

近幾年來,我們經(jīng)常會聽到智能醫(yī)療、自動駕駛、AI大戰(zhàn)圍棋高手等熱點詞匯或事件。對于這些詞匯,大家能想象到的可能是一臺醫(yī)療儀器,一輛汽車,也可能會以為和圍棋高手對戰(zhàn)的只是那臺小小的電腦。但事實并非如此,在它們背后,有我們看不到的龐然大物:超級計算機。?

  計算機電腦,我們并不陌生,但超級計算機似乎離我們的生活很遙遠,今天就跟大家聊一聊,我國首臺千萬億次超級計算機“天河一號”背后的故事。??

  超級計算機是計算機中功能最強、運算速度最快、存儲容量最大的一類計算機。經(jīng)常被用于國家高科技領域和尖端技術研究,或者科學家通過對數(shù)值模擬來預測和解釋以前無法實驗的自然現(xiàn)象,肩負著運行大型計算的使命。?

  簡單來說,超級計算機的基本構成其實和我們個人電腦的概念并沒有太大的差異,但規(guī)格與性能則強大很多。例如,家用電腦一般只有一個CPU,每個CPU內一般只有2個到8個物理核心;而一臺超級計算機則有成千上萬顆CPU,每顆CPU內通常有幾十個物理核心,于是超級計算機就成了這樣一臺由數(shù)百數(shù)千甚至更多的處理器組成的、能計算普通PC機和服務器不能完成的大型復雜課題的計算機。?

  超級計算機最大特點是在于它具有超強的計算和處理數(shù)據(jù)的能力,運算速度可達到每秒萬億次以上。?

  CPU,也叫中央處理器,是一塊超大規(guī)模的集成電路。它的功能主要是解釋計算機指令以及處理計算機軟件中的數(shù)據(jù),是一臺計算機的運算核心和控制核心。我們可以把CPU理解成人類的大腦,發(fā)現(xiàn)了問題就相當于輸入了數(shù)據(jù),這時大腦就會根據(jù)問題進行處理,處理的速度取決于大腦,也就是CPU的性能,性能越強,收到處理結果的速度就越快。?

  2007年11月,美國研制出了世界第一臺千萬億次超級計算機,峰值計算速度每秒1456萬億次。在2009年6月公布的世界超級計算機500強中,美國占據(jù)291席,歐洲占據(jù)145席,而且前10名全都是美國產(chǎn)品。與發(fā)達國家相比,我國不僅在計算能力上相差一個量級,裝機數(shù)量上也有所差距。?

  在日新月異、競爭激烈的超級計算機研制領域,不進則退是十分現(xiàn)實而殘酷的生存法則。因此,面對高性能計算領域的嚴峻挑戰(zhàn),中國國防科技大學計算機學院的科研人員再次吹響了研制“天河一號”的號角。?

  為了打造屬于自己的超級計算機,天河團隊堅持自主創(chuàng)新,潛心攻關,甚至在研制過程中還展開了一場極富創(chuàng)意的“主動出擊戰(zhàn)”。在當時,我國研討制定的方案是:先研制兩臺百萬次超級計算機,再研制一臺千萬億次超級計算機的“兩步走”計劃。但天河團隊經(jīng)過深入地技術調研和反復地權衡利弊,決定從每秒10萬億次直接沖刺每秒1000萬億次,走別人沒有走過的CPU加GPU技術路線,這一超常決策引起了人們的一片嘩然。?

  要知道,以10倍速度逐步遞增來研制超級計算機,已經(jīng)成為了國際慣例。從每秒10萬億次直接向每秒1000萬億次跨越,大多數(shù)人都對這一決策能否成功持有懷疑的態(tài)度。?

  按常理來說,CPU是用來計算數(shù)據(jù)的,GPU是用來進行圖形和視頻處理的,如果把GPU用來計算,不僅會讓編程很難,而且計算效率也很低。但GPU具有并行度高、功耗低、價格便宜等特點,如果能在用于科學計算上取得突破,將具有十分突出的優(yōu)勢。?

  為此,天河團隊大力攻關,不斷地進行可行性驗證。那一段時間,晚上的研究室燈火通明,大家廢寢忘食,想要攻克這一難題。2009年3月,天河團隊把CPU和GPU組合起來,發(fā)現(xiàn)總性能竟然還不到600億次,而一顆CPU就有近500億次的性能。也就是說GPU雖然用于圖像處理速度驚人,但讓它與CPU放在一塊用于科學計算,就變得非常懶惰,計算效能只有20%左右。?

  失敗的滋味并不好受,但是他們并沒有氣餒,而是連續(xù)突擊奮戰(zhàn)四個月,先后改進優(yōu)化了8萬多次,創(chuàng)造了一個科學奇跡:那就是在國際上首創(chuàng)了CPU和GPU相結合的異構融合計算體系結構,把GPU計算效能提高到70%以上,達到了世界最高水平!?

  到了2009年10月29日,天河團隊成功研制出了我國第一臺千萬億次超級計算機“天河一號”。一年后,升級改進的“天河一號”在第36屆國際超級計算機500強排行榜上取得了排名第一的好成績。?

  作為當時世界上運算速度最快的超級計算機,持續(xù)速度可以達到每秒2570萬億次浮點運算、峰值速度為4700萬億次。如果換算成我們民用計算機的運算速度,“天河一號”運算1小時,相當于13億人同時計算340年以上。??

  經(jīng)過我國科研人員多年的努力,終于打破了美國在超級計算機領域長期一家獨大的局面,這也標志著我國自主研制的超級計算機綜合技術水平跨入世界領先行列。?

  但在我們歡呼慶祝的同時,需要知道我國的科研團隊在奮起直追的路上,有多少個不眠之夜,又有多少次激流勇進??梢哉f,“天河一號”的成功,不僅來自于科研人員的辛苦鉆研,還來自超強的膽魄以及超出常人的科研精神。?

  就拿通信光纖的鋪設來說,當時“天河一號”需要進駐國家超算天津中心,因為是首期工程,所以時間緊、任務重。但在施工第一天,鋪設工程就遇到了關鍵性問題,原來施工人員剛鋪設幾根通信光纖,就發(fā)現(xiàn)在40多攝氏度的高溫下,水泥表面太過粗糙,光纖的絕緣膠皮很容易被磨出道道裂痕,個別地方甚至還露出線芯。如果這個問題不解決,輕者會導致信號中斷、通信短路,嚴重時還可能造成系統(tǒng)紊亂,影響“天河一號”的運行。?

  由于項目時間緊張,施工人員來不及多想,便紛紛跳進悶熱的溝槽,俯臥在粗糙的水泥地上,用身體鋪就了一條“人肉地毯”,從而將15000根通信光纖毫發(fā)無損地鋪設完畢。就這樣,等到“天河一號”試機那天,才使得打開機器的一瞬,全部通信線路暢通無阻。?

  聽完研制“天河一號”的艱辛過程,或許有人會有疑惑:科研團隊不辭辛苦,投入大量的人力、物力、財力制造出來的“天河一號”到底有什么作用呢??

  其實,“天河一號”超級計算機與我們老百姓的生活是密切相關的,它的應用可以簡單通俗地概括為三個方面:即算天、算地、算人。?

  所謂的“算天”,就是借助超級計算機預測氣候的變化,提供有關發(fā)生可能性低、但破壞性大的氣象事件的預警,這樣就可以減輕極端天氣給人類帶來的傷害。同樣,對于天氣情況的準確預報也需要具備迅速完成大量運算的能力,比如我國自行設計生產(chǎn)的“銀河Ⅱ型”大型機就曾經(jīng)被使用于天氣預報領域;在2008年北京奧運會中,北京氣象局也采用了超級計算機來為北京及周邊地區(qū)提供精確到小時的天氣預報。此外,超級計算機在航天領域同樣展現(xiàn)了絕佳的性能。?

  ?“算地”,就是相當于給地球做“CT”。比如,超級計算機對地震的模擬,可以讓我們更好地對地震進行預測;而且,超級計算機還能對石油勘探的數(shù)據(jù)進行處理,想把石油、天然氣資源盡量多地開采出來,都需要利用高性能超級計算機對數(shù)據(jù)進行精確處理。目前,“天河一號”已經(jīng)在石油勘探方面獲得了成功的應用。?

  而“算人”則是指探索人類大腦的秘密、破解人類基因密碼。如今,超級計算機的應用觸角已經(jīng)延伸到生命科學研究等領域。借助超級計算機強大的計算能力,人類研制新藥的周期會大大縮短,還可以為疾病的治療提供革命性的方法。目前,軍事醫(yī)學科學院已經(jīng)在“天河一號”上進行了以胰島素受體為靶點的糖尿病新型治療藥物的研發(fā)。?

  實際上,除了算天、算地、算人之外,超級計算機還可以為經(jīng)濟、科技、國防等領域存在的一系列復雜、大型的問題提供計算上的支持,解決普通計算機難以解決的“挑戰(zhàn)性問題”。而這正是科研工作者投入大量精力、時間去研制超級計算機的根本原因。



關注【深圳科普】微信公眾號,在對話框:
回復【最新活動】,了解近期科普活動
回復【科普行】,了解最新深圳科普行活動
回復【研學營】,了解最新科普研學營
回復【科普課堂】,了解最新科普課堂
回復【科普書籍】,了解最新科普書籍
回復【團體定制】,了解最新團體定制活動
回復【科普基地】,了解深圳科普基地詳情
回復【觀鳥知識】,學習觀鳥相關科普知識

聽說,打賞我的人最后都找到了真愛。
做科普,我們是認真的!
掃描關注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認識科普小朋友
  • 成為科學小記者