日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

ISC24 | 數(shù)據(jù)中心需要新的能效指標(biāo)

2024-05-14 13:52:48·  來源:NVIDIA英偉達(dá)企業(yè)解決方案  
 

超級計(jì)算機(jī)和數(shù)據(jù)中心的運(yùn)營人員因缺乏測量每單位能源所做有用功的標(biāo)準(zhǔn),無法衡量其在實(shí)現(xiàn)可持續(xù)計(jì)算方面的進(jìn)展。



數(shù)據(jù)中心需要更加先進(jìn)的、能夠顯示實(shí)際應(yīng)用運(yùn)行進(jìn)度的儀表盤來指導(dǎo)他們提高能效。


計(jì)算能效的公式很簡單——將所做的功除以所用的能源。但要將其應(yīng)用于數(shù)據(jù)中心,則需要考慮一些細(xì)節(jié)問題。


如今使用最廣泛的衡量標(biāo)準(zhǔn)——能源使用效率(PUE)就是將設(shè)施消耗的總能源與其計(jì)算基礎(chǔ)設(shè)施使用的能源進(jìn)行比較。在過去的 17 年中,PUE 幫助最高效的運(yùn)營者不斷接近理想狀態(tài),即在電能轉(zhuǎn)換和冷卻等過程中幾乎不浪費(fèi)任何能源。


尋找下一個(gè)指標(biāo)


PUE 在云計(jì)算興起的時(shí)候給數(shù)據(jù)中心帶來了很大的幫助,并將繼續(xù)發(fā)揮作用。但在如今的生成式 AI 時(shí)代,工作負(fù)載和運(yùn)行這些負(fù)載的系統(tǒng)都發(fā)生了巨大變化,因此僅使用 PUE 是不夠的。


這是因?yàn)?PUE 只能衡量數(shù)據(jù)中心消耗的能源,卻無法衡量數(shù)據(jù)中心的有用輸出。這就好比只衡量發(fā)動(dòng)機(jī)的耗油量,卻不知道汽車行駛了多遠(yuǎn)。


數(shù)據(jù)中心效率有許多衡量標(biāo)準(zhǔn)。2017 年的一篇文章列出了近三十多項(xiàng)標(biāo)準(zhǔn),其中有幾項(xiàng)側(cè)重于冷卻、用水量、安全、成本等具體目標(biāo)。


了解什么是“瓦特”


計(jì)算機(jī)行業(yè)長期以來一直以功率(通常以“瓦特”為單位)來描述系統(tǒng)及其處理器的能效,這多少有些令人遺憾。因?yàn)楸M管這個(gè)指標(biāo)很重要,但很多人沒有意識到“瓦特”只能衡量某一時(shí)間點(diǎn)的輸入功率,而無法衡量計(jì)算機(jī)實(shí)際使用的能源或使用能源的效率。


因此,當(dāng)以“瓦特”來衡量現(xiàn)代系統(tǒng)和處理器的輸入功率時(shí),即便數(shù)值上升也不意味著其能效下降。實(shí)際上,這些系統(tǒng)和處理器所做的功與能耗的比值一般會高出許多。


現(xiàn)代數(shù)據(jù)中心的衡量標(biāo)準(zhǔn)應(yīng)側(cè)重于能源,即工程界所稱的千瓦時(shí)或焦耳。關(guān)鍵之處在于它們利用這些能源做了多少有用功。


重新定義我們所說的功


在這一點(diǎn)上,業(yè)界還是習(xí)慣于使用抽象的術(shù)語進(jìn)行衡量,比如處理器指令或數(shù)學(xué)計(jì)算。因此,MIPS(每秒百萬條指令)和 FLOPS(每秒浮點(diǎn)運(yùn)算)這兩項(xiàng)指標(biāo)被廣泛使用。


只有計(jì)算機(jī)科學(xué)家才關(guān)心他們的系統(tǒng)能處理多少這樣的初級工作。用戶更希望知道他們的系統(tǒng)能完成多少實(shí)際工作,然而有用功的定義多少帶些主觀色彩。


側(cè)重于 AI 的數(shù)據(jù)中心主要參考 MLPerf 基準(zhǔn)測試。從事科學(xué)研究的超級計(jì)算中心通常會使用額外的功衡量標(biāo)準(zhǔn)。專注流媒體的商業(yè)數(shù)據(jù)中心可能還需要用到其他標(biāo)準(zhǔn)。


由此產(chǎn)生的應(yīng)用套件必須能夠隨著時(shí)間的推移而不斷發(fā)展,這樣才能反映最新技術(shù)水平和關(guān)聯(lián)度最高的用例。例如上一輪 MLPerf 增加了使用兩種生成式 AI 模型的測試,而這兩種模型在五年前甚至還不存在。


加速計(jì)算的標(biāo)準(zhǔn)


理想情況下,任何新的基準(zhǔn)測試都應(yīng)該能夠衡量加速計(jì)算的進(jìn)步。許多現(xiàn)代工作負(fù)載通過將具有并行處理能力的硬件、軟件與方法相結(jié)合,實(shí)現(xiàn)了比 CPU 更快、更高效的應(yīng)用運(yùn)行速度。


例如,在科學(xué)應(yīng)用方面,美國國家能源研究科學(xué)計(jì)算中心的 Perlmutter 超級計(jì)算機(jī)利用加速計(jì)算將能效平均提高了 5 倍。這就是為什么在 Green500 榜單上排名前 50 的超級計(jì)算機(jī)中有 39 臺(包括排名第一的系統(tǒng))都使用了 NVIDIA GPU。

由于 GPU 可以并行執(zhí)行大量任務(wù),因此與 CPU 相比,GPU 可以在更短的時(shí)間內(nèi)完成更多的工作并以此實(shí)現(xiàn)節(jié)能


許多行業(yè)的企業(yè)都取得了類似的成果。例如 PayPal 通過加速計(jì)算將實(shí)時(shí)欺詐檢測率提高了 10%,并將服務(wù)器能耗降至近八分之一。


隨著每一代 GPU 軟硬件的推出,性能提升幅度也在不斷增長。


斯坦福大學(xué)以人為本 AI 研究團(tuán)隊(duì)在最近的一份報(bào)告中預(yù)估,自 2003 年以來,GPU 的性能“大約提高了 7000 倍”,單位性能的能效比則 “提高了 5600 倍”。


數(shù)據(jù)中心需要一套基準(zhǔn)追蹤其主要工作負(fù)載的能效


兩位專家的見解


專家們也認(rèn)為有必要制定新的能效指標(biāo)。


最初提出 PUE 概念的數(shù)據(jù)中心工程師 Christian Belady 認(rèn)為,如今數(shù)據(jù)中心的 PUE 已達(dá)到 1.2 左右,這一指標(biāo)“已經(jīng)過時(shí)”。他表示:“該指標(biāo)在一切尚未完善的時(shí)候提高了數(shù)據(jù)中心的效率。但二十年后的今天,各方面都已經(jīng)較為完善,因此我們需要關(guān)注與當(dāng)今問題關(guān)系更加密切相關(guān)的其他指標(biāo)?!?


展望未來,Belady 表示:“性能指標(biāo)才是關(guān)鍵所在。雖然無法直接比較不同的工作負(fù)載,但我認(rèn)為如果按照工作負(fù)載進(jìn)行細(xì)分,那么成功的可能性會更大?!?


Jonathan Koomey 是一名研究計(jì)算機(jī)效率和可持續(xù)性的學(xué)者兼作家,對此也表示贊同。


Koomey 表示:“為了在效率方面做出正確決策,數(shù)據(jù)中心運(yùn)營需要一套基準(zhǔn)來衡量當(dāng)今使用最廣泛的 AI 工作負(fù)載對能耗的影響。”


“每焦耳 token 就是一個(gè)類似基準(zhǔn)的組成項(xiàng)的很好的例子。企業(yè)需要參加公開討論,提供有關(guān)其工作負(fù)載和實(shí)驗(yàn)的細(xì)節(jié)信息,并同意采取實(shí)事求是的測試程序,以此確保這些指標(biāo)能夠準(zhǔn)確描述硬件在實(shí)際運(yùn)行應(yīng)用時(shí)的能耗情況。”


“最后,我們需要一場公開的論壇來開展這項(xiàng)重要的工作(制定新的能效指標(biāo))?!?


群策群力


得益于 PUE 等指標(biāo)和 Green500 等榜單,數(shù)據(jù)中心和超級計(jì)算中心在能效方面取得了巨大進(jìn)步。


在生成式 AI 時(shí)代,我們可以而且必須付出更大的努力來進(jìn)一步提高能效。如果能夠衡量目前最先進(jìn)的應(yīng)用所做有用功所消耗的能源,就可以將超級計(jì)算和數(shù)據(jù)中心的能效提升到一個(gè)新的水平。

分享到:
 
反對 0 舉報(bào) 0 收藏 0 評論 0
滬ICP備11026917號-25