過去的兩年里,研華著手布局AIoT解決方案,將自己定位為一個全面的人工智能平臺解決方案提供商。為此,研華推出了從1U到4U的各種機(jī)架式GPU服務(wù)器。近期,研華發(fā)布了新款4U機(jī)架式高密度GPU服務(wù)器SKY-642,一款支持適用于人工智能訓(xùn)練端的GPU卡。
研華SKY-642-4U高密度GPU服務(wù)器
研華的SKY-642 4U高密度GPU服務(wù)器的設(shè)計是結(jié)合大數(shù)據(jù)收集和分析的發(fā)展趨勢。
●支持多達(dá)10個Nvidia v100 32GB PCIe卡,具有點(diǎn)對點(diǎn)功能,確保每個GPU之間的最大頻寬和最短的延遲;
●前置的12x 2.5”/3.5”硬盤盤位最大程度上提升服務(wù)器存儲能力;
●IPMI監(jiān)控系統(tǒng)包括10個GPU卡和HDD狀態(tài),智能風(fēng)扇控制通過有效溫度調(diào)節(jié),確保SKY-642中10個 GPU的穩(wěn)定性。
GPU之間的快速點(diǎn)對點(diǎn)通信
在深度學(xué)習(xí)和大數(shù)據(jù)分析領(lǐng)域,應(yīng)用程序需要更多與可擴(kuò)展性并行工作的GPU功能。通過采用均衡負(fù)載模式,SKY-642實(shí)現(xiàn)了點(diǎn)對點(diǎn)功能,縮短了GPU卡之間的延遲,同時加快了計算時間。
更好的散熱和系統(tǒng)風(fēng)扇設(shè)計
自SKY-642開始設(shè)計滿載10個GPU卡,散熱是一個重要的問題。采用一個雙層熱插拔系統(tǒng)風(fēng)扇增加了風(fēng)流和氣壓,用于冷卻10個雙層GPU卡時,近似的無線設(shè)計提高了系統(tǒng)的效能。一個專為CPU和GPU設(shè)計的單獨(dú)空氣通道,確保所有的GPU卡不是由CPU預(yù)熱。這使得系統(tǒng)風(fēng)扇控制比以往任何時候都更智能——單獨(dú)的風(fēng)扇區(qū)域根據(jù)GPU和CPU的最大負(fù)載分別控制每個系統(tǒng)風(fēng)扇。風(fēng)扇控制降低了不同工作負(fù)載下SKY-642的聲學(xué)性能。
智能平臺管理界面
在IPMI 2.0規(guī)范支持下,SKY-642允許用戶監(jiān)視、管理和控制遠(yuǎn)程服務(wù)器。用戶可以監(jiān)控傳感器,并在任何傳感器發(fā)生故障時接收警報。受監(jiān)控的傳感器跟蹤服務(wù)器中使用的GPU卡的溫度,并管理事件日志以找出重要信息。通過使用IPMI KVM或電源控制來實(shí)現(xiàn)遠(yuǎn)程服務(wù)器控制,以使服務(wù)器能夠通電/斷電和進(jìn)行電源循環(huán)。
(轉(zhuǎn)載)