技術(shù)
導(dǎo)讀:就在幾年前,計(jì)算領(lǐng)域還是通用計(jì)算的天下。此一時(shí),彼一時(shí),隨著計(jì)算密集型領(lǐng)域的快速崛起,面對(duì)移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算需求的爆炸式增長(zhǎng),傳統(tǒng)的單一CPU方案越來(lái)越力不從心。 另一方面,半導(dǎo)體技術(shù)在縱向提速上也已經(jīng)達(dá)到了物理極限,處理器性能再也無(wú)法按照摩爾定律,以每18個(gè)月翻倍...
就在幾年前,計(jì)算領(lǐng)域還是通用計(jì)算的天下。此一時(shí),彼一時(shí),隨著計(jì)算密集型領(lǐng)域的快速崛起,面對(duì)移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算需求的爆炸式增長(zhǎng),傳統(tǒng)的單一CPU方案越來(lái)越力不從心。
另一方面,半導(dǎo)體技術(shù)在縱向提速上也已經(jīng)達(dá)到了物理極限,處理器性能再也無(wú)法按照摩爾定律,以每18個(gè)月翻倍的速度持續(xù)增長(zhǎng)。
1、
在這樣的背景下,異構(gòu)計(jì)算“異軍突起”,成為支撐先進(jìn)和更復(fù)雜的AI、AIoT等對(duì)計(jì)算量要求巨大應(yīng)用的有力武器,在產(chǎn)業(yè)中迅速“上位”,使得異構(gòu)計(jì)算和異構(gòu)計(jì)算服務(wù)器市場(chǎng)迎來(lái)發(fā)展的黃金時(shí)期。
據(jù) IDC數(shù)據(jù)顯示,2019 年上半年,中國(guó)異構(gòu)計(jì)算服務(wù)器市場(chǎng)中,GPU 加速器市場(chǎng)規(guī)模已達(dá)9.37 億美元,F(xiàn)PFA/ASIC/其他加速器市場(chǎng)發(fā)展較之稍緩,規(guī)模達(dá)到 1250 萬(wàn)美元。但這些數(shù)字背后,隱藏著中國(guó)異構(gòu)計(jì)算服務(wù)器市場(chǎng)的巨大潛力。
據(jù) IDC預(yù)測(cè),2020 年,中國(guó)的 GPU 加速器市場(chǎng)將以 38.9% 的速度增長(zhǎng)至25.75 億美元,2023 年將增長(zhǎng)至 44.47 億美元,相比 2019 年增長(zhǎng)近 5 倍。而在中國(guó),GPU 服務(wù)器也已廣泛應(yīng)用于各行各業(yè),包括互聯(lián)網(wǎng)、服務(wù)業(yè)、政務(wù)、教育、電信、制造業(yè)、金融業(yè),等等。
這些數(shù)字,彰顯著中國(guó)異構(gòu)計(jì)算服務(wù)市場(chǎng)的黃金時(shí)期已然開(kāi)啟。
2、浪潮商用機(jī)器FP5468G2
“時(shí)勢(shì)造英雄”,識(shí)時(shí)務(wù)者為俊杰,各大云計(jì)算和服務(wù)廠商相繼意識(shí)到異構(gòu)計(jì)算是大勢(shì)所趨后,紛紛推出自己的異構(gòu)計(jì)算產(chǎn)品和服務(wù),其中就包括以自主研發(fā)技術(shù)實(shí)力專(zhuān)注于高端服務(wù)器的浪潮商用機(jī)器。
其實(shí)早在 2018 年 7 月,浪潮商用機(jī)器已經(jīng)推出了面向大規(guī)模數(shù)據(jù)中心的大數(shù)據(jù)分析應(yīng)用設(shè)計(jì)的高端雙路主流機(jī)架式服務(wù)器FP5280G2.以性能、存儲(chǔ)及拓展等多方面的卓越表現(xiàn),助力企業(yè)應(yīng)對(duì)數(shù)據(jù)海洋中多種IT應(yīng)用帶來(lái)的挑戰(zhàn)。
但超算和AI的融合應(yīng)用趨勢(shì)對(duì)計(jì)算性能提出了更高的要求,浪潮商用機(jī)器順應(yīng)這一市場(chǎng)需求,于 2019 年 12 月推出了擁有全場(chǎng)景超強(qiáng)異構(gòu)計(jì)算能力,能夠支持AI云平臺(tái)建設(shè)、深度學(xué)習(xí)訓(xùn)練和推理等應(yīng)用的FP5468G2.這款8/16 卡的服務(wù)器可以靈活調(diào)配,為HPC與AI的融合應(yīng)用需求提供了更好的選擇,能夠幫助各行各業(yè)在異構(gòu)計(jì)算領(lǐng)域作出創(chuàng)新。
而在這波浪潮中,嗅到商機(jī)的并非浪潮商用機(jī)器一家,其他廠商也推出過(guò)自己的異構(gòu)計(jì)算服務(wù)器產(chǎn)品。相比之下,F(xiàn)P5468G2 在 CPU、硬盤(pán)等方面優(yōu)勢(shì)明顯。
把一臺(tái) FP5468G2 服務(wù)器拆開(kāi),我們可以清晰地看到其獨(dú)特的布局設(shè)計(jì),包括最高可支持24塊3.5英寸大容量硬盤(pán)的前置存儲(chǔ),其中6個(gè)硬盤(pán)槽位可支持U.2 NVMe SSD,提供高效的數(shù)據(jù)讀取和落盤(pán)速度,極致的高效大容量本地存儲(chǔ)和高速I(mǎi)O拓展性能,為企業(yè)級(jí)用戶(hù)提供了海量數(shù)據(jù)存儲(chǔ)的優(yōu)選平臺(tái);此外整機(jī)還支持2+2 冗余鉑金電源,后置支持4個(gè)標(biāo)準(zhǔn)PCIe x16插槽,可支持4個(gè)100Gb遠(yuǎn)程直接內(nèi)存訪問(wèn)(RDMA)高速網(wǎng)絡(luò)。
待深入了解 FP5468G2 的內(nèi)部架構(gòu)之后,則會(huì)發(fā)現(xiàn)全新的架構(gòu),尤其其支持balance、common、cascade三種拓?fù)涞撵`活的異構(gòu)拓?fù)渑渲茫屗蔀橐粋€(gè)計(jì)算力超群的“小渦輪”,以合理的設(shè)計(jì)和完善的配置支持著復(fù)雜、大量的計(jì)算,并且能夠根據(jù)應(yīng)用場(chǎng)景/訓(xùn)練模型,靈活進(jìn)行拓?fù)淝袚Q。
FP5468G2 支持2顆POWER9 Sforza CPU,最多可支持 44 核及176線程超強(qiáng)調(diào)度能力,再加上8塊V100或者16塊T4 GPU,針對(duì)特定深度學(xué)習(xí)模型調(diào)優(yōu),性能相較同等X86平臺(tái)可提升多達(dá)20%,并全面兼容FPGA/AISC,提供特定應(yīng)用加速。
3、賦能
智能視頻分析:成本更低
拋開(kāi)技術(shù)和其他相關(guān)因素的考量,成本一直是阻礙企業(yè)采用異構(gòu)計(jì)算服務(wù)器的重要因素之一。而與同類(lèi)型產(chǎn)品相比,F(xiàn)P5468G2在成本上有著明顯的優(yōu)勢(shì),尤其是在其三大應(yīng)用場(chǎng)景之一——智能視頻分析領(lǐng)域。
FP5468G2可用于安防智能視頻分析,包括平安城市、智能交通、智慧社區(qū)、車(chē)輛識(shí)別、輿情分析等。在這些場(chǎng)景中,用戶(hù)最大的問(wèn)題是獲得最優(yōu)性?xún)r(jià)比存儲(chǔ)空間,節(jié)省TCO。
相比之下,F(xiàn)P5468G2在智能視頻分析領(lǐng)域的成本優(yōu)勢(shì)主要體現(xiàn)在以下三方面:
1. 節(jié)省空間:平均單位GPU占用0.25U機(jī)柜空間,部署密度更高;
2. 降低采購(gòu)成本:假設(shè)客戶(hù)需要16顆T4 GPU算力,一臺(tái)FP5468G2相比于4臺(tái)FP5280G2成本節(jié)省約24萬(wàn);
3. 降低運(yùn)營(yíng)成本:節(jié)約電力成本;假設(shè)工業(yè)用電計(jì)1元/kW·h,16卡GPU算力要求下,單臺(tái)FP5468G2三年可節(jié)省電費(fèi)3.15萬(wàn)元。
DL
隨著AI技術(shù)的進(jìn)步,很多企業(yè)都選擇推出自己的AI產(chǎn)品和技術(shù),隨之而來(lái)的是大量深度學(xué)習(xí)訓(xùn)練的需求。然而,深度學(xué)習(xí)訓(xùn)練需要超強(qiáng)的算力支持,極高的存儲(chǔ)IO,以及強(qiáng)大的數(shù)據(jù)交換能力,然而雖然市面上的產(chǎn)品和方案琳瑯滿(mǎn)目,但真正能同時(shí)具備這些能力的產(chǎn)品實(shí)際上是鳳毛麟角。
FP5468G2在深度學(xué)習(xí)訓(xùn)練場(chǎng)景中則兼顧了這幾點(diǎn),賦能AI企業(yè),進(jìn)行圖像檢測(cè)、語(yǔ)音識(shí)別和自然語(yǔ)言處理等,使教育行業(yè)能夠更加高效地推進(jìn)科學(xué)研究、高性能計(jì)算、人工智能算法研究等。
具體說(shuō)來(lái),F(xiàn)P5468G2在深度學(xué)習(xí)訓(xùn)練場(chǎng)景中的優(yōu)勢(shì)體現(xiàn)在以下具體的數(shù)字之中:
超強(qiáng)算力
支持8 塊V100或16 塊T4 GPU卡,提供全場(chǎng)景超強(qiáng)異構(gòu)計(jì)算能力
2顆POWER9處理器,具有多達(dá)44個(gè)核心、176線程超強(qiáng)調(diào)度能力;
支持4個(gè)標(biāo)準(zhǔn) PCIe x16 插槽,支持4個(gè)100Gb高速網(wǎng)絡(luò)
靈活拓?fù)?/p>
支持balance、common、cascade三種拓?fù)?,可根?jù)應(yīng)用場(chǎng)景/訓(xùn)練模型,進(jìn)行靈活拓?fù)淝袚Q;
合理設(shè)計(jì)、適配完善
GPU/CPU分離散熱,保障機(jī)器高效穩(wěn)定運(yùn)行;
全面兼容FPGA/AISC, 提供特定應(yīng)用加速。
值得一提的是,POWER9 采用增強(qiáng)的架構(gòu)體系,可支持SMT4并發(fā)多線程,110MB片上L3緩存,能更好應(yīng)對(duì)GPU數(shù)量增加帶來(lái)的數(shù)據(jù)調(diào)度負(fù)載的提升;獨(dú)特的高寬帶設(shè)計(jì)使得片內(nèi)寬帶可達(dá)7TB/s,外聯(lián)寬帶達(dá)25 GB/s。全新的微架構(gòu)對(duì)稱(chēng)數(shù)據(jù)處理引擎設(shè)計(jì),更高效的指令流水線與單線程性能,海量的數(shù)據(jù)存儲(chǔ)能力,讓FP5468G2的實(shí)力不容小覷。
AI
FP5468G2的第三個(gè)應(yīng)用場(chǎng)景是AI云/深度學(xué)習(xí)推理,在互聯(lián)網(wǎng)行業(yè),其可用于客戶(hù)行為分析、互動(dòng)娛樂(lè)、輿情分析、精準(zhǔn)營(yíng)銷(xiāo)、內(nèi)容監(jiān)控等;在金融行業(yè),可用于智能客服、人臉識(shí)別、風(fēng)險(xiǎn)評(píng)估、智能投顧等;在電信行業(yè),可用于智能服務(wù)、智能網(wǎng)絡(luò)、智能客服等。
在這些場(chǎng)景中,動(dòng)輒數(shù)億TB的數(shù)據(jù)流量往往需要海量的存儲(chǔ)空間,以應(yīng)對(duì)每天的日常運(yùn)營(yíng)。
FP5468G2支持海量的數(shù)據(jù)存儲(chǔ)和高速I(mǎi)O擴(kuò)展:
最大支持24塊3.5英寸大容量硬盤(pán),其中可支持6塊U.2 NVMe SSD
支持4個(gè)標(biāo)準(zhǔn) PCIe x16 插槽,支持4個(gè)100Gb高速網(wǎng)絡(luò)
FP5468G2可用于AI 公有云、企業(yè) AI 云、混合型 AI 計(jì)算應(yīng)用,如數(shù)據(jù)源中心管理、智慧醫(yī)療一卡通、政務(wù)服務(wù)云、高性能計(jì)算等。
在人工智能領(lǐng)域,F(xiàn)P5468G2 可用于深度學(xué)習(xí)訓(xùn)練和推理,是模型調(diào)優(yōu)的一把好手。
在視頻智能分析領(lǐng)域,F(xiàn)P5468G2 可在平安城市、智能交通、智慧社區(qū)的安防方面發(fā)揮巨大的作用,滿(mǎn)足視頻流海量存儲(chǔ)需求,進(jìn)行信息實(shí)時(shí)檢索、音視頻轉(zhuǎn)碼/壓縮等。
展望未來(lái),像 FP5468G2 這樣的異構(gòu)服務(wù)器發(fā)展前景非??捎^。據(jù) IDC 數(shù)據(jù)顯示,2020 年之前,異構(gòu)計(jì)算的應(yīng)用場(chǎng)景和服務(wù)領(lǐng)域已經(jīng)十分廣泛,包括發(fā)展相對(duì)成熟的智能客服、語(yǔ)音識(shí)別、人臉識(shí)別、風(fēng)險(xiǎn)評(píng)估等領(lǐng)域。但在 2020 年之后,異構(gòu)計(jì)算將拓展到智能機(jī)器人、智能服務(wù)、智能工廠、IT 自動(dòng)化、智能導(dǎo)診,甚至語(yǔ)言能力等更加復(fù)雜的場(chǎng)景中;到 2025 年,異構(gòu)計(jì)算在自適應(yīng)學(xué)習(xí)、智能診斷等需要謹(jǐn)慎決策的場(chǎng)景中也將發(fā)揮更大的作用。