當(dāng)?shù)貢r(shí)間周一(11月27日),有“云計(jì)算春晚”之稱、為期四天的“re:Invent”在美國拉斯維加斯盛大開啟。周二,亞馬遜與其云計(jì)算部門AWS都各自公布了重磅消息。
在AWS這邊,其發(fā)布了升級(jí)版的自研處理器芯片“Graviton4”。新聞稿稱,與上一代Graviton3相比,其計(jì)算性能提高了30%,內(nèi)核增加了50%,內(nèi)存帶寬增加了75%,為在亞馬遜EC2中運(yùn)行的云工作負(fù)載提供最佳的性價(jià)比和能效。
Graviton4 和 Trainium
AWS還發(fā)布了面向人工智能系統(tǒng)的升級(jí)款加速器芯片“Trainium2”。介紹稱,其訓(xùn)練速度是上一代Trainium1的四倍,并且能夠組合在超過10萬個(gè)芯片的EC2 UltraCluster中,“使基礎(chǔ)模型(FM)和大型語言模型(LLM)的訓(xùn)練只需極少的時(shí)間,同時(shí)能效將提升至2倍。”
據(jù)了解,Trainium2將于2024年投入應(yīng)用,可能取代AWS中部分英偉達(dá)的AI加速器產(chǎn)品,但這不意味著亞馬遜和英偉達(dá)分道揚(yáng)鑣。在會(huì)議上,英偉達(dá)CEO黃仁勛和AWS CEO Adam Selipsky一起上臺(tái),宣布兩家公司“擴(kuò)大戰(zhàn)略合作關(guān)系”。
最新的合作包括,AWS將成為第一家采用英偉達(dá)GH200 Grace Hopper Superchip平臺(tái)的云服務(wù)提供商,該平臺(tái)可以集成32個(gè)Grace Hopper超級(jí)芯片在一個(gè)封裝“GH200 NVL32”中。配備亞馬遜云技術(shù)后,服務(wù)可以擴(kuò)展到數(shù)千個(gè)GH200芯片。
另外,兩家公司將合作在AWS上托管英偉達(dá)的多節(jié)點(diǎn)AI訓(xùn)練即服務(wù)解決方案“NVIDIA DGX 云”,它也將成為第一個(gè)采用GH200 NVL32的DGX云。兩者還在Ceiba項(xiàng)目上進(jìn)行合作,設(shè)計(jì)全球最快的、GPU驅(qū)動(dòng)的AI超級(jí)計(jì)算機(jī),英偉達(dá)計(jì)劃使用它來推動(dòng)下一波生成式AI的創(chuàng)新。
AWS還將推出三個(gè)新的Amazon EC2實(shí)例,分別為P5e、G6和G6e,三者都將由英偉達(dá)的GPU提供支持。其中,G6e特別適合使用英偉達(dá)的平臺(tái)“NVIDIA Omniverse”來開發(fā)3D工作流程、構(gòu)建數(shù)字孿生和其他應(yīng)用程序。
除此以外,AWS CEO Adam Selipsky還發(fā)布了一款名為“Q”的聊天機(jī)器人,專門供人們?cè)诠ぷ髦惺褂,并且可以根?jù)客戶的業(yè)務(wù)進(jìn)行定制。新聞稿稱,用戶可以使用Q在AWS上構(gòu)建應(yīng)用程序、研究最佳實(shí)例、解決錯(cuò)誤以及獲得編寫新功能的幫助。