視頻企業(yè):世界人工智能大會
視頻描述:作為全球領(lǐng)先的AI Native Cloud服務(wù)商,GMI Cloud近日正式成為全球六大Reference Platform NVIDIA Cloud Partner之一,并將亮相2025世界人工智能大會(WAIC),于7月26-29日在世博展覽館核心主展區(qū)打造沉浸式技術(shù)體驗空間,并在FUTURE TECH創(chuàng)新企業(yè)展區(qū)進行技術(shù)分享和生態(tài)交流。
在OpenTalk環(huán)節(jié),GMI Cloud技術(shù)VP將進行主題《GMI Cloud Inference Engine在全球范圍內(nèi)的大規(guī)模集群調(diào)度和優(yōu)化》的分享,將深度拆解該引擎面對熱門大模型推理優(yōu)化架構(gòu)邏輯和技術(shù)實踐;介紹基于Dynamo的推理引擎實施P/D分離的具體架構(gòu)設(shè)計過程,分析分離前后的性能變化,以及這種實踐在優(yōu)化推理過程中的重要作用;同時與大家一起探討KVCache的池化策略,說明GMI Cloud Inference Engine是如何通過優(yōu)化訪存方式提高數(shù)據(jù)訪問效率,減少推理過程中的延遲,提升整體性能的。