近年來,隨著人工智能的廣泛應用,底層計算芯片的需求不斷增加。與傳統(tǒng) CPU 相比,GPU 更適合此類任務,因為它們提供了更好的性能,并在 AI 計算市場上搶得先機。
對此,在 WAIC?2023 期間,英特爾公司高級首席 AI 工程師、網(wǎng)絡與邊緣事業(yè)部中國區(qū)首席技術官張宇認為,推動本輪人工智能發(fā)展最核心的要素,實際上是計算、通訊和存儲技術的不斷提升。無論是大模型還是融合 AI,實際上邊緣在整個 AI 生態(tài)系統(tǒng)中扮演著非常重要的角色。
張宇表示,「隨著行業(yè)數(shù)字化轉(zhuǎn)型,人們對于敏捷連接,實時業(yè)務以及應用智能等方面的訴求,推動了邊緣人工智能的發(fā)展。但是邊緣人工智能目前絕大部分的應用還處于邊緣推理階段。也就是說我們要利用大量數(shù)據(jù)以及極大算力在數(shù)據(jù)中心訓練一個模型,我們把訓練的結(jié)果推送到前端去執(zhí)行一個推理操作。這是目前絕大部分在邊緣實現(xiàn)人工智能的使用模式。」
張宇觀察當前 AI 大型語言模型(LLM)的商業(yè)進展,仍未發(fā)現(xiàn)特別成功的商業(yè)模式和持久的使用場景,認為 LLM 的商業(yè)模式仍在摸索中。他進一步表示,目前 AI 訓練市場的主流方案是英偉達高階 GPU 無疑。
因此,英特爾計劃推廣專用 AI 芯片進行訓練并不容易,但英特爾仍計劃將旗下 AI 芯片 Habana Gaudi 2 引進中國市場,這一款產(chǎn)品將是落實英特爾 AI 戰(zhàn)略的關鍵一環(huán)。
英特爾 2019 年底斥資 20 億美元收購以色列初創(chuàng)芯片企業(yè) Habana,如今成了另辟蹊徑挑戰(zhàn)英偉達的利器。張宇表示,專門針對 LLM 訓練任務設計的 Habana Gaudi 2 芯片,是試圖打破主流 GPU 方案的嘗試。
張宇認為,網(wǎng)絡互連對 LLM 的訓練推理任務也同樣重要,英特爾將以自身在網(wǎng)絡技術領域的累積,試圖解決 AI 大型語言模型的網(wǎng)絡瓶頸問題。
此外,英特爾在 FPGA 方案基礎上開發(fā)基礎設施處理器(IPU),本質(zhì)上也就是 DPU,而英特爾嘗試提高網(wǎng)絡傳輸?shù)目伎啃?,該功能也包含在其即將發(fā)表的新一代 IPU 產(chǎn)品中。