本週都是AI的新聞。
(1)自研模型 MAI-Thinking-1、常駐代理人 Scout、量子晶片 Majorana 2 同日亮相,微軟 Build 2026 重新定義 AI 平台邊界(原文點此)
Microsoft發表多款自研MAI系列LLM,未來將逐漸整合進Microsoft旗下的產品。
短評:
Microsoft今年結束與OpenAI的獨家合作關係後,除了導入Anthropic的Claude等LLM,也加快了自研LLM的開發與更新步調。由於目前LLM市場尚未出現具壓倒性優勢的領導者,因此對Microsoft而言,採用多元化的LLM來源能為旗下產品帶來更大的彈性,使其能根據不同應用場景選擇最合適的模型,算是往好的方向發展。
(2)Nvidia 加入 Windows on Arm 陣營,推升 Arm 架構 AI 筆電 2029 年滲透率達 34.2%(原文點此)
Nvidia推出RTX Spark個人AI運算平台,主攻搭載Windows作業系統的AI PC、NB、小型工作站...等市場,外界預估成品售價約1800美元~2900美元左右。
編按:
[a]RTX Spark平台是搭載與聯發科共同開發的N1、N1X晶片,晶片中採用Arm架構CPU、 Blackwell架構GPU,並使用最高128GB的Unified Memory。 Microsoft也特別為此平台調整其Windows on Arm(Arm架構)作業系統。
[b]AI PC曾是硬體廠商於2023年前後積極推廣的產品概念。 然而,當時的PC仍採用以NPU/GPU(AI運算單元)作為CPU輔助加速器的設計思維,且NPU/GPU與CPU並未共用記憶體架構,導致資料需要頻繁在不同運算單元之間搬移,增加了額外的傳輸延遲,使整體AI運算效能受到限制。 相較之下,RTX Spark平台直接沿用了目前主流AI伺服器的架構設計,僅將硬體規模縮減至適合邊緣運算的等級,並搭配一般使用者較熟悉的Windows作業系統。 因此,其運算能力相較於傳統AI PC有大幅提升,可作為部署AI應用的強大Edge端運算裝置。
短評:
隨著AI Agent應用快速普及,企業的AI使用量大幅增加,也使相關雲端運算與模型服務成本持續攀升。 透過在本地端部署小型LLM,企業可將部分AI工作負載移至邊緣設備執行,進而降低對雲端資源的依賴與整體AI支出,因此對於有成本控管需求的企業而言具備相當吸引力。 此外,若AI Agent的主要應用場景不依賴尚未移植至Windows on ARM平台的軟體生態系,轉換至RTX Spark的阻力將進一步降低。整體而言,我對RTX Spark未來的發展抱持相當正面的看法。
留言
張貼留言