中國 AI 公司 DeepSeek 於 3 月初正式發布 V4,這是迄今最具野心的開源權重模型。V4 擁有約 1 兆個總參數,是一個統一的多模態系統,可以生成文字、圖片和影片,且針對華為昇騰和寒武紀等中國 AI 晶片進行了特別優化。V4 完全開源,任何人可免費下載和本地部署。
📌 關鍵重點
- 約 1 兆參數,但採用 MoE 架構,實際運算量遠小於全參數
- 統一多模態:文字、圖片、影片生成,一個模型全搞定
- 針對華為昇騰、寒武紀等中國晶片優化,降低對 NVIDIA 依賴
- 完全開源開放,可免費下載本地運行
- 在多項基準測試上與頂尖閉源模型相當
💡 創業者啟示
DeepSeek V4 再次打破「頂尖 AI 只有大公司玩得起」的假設。1 兆參數聽起來嚇人,但 MoE 架構讓它可以在較低的硬體需求下運行。對創業者來說,這代表一個低成本的強大底層模型選項——特別是如果你的應用場景是多模態的。