首頁 新聞 DeepSeek的AI突破:成本顯示

DeepSeek的AI突破:成本顯示

by Elijah Feb 18,2025

DeepSeek令人驚訝的是廉價的AI聊天機器人挑戰行業巨頭。 DeepSeek的AI自我引入“問任何東西,得到令人驚訝的答案”的自我吸引已成為主要的市場競爭對手,甚至導致NVIDIA的股價大幅下降。它的成功源於創新技術和實質性(盡管未公開)投資的獨特組合。

DeepSeek Test圖像:ensigame.com

關鍵技術進步包括:

  • 多語預測(MTP):同時預測多個單詞,提高準確性和效率。
  • 專家的混合物(MOE):使用256個神經網絡,每個令牌激活8個,加速培訓並提高性能。
  • 多頭潛在注意力(MLA):反複從文本片段中提取關鍵信息,從而最大程度地減少了忽略關鍵細節的風險。

DeepSeek最初聲稱使用2048 GPU的DeepSeek V3型號僅獲得600萬美元的培訓成本。然而,半分析顯示出更廣泛的基礎設施,包括大約50,000個NVIDIA HOPPER GPU(包括H800,H100和H20單位),分布在多個數據中心。該基礎設施的總服務器投資約為16億美元,運營費用估計為9.44億美元。

DeepSeek V3圖像:ensigame.com

中國對衝基金High-Flyer的子公司DeepSeek擁有其數據中心,提供了對優化和更快的創新實施的控製。它的自籌資金地位增強了敏捷性。該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國大學。

最初的600萬美元數字可能隻反映了培訓前的GPU成本,不包括研究,改進,數據處理和整體基礎設施費用。 DeepSeek的總AI開發投資超過5億美元。與更大的官僚競爭者相比,它的簡化結構允許有效的創新。

DeepSeek圖像:ensigame.com

盡管DeepSeek的成功展示了一家資金充足的獨立AI公司的競爭潛力,但“革命預算”主張卻具有誤導性。他們的成功歸因於大量投資,技術突破和強大的團隊。但是,即使有了這些巨大的支出,DeepSeek的成本仍然比競爭對手低得多。例如,DeepSeek的R1型號的培訓成本為500萬美元,而Chatgpt4的1億美元。

DeepSeek圖像:ensigame.com

最新文章 更多+
  • 04 2025-06
    Blastoise返回PokémonTCGPocket的最新奇蹟活動

    PokémonTCGPocket很高興推出其最新的Wonder Pick活動,其標誌性的Blastoise也是如此。粉絲可以享受獨家卡和主題化妝品,直到1月21日。 Wonder Pick允許玩家從全球助推器包中選擇五張隨機卡,從而提供了收集的機會

  • 04 2025-06
    “緊急電話112:攻擊小隊在移動設備上啟動現實的消防模擬”

    緊急電話112:攻擊小隊向移動設備引入了身臨其境的消防模擬,使玩家可以採用各種具有挑戰性的情況,從小型棚大火到危險的房屋火災。這個遊戲使您扮演精英消防團隊的角色,在那裡快速思考

  • 04 2025-06
    Woot與高級視頻遊戲交易的亞馬遜春季銷售

    春天無處不在,遊戲玩家很幸運!亞馬遜的大型春季銷售帶來了一些奇妙的交易,其他零售商(如Woot(由亞馬遜擁有)和沃爾瑪(Walmart)和沃爾瑪(Walmart)都遵循令人難以置信的折扣。如果您一直在關註一些新遊戲,那麼現在是完美的時光