Ev Haberler Deepseek'in AI atılımı: Maliyetler ortaya çıktı

Deepseek'in AI atılımı: Maliyetler ortaya çıktı

by Elijah Feb 18,2025

Deepseek'in AI atılımı: Maliyetler ortaya çıktı

Deepseek'in şaşırtıcı derecede ucuz AI Chatbot, endüstri devlerine meydan okuyor. Deepseek'in yapay zekası, "herhangi bir şey sor, şaşırtıcı bir cevap al" ın kendi kendini tanıtmak, Nvidia'nın hisse senedi fiyatında önemli düşüşlere bile neden olan önemli bir pazar rakibi haline geldi. Başarısı, yenilikçi teknolojinin eşsiz bir kombinasyonundan kaynaklanmaktadır ve açıklanmamış da olsa önemli bir yatırımdan kaynaklanmaktadır.

%İmgp%resim: ensigame.com

Kilit teknolojik gelişmeler şunları içerir:

  • Çoklu atak tahmin (MTP): aynı anda birden fazla kelimeyi tahmin ederek doğruluğu ve verimliliği artırır.
  • Uzmanların Karışımı (MOE): 256 sinir ağı kullanır, her jeton için sekiz'i etkinleştirir, eğitimi hızlandırır ve performansı artırır.
  • Çok Başlı Gizli Dikkat (MLA): Tekrar tekrar metin parçalarından anahtar bilgileri çıkarır ve önemli ayrıntıları gözden geçirme riskini en aza indirir.

Deepseek başlangıçta 2048 GPU kullanan Deepseek V3 modeli için sadece 6 milyon dolarlık bir eğitim maliyeti talep etti. Bununla birlikte, semianaliz, birden fazla veri merkezine yayılmış yaklaşık 50.000 NVIDIA hopper GPU'larını (H800, H100 ve H20 birimleri dahil) kapsayan çok daha kapsamlı bir altyapı ortaya çıkarmıştır. Bu altyapı, yaklaşık 1,6 milyar dolarlık toplam sunucu yatırımını temsil eder ve operasyonel giderlerin 944 milyon dolar olduğu tahmin edilmektedir.

%İmgp%resim: ensigame.com

Bir Çin Hedge Fonu olan High-Flyer'in bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, optimizasyon ve daha hızlı inovasyon uygulaması üzerinde kontrol sağlıyor. Kendi kendini finanse edilen statüsü çevikliği artırır. Şirket, en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde, öncelikle Çin üniversitelerinden.

İlk 6 milyon dolarlık rakam, muhtemelen araştırma, arıtma, veri işleme ve genel altyapı masrafları hariç, GPU öncesi maliyetleri yansıtmaktadır. Deepseek'in toplam AI geliştirme yatırımı 500 milyon doları aşıyor. Aerodinamik yapısı, daha büyük, daha bürokratik rakiplere kıyasla verimli yeniliklere izin verir.

%İmgp%resim: ensigame.com

Deepseek'in başarısı, iyi finanse edilen bağımsız bir AI şirketinin rekabet potansiyelini sergilerken, "devrimci bütçe" iddiası yanıltıcıdır. Başarıları önemli yatırımlara, teknolojik atılımlara ve güçlü bir ekibe atfedilir. Bununla birlikte, bu önemli harcamalarda bile, Deepseek'in maliyetleri rakiplerden önemli ölçüde daha düşüktür. Örneğin, Deepseek'in R1 modeli, ChatGPT4'ün 100 milyon dolarına kıyasla eğitilmesi için 5 milyon dolara mal oldu.

%İmgp%resim: ensigame.com

En son makaleler Daha+