Deepseek yang mengejutkan murah AI Chatbot mencabar gergasi industri. Mempunyai pengenalan diri "Tanya apa-apa, dapatkan jawapan yang mengejutkan," DeepSeek's AI telah menjadi pesaing pasaran utama, bahkan menyebabkan penurunan yang ketara dalam harga saham Nvidia. Kejayaannya berpunca daripada gabungan unik teknologi inovatif dan besar, walaupun tidak didedahkan, pelaburan.
imej: ensigame.com
Kemajuan teknologi utama termasuk:
- Ramalan Multi-Token (MTP): Meramalkan beberapa perkataan secara serentak, meningkatkan ketepatan dan kecekapan.
- Campuran Pakar (MOE): Menggaji 256 rangkaian saraf, mengaktifkan lapan untuk setiap token, mempercepatkan latihan dan meningkatkan prestasi.
- Perhatian Laten Multi-Head (MLA): Berulang kali mengekstrak maklumat utama dari serpihan teks, meminimumkan risiko menghadap butiran penting.
DeepSeek pada mulanya mendakwa kos latihan hanya $ 6 juta untuk model DeepSeek V3 menggunakan 2048 GPU. Walau bagaimanapun, semianalisis mendedahkan infrastruktur yang jauh lebih luas, yang merangkumi kira -kira 50,000 GPU NVIDIA Hopper (termasuk unit H800, H100, dan H20) yang tersebar di pelbagai pusat data. Infrastruktur ini mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.
imej: ensigame.com
DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memberikan kawalan ke atas pengoptimuman dan pelaksanaan inovasi yang lebih cepat. Status yang dibiayai sendiri meningkatkan ketangkasan. Syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, terutamanya dari universiti -universiti China.
Angka awal $ 6 juta mungkin hanya mencerminkan kos GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan perbelanjaan infrastruktur keseluruhan. Jumlah pelaburan pembangunan AI DeepSeek melebihi $ 500 juta. Strukturnya yang diselaraskan membolehkan inovasi yang cekap berbanding dengan pesaing birokrasi yang lebih besar.
imej: ensigame.com
Walaupun kejayaan DeepSeek mempamerkan potensi kompetitif sebuah syarikat AI bebas yang dibiayai dengan baik, tuntutan "bajet revolusioner" adalah mengelirukan. Kejayaan mereka dikaitkan dengan pelaburan yang besar, kejayaan teknologi, dan pasukan yang kuat. Walau bagaimanapun, walaupun dengan perbelanjaan yang signifikan, kos DeepSeek kekal jauh lebih rendah daripada pesaing. Sebagai contoh, model R1 DeepSeek berharga $ 5 juta untuk melatih, berbanding $ 100 juta ChatGPT4.
imej: ensigame.com