Bahay Balita Breakthrough ng Deepseek AI: Ang mga gastos ay ipinahayag

Breakthrough ng Deepseek AI: Ang mga gastos ay ipinahayag

by Elijah Feb 18,2025

Ang nakakagulat na Deepseek ay murang mga hamon sa industriya ng AI chatbot. Ipinagmamalaki ang isang pagpapakilala sa sarili ng "magtanong kahit ano, kumuha ng isang nakakagulat na sagot," ang Deepseek's AI ay naging isang pangunahing katunggali sa merkado, kahit na nagdudulot ng mga makabuluhang patak sa presyo ng stock ng Nvidia. Ang tagumpay nito ay nagmumula sa isang natatanging kumbinasyon ng makabagong teknolohiya at malaki, kahit na hindi natukoy, pamumuhunan.

DeepSeek TestImahe: ensigame.com

Ang mga pangunahing pagsulong sa teknolohiya ay kasama ang:

  • Multi-Token Prediction (MTP): Hinuhulaan ng maraming mga salita nang sabay-sabay, pagpapalakas ng kawastuhan at kahusayan.
  • Paghahalo ng mga eksperto (MOE): Gumagamit ng 256 Neural Networks, pag -activate ng walong para sa bawat token, pabilis na pagsasanay at pagpapabuti ng pagganap.
  • Multi-head Latent pansin (MLA): Paulit-ulit na kinukuha ang mga pangunahing impormasyon mula sa mga fragment ng teksto, na binabawasan ang panganib ng pagtatanaw ng mga mahahalagang detalye.

Una nang inangkin ng Deepseek ang isang $ 6 milyong gastos sa pagsasanay para sa modelo ng Deepseek V3 gamit ang 2048 GPU. Gayunpaman, ang semianalysis ay nagsiwalat ng isang mas malawak na imprastraktura, na sumasaklaw sa humigit -kumulang na 50,000 NVIDIA HOPPER GPUs (kabilang ang H800, H100, at H20 unit) na kumalat sa maraming mga sentro ng data. Ang imprastraktura na ito ay kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.

DeepSeek V3Imahe: ensigame.com

Ang DeepSeek, isang subsidiary ng high-flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data nito, na nagbibigay ng kontrol sa pag-optimize at mas mabilis na pagpapatupad ng pagbabago. Ang katayuan na pinondohan ng sarili ay nagpapabuti ng liksi. Ang kumpanya ay umaakit sa nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na mula sa mga unibersidad sa Tsino.

Ang paunang $ 6 milyong figure ay malamang na sumasalamin lamang sa mga pre-pagsasanay na gastos sa GPU, hindi kasama ang pananaliksik, pagpipino, pagproseso ng data, at pangkalahatang gastos sa imprastraktura. Ang kabuuang pamumuhunan sa pag -unlad ng Deepseek ay lumampas sa $ 500 milyon. Ang streamline na istraktura nito ay nagbibigay -daan para sa mahusay na pagbabago kumpara sa mas malaki, mas maraming mga kakumpitensya sa burukrasya.

DeepSeekImahe: ensigame.com

Habang ang tagumpay ng Deepseek ay nagpapakita ng mapagkumpitensyang potensyal ng isang mahusay na pondo na independiyenteng kumpanya ng AI, ang "rebolusyonaryong badyet" na pag-angkin ay nakaliligaw. Ang kanilang tagumpay ay maiugnay sa malaking pamumuhunan, mga pambihirang tagumpay sa teknolohiya, at isang malakas na koponan. Gayunpaman, kahit na sa mga makabuluhang paggasta na ito, ang mga gastos sa Deepseek ay nananatiling mas mababa kaysa sa mga kakumpitensya. Halimbawa, ang modelo ng R1 ng Deepseek ay nagkakahalaga ng $ 5 milyon upang sanayin, kumpara sa $ 100 milyon ng ChatGPT4.

DeepSeekImahe: ensigame.com

Mga pinakabagong artikulo Higit pa+
  • 10 2025-06
    "Gutom: Isang Multiplayer RPG na may Extraction Loop, Pa Higit Pa"

    Ang mga shooters ng Extraction ay naging pangkaraniwan, na ginagawang mas mahirap kaysa sa mga bagong pamagat upang mag -ukit ng isang natatanging pagkakakilanlan. Iyon mismo ang dahilan kung bakit nasasabik akong kumonekta sa koponan sa Good Fun Corporation upang makakuha ng isang eksklusibong sneak peek sa *Hunger *, ang kanilang paparating na Unreal Engine 5-powered first-pe

  • 10 2025-06
    Diablo 4: Malaking ibunyag na itinakda para sa Enero 21

    Opisyal na inilabas ni Blizzard ang lahat ng mga detalye para sa*Diablo 4*season 7, na pinamagatang ** Season ng Witchcraft **, na nakatakdang ilunsad sa ** Enero 21 sa 10am PST **. Dahil ang paglabas nito noong 2023, * ang Diablo 4 * ay patuloy na pinahusay na may mga pangunahing pag -update, pana -panahong mga kaganapan, at nilalaman ng pagpapalawak, Keepin

  • 04 2025-06
    Bumalik ang Blastoise sa pinakabagong mga kaganapan sa pagtataka ng Pokémon TCG Pocket

    Ang Pokémon TCG Pocket ay nasasabik na ilunsad ang pinakabagong kaganapan ng Wonder Pick, na nagtatampok ng iba kundi ang iconic na Blastoise. Ang mga tagahanga ay maaaring tamasahin ang mga eksklusibong kard at may temang pampaganda hanggang ika -21 ng Enero. Pinapayagan ng Wonder Pick ang mga manlalaro na pumili ng limang random card mula sa mga pandaigdigang pack ng booster, na nag -aalok ng mga pagkakataon upang makolekta