दीपसेक की आश्चर्यजनक रूप से सस्ती एआई चैटबॉट चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। "कुछ भी पूछें, एक आश्चर्यजनक उत्तर प्राप्त करें," के आत्म-परिचय का दावा करते हुए, डीपसेक का एआई एक प्रमुख बाजार प्रतियोगी बन गया है, यहां तक कि एनवीडिया के स्टॉक मूल्य में महत्वपूर्ण गिरावट का कारण भी। इसकी सफलता अभिनव प्रौद्योगिकी के एक अनूठे संयोजन से उपजी है और पर्याप्त, अज्ञात, निवेश।
छवि: ensigame.com
प्रमुख तकनीकी प्रगति में शामिल हैं:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): सटीकता और दक्षता को बढ़ावा देने के साथ, एक साथ कई शब्दों की भविष्यवाणी करता है।
- विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क को नियुक्त करता है, प्रत्येक टोकन के लिए आठ को सक्रिय करता है, प्रशिक्षण में तेजी और प्रदर्शन में सुधार करता है।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): बार-बार टेक्स्ट के टुकड़ों से महत्वपूर्ण जानकारी निकालता है, जिससे महत्वपूर्ण विवरणों की अनदेखी के जोखिम को कम किया जाता है।
दीपसेक ने शुरू में 2048 जीपीयू का उपयोग करके अपने डीपसेक वी 3 मॉडल के लिए केवल $ 6 मिलियन प्रशिक्षण लागत का दावा किया था। हालांकि, सेमियनलिसिस ने कई डेटा केंद्रों में फैले लगभग 50,000 एनवीडिया हॉपर जीपीयू (एच 800, एच 100 और एच 20 यूनिट सहित) को शामिल करते हुए, एक अधिक व्यापक बुनियादी ढांचे का खुलासा किया। यह बुनियादी ढांचा लगभग 1.6 बिलियन डॉलर के कुल सर्वर निवेश का प्रतिनिधित्व करता है, जिसमें परिचालन खर्च $ 944 मिलियन का अनुमान है।
छवि: ensigame.com
एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक, अपने डेटा केंद्रों का मालिक है, जो अनुकूलन और तेजी से नवाचार कार्यान्वयन पर नियंत्रण प्रदान करती है। इसकी स्व-वित्त पोषित स्थिति चपलता को बढ़ाती है। कंपनी शीर्ष प्रतिभा को आकर्षित करती है, कुछ शोधकर्ताओं ने मुख्य रूप से चीनी विश्वविद्यालयों से सालाना $ 1.3 मिलियन से अधिक कमाई की।
प्रारंभिक $ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण GPU लागतों को दर्शाता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और समग्र बुनियादी ढांचे के खर्चों को छोड़कर। दीपसेक का कुल एआई विकास निवेश $ 500 मिलियन से अधिक है। इसकी सुव्यवस्थित संरचना बड़े, अधिक नौकरशाही प्रतियोगियों की तुलना में कुशल नवाचार के लिए अनुमति देती है।
छवि: ensigame.com
जबकि दीपसेक की सफलता एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी की प्रतिस्पर्धी क्षमता को प्रदर्शित करती है, "क्रांतिकारी बजट" का दावा भ्रामक है। उनकी सफलता को पर्याप्त निवेश, तकनीकी सफलता और एक मजबूत टीम के लिए जिम्मेदार ठहराया जाता है। हालांकि, इन महत्वपूर्ण खर्चों के साथ भी, दीपसेक की लागत प्रतियोगियों की तुलना में काफी कम है। उदाहरण के लिए, Chatgpt4 के $ 100 मिलियन की तुलना में दीपसेक के R1 मॉडल की लागत $ 5 मिलियन है।
छवि: ensigame.com