AI chatbot chatbot ที่ไม่แพงอย่างน่าประหลาดใจของ Deepseek ท้าทายยักษ์ใหญ่ในอุตสาหกรรม การเปิดตัวด้วยตนเองของ "ถามอะไรก็ได้รับคำตอบที่น่าประหลาดใจ" AI ของ Deepseek ได้กลายเป็นคู่แข่งในตลาดที่สำคัญแม้จะทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมาก ความสำเร็จของมันเกิดจากการผสมผสานที่เป็นเอกลักษณ์ของเทคโนโลยีที่เป็นนวัตกรรมและการลงทุนที่ไม่เปิดเผย
IMGP%Image: Ensigame.com
ความก้าวหน้าทางเทคโนโลยีที่สำคัญ ได้แก่ :
- การทำนายแบบมัลติเทน (MTP): ทำนายหลายคำพร้อมกันเพิ่มความแม่นยำและประสิทธิภาพ
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): มีเครือข่ายประสาท 256 เครือข่ายเปิดใช้งานแปดโทเค็นแต่ละโทเค็นเร่งการฝึกอบรมและปรับปรุงประสิทธิภาพ
- ความสนใจแฝงหลายหัว (MLA): สกัดข้อมูลสำคัญซ้ำ ๆ จากชิ้นส่วนข้อความลดความเสี่ยงของการมองเห็นรายละเอียดที่สำคัญ
Deepseek เริ่มแรกอ้างว่ามีค่าใช้จ่ายในการฝึกอบรมเพียง 6 ล้านเหรียญสหรัฐสำหรับรุ่น Deepseek V3 โดยใช้ GPU ในปี 2048 อย่างไรก็ตาม Semianalysis เปิดเผยโครงสร้างพื้นฐานที่กว้างขวางกว่าซึ่งครอบคลุมประมาณ 50,000 Nvidia Hopper GPU (รวมถึง H800, H100 และ H20 หน่วย) กระจายไปทั่วศูนย์ข้อมูลหลายแห่ง โครงสร้างพื้นฐานนี้แสดงถึงการลงทุนเซิร์ฟเวอร์ทั้งหมดประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานประมาณ 944 ล้านดอลลาร์
IMGP%Image: Ensigame.com
Deepseek ซึ่งเป็น บริษัท ย่อยของ High-Flyer ซึ่งเป็นกองทุนป้องกันความเสี่ยงของจีนเป็นเจ้าของศูนย์ข้อมูลให้การควบคุมการเพิ่มประสิทธิภาพและการใช้นวัตกรรมที่เร็วขึ้น สถานะที่ได้รับการสนับสนุนตนเองช่วยเพิ่มความคล่องตัว บริษัท ดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีส่วนใหญ่มาจากมหาวิทยาลัยจีน
ตัวเลขเริ่มต้น $ 6 ล้านน่าจะสะท้อนถึงค่าใช้จ่าย GPU ก่อนการฝึกอบรมไม่รวมการวิจัยการปรับแต่งการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐานโดยรวม การลงทุนการพัฒนา AI ทั้งหมดของ Deepseek เกิน $ 500 ล้าน โครงสร้างที่คล่องตัวช่วยให้นวัตกรรมมีประสิทธิภาพเมื่อเทียบกับคู่แข่งที่มีขนาดใหญ่และมีระบบราชการมากขึ้น
IMGP%Image: Ensigame.com
ในขณะที่ความสำเร็จของ Deepseek นำเสนอศักยภาพในการแข่งขันของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีการเรียกร้อง "งบประมาณปฏิวัติ" นั้นทำให้เข้าใจผิด ความสำเร็จของพวกเขาเกิดจากการลงทุนที่สำคัญการพัฒนาทางเทคโนโลยีและทีมที่แข็งแกร่ง อย่างไรก็ตามแม้จะมีค่าใช้จ่ายที่สำคัญเหล่านี้ค่าใช้จ่ายของ Deepseek ยังคงต่ำกว่าคู่แข่งอย่างมาก ตัวอย่างเช่นรุ่น R1 ของ Deepseek มีค่าใช้จ่าย 5 ล้านดอลลาร์ในการฝึกอบรมเมื่อเทียบกับ $ 100 ล้านของ ChatGPT4
IMGP%Image: Ensigame.com