AI Chatbot rẻ tiền đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Tự hào về việc tự giới thiệu "Hỏi bất cứ điều gì, nhận được một câu trả lời đáng ngạc nhiên", AI của Deepseek đã trở thành một đối thủ cạnh tranh thị trường lớn, thậm chí gây ra sự sụt giảm đáng kể về giá cổ phiếu của NVIDIA. Thành công của nó bắt nguồn từ sự kết hợp độc đáo của công nghệ sáng tạo và đầu tư đáng kể, mặc dù không được tiết lộ.
Hình ảnh: Obligame.com
Những tiến bộ công nghệ chính bao gồm:
- Dự đoán đa điểm (MTP): Dự đoán đồng thời nhiều từ, tăng độ chính xác và hiệu quả.
- Hỗn hợp các chuyên gia (MOE): Sử dụng 256 mạng lưới thần kinh, kích hoạt tám cho mỗi mã thông báo, tăng tốc đào tạo và cải thiện hiệu suất.
- Sự chú ý tiềm ẩn đa đầu (MLA): Liên tục trích xuất thông tin chính từ các đoạn văn bản, giảm thiểu rủi ro nhìn ra các chi tiết quan trọng.
Deepseek ban đầu tuyên bố chỉ có chi phí đào tạo 6 triệu đô la cho mẫu Deepseek V3 của mình bằng GPU 2048. Tuy nhiên, Semianalysis cho thấy cơ sở hạ tầng rộng lớn hơn nhiều, bao gồm khoảng 50.000 GPU phễu NVIDIA (bao gồm H800, H100 và H20) trải rộng trên nhiều trung tâm dữ liệu. Cơ sở hạ tầng này đại diện cho tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính là 944 triệu đô la.
Hình ảnh: Obligame.com
Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, cung cấp quyền kiểm soát tối ưu hóa và triển khai đổi mới nhanh hơn. Tình trạng tự tài trợ của nó giúp tăng cường sự nhanh nhẹn. Công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.
Con số 6 triệu đô la ban đầu có thể chỉ phản ánh chi phí GPU trước khi đào tạo, không bao gồm nghiên cứu, tinh chỉnh, xử lý dữ liệu và chi phí cơ sở hạ tầng tổng thể. Tổng đầu tư phát triển AI của Deepseek vượt quá 500 triệu đô la. Cấu trúc hợp lý của nó cho phép đổi mới hiệu quả so với các đối thủ cạnh tranh lớn hơn, quan liêu hơn.
Hình ảnh: Obligame.com
Trong khi thành công của Deepseek thể hiện tiềm năng cạnh tranh của một công ty AI độc lập được tài trợ tốt, thì tuyên bố "ngân sách cách mạng" là sai lệch. Thành công của họ được quy cho đầu tư đáng kể, đột phá công nghệ và một đội ngũ mạnh mẽ. Tuy nhiên, ngay cả với những chi tiêu đáng kể này, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh. Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la để đào tạo, so với 100 triệu đô la của TATGPT4.
Hình ảnh: Obligame.com