Trang chủ Tin tức Bước đột phá AI của Deepseek: Chi phí được tiết lộ

Bước đột phá AI của Deepseek: Chi phí được tiết lộ

by Elijah Feb 18,2025

AI Chatbot rẻ tiền đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Tự hào về việc tự giới thiệu "Hỏi bất cứ điều gì, nhận được một câu trả lời đáng ngạc nhiên", AI của Deepseek đã trở thành một đối thủ cạnh tranh thị trường lớn, thậm chí gây ra sự sụt giảm đáng kể về giá cổ phiếu của NVIDIA. Thành công của nó bắt nguồn từ sự kết hợp độc đáo của công nghệ sáng tạo và đầu tư đáng kể, mặc dù không được tiết lộ.

DeepSeek TestHình ảnh: Obligame.com

Những tiến bộ công nghệ chính bao gồm:

  • Dự đoán đa điểm (MTP): Dự đoán đồng thời nhiều từ, tăng độ chính xác và hiệu quả.
  • Hỗn hợp các chuyên gia (MOE): Sử dụng 256 mạng lưới thần kinh, kích hoạt tám cho mỗi mã thông báo, tăng tốc đào tạo và cải thiện hiệu suất.
  • Sự chú ý tiềm ẩn đa đầu (MLA): Liên tục trích xuất thông tin chính từ các đoạn văn bản, giảm thiểu rủi ro nhìn ra các chi tiết quan trọng.

Deepseek ban đầu tuyên bố chỉ có chi phí đào tạo 6 triệu đô la cho mẫu Deepseek V3 của mình bằng GPU 2048. Tuy nhiên, Semianalysis cho thấy cơ sở hạ tầng rộng lớn hơn nhiều, bao gồm khoảng 50.000 GPU phễu NVIDIA (bao gồm H800, H100 và H20) trải rộng trên nhiều trung tâm dữ liệu. Cơ sở hạ tầng này đại diện cho tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính là 944 triệu đô la.

DeepSeek V3Hình ảnh: Obligame.com

Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, cung cấp quyền kiểm soát tối ưu hóa và triển khai đổi mới nhanh hơn. Tình trạng tự tài trợ của nó giúp tăng cường sự nhanh nhẹn. Công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.

Con số 6 triệu đô la ban đầu có thể chỉ phản ánh chi phí GPU trước khi đào tạo, không bao gồm nghiên cứu, tinh chỉnh, xử lý dữ liệu và chi phí cơ sở hạ tầng tổng thể. Tổng đầu tư phát triển AI của Deepseek vượt quá 500 triệu đô la. Cấu trúc hợp lý của nó cho phép đổi mới hiệu quả so với các đối thủ cạnh tranh lớn hơn, quan liêu hơn.

DeepSeekHình ảnh: Obligame.com

Trong khi thành công của Deepseek thể hiện tiềm năng cạnh tranh của một công ty AI độc lập được tài trợ tốt, thì tuyên bố "ngân sách cách mạng" là sai lệch. Thành công của họ được quy cho đầu tư đáng kể, đột phá công nghệ và một đội ngũ mạnh mẽ. Tuy nhiên, ngay cả với những chi tiêu đáng kể này, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh. Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la để đào tạo, so với 100 triệu đô la của TATGPT4.

DeepSeekHình ảnh: Obligame.com

Bài viết mới nhất Hơn+
  • 04 2025-06
    Blastoise trở lại trong các sự kiện kỳ ​​quan mới nhất của Pokémon TCG Pocket

    Pokémon TCG Pocket rất vui mừng được ra mắt sự kiện Wonder Pick mới nhất của mình, không có ai khác ngoài Blastoise mang tính biểu tượng. Người hâm mộ có thể thưởng thức thẻ độc quyền và mỹ phẩm theo chủ đề cho đến ngày 21 tháng 1. Wonder Pick cho phép người chơi chọn năm thẻ ngẫu nhiên từ các gói tăng cường toàn cầu, cung cấp cơ hội để thu thập

  • 04 2025-06
    "Cuộc gọi khẩn cấp 112: Squad Attack ra mắt mô phỏng chữa cháy thực tế trên thiết bị di động"

    Cuộc gọi khẩn cấp 112: Biệt đội tấn công giới thiệu một mô phỏng chữa cháy vô dụng cho các thiết bị di động, cho phép người chơi tham gia nhiều tình huống đầy thách thức, từ các vụ cháy nhỏ đến những ngôi nhà đầy nguy hiểm. Trò chơi này đặt bạn vào vai một đội chữa cháy ưu tú, nơi suy nghĩ nhanh chóng

  • 04 2025-06
    Woot Outshines Sale Spring's Spring Sale với các giao dịch trò chơi video vượt trội

    Tiết kiệm mùa xuân ở khắp mọi nơi, và game thủ may mắn! Sale Big Spring của Amazon đã mang đến một số giao dịch tuyệt vời lên bàn và các nhà bán lẻ khác như Woot (thuộc sở hữu của Amazon) và Walmart đang theo dõi với giảm giá đáng kinh ngạc. Nếu bạn đã để mắt đến một số trò chơi mới, bây giờ là thời điểm hoàn hảo