Tuy nhiên, một báo cáo mới đây từ công ty tư vấn tài chính Bernstein chỉ ra rằng tuyên bố này có phần phóng đại và không phản ánh đầy đủ thực tế chi phí phát triển AI.
Xuất hiện rầm rộ trên truyền thông và mạng xã hội ngay đầu năm Ất Tỵ, DeepSeek khiến nhiều người sửng sốt với cam kết có thể tạo ra một hệ thống AI ngang ngửa OpenAI với mức ngân sách chỉ 5 triệu USD. Thông tin này thậm chí còn khiến thị trường chứng khoán quốc tế có những biến động đáng kể.
Tuy nhiên, báo cáo từ Bernstein nhanh chóng đặt dấu hỏi về tính chính xác của tuyên bố này. Theo các chuyên gia, việc phát triển một mô hình AI tiên tiến không chỉ đòi hỏi chi phí điện toán mà còn bao gồm nhiều khoản đầu tư lớn khác như nghiên cứu, thử nghiệm, tối ưu hóa thuật toán và nhân sự.
"Chúng tôi tin rằng DeepSeek không thể tạo ra một hệ thống AI tương đương OpenAI chỉ với 5 triệu USD. Mặc dù các mô hình của họ rất ấn tượng, nhưng đó không phải là một phép màu, và sự náo động cuối tuần qua có phần bị thổi phồng", báo cáo của Bernstein nhận định.
DeepSeek đang phát triển hai mô hình AI chính: DeepSeek-V3 và DeepSeek R1.
DeepSeek-V3 sử dụng kiến trúc MOE (Mixture of Experts), cho phép kết hợp nhiều mô hình nhỏ hơn để tối ưu hiệu suất trong khi tiết kiệm tài nguyên tính toán.
Mô hình này có 671 tỷ tham số, trong đó 37 tỷ tham số được kích hoạt cùng lúc, giúp cải thiện khả năng xử lý thông tin với mức tiêu thụ tài nguyên thấp hơn.
Để đào tạo mô hình này, DeepSeek sử dụng cụm 2.048 GPU Nvidia H800 trong khoảng thời gian 2 tháng, tương đương 5,5 triệu giờ GPU. Một số ước tính cho rằng chi phí phần cứng có thể rơi vào khoảng 5 triệu USD. Tuy nhiên, Bernstein lưu ý rằng con số này chỉ phản ánh chi phí điện toán, chưa tính đến hàng loạt chi phí khác như lương nhân sự, thử nghiệm, tối ưu thuật toán và phát triển hệ sinh thái ứng dụng AI.
DeepSeek cũng giới thiệu DeepSeek R1, một phiên bản nâng cao của V3, sử dụng học tăng cường (Reinforcement Learning - RL) để cải thiện khả năng suy luận. Mô hình này được cho là có thể cạnh tranh với AI của OpenAI trong một số tác vụ đòi hỏi tư duy logic. Tuy nhiên, Bernstein nhấn mạnh rằng quá trình phát triển R1 đòi hỏi nguồn lực lớn hơn nhiều so với những gì DeepSeek công bố.
Dù Bernstein đánh giá cao các tiến bộ công nghệ của DeepSeek, công ty này cho rằng AI không thể được phát triển chỉ với ngân sách 5 triệu USD.
Một so sánh đáng chú ý là quá trình huấn luyện DeepSeek-V3 chỉ tiêu tốn 2,7 triệu giờ GPU, bằng 9% lượng tài nguyên tính toán so với một số mô hình AI hàng đầu khác. Điều này giúp DeepSeek tối ưu chi phí đáng kể, nhưng vẫn không thể biến AI thành một sản phẩm "giá rẻ" như tuyên bố.
Bernstein kết luận: "Những bước tiến của DeepSeek là đáng chú ý, nhưng cần thận trọng trước những tuyên bố mang tính giật gân. Việc tạo ra một đối thủ thực sự của OpenAI với mức đầu tư 5 triệu USD là điều không thực tế."