Trang chủ > Tin tức > Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển
Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Tuy nhiên, nó vẫn rẻ hơn so với các đối thủ cạnh tranh.
Chatbot mới từ Deepseek đã giới thiệu với tôi với mô tả hấp dẫn này:
Xin chào, tôi đã được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên.
Ngày nay, trí tuệ nhân tạo được phát triển bởi Deepseek đã nổi lên như một đối thủ cạnh tranh đáng gờm trên thị trường, đáng chú ý là đóng góp cho một trong những mức giá cổ phiếu lớn nhất của Nvidia.
Hình ảnh: Ensigame.com
Điều khiến mô hình này khác biệt là kiến trúc và phương pháp đào tạo sáng tạo của nó. Nó sử dụng một số công nghệ tiên tiến:
Dự đoán đa điểm (MTP): Thay vì dự đoán một từ tại một thời điểm, mô hình dự báo nhiều từ đồng thời bằng cách phân tích các phần khác nhau của một câu. Cách tiếp cận này tăng cường cả độ chính xác và hiệu quả của mô hình.
Hỗn hợp các chuyên gia (MOE): Kiến trúc này sử dụng các mạng thần kinh khác nhau để xử lý dữ liệu đầu vào. Công nghệ tăng tốc đào tạo AI và cải thiện hiệu suất. Trong DeepSeek V3, 256 mạng thần kinh được sử dụng, với tám mạng được kích hoạt cho mỗi nhiệm vụ xử lý mã thông báo.
Sự chú ý tiềm ẩn đa đầu (MLA): Cơ chế này giúp tập trung vào các phần quan trọng nhất của câu. MLA trích xuất các chi tiết chính từ các đoạn văn bản nhiều lần thay vì chỉ một lần, giảm khả năng thiếu thông tin quan trọng. Nhờ điều này, AI có nhiều khả năng nắm bắt các sắc thái quan trọng trong dữ liệu đầu vào.
Deepseek, khởi nghiệp nổi tiếng của Trung Quốc tuyên bố đã tạo ra một mô hình AI cạnh tranh với chi phí tối thiểu, nói rằng họ chỉ chi 6 triệu đô la cho việc đào tạo mạng lưới thần kinh mạnh mẽ Deepseek V3 và chỉ sử dụng 2048 bộ xử lý đồ họa.
Hình ảnh: Ensigame.com
Tuy nhiên, các nhà phân tích từ Semianalysis đã phát hiện ra rằng Deepseek vận hành một cơ sở hạ tầng tính toán lớn bao gồm khoảng 50.000 GPU phễu NVIDIA. Điều này bao gồm 10.000 đơn vị H800, 10.000 H100 nâng cao hơn và các lô GPU H20 bổ sung. Các tài nguyên này được phân phối trên một số trung tâm dữ liệu và được sử dụng để đào tạo, nghiên cứu và mô hình tài chính của AI.
Tổng đầu tư của công ty vào máy chủ lên tới khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính là 944 triệu đô la.
Deepseek là một công ty con của FLEGER FLEGER của Quỹ phòng hộ Trung Quốc, giúp khởi động như một bộ phận riêng biệt tập trung vào AI Technologies vào năm 2023. Không giống như hầu hết các công ty khởi nghiệp cho thuê sức mạnh điện toán từ các nhà cung cấp đám mây, DeepSeek sở hữu các trung tâm dữ liệu riêng của mình, giúp nó hoàn toàn kiểm soát tối ưu hóa mô hình AI. Công ty vẫn tự tài trợ, tác động tích cực đến tính linh hoạt và tốc độ ra quyết định của nó.
Hình ảnh: Ensigame.com
Hơn nữa, một số nhà nghiên cứu tại Deepseek kiếm được hơn 1,3 triệu đô la hàng năm, thu hút tài năng hàng đầu từ các trường đại học hàng đầu Trung Quốc (công ty không thuê các chuyên gia nước ngoài).
Ngay cả khi xem xét điều này, yêu cầu đào tạo gần đây của Deepseek về mô hình mới nhất của mình chỉ với 6 triệu đô la có vẻ không thực tế. Con số này chỉ đề cập đến chi phí sử dụng GPU trong quá trình đào tạo trước và không chiếm chi phí nghiên cứu, sàng lọc mô hình, xử lý dữ liệu hoặc chi phí cơ sở hạ tầng tổng thể.
Kể từ khi thành lập, Deepseek đã đầu tư hơn 500 triệu đô la vào phát triển AI. Tuy nhiên, không giống như các công ty lớn hơn bị gánh nặng bởi quan liêu, cấu trúc nhỏ gọn của Deepseek cho phép nó thực hiện tích cực và hiệu quả các đổi mới AI.
Hình ảnh: Ensigame.com
Ví dụ về DeepSeek chứng minh rằng một công ty AI độc lập được tài trợ tốt có thể cạnh tranh với các nhà lãnh đạo ngành công nghiệp. Tuy nhiên, các chuyên gia nhấn mạnh rằng thành công của công ty chủ yếu là do hàng tỷ khoản đầu tư, đột phá kỹ thuật và một nhóm mạnh mẽ, trong khi tuyên bố về "ngân sách cách mạng" để phát triển các mô hình AI có phần phóng đại.
Tuy nhiên, chi phí của đối thủ vẫn cao hơn đáng kể. Chẳng hạn, so sánh chi phí đào tạo mô hình: Deepseek đã chi 5 triệu đô la cho R1, trong khi TATGPT4O có giá 100 triệu đô la.
-
Fun with Ragdolls GameNếu bạn đang tìm kiếm một trò chơi cho phép sự sáng tạo của bạn tăng vọt, niềm vui với Ragdolls là trò chơi vật lý hộp cát của bạn. Đi sâu vào một môi trường thế giới mở rộng, nơi bạn có thể điều khiển các nhân vật ragdoll theo vô số cách sáng tạo. Từ việc chế tạo các thiết lập phức tạp đến thử nghiệm với vật lý động
-
F18 Carrier Landing LiteĐi sâu vào thế giới ly kỳ của Hàng không Hải quân với F18 Carrier Land Lite, một trò chơi mô phỏng chuyến bay di động được thiết kế để thách thức và thu hút người chơi ở mỗi lượt. Cho dù bạn đang cất cánh, điều hướng thông qua các kịch bản khác nhau hoặc thực hiện nghệ thuật tinh tế của một máy bay chiến đấu F-18 trên A A
-
Darkness SurvivalĐi sâu vào thế giới lạnh lùng của sự sống sót trong bóng tối, một trò chơi sinh tồn đẩy người chơi vào một cõi bóng tối, đau khổ. Được trang bị chỉ với các công cụ cơ bản, nhiệm vụ của bạn là thu thập tài nguyên, xây dựng các thiên đường an toàn và chống lại các sinh vật đe dọa ẩn nấp trong bóng tối. Bầu không khí dữ dội của trò chơi và ch
-
Chinese ParentsĐi sâu vào thế giới nhập vai của cha mẹ Trung Quốc, một trò chơi mô phỏng cuộc sống cho phép bạn trải nghiệm những thách thức độc đáo khi lớn lên trong một gia đình Trung Quốc điển hình. Là một người chơi, bạn sẽ bước vào đôi giày của một đứa trẻ, tung hứng cuộc sống học đường, các mối quan hệ và những kỳ vọng cao của cha mẹ bạn. Engag
-
Pocket Mini GolfĐi sâu vào thế giới thú vị của Pocket Mini Golf, một trò chơi di động thú vị và giản dị mang lại niềm vui của Golf Mini Golf sang đầu ngón tay của bạn. Trải nghiệm sự hồi hộp của việc điều hướng thông qua các khóa học được thiết kế sáng tạo được đóng gói với các chướng ngại vật, đường dốc và những thách thức độc đáo. Với các điều khiển trực quan của nó, bạn CA
-
Angry Birds Go!Những con chim giận dữ đi! là một trò chơi đua xe kart thú vị, đưa các nhân vật yêu quý từ vũ trụ Angry Birds vào một thế giới hành động tốc độ cao. Người chơi có thể chọn những con chim yêu thích của họ và cạnh tranh trên các đường đua khác nhau, điều hướng qua nhiều chướng ngại vật và sử dụng sức mạnh để đạt được
-
Stalker 2: Danh sách tất cả các hiện vật và cách lấy chúng
-
Pokémon của người huấn luyện sẽ xuất hiện trở lại trong Pokémon TCG vào năm 2025
-
Clash of Clans Ra mắt Tòa thị chính 17: Đã phát hành bản cập nhật thay đổi trò chơi
-
Tin nóng: Ubisoft tiết lộ liên doanh chơi game NFT bí mật
-
Bộ sạc và bộ làm mát của REDMAGIC được tăng cường để thống trị thiết bị di động