Rumah > Berita > Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang
Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang

Walau bagaimanapun, ia masih lebih murah daripada pesaingnya.
Chatbot baru dari DeepSeek memperkenalkan dirinya kepada saya dengan keterangan yang menarik ini:
Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.
Hari ini, kecerdasan buatan yang dibangunkan oleh DeepSeek telah muncul sebagai pesaing yang hebat di pasaran, terutamanya menyumbang kepada salah satu penurunan harga saham terbesar di Nvidia.
Imej: ensigame.com
Apa yang membezakan model ini adalah kaedah seni bina dan latihan yang inovatif. Ia menggunakan beberapa teknologi canggih:
Ramalan Multi-Token (MTP): Daripada meramalkan satu perkataan pada satu masa, model meramalkan pelbagai perkataan secara serentak dengan menganalisis bahagian-bahagian yang berlainan dari ayat. Pendekatan ini meningkatkan ketepatan dan kecekapan model.
Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input. Teknologi ini mempercepat latihan AI dan meningkatkan prestasi. Di Deepseek V3, 256 rangkaian saraf digunakan, dengan lapan diaktifkan untuk setiap tugas pemprosesan token.
Perhatian Laten Multi-Head (MLA): Mekanisme ini membantu memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat. MLA mengekstrak butiran utama dari serpihan teks berulang kali bukan sekadar sekali, mengurangkan kemungkinan maklumat penting yang hilang. Terima kasih kepada ini, AI lebih cenderung untuk menangkap nuansa penting dalam data input.
Permulaan Cina yang terkenal DeepSeek mendakwa telah mencipta model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya membelanjakan $ 6 juta untuk melatih rangkaian saraf yang kuat DeepSeek V3 dan hanya menggunakan pemproses grafik 2048.
Imej: ensigame.com
Walau bagaimanapun, penganalisis dari semianalisis mendapati bahawa DeepSeek mengendalikan infrastruktur pengiraan yang besar yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper. Ini termasuk 10,000 unit H800, 10,000 lebih maju H100s, dan kumpulan tambahan GPU H20. Sumber -sumber ini diedarkan di beberapa pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.
Jumlah pelaburan syarikat dalam pelayan berjumlah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.
DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan sebagai bahagian yang berasingan yang memberi tumpuan kepada teknologi AI pada tahun 2023. Syarikat itu tetap dibiayai sendiri, yang memberi kesan positif kepada kelonggaran dan kelajuan membuat keputusan.
Imej: ensigame.com
Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing).
Walaupun memandangkan ini, tuntutan DeepSeek baru -baru ini melatih model terkini untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya merujuk kepada kos penggunaan GPU semasa latihan pra-latihan dan tidak mengambil kira perbelanjaan penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur keseluruhan.
Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Walau bagaimanapun, tidak seperti syarikat yang lebih besar yang dibebani oleh birokrasi, struktur padat DeepSeek membolehkannya secara aktif dan berkesan melaksanakan inovasi AI.
Imej: ensigame.com
Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh berbilion -bilion dalam pelaburan, penemuan teknikal, dan pasukan yang kuat, sementara tuntutan tentang "anggaran revolusioner" untuk membangunkan model AI agak dibesar -besarkan.
Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, bandingkan kos latihan model: DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4O berharga $ 100 juta.
-
Fun with Ragdolls GameJika anda sedang mencari permainan yang membolehkan kreativiti anda melambung, menyeronokkan dengan Ragdolls adalah permainan fizik kotak pasir anda. Menyelam ke dalam persekitaran dunia terbuka yang luas di mana anda boleh memanipulasi watak-watak Ragdoll dalam pelbagai cara kreatif. Dari membuat persediaan rumit untuk bereksperimen dengan Fizik Dinamik-B
-
F18 Carrier Landing LiteMenyelam ke dunia penerbangan tentera laut yang mendebarkan dengan F18 Carrier Landing Lite, permainan simulasi penerbangan mudah alih yang direka untuk mencabar dan melibatkan pemain pada setiap masa. Sama ada anda berlepas, menavigasi melalui pelbagai senario, atau melaksanakan seni halus pendaratan jet pejuang F-18
-
Darkness SurvivalMenyelam ke dalam dunia survival kegelapan yang menyeramkan, permainan survival yang mendorong pemain ke dalam dunia yang mengerikan. Berbekalkan hanya alat asas, misi anda adalah untuk mengumpul sumber, membina tempat yang selamat, dan menangkis makhluk yang mengancam yang bersembunyi di dalam kegelapan. Suasana permainan yang sengit dan ch
-
Chinese ParentsMenyelam ke dunia ibu bapa Cina yang mendalam, permainan simulasi hidup yang membolehkan anda mengalami cabaran unik yang membesar dalam keluarga Cina yang tipikal. Sebagai pemain, anda akan melangkah ke kasut kanak -kanak, menyesuaikan diri dengan kehidupan sekolah, hubungan, dan jangkaan yang tinggi terhadap ibu bapa anda. Engag
-
Pocket Mini GolfMenyelam ke dunia golf poket mini yang menyenangkan, permainan mudah alih yang menyeronokkan dan kasual yang membawa kegembiraan mini golf ke hujung jari anda. Mengalami keseronokan menavigasi melalui kursus yang direka secara kreatif yang penuh dengan halangan, tanjakan, dan cabaran yang unik. Dengan kawalan intuitifnya, anda ca
-
Angry Birds Go!Burung marah pergi! adalah permainan perlumbaan kart yang menggembirakan yang membawa watak-watak yang dikasihi dari The Angry Birds Universe menjadi dunia yang berkelajuan tinggi dan penuh aksi. Pemain boleh memilih burung kegemaran mereka dan bersaing dengan pelbagai trek, menavigasi melalui pelbagai halangan dan menggunakan kuasa untuk mendapatkan
-
Stalker 2: Senarai Semua Artifak & Cara Mendapatkannya
-
Pokémon Jurulatih Akan Muncul Semula dalam Pokémon TCG pada tahun 2025
-
Clash of Clans Memperkenalkan Dewan Perbandaran 17: Kemas Kini Mengubah Permainan Dikeluarkan
-
Pecah: Ubisoft Memperkenalkan Usaha Permainan NFT Terselindung
-
Pengecas dan Penyejuk REDMAGIC Ditingkatkan untuk Penguasaan Mudah Alih