Dom > Aktualności > Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

May 21,25(1 tygodni temu)
Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

Jest jednak nadal tańszy niż jego konkurenci.

Nowy chatbot z Deepseek przedstawił mi ten intrygujący opis:

Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć.

Dzisiaj sztuczna inteligencja opracowana przez Deepseek pojawiła się jako potężny konkurent na rynku, w szczególności przyczyniając się do jednego z największych spadków cen akcji w NVIDIA.

Test Deepseek Zdjęcie: engame.com

Tym, co wyróżnia ten model, to innowacyjna architektura i metody szkolenia. Stosuje kilka najnowocześniejszych technologii:

Prognozowanie wielu tokenów (MTP): Zamiast przewidywać jedno słowo jednocześnie, model prognozuje wiele słów jednocześnie poprzez analizę różnych części zdania. Podejście to zwiększa zarówno dokładność, jak i wydajność modelu.

Mieszanka ekspertów (MOE): Architektura ta wykorzystuje różne sieci neuronowe do przetwarzania danych wejściowych. Technologia przyspiesza szkolenie AI i poprawia wydajność. W Deepseek V3 wykorzystywane jest 256 sieci neuronowych, a osiem jest aktywowanych dla każdego zadania przetwarzania tokenu.

Utrzymująca uwaga wielowłócona (MLA): Ten mechanizm pomaga skupić się na najważniejszych częściach zdania. MLA wielokrotnie wyodrębnia kluczowe szczegóły z fragmentów tekstu, a nie tylko raz, zmniejszając prawdopodobieństwo braku ważnych informacji. Dzięki temu sztuczna inteligencja jest bardziej skłonna do przechwytywania kluczowych niuansów w danych wejściowych.

Wybitny chiński startup Deepseek twierdził, że stworzył konkurencyjny model AI przy minimalnych kosztach, stwierdzając, że wydali tylko 6 milionów dolarów na szkolenie potężnej sieci neuronowej Deepseek V3 i zastosowali zaledwie 2048 procesorów graficznych.

Deepseek v3 Zdjęcie: engame.com

Jednak analitycy z semianalizy odkryli, że Deepseek prowadzi dużą infrastrukturę obliczeniową obejmującą około 50 000 GPU Nvidia Hopper. Obejmuje to 10 000 jednostek H800, 10 000 bardziej zaawansowanych H100 i dodatkowe partie H20 GPU. Zasoby te są dystrybuowane w kilku centrach danych i są wykorzystywane do szkolenia AI, badania i modelowanie finansowe.

Całkowita inwestycja Spółki w serwerach wynosi około 1,6 miliarda dolarów, a wydatki operacyjne szacują na 944 mln USD.

Deepseek jest spółką zależną chińskiego funduszu hedgingowego High-Flyer, która odrzuciła start-upa jako odrębny podział koncentrujący się na technologiach AI w 2023 r.. W przeciwieństwie do większości startupów, które wynajmują siłę obliczeniową od dostawców chmur, Deepseek jest właścicielem własnych centrów danych, co daje mu pełną kontrolę nad optymalizacją modelu AI i włączając szybką wdrażanie innowacji. Firma pozostaje finansowana, co pozytywnie wpływa na jego elastyczność i szybkość podejmowania decyzji.

Deepseek Zdjęcie: engame.com

Ponadto niektórzy badacze Deepseek zarabiają ponad 1,3 miliona dolarów rocznie, przyciągając najlepsze talenty wiodących chińskich uniwersytetów (firma nie zatrudniał zagranicznych specjalistów).

Nawet biorąc to pod uwagę, ostatnie twierdzenie Deepseeka o szkolenie najnowszego modelu za jedyne 6 milionów dolarów wydaje się nierealne. Liczba ta odnosi się jedynie do kosztu wykorzystania GPU podczas wstępnego treningu i nie uwzględnia kosztów badań, udoskonalania modelu, przetwarzania danych lub ogólnych kosztów infrastruktury.

Od samego początku Deepseek zainwestował ponad 500 milionów dolarów w rozwój AI. Jednak w przeciwieństwie do większych firm obciążonych biurokracją, kompaktowa struktura Deepseek pozwala jej aktywnie i skutecznie wdrażać innowacje AI.

Deepseek Zdjęcie: engame.com

Przykład Deepseek pokazuje, że dobrze finansowana niezależna firma AI może konkurować z liderami branży. Niemniej jednak eksperci podkreślają, że sukces firmy wynika głównie z miliardów inwestycji, przełomów technicznych i silnego zespołu, podczas gdy twierdzenia o „rewolucyjnym budżecie” dla opracowywania modeli AI są nieco przesadzone.

Mimo to koszty konkurencji pozostają znacznie wyższe. Na przykład porównaj koszty treningu modelowego: Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4O kosztował 100 milionów dolarów.

Odkryć
  • Fun with Ragdolls Game
    Fun with Ragdolls Game
    Jeśli szukasz gry, która pozwala kreatywności wzrosnąć, zabawa z Ragdolls to gra fizyka piaskownicy. Zanurz się w ekspansywnym środowisku z otwartego świata, w którym można manipulować postaciami ragdoll na niezliczony sposób twórczy. Od tworzenia skomplikowanych konfiguracji po eksperymentowanie z dynamiczną fizyką-B
  • F18 Carrier Landing Lite
    F18 Carrier Landing Lite
    Zanurz się w ekscytującym świecie lotnictwa morskiego z F18 Carrier Landing Lite, mobilną grę symulacji lotu zaprojektowanego w celu zakwestionowania i angażowania graczy na każdym kroku. Niezależnie od tego, czy starasz się, przechodzisz przez różne scenariusze, czy wykonujesz delikatną sztukę lądowania myśliwca F-18 na A A
  • Darkness Survival
    Darkness Survival
    Zanurz się w mrożącym krewnym świecie przetrwania ciemności, gry przetrwania, która wtrzymuje graczy w wstrząsającą, mroczną królestwo. Uzbrojony w tylko podstawowe narzędzia, twoją misją jest zbieranie zasobów, konstruowanie bezpiecznych rajów i odrzucanie groźnych stworzeń czających się w ciemności. Intensywna atmosfera i ch
  • Chinese Parents
    Chinese Parents
    Zanurz się w wciągającym świecie chińskich rodziców, gry symulacyjnej, która pozwala doświadczyć wyjątkowych wyzwań związanych z dorastaniem w typowej chińskiej rodzinie. Jako gracz wejdziesz w buty dziecka, żonglując życiem szkolnym, związkami i wysokimi oczekiwaniami rodziców. Engag
  • Pocket Mini Golf
    Pocket Mini Golf
    Zanurz się w cudownym świecie Pocket Mini Golf, zabawnej i swobodnej gry mobilnej, która przynosi radość minigolfa prosto na wyciągnięcie ręki. Doświadcz emocji związanych z nawigacją przez twórczo zaprojektowane kursy wypełnione przeszkodami, rampami i wyjątkowymi wyzwaniami. Z intuicyjnymi elementami kontroli, CA
  • Angry Birds Go!
    Angry Birds Go!
    Angry Birds Go! to radosna gra wyścigowa gokartowa, która wprowadza ukochane postacie z Angry Birds Universe w szybki, pełen akcji świat. Gracze mogą wybrać swoje ulubione ptaki i konkurować na różnych utworach, nawigując przez różne przeszkody i wykorzystując ulepszenia do zdobycia