Lar > Notícias > A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver
A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

No entanto, ainda é mais barato que seus concorrentes.
O novo chatbot de Deepseek me apresentou com esta descrição intrigante:
Olá, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que pode até surpreendê -lo.
Hoje, a inteligência artificial desenvolvida pela Deepseek emergiu como um concorrente formidável no mercado, contribuindo principalmente para uma das maiores quedas de preços das ações da NVIDIA.
Imagem: Ensigame.com
O que diferencia esse modelo são seus métodos inovadores de arquitetura e treinamento. Emprega várias tecnologias de ponta:
Previsão com vários toques (MTP): Em vez de prever uma palavra de cada vez, o modelo prevê várias palavras simultaneamente analisando diferentes partes de uma frase. Essa abordagem aprimora a precisão e a eficiência do modelo.
Mistura de especialistas (MOE): Esta arquitetura usa várias redes neurais para processar dados de entrada. A tecnologia acelera o treinamento de IA e melhora o desempenho. Em Deepseek V3, 256 redes neurais são utilizadas, com oito sendo ativados para cada tarefa de processamento de token.
Atenção latente de várias cabeças (MLA): Esse mecanismo ajuda a se concentrar nas partes mais significativas de uma frase. O MLA extrai os principais detalhes dos fragmentos de texto repetidamente, e não apenas uma vez, reduzindo a probabilidade de perder informações importantes. Graças a isso, é mais provável que a IA capture nuances cruciais nos dados de entrada.
A proeminente startup chinesa Deepseek alegou ter criado um modelo de IA competitivo com custos mínimos, afirmando que gastaram apenas US $ 6 milhões no treinamento da poderosa rede neural Deepseek V3 e usou apenas 2048 processadores gráficos.
Imagem: Ensigame.com
No entanto, analistas da semiânica descobriram que a DeepSeek opera uma grande infraestrutura computacional, compreendendo aproximadamente 50.000 GPUs NVIDIA Hopper. Isso inclui 10.000 unidades H800, 10.000 H100s mais avançados e lotes adicionais de GPUs H20. Esses recursos são distribuídos em vários data centers e são utilizados para treinamento, pesquisa e modelagem financeira de IA.
O investimento total da empresa em servidores é de cerca de US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões.
A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que saiu da startup como uma divisão separada focada nas tecnologias de IA em 2023. Ao contrário da maioria das startups que alugam o poder de computação de fornecedores de nuvem, a DeepSeek possui seus próprios data centers, oferecendo controle total sobre o otimização do modelo de IA e a implementação mais rápida de inovações. A empresa permanece auto-financiada, o que afeta positivamente sua flexibilidade e velocidade de tomada de decisão.
Imagem: Ensigame.com
Além disso, alguns pesquisadores da Deepseek ganham mais de US $ 1,3 milhão anualmente, atraindo os principais talentos das principais universidades chinesas (a empresa não contrata especialistas estrangeiros).
Mesmo considerando isso, a recente reivindicação da Deepseek de treinar seu modelo mais recente por apenas US $ 6 milhões parece irrealista. Este número refere-se apenas ao custo do uso da GPU durante o pré-treinamento e não explica despesas de pesquisa, refinamento de modelos, processamento de dados ou custos gerais de infraestrutura.
Desde a sua criação, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. No entanto, diferentemente das empresas maiores sobrecarregadas pela burocracia, a estrutura compacta da Deepseek permite que ela implemente ativamente e efetivamente as inovações de IA.
Imagem: Ensigame.com
O exemplo da Deepseek demonstra que uma empresa independente de IA independente pode competir com os líderes do setor. No entanto, os especialistas enfatizam que o sucesso da empresa se deve em grande parte a bilhões de investimentos, avanços técnicos e uma equipe forte, enquanto as reivindicações sobre um "orçamento revolucionário" para o desenvolvimento de modelos de IA são um pouco exageradas.
Ainda assim, os custos dos concorrentes permanecem significativamente maiores. Por exemplo, compare o custo do treinamento do modelo: Deepseek gastou US $ 5 milhões em R1, enquanto o ChatGPT4O custou US $ 100 milhões.
-
Campercontact - Camper VanDescubra o companheiro de viagem perfeito para entusiastas de campervans com o Campercontact - Camper Van! Nosso aplicativo possui um impressionante banco de dados com mais de 50.000 locais em 58 países, ajudando você a encontrar facilmente spots id
-
Virtual DroidExperimente a alegria como um androide virtual, agora aprimorado com IA de ponta.Descubra o Virtual DroidSeu portal para o metaverso virtual agora conta com bots inteligentes alimentados por IA.Integração de IA avançada - Desfrute de conversas realis
-
One Player No Online HorrorEntre em uma experiência nostálgica de terror no estilo PS1Você se atreve a desvendar os segredos ocultos nas lendas de um jogo multiplayer abandonado? Você será transportado para um mundo de terror da era PS1, com modos de capturar a bandeira e deat
-
Virtual-BetQuer explorar as apostas desportivas sem gastar dinheiro real? A Virtual-Bet proporciona a experiência de apostas perfeita e sem riscos. Esta aplicação inovadora permite que desfrutes de apostas competitivas contra outros jogadores utilizando apenas
-
Superhero Logo QuizQuantos logótipos de super-heróis consegues reconhecer? Testa as tuas habilidades!O Superhero Logo Quiz é o jogo perfeito para fãs de todo o mundo que adoram super-heróis icónicos. Desafia o teu conhecimento com este emocionante questionário que test
-
Quay Hũ ClubProcurando um destino de jogos premium que seja seguro, confiável e acessível em todos os dispositivos? Descubra o Quay Hũ Club! Nosso aplicativo oferece diversão sem fim com uma coleção diversificada de Slots e minijogos projetados para entretenim
-
Pokémon do treinador definido para ressurgir no Pokémon TCG em 2025
-
Clash of Clans Revela o Town Hall 17: Lançada atualização revolucionária
-
Dominar as técnicas de Parry em declarado: um guia
-
Stalker 2: lista de todos os artefatos e como obtê-los
-
Última hora: Ubisoft revela empreendimento secreto de jogos NFT