Lar > Notícias > A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver
A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

No entanto, ainda é mais barato que seus concorrentes.
O novo chatbot de Deepseek me apresentou com esta descrição intrigante:
Olá, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que pode até surpreendê -lo.
Hoje, a inteligência artificial desenvolvida pela Deepseek emergiu como um concorrente formidável no mercado, contribuindo principalmente para uma das maiores quedas de preços das ações da NVIDIA.
Imagem: Ensigame.com
O que diferencia esse modelo são seus métodos inovadores de arquitetura e treinamento. Emprega várias tecnologias de ponta:
Previsão com vários toques (MTP): Em vez de prever uma palavra de cada vez, o modelo prevê várias palavras simultaneamente analisando diferentes partes de uma frase. Essa abordagem aprimora a precisão e a eficiência do modelo.
Mistura de especialistas (MOE): Esta arquitetura usa várias redes neurais para processar dados de entrada. A tecnologia acelera o treinamento de IA e melhora o desempenho. Em Deepseek V3, 256 redes neurais são utilizadas, com oito sendo ativados para cada tarefa de processamento de token.
Atenção latente de várias cabeças (MLA): Esse mecanismo ajuda a se concentrar nas partes mais significativas de uma frase. O MLA extrai os principais detalhes dos fragmentos de texto repetidamente, e não apenas uma vez, reduzindo a probabilidade de perder informações importantes. Graças a isso, é mais provável que a IA capture nuances cruciais nos dados de entrada.
A proeminente startup chinesa Deepseek alegou ter criado um modelo de IA competitivo com custos mínimos, afirmando que gastaram apenas US $ 6 milhões no treinamento da poderosa rede neural Deepseek V3 e usou apenas 2048 processadores gráficos.
Imagem: Ensigame.com
No entanto, analistas da semiânica descobriram que a DeepSeek opera uma grande infraestrutura computacional, compreendendo aproximadamente 50.000 GPUs NVIDIA Hopper. Isso inclui 10.000 unidades H800, 10.000 H100s mais avançados e lotes adicionais de GPUs H20. Esses recursos são distribuídos em vários data centers e são utilizados para treinamento, pesquisa e modelagem financeira de IA.
O investimento total da empresa em servidores é de cerca de US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões.
A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que saiu da startup como uma divisão separada focada nas tecnologias de IA em 2023. Ao contrário da maioria das startups que alugam o poder de computação de fornecedores de nuvem, a DeepSeek possui seus próprios data centers, oferecendo controle total sobre o otimização do modelo de IA e a implementação mais rápida de inovações. A empresa permanece auto-financiada, o que afeta positivamente sua flexibilidade e velocidade de tomada de decisão.
Imagem: Ensigame.com
Além disso, alguns pesquisadores da Deepseek ganham mais de US $ 1,3 milhão anualmente, atraindo os principais talentos das principais universidades chinesas (a empresa não contrata especialistas estrangeiros).
Mesmo considerando isso, a recente reivindicação da Deepseek de treinar seu modelo mais recente por apenas US $ 6 milhões parece irrealista. Este número refere-se apenas ao custo do uso da GPU durante o pré-treinamento e não explica despesas de pesquisa, refinamento de modelos, processamento de dados ou custos gerais de infraestrutura.
Desde a sua criação, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. No entanto, diferentemente das empresas maiores sobrecarregadas pela burocracia, a estrutura compacta da Deepseek permite que ela implemente ativamente e efetivamente as inovações de IA.
Imagem: Ensigame.com
O exemplo da Deepseek demonstra que uma empresa independente de IA independente pode competir com os líderes do setor. No entanto, os especialistas enfatizam que o sucesso da empresa se deve em grande parte a bilhões de investimentos, avanços técnicos e uma equipe forte, enquanto as reivindicações sobre um "orçamento revolucionário" para o desenvolvimento de modelos de IA são um pouco exageradas.
Ainda assim, os custos dos concorrentes permanecem significativamente maiores. Por exemplo, compare o custo do treinamento do modelo: Deepseek gastou US $ 5 milhões em R1, enquanto o ChatGPT4O custou US $ 100 milhões.
-
Snakes and Ladders Dice GameEmbarque em uma jornada deliciosa e nostálgica com o jogo de tabuleiro clássico, agora disponível no seu dispositivo Android, com caneca e jogo de dados. Também conhecida como Snake Ludo, este jogo o transportará de volta à sua infância com sua jogabilidade simples e emocionante. Enrole os dados, mova sua peça,
-
Tiny ThiefMergulhe no mundo extravagante de *Tiny Thief *, um jogo de aventura de quebra-cabeça que o transporta para um reino medieval, onde astúcia e inteligência são seus maiores aliados. Ao guiar nosso protagonista do tamanho de uma cerveja através de uma série de níveis encantadores ilustrados, você encontrará desafios e quebra-cabeças deliciosos
-
Trap Adventure 2Se você está procurando uma experiência de jogo emocionante e humorística, * Trap Adventure 2 * é o jogo do jogo de plataformas para você. Conhecida por sua jogabilidade desafiadora e armadilhas inteligentes, mantém os jogadores na ponta dos pés enquanto navegam por níveis cheios de obstáculos, inimigos e quebra -cabeças engenhosos. O charme do jogo
-
Fun with Ragdolls GameSe você está procurando um jogo que permita que sua criatividade suba, a diversão com o Ragdolls é o seu jogo de física de sandbox. Mergulhe em um amplo ambiente de mundo aberto, onde você pode manipular personagens de ragdoll de inúmeras maneiras criativas. De criação de configurações complexas até experimentar a física dinâmica-B
-
F18 Carrier Landing LiteMergulhe no emocionante mundo da aviação naval com o F18 Carrier Landing Lite, um jogo de simulação de vôo móvel projetado para desafiar e envolver jogadores a cada passo. Esteja você decolando, navegando em vários cenários ou executando a delicada arte de desembarcar um jato de caça F-18 em um A A
-
Darkness SurvivalMergulhe no mundo assustador da sobrevivência das trevas, um jogo de sobrevivência que empurra os jogadores em um reino sombrio e sombrio. Armado com apenas ferramentas básicas, sua missão é coletar recursos, construir refúgios seguros e afastar criaturas ameaçadoras à espreita no escuro. A atmosfera intensa do jogo e CH
-
Stalker 2: lista de todos os artefatos e como obtê-los
-
Pokémon do treinador definido para ressurgir no Pokémon TCG em 2025
-
Clash of Clans Revela o Town Hall 17: Lançada atualização revolucionária
-
Última hora: Ubisoft revela empreendimento secreto de jogos NFT
-
Carregador e cooler da REDMAGIC aprimorados para domínio móvel