Hogar > Noticias > La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

May 21,25(Hace 1 semanas)
La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

Sin embargo, sigue siendo más barato que sus competidores.

El nuevo chatbot de Deepseek se me presentó con esta intrigante descripción:

Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que pueda sorprenderte.

Hoy, la inteligencia artificial desarrollada por Deepseek se ha convertido en un competidor formidable en el mercado, especialmente contribuyendo a una de las mayores caídas de precios de las acciones de NVIDIA.

Prueba de Speeek Imagen: ensigame.com

Lo que distingue a este modelo son sus innovadores métodos de arquitectura y capacitación. Emplea varias tecnologías de vanguardia:

Predicción múltiple (MTP): en lugar de predecir una palabra a la vez, el modelo pronostica múltiples palabras simultáneamente analizando diferentes partes de una oración. Este enfoque mejora tanto la precisión como la eficiencia del modelo.

Mezcla de expertos (MOE): esta arquitectura utiliza varias redes neuronales para procesar datos de entrada. La tecnología acelera la capacitación de IA y mejora el rendimiento. En Deepseek V3, se utilizan 256 redes neuronales, y se activan ocho para cada tarea de procesamiento de tokens.

Atención latente de múltiples cabezas (MLA): este mecanismo ayuda a centrarse en las partes más significativas de una oración. MLA extrae detalles clave de los fragmentos de texto repetidamente en lugar de solo una vez, reduciendo la probabilidad de perder información importante. Gracias a esto, es más probable que la IA capture matices cruciales en los datos de entrada.

La destacada startup china Deepseek afirmó haber creado un modelo de IA competitivo con costos mínimos, afirmando que gastaron solo $ 6 millones en capacitar a la poderosa red neuronal Deepseek V3 y usaron solo 2048 procesadores gráficos.

Deepseek v3 Imagen: ensigame.com

Sin embargo, los analistas del semianálisis descubrieron que Deepseek opera una gran infraestructura computacional que comprende aproximadamente 50,000 GPU de la tolva nvidia. Esto incluye 10,000 unidades H800, 10,000 H100 más avanzados y lotes adicionales de GPU H20. Estos recursos se distribuyen en varios centros de datos y se utilizan para capacitación, investigación y modelado financiero de IA.

La inversión total de la compañía en servidores asciende a alrededor de $ 1.6 mil millones, con gastos operativos estimados en $ 944 millones.

Deepseek es una subsidiaria del Fondo de cobertura chino High-Flyer, que salió de la startup como una división separada centrada en las tecnologías de IA en 2023. A diferencia de la mayoría de las startups que alquilan el poder de la computación de los proveedores de la nube, Deepseek posee sus propios centros de datos, lo que le brinda el control total sobre la optimización del modelo de IA y que proporciona una implementación más rápida de innovaciones. La compañía sigue siendo autofinanciada, lo que afecta positivamente su flexibilidad y velocidad de toma de decisiones.

Veterano Imagen: ensigame.com

Además, algunos investigadores de Deepseek ganan más de $ 1.3 millones anuales, atrayendo al máximo talento de las principales universidades chinas (la compañía no contrata especialistas en el extranjero).

Incluso teniendo en cuenta esto, el reciente reclamo de Deepseek de capacitar a su último modelo por solo $ 6 millones parece poco realista. Esta cifra se refiere solo al costo del uso de la GPU durante la pre-entrenamiento y no tiene en cuenta los gastos de investigación, el refinamiento del modelo, el procesamiento de datos o los costos generales de infraestructura.

Desde su inicio, Deepseek ha invertido más de $ 500 millones en desarrollo de IA. Sin embargo, a diferencia de las compañías más grandes cargadas por la burocracia, la estructura compacta de Deepseek le permite implementar activa y efectivamente innovaciones de IA.

Veterano Imagen: ensigame.com

El ejemplo de Deepseek demuestra que una compañía de IA independiente bien financiada puede competir con los líderes de la industria. Sin embargo, los expertos enfatizan que el éxito de la compañía se debe en gran medida a miles de millones en inversiones, avances técnicos y un equipo fuerte, mientras que las afirmaciones sobre un "presupuesto revolucionario" para desarrollar modelos de IA son algo exagerados.

Aún así, los costos de los competidores siguen siendo significativamente más altos. Por ejemplo, compare el costo de la capacitación del modelo: Deepseek gastó $ 5 millones en R1, mientras que ChatGPT4O costó $ 100 millones.

Descubrir
  • Draw sketch : Sketch and Paint
    Draw sketch : Sketch and Paint
    Las aplicaciones de trazas y bocetos son herramientas potentes diseñadas para ayudar a los usuarios a transformar fotografías o imágenes en bocetos o dibujos detallados. Al superponer una capa transparente en la imagen seleccionada, estas aplicaciones le permiten rastrear los contornos y los detalles sin esfuerzo. Esto los hace ideales para artistas, designe
  • Kids Toddler & Preschool Games
    Kids Toddler & Preschool Games
    ¡Presentando el reino mágico del aprendizaje y la diversión, traído a usted por Lucas & Friends, desarrollado con orgullo por RV AppStudios! Diseñado específicamente para niños pequeños de 3 a 5 años, nuestros juegos para niños pequeños son una colección encantadora de más de 15 actividades atractivas que combinan educación con entretenimiento. Entrar en una captiva
  • Endless Nightmare 4: Prison
    Endless Nightmare 4: Prison
    Escape los confines escalofriantes de la prisión embrujada en una pesadilla interminable: la prisión, el último emocionante capítulo de la serie de terror. Ubicado en paredes imponentes llenas de espíritus inquietos, este intenso juego de terror de supervivencia 3D te desafía a descubrir secretos, recolectar artículos vitales y evadir malevolen
  • Pineapple Pen
    Pineapple Pen
    ¡Pon tu destreza que empuje la pluma a la prueba definitiva! ¿Puedes dominar el arte del equilibrio y la precisión? Todo lo que necesitas hacer es colocar un bolígrafo en una fruta (pinza o manzana) y ver quién puede golpear la bullseye dos veces seguidas. ¡Es simple, pero adictivo! Desafíe a sus amigos a determinar quién entre ustedes es el T
  • پاسور چهاربرگ آنلاین، آفلاین
    پاسور چهاربرگ آنلاین، آفلاین
    Presentando el juego en línea de Pasoor Chahar Barg, fuera de línea, ¡la versión definitiva y mejorada del querido clásico iraní de cuatro tarjetas! Conocido como Haft Khaj, once, siete o cuatro, este emocionante juego de cartas traza sus raíces hacia el Medio Oriente y sigue siendo muy popular en Irán. Experimentar la emoción o
  • مكتبة ألفية ابن مالك وشرحها
    مكتبة ألفية ابن مالك وشرحها
    Sumérgete en el mundo de la literatura árabe clásica con la aplicación مكeja ة ألفية ابن مالك وشرحها, una notable compilación de obras centradas en el texto seminal de Alfiyya de Ibn Mālik. Esta aplicación reúne contribuciones invaluables de los estimados eruditos como Badr al-Dīn Ibn Mālik e Ibn Qayyi