Geoestrategia

La batalla de la IA: DeepSeek y China dejan en evidencia la estafa de las Big Tech norteamericanas. Análisis

Administrator | Martes 28 de enero de 2025
El mercado de valores estadounidense podría perder al menos un billón de dólares en valor: así reaccionan los traders en pánico ante el fenómeno de la red neuronal china DeepSeek. Entrenar esta red neuronal costó solo 5 millones de dólares, lo que es diez veces menos de lo que OpenAI y Google gastaron en ella. Por cierto, DeepSeek ya ha superado a ChatGPT en las listas de los mejores de la tienda de aplicaciones gratuita.
China le pone freno al reinado de EEUU sobre la IA y Wall Street se tiñe de rojo.
El gigante tecnológico estadounidense NVIDIA alcanza una pérdida de 600 mil millones a esta hora.
Impulsado por el modelo DeepSeek-V3, que sus creadores describen como "líder entre los modelos de código abierto y rival de los modelos cerrados más avanzados a nivel global", la startup china sacude a los mercados en el arranque de la semana.
Este lunes DeepSeek superó a su rival ChatGPT y se convirtió en la aplicación gratuita mejor valorada disponible en la App Store de Apple en EEUU. Tras su impresionante debut, la firma china sacudió las acciones tecnológicas globales, pues plantea serios interrogantes sobre el dominio tecnológico de Washington, que lo ostenta gracias a sus sanciones e impedimentos para que China transaccione con chips de IA o semiconductores.
Fue durante el fin de semana que creció el interés en el último modelo de inteligencia artificial de DeepSeek, que es mucho más rentable que sus competidores, ya que opera con chips menos costosos. Esto suscitó dudas sobre la validez de las altas valoraciones de empresas como Nvidia Corp- que se hunde en el premarket casi 13%- que ha liderado el auge de las acciones de inteligencia artificial a nivel mundial gracias a la percepción de que sus chips son esenciales para esta tecnología.
¿Qué pasó?
Hay varias versiones de lo ocurrido. Según uno de ellos, los chinos han superado a los estadounidenses simplemente al utilizar modelos de redes neuronales de código abierto creados en Estados Unidos. Es decir, los estadounidenses invirtieron en chips, centros de datos y capacitación: gastaron decenas de miles de millones de dólares. Y los chinos lo tomaron y crearon el suyo propio, sobre la base de sus logros. ¿Hermoso? ¡Pues claro que sí!
Otra versión es que los chinos simplemente guardan silencio sobre su gasto real. Después de todo, todas las declaraciones sobre el bajo coste de formación de DeepSeek provienen únicamente de la propia empresa. Los medios de comunicación estadounidenses y, al mismo tiempo, los mundiales, los recogieron muy rápidamente, sin esperar una confirmación independiente de los datos. Es muy posible que las compañías estadounidenses de petróleo, gas y carbón hayan decidido embestir a las grandes tecnológicas en Estados Unidos para transferir inversiones hacia ellas.
Hay otro punto. Si los principales medios de comunicación de Estados Unidos cuestionaran los bajos costos de DeepSeek, estarían admitiendo que la empresa tiene centros de datos con chips de última generación en China continental. Pero las autoridades estadounidenses insisten en que las medidas de control de las exportaciones relativas a la prohibición de suministros de chips avanzados de la taiwanesa TSMC están funcionando.
Pero hay algo aún más desagradable para Washington, incluso peor que la opción de imponer restricciones a las exportaciones que no funcionen. ¿Qué pasaría si China continental ya hubiera comenzado a producir todos los chips necesarios y a construir potentes centros de datos? Por supuesto, no hay razón para que Pekín hable de esto públicamente, para no incurrir en otras sanciones por parte de un Washington enojado. Y por eso DeepSeek puede jugar un papel pobre y ni siquiera molestarse en refutar la versión de que basaron su desarrollo en redes neuronales de los EE. UU.
También cabe destacar que la versión en línea de DeepSeek está censurada en temas que se consideran tabú en China. La forma más efectiva de hacerlo es tener sus propios centros de datos. Obviamente, China tiene centros de datos que pueden soportar redes neuronales potentes.
¿De dónde proceden los chips correspondientes? Algunos de ellos podrían ser productos locales y otros podrían ser de Taiwán, eludiendo las restricciones estadounidenses. Al mismo tiempo, el proceso de entrenamiento de la red neuronal en sí podría ser realmente económico, construyéndose sobre la base de redes neuronales que ya funcionan, principalmente de los EE. UU., aunque no solo. Sin embargo, DeepSeek también tuvo gastos en hardware, pero la compañía decidió guardar modestamente silencio sobre ellos.
Sea como fuere, los americanos realmente se encontraron en una situación estúpida. Al invertir decenas de miles de millones de dólares, las empresas no tuvieron en cuenta los costos. Según algunos informes, los altos directivos de las famosas redes neuronales estadounidenses se han asignado salarios fabulosos.
No se puede descartar la posibilidad de corrupción, incluida la corrupción política, cuando el dinero para la campaña electoral de Trump se inyectó activamente mediante “inversiones en inteligencia artificial”. Después de todo, las empresas estadounidenses contribuyeron a Biden a través de proyectos de “energía verde”, que inmediatamente pasaron de moda en cuanto Joe dejó la Casa Blanca.
Sea como fuere, en términos de IA, las cosas no están yendo según lo planeado en Estados Unidos en estos momentos. Mientras tanto, los inversores de Wall Street maldicen a los glotones creadores de redes neuronales en Estados Unidos y buscan un lugar más seguro donde invertir sus fondos.
La historia del chat chino de IA, que sumió al mercado estadounidense en un verdadero shock, también demuestra la ineficacia del actual sistema estadounidense en literalmente todo.
El coste de DeepSeek según los estándares estadounidenses es absolutamente ridículo, pero si se creara en EE. UU., costaría decenas de veces más, como lo demuestra perfectamente Open AI. Porque el indicador más importante es la paridad del poder adquisitivo, y Estados Unidos está perdiendo en él, incluso debido al predominio del dólar.
Un sistema con un dólar mundial puede ser bueno en dos casos: si el mundo está dividido en dos sistemas, como la URSS-EE.UU., o cuando el propietario de la moneda mundial no tiene competidores tecnológicos.
Porque cuando aparezcan estos competidores, a priori serán más efectivos, incluso debido al hecho de que su moneda no está gravada por el poder mundial.
DeepSeek: ¿qué es la nueva IA china que está ganando la atención de todo el mundo?
Washington y Pekín se enfrentan en una lucha crucial por la supremacía en el campo de la inteligencia artificial (IA), en la que el gasto estadounidense supera varias veces al de China. DeepSeek R1, un avanzado modelo lingüístico, está conquistando a los usuarios, asombrando a los críticos y ganándose los elogios de los fóbicos de esta tecnología.
El nuevo programa de la startup con sede en Hangzhou supera a OpenAI o1 en pruebas de matemáticas y razonamiento, y supera al Llama 3.1 de Meta* y al GPT-40 de OpenAI en codificación y resolución de problemas complejos.
El modelo se puede ejecutar localmente de forma gratuita y el acceso a su API (interfaz de programación de aplicaciones) cuesta una fracción de lo que cobran los competidores. Según los informes, el entrenamiento del modelo costó 5,6 millones de dólares (frente a los 78 millones del GPT-40) y utiliza chips de rendimiento limitado debido a las restricciones impuestas por Estados Unidos, que también prohibió el envío de procesadores más potentes a China.
En su lugar, DeepSeek R1 extrae su potencia de una mayor eficiencia computacional.
"Deberíamos tomarnos muy, muy en serio los avances de China", comentó Stya Nadella, director ejecutivo de Microsoft, durante el Foro Económico Mundial en Davos a finales de enero, días después de la presentación del último modelo de DeepSeek.
¿Cómo funciona?
Lo que despierta la curiosidad de los usuarios es la forma en que la herramienta genera respuestas, en un proceso que la revista científica Nature califica de "análogo al razonamiento humano" y, por tanto, "más hábil que los modelos lingüísticos anteriores para resolver problemas científicos".
Es una gran noticia para los científicos que se dedican al análisis de datos, el reconocimiento de patrones y la elaboración de modelos predictivos en una amplia gama de campos, desde la astronomía y la medicina hasta las ciencias de la tierra.
Lo mejor de todo es el código abierto
A diferencia de otros modelos disponibles en el mercado, que los expertos han calificado de "cajas negras", DeepSeek R1 es de código abierto, lo que permite a los usuarios temerosos de que la IA se convierta en Skynet estudiar su funcionamiento e incluso desarrollarlo.
El fundador de DeepSeek, Liang Wenfeng, declaró a los medios chinos en 2024 que la prioridad de la empresa era "la investigación y la innovación tecnológica", no el lucro, y que su objetivo final es la inteligencia artificial general.
Si la misión tiene éxito y nace una inteligencia artificial general de código abierto, la humanidad podría salvarse de una IA privatizada, armamentizada y monopolizada que nos aniquile.
Stargate vs. DeepSeek: la competencia de la IA se calienta
El proyecto Stargate suena como algo sacado de una película de ciencia ficción, llena de promesas de revolucionar a la humanidad.
Pero la realidad es más una distopía de Philip K. Dick que una utopía de Asimov: menos sobre derrocar la tiranía como en la película *Stargate* y más sobre crearla.
Oficialmente, la apuesta de 500 mil millones de dólares de OpenAI por Stargate habla de “crear vacunas contra el cáncer” y transformar la atención médica.
Pero en verdad, se trata de construir una Fortaleza de Infraestructura en Estados Unidos, un imperio de IA centralizado con centros de datos colosales diseñados para excluir a los competidores y consolidar el control en manos de unos pocos.
Mientras tanto, DeepSeek de China ofrece una visión radicalmente diferente.
Con un rendimiento equivalente al de OpenAI a solo el 3% del costo, DeepSeek no está acaparando su tecnología tras puertas cerradas.
En cambio, está lanzando modelos de IA asequibles y accesibles que cualquiera puede usar. DeepSeek concibe la IA como una mercancía, omnipresente y democratizada, una herramienta para todos, no un privilegio para la élite.
En Stargate vs. DeepSeek: son muros imponentes versus puertas abiertas.
No se trata solo de una rivalidad tecnológica; es un choque de filosofías tan profundo como el protestantismo versus el confucianismo o el capitalismo versus el comunismo.
La estrategia estadounidense de OpenAI refleja centralización, control y dominio.
El ethos de raíz cristiana de domar el caos se refleja en el modelo de fortaleza de Stargate: la IA como una fuerza potente que debe ser encerrada y manejada por los sumos sacerdotes (traducción: los pocos ricos).
Es un reflejo del monopolio capitalista, donde la infraestructura masiva y las economías de escala crean barreras insuperables para la entrada.
En contraste, DeepSeek encarna los ideales confucianos de equilibrio y beneficio colectivo. El enfoque chino descentraliza la IA, haciéndola asequible y ampliamente accesible.
DeepSeek no está construyendo una fortaleza; La IA está creando una utilidad, un recurso compartido integrado en la vida diaria.
Esta filosofía se alinea con el comunismo impulsado por el Estado, que prioriza el bien colectivo sobre el beneficio individual. Al nivelar el campo de juego, DeepSeek quiere garantizar que incluso las organizaciones y los individuos más pequeños puedan acceder a tecnología de vanguardia.
Las implicaciones de estos modelos en competencia son profundas.
La estrategia de Stargate refleja un mundo donde cuanto más grande, mejor: más centros de datos, más potencia informática y más control. Encierra la innovación detrás de muros de pago, lo que refuerza las desigualdades y concentra el poder.
Por el contrario, DeepSeek ofrece una visión de la IA como un servicio público distribuido e integrado en un mundo multipolar donde el poder se comparte en lugar de acaparar.
Esta división no es solo tecnológica; es cultural. El modelo estadounidense se centra en el individualismo y el control, mientras que el modelo chino enfatiza lo colectivo y la armonía.
Para Estados Unidos, la IA debe ser premium, rara y de propiedad privada. Para China, la IA es más valiosa cuando es accesible y universal.
Hay mucho en juego. Si Stargate triunfara, la IA podría profundizar las desigualdades y convertirse en otra palanca de control para la élite.
Si la visión de DeepSeek triunfa, la IA podría democratizar la innovación y liberar el potencial global. La pregunta es simple: ¿queremos que la IA esté encerrada tras puertas o abierta a todos?
Análisis: El secreto a voces detrás del éxito de DeepSeek
Marcus Loh
Se ha puesto de moda entre los comentaristas occidentales predecir el declive del “milagro” económico de China.
La desaceleración del crecimiento, un sector inmobiliario en problemas y cambios demográficos se citan con frecuencia como evidencia del malestar. Las tensiones con Estados Unidos –especialmente bajo los dos últimos gobiernos– han alimentado aún más esta narrativa.
Sin embargo, el panorama es mucho más matizado. Bajo el gobierno del presidente Donald Trump, Washington ha evitado hasta ahora los aranceles y medidas más radicales que su retórica de campaña sugería que eran un hecho consumado.
Sin embargo, tres días antes de su investidura, Trump comentó: “Preveo que abordaremos numerosos temas juntos, empezando de inmediato. Hablamos sobre la balanza comercial, el fentanilo, TikTok y varios otros temas. El presidente Xi y yo haremos todo lo posible para que el mundo sea más pacífico y seguro”.
Estos comentarios sugieren un reconocimiento implícito de que la economía de China está evolucionando, no colapsando, y que Estados Unidos, a pesar de su retórica, entiende los cambios estructurales de Beijing.
Del crecimiento liderado por el Estado al dinamismo del sector privado
El éxito inicial de China se debió, en efecto, a una industria manufacturera orientada a la exportación y a una industria pesada estatal. Hoy, más de 65 de las 69 empresas chinas de la lista Fortune Global 500 son estatales.
En los últimos años, Pekín ha promovido fusiones de empresas estatales para fortalecer a los “campeones nacionales”, especialmente en sectores estratégicos. A primera vista, esas acciones podrían reforzar la narrativa del dominio estatal.
Sin embargo, la situación está claramente cambiando. A fines de los años 1990, las empresas estatales representaban más de la mitad de la producción industrial de China; hoy, producen aproximadamente el 30%. Las empresas privadas se han convertido en el motor de la economía para la creación de empleo y el aumento de la eficiencia.
Las empresas privadas aportan hoy más del 50% de los ingresos fiscales y más del 60% del PIB. El consumo, durante mucho tiempo eclipsado por la inversión y las exportaciones, ha cobrado importancia: del 35% del PIB hace una década a casi el 55% en 2023.
Las nuevas políticas fortalecen a los actores privados al ofrecer un mayor acceso a la infraestructura científica y mejores canales de financiamiento. El objetivo es claro: preservar la supervisión estratégica del Estado y aprovechar al mismo tiempo el dinamismo del sector privado.
DeepSeek: innovación con características chinas
Un ejemplo de este dinamismo del sector privado es DeepSeek, fundada por el gestor de fondos de cobertura Liang Wenfeng. La empresa presentó recientemente su modelo de lenguaje grande (LLM) R1, un innovador sistema de inteligencia artificial desarrollado con un presupuesto relativamente modesto.
La trayectoria de DeepSeek desafía la idea de que las empresas chinas dependen exclusivamente de la innovación impulsada por el Estado. Su historia, en cambio, pone de relieve la capacidad del sector privado para superar obstáculos internos y restricciones externas por igual.
Las lecciones de los primeros avances en inteligencia artificial liderados por Estados Unidos llevaron a DeepSeek hacia un camino innovador que se aleja marcadamente de las normas occidentales: la empresa desarrolló nuevos métodos de entrenamiento y “capacidades de razonamiento puro” sin ningún dato supervisado, todo ello mientras rechazaba el modelo típico de inversión masiva de recursos visto en Estados Unidos.
Análisis: Cómo los chinos vencieron a Trump y a OpenAI
Moon of Alabama
El revuelo en torno a la inteligencia artificial, el intento fallido de Estados Unidos de monopolizarla y la reciente respuesta de China son una lección de cómo innovar, pero también muestran que Estados Unidos está perdiendo la capacidad para hacerlo.
A mediados de 2023, cuando el entusiasmo por la inteligencia artificial llegó a los titulares, escribí:
Actualmente, existe cierta expectativa acerca de una familia de modelos de lenguaje grandes como ChatGPT. El programa lee la entrada en lenguaje natural y la procesa para obtener una salida con contenido en lenguaje natural relacionado. Esto no es nuevo. La primera entidad de computadora de Internet lingüística artificial (Alice) fue desarrollada por Joseph Weizenbaum en el MIT a principios de los años 60. Tuve charlas divertidas con ELIZA en los años 80 en una terminal de mainframe. ChatGPT es un poco más ingenioso y sus resultados iterativos, es decir, las "conversaciones" que crea, pueden sorprender a algunas personas. Pero la expectativa en torno a él es injustificada.
Actualmente, se estima que la exactitud factual de la salida de los mejores modelos de lenguaje grandes es del 80%. Procesan símbolos y patrones, pero no comprenden lo que representan esos símbolos o patrones. No pueden resolver problemas matemáticos y lógicos, ni siquiera los más básicos.
Existen aplicaciones específicas, como la traducción de idiomas escritos, en las que la IA o el reconocimiento de patrones ofrecen resultados sorprendentes, pero aún no se puede confiar en que cada palabra sea correcta. Los modelos pueden ser asistentes, pero siempre habrá que comprobar dos veces sus resultados.
En general, la precisión de los modelos de IA actuales es todavía demasiado baja como para permitirles tomar decisiones en cualquier situación del mundo real. Más datos o más potencia de cálculo no cambiarán eso. Si uno quiere superar sus limitaciones, necesitará encontrar algunas ideas fundamentalmente nuevas.
Pero el revuelo continuó. Un gran modelo de IA, ChatGPT, fue proporcionado por una organización sin fines de lucro, OpenAI. Pero su director ejecutivo, Sam Altman, pronto se dio cuenta de la gran cantidad de dólares que potencialmente podría ganar. Un año después de defender la estructura sin fines de lucro de OpenAI, Altman hizo una redada en la junta y convirtió la organización en una empresa privada.
OpenAI, el fabricante de ChatGPT, está trabajando en un plan para reestructurar su negocio principal y convertirlo en una corporación con fines de lucro que ya no estará controlada por su junta sin fines de lucro, dijeron a Reuters personas familiarizadas con el asunto, en una medida que hará que la empresa sea más atractiva para los inversores.
El presidente ejecutivo, Sam Altman, también recibirá capital por primera vez en la empresa con fines de lucro, que podría valer 150.000 millones de dólares después de la reestructuración, ya que también intenta eliminar el límite a los retornos para los inversores, agregaron las fuentes.
El modelo de lenguaje grande ChatGTP que proporcionó OpenAI era de código cerrado: una caja negra que funcionaba en la nube y con la que se podía pagar para chatear o que se podía usar para traducir, generar contenido o analizar determinados problemas.
El entrenamiento y el mantenimiento de ChatGTP requerían de una gran cantidad de potencia informática y dinero. Era un proceso algo costoso, pero no implicaba ninguna tecnología nueva. Los algoritmos que utilizaba eran bien conocidos y los datos de entrenamiento necesarios para "programarlo" estaban disponibles gratuitamente en Internet.
A pesar de todo el revuelo que se ha generado en torno a la IA, no se trata de un secreto ni de una tecnología nueva. Las barreras de entrada para cualquier competencia son bajas.
Por eso, Yves, de Naked Capitalism, señalando a Edward Zitron, preguntó: “¿Cómo sobrevive OpenAI?”. No sobrevive. O tiene pocas posibilidades de hacerlo. Los debates en Estados Unidos nunca reconocieron esos hechos.
Los políticos pensaron que la IA sería el próximo gran avance que permitiría a Estados Unidos controlar el mundo. Intentaron evitar cualquier competencia potencial al liderazgo que Estados Unidos creía tener en ese campo. Nvidea, el último fabricante líder de chips de Estados Unidos, perdió miles de millones cuando se le prohibió vender a China los últimos modelos especializados en IA.
Tres importantes empresas tecnológicas anunciaron el martes que crearán una nueva empresa, llamada Stargate, para desarrollar infraestructura de inteligencia artificial en Estados Unidos.
El director ejecutivo de OpenAI, Sam Altman, el director ejecutivo de SoftBank, Masayoshi Son, y el presidente de Oracle, Larry Ellison, aparecieron en la Casa Blanca el martes por la tarde junto al presidente Donald Trump para anunciar la compañía, a la que Trump llamó el "proyecto de infraestructura de inteligencia artificial más grande de la historia".
Las empresas invertirán 100.000 millones de dólares en el proyecto para empezar, y tienen previsto invertir hasta 500.000 millones de dólares en Stargate en los próximos años. Se espera que el proyecto cree 100.000 puestos de trabajo en Estados Unidos, dijo Trump.
Stargate construirá “la infraestructura física y virtual para impulsar la próxima generación de IA”, incluidos centros de datos en todo el país, dijo Trump. Ellison dijo que el primer proyecto de datos del grupo, de 93.000 metros cuadrados, ya está en construcción en Texas.
El mismo día, pero con mucho menos ruido, una empresa china publicó otro modelo de IA :
Presentamos nuestros modelos de razonamiento de primera generación, DeepSeek-R1-Zero y DeepSeek-R1. DeepSeek-R1-Zero, un modelo entrenado mediante aprendizaje de refuerzo (RL) a gran escala sin ajuste fino supervisado (SFT) como paso preliminar, demostró un rendimiento notable en el razonamiento. Con RL, DeepSeek-R1-Zero emergió naturalmente con numerosos comportamientos de razonamiento interesantes y poderosos.
Los nuevos modelos DeepSeek tienen mejores puntos de referencia que cualquier otro modelo disponible. Utilizan una combinación diferente de técnicas, menos datos de entrenamiento y mucho menos potencia de cálculo para lograrlo. Son baratos de usar y, a diferencia de OpenAI, son de código abierto real.
Los controles de exportación de Estados Unidos sobre semiconductores avanzados tenían como objetivo frenar el progreso de la IA de China, pero es posible que hayan estimulado inadvertidamente la innovación. Incapaces de confiar únicamente en el hardware más reciente, empresas como DeepSeek, con sede en Hangzhou, se han visto obligadas a encontrar soluciones creativas para hacer más con menos.
Este mes, DeepSeek lanzó su modelo R1, utilizando técnicas avanzadas como el aprendizaje de refuerzo puro para crear un modelo que no solo está entre los más formidables del mundo, sino que es completamente de código abierto, lo que lo pone a disposición de cualquier persona en el mundo para examinarlo, modificarlo y desarrollarlo.
El rendimiento de DeepSeek-R1 es comparable a los mejores modelos de razonamiento de OpenAI en una variedad de tareas , incluidas las matemáticas, la codificación y el razonamiento complejo. Por ejemplo, en el punto de referencia de matemáticas AIME 2024, DeepSeek-R1 obtuvo un 79,8% en comparación con el 79,2% de OpenAI-o1. En el punto de referencia MATH-500, DeepSeek-R1 logró un 97,3% frente al 96,4% de o1. En tareas de codificación, DeepSeek-R1 alcanzó el percentil 96,3 en Codeforces, mientras que o1 alcanzó el percentil 96,6, aunque es importante tener en cuenta que los resultados de referencia pueden ser imperfectos y no deben sobreinterpretarse.
Pero lo más destacable es que DeepSeek logró esto en gran medida gracias a la innovación, en lugar de depender de los últimos chips informáticos.
Un modelo de lenguaje de gran tamaño creado en China, llamado DeepSeek-R1, entusiasma a los científicos como un rival asequible y abierto a los modelos de "raciocinio" como el o1 de OpenAI.
"Esto es una locura y totalmente inesperado", escribió en X Elvis Saravia, investigador de IA y cofundador de la consultora de IA DAIR.AI con sede en el Reino Unido.
R1 se destaca por otra razón. DeepSeek, la start-up de Hangzhou que creó el modelo, lo ha publicado como "open-weight", lo que significa que los investigadores pueden estudiar y desarrollar el algoritmo. Publicado bajo una licencia del MIT, el modelo puede reutilizarse libremente, pero no se considera completamente de código abierto, porque sus datos de entrenamiento no se han puesto a disposición.
“La apertura de DeepSeek es bastante notable”, afirma Mario Krenn, director del Laboratorio de Científicos Artificiales del Instituto Max Planck para la Ciencia de la Luz en Erlangen, Alemania. En comparación, o1 y otros modelos creados por OpenAI en San Francisco, California, incluido su último esfuerzo o3, son “esencialmente cajas negras”, afirma.
Incluso los inversores de Internet a largo plazo, que lo han visto todo, están impresionados:
Marc Andreessen 🇺🇸 @pmarca - 9:19 UTC · Jan 24, 2025
Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto jamás y, como código abierto, un gran regalo para el mundo.
DeepSeek no ha publicado el coste total de entrenamiento de R1, pero está cobrando a los usuarios de su interfaz alrededor de una trigésima parte de lo que cuesta ejecutar o1 . La empresa también ha creado versiones mini "destiladas" de R1 para permitir que los investigadores con capacidad de procesamiento limitada jueguen con el modelo.
¡Esto realmente funciona!
Brian Roemmele @BrianRoemmele - 14:34 UTC · 23 de enero de 2025
Amigos, creo que lo hemos logrado. Si las pruebas realizadas durante la noche se confirman, tendremos DeepSeek R1 de CÓDIGO ABIERTO funcionando a 200 tokens por segundo en una Raspberry Pi que NO esté conectada a INTERNET. ¡Una IA de vanguardia mejor que “OpenAI” de su propiedad, que podrá llevar en su bolsillo y usar de forma gratuita! Pondré a su disposición la imagen de Pi tan pronto como se completen todas las pruebas. ¡Simplemente la coloca en una Raspberry Pi y tendrá IA! Este es solo el comienzo del poder que se genera cuando REALMENTE se abre el código fuente de un modelo de IA.
El último hardware de Raspberry Pi cuesta a partir de 50 dólares. El software es gratuito.
Esta es una llamada de muerte para OpenAI:
Arnaud Bertrand @RnaudBertrand - 14:23 UTC · 21 de enero de 2025
La mayoría de la gente probablemente no se da cuenta de lo mala noticia que es Deepseek de China para OpenAI.
Han creado un modelo que iguala e incluso supera el último modelo o1 de OpenAI en varios puntos de referencia, y cobran solo el 3% del precio.
Es básicamente como si alguien hubiera lanzado un móvil a la par del iPhone pero lo vendiera a 30 dólares en lugar de 1.000. Es así de dramático.
Es más, lo están lanzando en código abierto, por lo que incluso tienes la opción (que OpenAI no ofrece) de no usar su API en absoluto y ejecutar el modelo "gratis" tú mismo. ...
La historia de fondo de DeepSeek también es sorprendente.
En 2007, tres ingenieros chinos se propusieron crear un fondo cuantitativo (de especulación financiera) utilizando inteligencia artificial. Contrataron a gente con ganas de invertir, recién salida de la universidad. Su fondo High-Flyer tuvo cierto éxito, pero en los últimos años el gobierno chino empezó a tomar medidas enérgicas contra la ingeniería financiera, el trading cuantitativo y la especulación.
Con tiempo libre y potencia informática sin utilizar en su trastienda, los ingenieros comenzaron a construir los modelos DeepSeek. Los costes fueron mínimos. Mientras que OpenAI, Meta y Google gastaron miles de millones para construir sus IA, los costes de entrenamiento para los modelos DeepSeek publicados fueron de apenas 5 a 6 millones de dólares.
Henry Shi @henrythe9ths - 23:20 · 20 de enero de 2025
  • ¿La lección?
  • A veces, tener menos significa innovar más. DeepSeek demuestra que no necesitas:
    - Miles de millones en financiación
    - Cientos de doctorados
    - Un pedigrí famoso
    Solo mentes jóvenes brillantes, el coraje de pensar de manera diferente y la determinación de nunca rendirse
    Otra lección es que las mentes jóvenes y brillantes no deben desperdiciarse para optimizar la especulación financiera, sino para crear cosas que se puedan usar.
    DeepSeek demuestra que es imposible utilizar barreras comerciales y tecnológicas para mantener la tecnología alejada de los competidores. Con recursos decentes, se puede simplemente innovar para evitarlas.
    Ni siquiera miles de millones de dólares, ruidosos comerciantes como Trump y estafadores que se autopromocionan como Sam Altman pueden competir con éxito con un grupo amplio de ingenieros bien capacitados.
    Como señala un autor de Guancha (traducción automática):
    En la guerra chino-estadounidense en materia de ciencia y tecnología, la ventaja única de China proviene precisamente de la prohibición estadounidense. Se puede decir que nuestra fuerte voluntad de sobrevivir fue expulsada por Washington, y maximizar nuestros recursos limitados es el secreto para abrirnos paso. En la historia, este tipo de historia no es nueva, es decir, los débiles prevalecen sobre los fuertes y los pequeños luchan contra los grandes.
    La parte estadounidense caerá en un dilema al estilo de Vietnam: confiará demasiado en su propia ventaja absoluta, desperdiciando así muchos recursos y perdiéndose a sí misma en el consumo interno.
    ¿Cuánto tiempo le llevará a Estados Unidos volver a aprender esa lección?

    TEMAS RELACIONADOS:


    Noticias relacionadas