Hogar » DeepSeek: ¿Por qué el mundo entero se está volviendo loco? ¿Qué está pasando en el fondo?

Soluciones de negocios

informática, telefonía

Trucos y consejos

Estilo de vida

10.02.2025 14:00

Compartir con otros:

DeepSeek: ¿Por qué el mundo entero se está volviendo loco? ¿Qué está pasando en el fondo?

Sabíamos que sucedería, pero ocurrió mucho antes de lo que esperábamos. Incluso en Estados Unidos pensaban que tenían al menos un año o dos de ventaja antes de que China los alcanzara en el campo de la inteligencia artificial.

DeepSeek es un nombre que ha infundido miedo en las empresas más grandes de Estados Unidos. No fue sólo OpenAI el que inició la locura por la inteligencia artificial (IA) generativa, sino también Google, Microsoft, Anthropic, Meta, Amazon y todos los demás que erróneamente pensaron que dominarían al menos por un tiempo más y atraerían miles de millones en inversiones y se asustaron.

Cuando la empresa china DeepSeek presentó su modelo de inteligencia artificial el mes pasado, sacudió los cimientos estadounidenses con el mensaje de que su modelo era equivalente, o en algunos aspectos incluso mejor, que los estadounidenses, y a una fracción del precio. Según se informa, el modelo DeepSeek-V3 requiere solo 6 millones de dólares en potencia informática para su entrenamiento, lo que no incluye “investigaciones previas y experimentos de ablación sobre arquitecturas, algoritmos o datos”.

Inmediatamente después de su lanzamiento, DeepSeek superó a ChatGPT en términos de calificaciones en la tienda móvil de Apple, y el número de descargas también está creciendo constantemente.

Las consecuencias fueron enormes. En Estados Unidos se preguntan si las enormes inversiones en IA eran realmente necesarias si sus colegas chinos fueron capaces de lograr el mismo resultado con escasas inversiones. Las acciones de las empresas, incluida Nvidia, cayeron y surgió nuevamente la pregunta de si este sería el momento en que estallaría la burbuja de la IA.

Por otro lado, muchos se preguntan si DeepSeek es realmente tan revolucionario como dice la compañía. ¿Están ocultando algo? ¿Qué utilizaron para entrenar su modelo?

¿Qué es DeepSeek?

DeepSeek es el nombre de una startup, un modelo de lenguaje a gran escala y un chatbot que funciona de manera similar a ChatGPT, Gemini y Copilot. La apariencia, el método de uso y también el método de comunicación son casi idénticos a las soluciones estadounidenses, por lo que la transición fue muy fácil para los usuarios y el uso ya les resultaba familiar.

¿Qué tan potente es y es realmente mejor que ChatGPT y los demás? La compañía dice que es tan poderoso como el modelo o1 de OpenAI, que se lanzó a fines del año pasado, en tareas como matemáticas y codificación. OpenAI presentó recientemente un nuevo modelo, el o3, que se dice que es más potente que todos los modelos en pruebas, pero aún no está disponible para el público para pruebas.

El último modelo R1 (DeepSeek) es un modelo de lenguaje de razonamiento. Igual que el modelo o1 de OpenAI. Estos modelos generan respuestas gradualmente y simulan la forma en que las personas piensan sobre los problemas o las ideas.

Inteligencia artificial DeepSeek ChatGPT-1

La mayor sorpresa fue el hecho de que solo se gastaron 6 millones de dólares en entrenar el modelo V3 que impulsa el chatbot. A modo de comparación, OpenAI gastó más de 100 millones de dólares en el desarrollo del modelo GPT-4, y Meta gastó alrededor de 60 millones de dólares en Llama. Lo lograron a pesar de las restricciones comerciales que han significado que China no ha tenido acceso oficialmente a los últimos chips durante algún tiempo.

Se dice que el fundador de DeepSeek ha acumulado chips Nvidia A100, cuya exportación a China está prohibida desde septiembre de 2022. Algunos expertos creen que combinó estos chips con otros más baratos y menos sofisticados, dando como resultado un proceso mucho más eficiente. DeepSeek también utiliza menos memoria que sus competidores, lo que en última instancia reduce el costo de ejecución de tareas para los usuarios.

También hay rumores de que la compañía realmente está utilizando los últimos chips Nvidia H100, pero no hay pruebas concretas y la compañía aún no ha comentado las "acusaciones".

Una nueva investigación independiente de SemiAnalysis dice que gastaron alrededor de 500 millones de dólares en hardware. Su ritmo vertiginoso de desarrollo de modelos de IA equivalentes también está bajo el escrutinio de OpenAI, que sospecha que la empresa china ha "destilado sus modelos".

Poco después de su lanzamiento y de ganar popularidad en la Apple Store, DeepSeek comenzó a experimentar interrupciones. El chatbot no estuvo disponible durante mucho tiempo y las empresas y los desarrolladores no tenían acceso a su API. La compañía anunció que había sido blanco de ataques maliciosos, que ralentizaron sus operaciones y restringieron temporalmente el registro.

¿Quién lidera la revolución de la IA en China?

DeepSeek no apareció de la noche a la mañana, pero hasta el mes pasado no atrajo mucha atención de los medios, a pesar de que se sabía que estaba desarrollando modelos de IA. La startup es propiedad mayoritaria de Liang Wenfeng, quien también es cofundador del fondo de inversión High-Flyer. Este último anunció en marzo de 2023 que estaba iniciando un nuevo proyecto y estableciendo un "grupo de investigación nuevo e independiente para explorar la esencia de la inteligencia artificial general". Unos meses más tarde, adquirimos la empresa DeepSeek. Atrajeron a talentos jóvenes y experimentados principalmente con la promesa de altos salarios y la oportunidad de trabajar en proyectos de investigación únicos.

No está claro cuánto invirtió High-Flyer en DeepSeek. High-Flyer tiene una oficina en el mismo edificio que DeepSeek y, según datos de los registros de empresas chinas, también posee patentes relacionadas con chips utilizados para entrenar modelos de inteligencia artificial.

¿Cómo proceder?

DeepSeek describió en la investigación cómo entrena sus modelos. Como la empresa oficial no tiene acceso a los mismos chips que sus competidores estadounidenses, tuvo que encontrar otra forma.

Los principales sistemas de inteligencia artificial aprenden sus habilidades encontrando patrones en grandes cantidades de datos, incluidos texto, imágenes y sonidos. DeepSeek describió una forma de distribuir este análisis de datos entre múltiples modelos de IA especializados, minimizando al mismo tiempo el tiempo perdido en la transferencia de datos de un lugar a otro.

Otros han utilizado métodos similares anteriormente, pero mover datos entre modelos generalmente ha reducido la eficiencia. DeepSeek hizo esto de una manera que le permitió utilizar menos potencia informática.

El costo y el método de entrenamiento no son las únicas diferencias en comparación con otros modelos de IA. DeepSeek también es de código abierto, lo que significa que prácticamente cualquier persona puede descargarlo, usarlo y actualizarlo.

Por el contrario, los modelos de Meta y Google, aunque están disponibles para que cualquiera los vea, no se consideran verdaderamente de código abierto, ya que la forma en que los usuarios utilizan los modelos está restringida por licencias, y los conjuntos de datos de entrenamiento no están disponibles públicamente y también han sido objeto de numerosas demandas. Por ejemplo, Facebook, o Meta, están en una batalla legal con autores que acusan a la compañía de utilizar copias pirateadas de sus libros con fines didácticos. El New York Times está demandando a Microsoft y OpenAI por supuestamente utilizar su contenido con fines educativos sin permiso.

Una de las razones por las que los modelos de UI estadounidenses no son de código abierto es la mayor posibilidad de difundir información falsa, discursos de odio y similares, pero la principal es sin duda el beneficio y más oportunidades de monetizar los modelos de UI.

Los modelos chinos de código abierto, según los expertos, pueden democratizar la inteligencia artificial, lo que podría socavar gravemente la estrategia de las empresas estadounidenses. El temor es que las empresas y los científicos estadounidenses también comiencen a utilizar DeepSeek para desarrollar y construir sus propias soluciones.

En China, el último modelo ya ha sido utilizado por empresas de telecomunicaciones, y Geely es la primera entre las empresas automotrices en integrar el modelo DeepSeek en los sistemas inteligentes de sus automóviles.

Mientras tanto, en otras partes del mundo ya se plantea un posible bloqueo. Italia, Irlanda, Bélgica, Países Bajos y Francia son países que ya han iniciado una investigación sobre cómo DeepSeek utiliza y almacena los datos y si puede estar violando las regulaciones de datos europeas. DeepSeek está bloqueado preventivamente en Italia y su uso también está prohibido en Corea del Sur y Australia.

DeepSeek dice que han tomado todas las medidas de seguridad para proteger los datos que almacenan en China. Pero no pasó mucho tiempo antes de que los expertos descubrieran que la compañía había dejado accidentalmente millones de líneas de datos sin protección, incluidas claves de software, registros, chats y más.

Cisco analizó el último actor de IA y descubrió que “DeepSeek R1 carece de protecciones sólidas, lo que lo hace altamente susceptible a avances algorítmicos y posibles abusos”.

Se ha abierto un nuevo frente

En enero de 2025, Estados Unidos era el único caballo en la carrera, y los jinetes estadounidenses no necesitaban recurrir a nadie en el interior del país. Ahora China les está pisando los talones. Desde hace tiempo existe un frente comercial y tecnológico abierto entre Estados Unidos y China, y DeepSeek ha abierto un nuevo frente en el que se decidirá el destino de la inteligencia artificial.