Hogar » ¿Es realmente tan bueno el modelo de inteligencia artificial DeepSeek del que habla todo el mundo?

Software

30.01.2025 08:01

Compartir con otros:

¿Es realmente tan bueno el modelo de inteligencia artificial DeepSeek del que habla todo el mundo?

Todos los que seguimos al menos un poco más regularmente el campo del desarrollo de la inteligencia artificial nos preguntamos lo mismo: ¿será el modelo de IA chino DeepSeek el que superará al estadounidense y asumirá el papel protagonista?

DeepSeek es actualmente el modelo de inteligencia artificial más popular y ocupa el primer puesto en la AppStore de Apple en los EE. UU. y el Reino Unido. Se trata de un modelo de IA completamente gratuito de la startup china DeepSeek, que tiene como objetivo llevar la inteligencia artificial a un público más amplio. ¿Cómo? Con una versión gratuita del competidor del modelo o1 ChatGPT de OpenAI.

Casi todos los días aparecen nuevas aplicaciones de interfaz de usuario en la App Store y suele haber mucho revuelo en torno al lanzamiento de un nuevo modelo mientras la gente busca la próxima alternativa a ChatGPT. Ya sea que seas fanático del software OpenAI o prefieras usar Google Gemini, hay una herramienta de interfaz de usuario para todos, y DeepSeek quiere ser el próximo ícono en tu pantalla de inicio.

El sitio web Tech Radar decidió probar los modelos DeepSeek V3 y DeeThink R1 y compararlos con ChatGPT 4o y o1. El objetivo principal de la comparación fue determinar si las publicaciones de los usuarios en línea están justificadas y si DeepSeek realmente representa una amenaza para los modelos de IA estadounidenses que hasta ahora han reinado supremos en el mercado de inteligencia artificial generativa.

Primero lo básico

En la prueba, Tech Radar quería obtener una visión completa de todo lo que DeepThink tiene para ofrecer en comparación con ChatGPT, por lo que parecía justo utilizar el chatbot de IA de la misma manera que uno usaría una IA en la vida cotidiana.

ChatGPT o4 y DeepSeek V3 comenzaron pidiendo a ambos modelos que crearan una programación diaria con información sobre cuándo se despierta el usuario, la rutina del perro y un breve desglose del trabajo. Ambos modelos crearon fantásticos horarios que el usuario podía utilizar prácticamente todos los días. Sin embargo, la función de memoria ChatGPT hizo que la programación fuera más coherente.

Para empezar, es importante señalar que DeepSeek solo puede recordar información del mismo chat y no puede acceder a información de chats anteriores para ayudarlo a responder.

Explícamelo como si tuviera 5 años.

Luego, Tech Radar preguntó a ambas modelos sobre los playoffs de la muy popular liga NFL. Pidieron un resumen de 200 palabras del concepto de los playoffs de la NFL. Ambos modelos proporcionaron excelente información que permitió comprender completamente cómo funciona el sistema y el camino que debe tomar un equipo para llegar al Super Bowl.

ChatGPT optó por un párrafo de 200 palabras, mientras que DeepSeek dividió la información en viñetas. Notaron que ChatGPT proporcionó más contexto sobre cómo los equipos obtienen una invitación a una liga especial, pero la diferencia entre los resultados es bastante pequeña y probablemente te gustará uno más que el otro basándose únicamente en tus preferencias personales.

Resolución de problemas

Después de cubrir los conceptos básicos, llegaron a la pregunta principal, es decir, si DeepThink R1 está a la altura de las expectativas. En línea, los usuarios escriben que el modelo gratuito DeepThink R1 es tan bueno como el ChatGPT o1, que está disponible de forma gratuita hasta cierto punto, pero requiere una suscripción para tener acceso completo.

Para probar la capacidad de razonamiento de los chatbots, buscaron algunos de los desafíos más difíciles que pudieron encontrar. Quedaron impactados por ciertos resultados:

Pregunta 1: Encuentra la palabra que falta: manzana, rojo, carbón

Para la prueba, decidieron evitar las preguntas de opción múltiple y en su lugar simplemente escribieron la pregunta y presionaron Enter.

ChatGPT o1 tardó 1 minuto y 29 segundos en responder y encontró conexiones entre las palabras y el cuento de hadas Blancanieves. La modelo decidió responder basándose en esta cita: “Sus labios eran rojos como la sangre, su cabello era negro como el carbón y su piel era blanca como la nieve.". Basándose en esta cita, o1 eligió Nieve como respuesta a la palabra que faltaba. Aunque el proceso de pensamiento era el modelo o1, no era la respuesta que buscaban.

DeepThink R1, sin embargo, tardó 1 minuto y 14 segundos en responder y logró adivinar la palabra correcta: Negro. La manzana es roja; El carbón es negro. Impresionante, por decir lo menos.

Pregunta 2: 1. Completa la secuencia: 1, 2, 4, 8, ? 2. Completa la secuencia: casa, Saturno, perro, hamburguesa, ?

Aunque la primera secuencia es muy fácil, la segunda es imposible (son sólo cuatro palabras al azar). ¿Podrían ChatGPT o1 o DeepThink R1 detectar la trampa?

Ni siquiera. Ambos modelos intentaron encontrar una respuesta y dieron una completamente diferente. DeepThink R1 respondió “amarillo” porque pensó que las palabras estaban relacionadas con su color (casa blanca, Saturno amarillo, perro marrón, hamburguesa amarilla). ChatGPT o1, por otro lado, respondió “coche” porque encontró la secuencia casi imposible, pero decidió ofrecer respuestas basadas en un “enfoque de rompecabezas clásico”. El enfoque que eligió fue asociar cada objeto con la categoría más grande a la que pertenece (casa = edificio, Saturno = planeta, perro = animal, hamburguesa = comida y automóvil = vehículo).

Al final, ambos modelos estaban equivocados y ninguno respondía de manera que estableciera claramente que había demasiadas variables para dar una respuesta precisa.

¿DeepSeek frente a ChatGPT?

Tech Radar ha probado ambos modelos de varias maneras y ahora la pregunta es: ¿cuál es mejor? Según las respuestas que recibieron durante las pruebas, DeepThink R1 es un excelente modelo de inferencia gratuito que puede hacerte preguntarte si vale la pena pagar por el acceso a o1. DeepSeek solo está disponible en línea, en la App Store de iOS y Play Store, y es probable que próximamente esté disponible una aplicación independiente para Mac o iPad.

Tech Radar decidió seguir con ChatGPT, principalmente porque dependen en gran medida de la función de recuerdos, que permite al chatbot hacer referencia a conversaciones anteriores. ChatGPT también se beneficia de una aplicación independiente para dispositivos Mac y iPad, así como de la capacidad de crear imágenes con uno de los mejores generadores de imágenes de inteligencia artificial, DALL-E.

DeepSeek se basa únicamente en texto y carece de capacidades multimodales, pero dado que este es solo el comienzo de su viaje, es un competidor muy serio en el campo de los modelos de UI, y definitivamente escucharemos mucho sobre él.