He estado jugando más con Deepseek, y debo decir que es una auténtica pasada, al nivel de los modelos más top del momento y encima gratis.
Hilo con mis impresiones y las ventajas que le veo respecto a o1 de OpenAI:
👇
DeepSeek es una familia de modelos chinos open source, desarrollados por un fondo de inversión como side project (o esa es la historia oficial).
Sus últimos modelos son V3, que ya igualó y hasta superó en rendimiento a GPT-4o de OpenAI, y R1, su modelo de razonamiento.
👇
Si V3 ya había sorprendido, R1 ha sido la revolución.
No sólo iguala a o1 de OpenAI, hasta ahora el único modelo con razonamiento lanzado oficialmente (el de Google es experimental), sino que dicen haber gastado mucho menos en entrenamiento y han usado un nuevo método.
👇
Simplificando, la diferencia de su método es que sólo usan RL (Reinforcement Learning) para guiar el "razonamiento" del modelo hacia la mejor respuesta posible.
No parten de un fine tuning supervisado (SFT) para guiar el proceso de razonamiento, como sí ha hecho OpenAI.
👇
¿El resultado? Compruébalo tú mismo en el chatbot gratuito de DeepSeek, y marcando el botón de DeepThink R1: chat.deepseek.com/
La principal diferencia respecto a o1 de OpenAI es que podemos ver su hilo de razonamiento, lo cual mola (Gemini 2.0 Flash también hace esto)
👇
Para mí la mayor ventaja y que hasta ahora no ofrece ningún otro: puedes usar al mismo tiempo el modo de razonamiento y la búsqueda web.
Es como si pudieras usar SearchGPT y o1 al mismo tiempo. Gemini tampoco permite combinar su 2.0 Flash con grounding en resultados web.
👇
Al combinar estos dos "super poderes" se reducen mucho las alucinaciones. Por lo que he podido ver, al fin se pueden obtener respuestas útiles sobre temas oscuros o muy longtail.
Si algo está en internet, aunque sea en un rincón recóndito, DeepSeek R1 podrá razonar sobre ello
En lo negativo, DeepSeek no está exento de sesgos o censura, sólo que es un sesgo muy diferente al acostumbrado en los modelos de Silicon Valley.
No se os ocurra preguntarle por política china. Según R1, el gobierno chino nunca se equivoca... 😅 x.com/benhylak/status/1882521144827531333