Noticias de IA

Jardines Vallados en AI: ChatGPT vs Claude vs Gemini

Los chatbots, ChatGPT o Gemini o Claude, son de la tecnologia que más rapido creció en la historia; literalmente cientos de miles de millones de dólares están siendo invertidos para que OpenAI, Anthropic o Google sean los ganadores de esta carrera y adquieran clientes lo más rápido posible; ¿la razón? una vez que empezás a usar un chatbot el lock-in para cambiar a otro es gigante y no lo vas a querer hacer.

Primer ¿Qué es lock-in? En el contexto de la tecnología, lock-in es la dependencia que se genera hacia un proveedor o producto, dificultando cambiar a una alternativa como el cambiar de iPhone a Android o de Windows a Mac. En el caso de los chatbots de IA –especialmente ChatGPT (OpenAI), Claude (Anthropic) y Gemini (Google)– existen mecanismos que fomentan esta fidelidad forzada y lo interesante es que podemos dividir en 3 contextos el lock-in en estos productos: (a) técnico, (b) producto y (c) el de uso.

Lock-in técnico (dependencia de la tecnología)

En el plano técnico, esto es más relevante para usuarios B2B (o sea, no finales) los tres modelos son cerrados y propietarios, lo que implica que dependes de la infraestructura y avances del proveedor:

  • ChatGPT (OpenAI): Funciona con modelos como GPT-4 que no son de código abierto, accesibles solo a través de la API o la interfaz de OpenAI. Si construís soluciones o flujos de trabajo basados en GPT-4, migrar a otro modelo requeriría re-desarrollar integraciones y puede implicar perder la calidad o afinación específica lograda. Por ejemplo, muchas empresas han incorporado la API de ChatGPT en sus productos; salir de ahí supone re-entrenar modelos alternativos o aceptar resultados diferentes. Además, OpenAI ofrece opciones de fine-tuning (ajuste fino) en algunos de sus modelos: una vez que entrenas GPT con datos propios, ese ajuste no es portátil a otros sistemas, incrementando la dependencia técnica.
  • Gemini (Google): Es la familia de modelos de lenguaje de Google (evolución de PaLM y de Bard). Al igual que ChatGPT, es un servicio cerrado en la nube de Google, sin opción de auto-hospedaje. El acceso suele ser mediante la app de Gemini (antes Bard) o APIs de Google. Esto crea lock-in porque cualquier solución construida sobre Gemini queda atada a Google Cloud y a sus condiciones. Además, como Google utiliza hardware optimizado (TPUs) y una integración profunda con su ecosistema, se dificulta replicar la solución fuera de su plataforma, así que quienes dependen de su capacidad (por ejemplo, en multi-modalidad o en comprensión de consultas complejas) se ven obligados a seguir usando los servicios de Google.
  • Claude (Anthropic): También es un modelo propietario ofrecido a través de API y aplicaciones asociadas (como la integración nativa en Slack o la plataforma web de Anthropic). Un ejemplo, Claude destacó por innovar en el tamaño de la ventana de contexto –pudiendo manejar hasta 100,000 tokens en Claude 2– lo que significa que puede leer documentos o conversaciones muy extensas. Si tu caso de uso aprovecha esa capacidad (por ejemplo, cargar informes largos para análisis), puedes quedar bloqueado en Claude porque otros bots (hasta hace poco) no manejaban tanto contexto. Nuevamente, al no ser open-source, no es posible llevar el modelo fuera de Anthropic. Así, a nivel técnico, los tres chatbots generan un lock-in similar: utilizan modelos de IA exclusivos y nativos de cada proveedor, obligando a permanecer en sus plataformas para mantener el mismo rendimiento.

Lock-in de producto (ecosistema y funcionalidades)

Cada servicio de chatbot construye funciones y ecosistemas en torno al modelo base, lo que refuerza la lealtad del usuario al producto:

  • ChatGPT: OpenAI ha convertido ChatGPT en una plataforma con características únicas. Por ejemplo, introdujo un ecosistema de plugins donde el chatbot puede conectarse con servicios de terceros (buscador de vuelos, bases de conocimiento, herramientas como Wolfram Alpha, etc.), ampliando enormemente lo que puede hacer. Estos complementos resuelven tareas dentro de ChatGPT, evitando que el usuario salga a otras apps. Asimismo, OpenAI agregó capacidades multimodales: ChatGPT puede analizar imágenes y voz, integrando funcionalidades que antes requerían herramientas separadas. También funciones como Code Interpreter (ahora llamado “Advanced Data Analysis”) permiten ejecutar código y procesar archivos dentro de la misma interfaz de chat. Todas estas facilidades hacen que el usuario encuentre en ChatGPT un “todo en uno”, dificultando reemplazarlo con otro bot que no tenga un repertorio de plugins o características equivalente.
  • Gemini (Google): La estrategia de Google para Gemini (y Bard) es apoyarse en su amplio ecosistema de servicios. Gemini está integrándose con las aplicaciones de Google que millones de personas usan a diario. Por ejemplo, con las Extensiones de Bard/Gemini, el asistente puede extraer información de Gmail, Google Drive, Maps, YouTube y otras apps directamente dentro de la conversación . Esto significa que un usuario de Gmail o Docs puede pedirle a Gemini que encuentre un correo específico, resuma un documento de Drive o planifique un viaje con datos de Maps, todo sin salir del chat. Este nivel de integración es un poderoso lock-in de producto: si tu vida digital está en Google (correo, fotos, documentos, calendario), es muy tentador usar el chatbot nativo que “habla” con esas apps. Gemini con personalización incluso usa tu historial de búsquedas de Google para dar respuestas adaptadas a tus intereses , y Google planea conectarlo también con Fotos y YouTube . En conjunto, Gemini se vuelve una pieza central del ecosistema Google –un asistente personal omnipresente– del que es difícil salir sin perder comodidades.
  • Claude: Anthropic, aunque más nuevo en el plano de producto de consumo, ha buscado nichos específicos para Claude. Un factor importante es la integración empresarial: por ejemplo, Slack incorporó a Claude como parte de sus herramientas (Slack GPT), lo que atrae a equipos de trabajo a usar Claude dentro de su flujo laboral. Si tu empresa comienza a usar Claude en Slack para asistencia en canal, quedas ligado a ese entorno. En cuanto a funcionalidades diferenciadoras, Claude ofrece estilos personalizables (Anthropic introdujo Claude Styles a fines de 2024 para ajustar la personalidad o tono del bot) . Sin embargo, en general Anthropic ha mantenido una interfaz más sencilla. No tiene, por ahora, un sistema de plugins tan amplio ni capacidades multimediales visibles al usuario común. Su ventaja de producto recae más en la experiencia de conversación (se percibe amistoso y bueno en tareas creativas) y en límites más amplios (contexto extenso, respuestas más largas), lo cual fideliza a usuarios que necesitan esas cualidades. Aun con menos “campanas y silbatos” que ChatGPT o Google, Claude genera lock-in si has adaptado tu flujo de trabajo a sus puntos fuertes (ej. cargar grandes documentos, uso en herramientas como Notion o Slack mediante API).

Lock-in de uso (memoria, personalización y datos del usuario)

Captura: Ajustes de memoria en ChatGPT. La IA va recordando detalles proporcionados por el usuario para personalizar futuras respuestas (por ejemplo, preferencias de formato, datos personales mencionados, etc.). Este perfil almacenado hace que mientras más uses ChatGPT, más se adapte a ti, fortaleciendo el lock-in .

El lock-in más sutil –y quizás más poderoso– surge del historial de uso y la personalización. A medida que interactúas con el chatbot, este puede aprender sobre tus preferencias, contexto y necesidades, creando un perfil que enriquece las siguientes respuestas. Cada servicio ha implementado esta idea de memoria de manera diferente:

  • ChatGPT: OpenAI introdujo la memoria activa entre conversaciones en 2024. Ahora ChatGPT puede referenciar todas tus conversaciones pasadas para darte respuestas más relevantes y personalizadas . Por ejemplo, recuerda que tienes una hija pequeña o que te gusta cierto estilo de resumen si se lo has mencionado, y aplicará ese contexto automáticamente en nuevas sesiones. Además, las instrucciones personalizadas permiten fijar datos o indicaciones persistentes sobre ti (rol, tono deseado, información clave) sin tener que repetirlas en cada chat. En conjunto, “mientras más usas ChatGPT, más útil se vuelve” porque cada nueva conversación se construye sobre lo que ya sabe de ti . Esto crea un fuerte lock-in de uso: después de semanas o meses, ChatGPT “te conoce” y cambiar a otro chatbot implicaría perder esa familiaridad. Hay que destacar que esta memoria es persistente y unificada: no distingue entre diferentes contextos o proyectos, lo que puede llevar a que detalles de un ámbito aparezcan en otro si no se tiene cuidado  . Aun así, desde el punto de vista de la fidelización, este perfil global anima a usar siempre la misma IA para no empezar desde cero en cada nueva plataforma.
  • Gemini (Google): Google, tras un periodo más conservador, ha incorporado recientemente funciones de memoria y contexto personal en Gemini. En 2024 permitía que el usuario le pida “recuerda que me interesa X”, pero desde agosto de 2025 ya recuerda detalles previos automáticamente si activas esa opción . Con la función Personal Context (Contexto personal) encendida, Gemini “aprende de tus conversaciones pasadas para brindar respuestas relevantes y a tu medida”  . Un ejemplo dado por Google: si antes hablaste con Gemini sobre ideas para un canal de YouTube de cultura japonesa, más adelante, al pedir nuevas ideas, te sugerirá algo relacionado (como comida japonesa) sin que tengas que recordárselo  . Asimismo, Gemini aprovecha datos de tu cuenta Google (p. ej. historial de búsquedas) para afinar respuestas a tus intereses . En esencia, Google busca construir un asistente personal inteligente completamente integrado a tu vida digital: “nuestra visión es un asistente de IA que aprende y te entiende verdaderamente”, dijo un director del proyecto . Esto evidentemente aumenta la dependencia: un usuario que habilita estos recuerdos en Gemini verá cómo el asistente cada vez le ahorra más contexto y le entrega respuestas a la carta, volviéndose difícil renunciar a esa comodidad. (Vale mencionar que Google activa esta personalización por defecto en ciertos países, aunque permite desactivarla ). En resumen, tu actividad previa en Google se convierte en valor añadido exclusivo de Gemini, cerrando la puerta a competidores que no pueden acceder a esos datos.

Captura: Búsqueda de conversaciones pasadas en Claude 2. El usuario pregunta “¿en qué estábamos trabajando antes de mis vacaciones?” y Claude localiza y resume el chat relevante. A diferencia de ChatGPT, Claude no mezcla contextos automáticamente: solo recupera aquello que se le solicita , evitando construir un perfil unificado del usuario.

  • Claude (Anthropic): La aproximación de Anthropic ha sido más enfocada en el control del usuario que en la proactividad. Durante mucho tiempo, Claude no guardaba memoria persistente entre chats –cada conversación era aislada–. En agosto de 2025 lanzaron una función de “Conversa y busca” que permite al usuario consultar conversaciones previas cuando lo necesite . Por ejemplo, puedes indicarle a Claude: “revisa lo que discutimos la semana pasada sobre el Proyecto X” y el sistema buscará en tus chats archivados para traer los detalles relevantes . Importante: “Claude solo recupera y referencia tus chats pasados cuando se lo pides, y no está construyendo un perfil de usuario según aclaró Anthropic . Es decir, no hay memoria automática cruzada; tú decides cuándo y qué recordar. Esto tiene dos caras para el lock-in: por un lado, ofrece menos personalización espontánea que ChatGPT o Gemini, lo que podría significar un vínculo menos fuerte (el usuario no siente que Claude “lo conoce” de manera profunda). Pero, por otro lado, algunos usuarios profesionales pueden preferir esta compartimentación. Claude introdujo el concepto de “memoria por proyecto”, donde los recuerdos no se mezclan entre distintos temas o clientes  . Esto evita filtraciones de información de un contexto a otro y da más confianza para usar la herramienta en entornos sensibles. Si tu prioridad es ese control, podrías volverte leal a Claude precisamente porque no te arriesga con memorias fuera de lugar. En síntesis, el lock-in de uso en Claude es más débil en términos de perfil personal global, pero Anthropic apuesta a fidelizar mediante la transparencia y seguridad: tú mandas sobre qué se recuerda y cuándo, y no tienes sorpresas de la IA sacando datos antiguos sin pedirlo . Aun con enfoques distintos, todos los proveedores reconocen que la memoria es clave para enganchar a los usuarios: “las funciones de memoria buscan atraer y mantener usuarios en un servicio, aumentando la ‘pegajosidad’” .

Antes era "interoperabilidad" ahora ¿podés llevarte tu contexto de un chatbot a otro?

La realidad actual es que no existe portabilidad fácil de un contexto personalizado entre distintas plataformas. Cada proveedor guarda tus datos de manera propietaria y no ofrece, por ejemplo, una exportación de “lo que la IA ha aprendido de mí” en formato estándar. Si quisieras cambiar de bot, prácticamente tendrías que empezar de cero o manualmente resumir y reenviar la información relevante.

Por ejemplo, ChatGPT permite ver y editar lo que recuerda de ti en sus ajustes de memoria, e incluso exportar tus conversaciones en un archivo, pero otro chatbot no sabría interpretar directamente esos datos para replicar el mismo entendimiento. De forma similar, Gemini podría estar usando tu historial de búsquedas y otros datos de Google –los cuales no puedes simplemente transferir a un rival, por privacidad y formato–. Claude, al no compilar un perfil único, te lo pone un poco más fácil en el sentido de que lo que necesita saber, tú se lo das explícitamente (y podrías dárselo igualmente a otro bot). Aún así, no hay una API universal ni estándar de “memoria de usuario” que permita llevar tu contexto personal de ChatGPT a Gemini o viceversa. Esta falta de portabilidad es deliberada hasta cierto punto: como vimos, la memoria y personalización son ventajas competitivas y mecanismo de lock-in. Cada empresa quiere que los beneficios de “conocerte bien” se queden dentro de su producto.

¿Y Meta AI?

Aunque Meta también lanzó su propio chatbot, no lo incluimos en este análisis por dos motivos principales:

  1. Nivel de adopción: hoy Meta AI está principalmente integrado en productos como Facebook, Instagram o WhatsApp, pero su alcance como asistente independiente es todavía limitado comparado con ChatGPT, Gemini o Claude.
  2. Estrategia distinta: Meta apuesta a modelos abiertos como Llama para impulsar su IA. Su jugada es más bien construir un ecosistema de desarrolladores y empresas que adopten su tecnología, en lugar de generar lock-in sobre un único asistente centralizado con memoria y personalización.

En otras palabras, la competencia de Meta es más horizontal (distribución de modelos abiertos) que vertical (chatbot con lock-in directo), y por eso este post se centra en quienes hoy disputan el lock-in de los usuarios finales.

Los chatbots de IA más avanzados están desplegando una combinación de estrategias para mantenernos enganchados en sus plataformas. En lo técnico, nos atan con modelos potentes pero propietarios y difíciles de reemplazar. A nivel de producto, nos seducen con integraciones y funciones exclusivas (ya sean plugins, acceso al ecosistema Google, o contextos gigantes para manejar nuestros datos). Y mediante el uso continuado, construyen una relación cada vez más personalizada –ya sea mediante un perfil unificado como ChatGPT/Gemini, o con memorias controladas por el usuario como Claude– que hace que cambiar de chatbot se sienta como retroceder.

Como usuarios o creadores de contenido, es importante ser conscientes de estos lock-ins. Disfrutar de la conveniencia de que “mi chatbot ya sabe lo que quiero” es genial, pero implica confiar nuestros datos y preferencias a un silo específico. Por ahora, mover nuestro “yo digital” de una IA a otra no es sencillo, así que elegir con cuál casarse no es trivial. La competencia entre OpenAI, Anthropic y Google está llevando a rápidos avances –todos han acelerado en incorporar memoria y personalización – lo que beneficia al usuario en funcionalidad. Pero también refuerza que cada uno quiera ser “el asistente del que no te puedes desprender”.

En última instancia, un posible camino para aliviar el lock-in sería que aparezcan estándares abiertos o asistentes locales que permitieran portar nuestras instrucciones y datos de contexto de forma privada. Sin embargo, hoy por hoy, si inviertes tiempo en un chatbot, tiendes a quedarte con él por inercia y beneficio acumulado.

Este es un mercado donde habrán pocos ganadores y por eso cada uno quemando decenas de miles de millones de inversores; porque una vez elegido es muy dificil que lo dejes; la elección racional seria: "elegir aquel que se alinee con tus valores (privacidad, control) y necesidades, sabiendo que cambiar de barco más adelante tendrá sus costos" pero ¿como lo podrías saber si ni siquiera creo que lo sepan ellos mismos?

| Inteligencia Artifical
Tags:
Anthropic Google IA innovación inversiones openai privacidad

Juniors por AI: la forma más rápida de destruir el pipeline de talento

Hoy Matt Garman, el jefe de AWS dijo en voz alta algo que repito en las charlas sobre AI: reemplazar a los empleados junior con herramientas o agentes de inteligencia artificial es una de las ideas más estúpidas que existen.

Si uno analiza como se forma un ecosistema de trabajo, como se arma una carrera, como se desarrolla el talento y hasta los costos organizacionales... lo único que estás haciendo es confirmar una tesis que sostengo hace tiempo: usar AI para “sacar del medio” a los juniors es destruir a largo plazo la base del talento de cualquier organización.

  • El pipeline de talento se rompe: Un junior necesita aprender haciendo. Es en esa etapa donde se equivocan, reciben feedback y crecen para convertirse en seniors. Si cortás esa experiencia porque la “reemplaza” la AI, estás matando el semillero del que salen los futuros líderes.
  • Rompés la estructura de costos del talento: El modelo natural es que juniors hagan tareas más operativas mientras crecen, liberando a los seniors para trabajos de mayor impacto. Si eliminás juniors, los seniors terminan atascados en tareas que la AI todavía no puede resolver sola. Resultado: ineficiencia y costos más altos.
  • Perdés diversidad de perspectivas: No es solo cuestión de edad: los juniors suelen venir con nuevas herramientas, marcos mentales distintos y otra forma de ver los problemas. Quitar esa capa del equipo empobrece la toma de decisiones y refuerza la homogeneidad.
  • Son los más nativos en AI: El talento joven no necesita que lo convenzas ni le armes talleres para usar herramientas de inteligencia artificial. Ya las adoptan de forma natural. Reemplazarlos es perder el grupo que mejor y más rápido incorpora la AI en los procesos.

Es cierto, los agentes y los modelos que estan apareciendo día a día pueden hacer mil tareas "básicas" y soy el primero en pensar que se pueden optimizar y reemplazar procesos y talento (hey, es algo natural como parte del progreso) pero creo, más allá del interés corporativo de AWS, que la mejor apuesta es potenciar el talento joven con herramientas y agentes de IA en vez de reemplazarlo directamente.

| Inteligencia Artifical
Tags:
AI IA talento

"There is no spoon": Por qué los LLMs no 'alucinan'

Recuerdo en The Matrix cuando Neo llega a conocer a The Oracle: ahí se da cuenta de que no hay una cuchara, sino solo la representación mental de una cuchara. Es entonces cuando comprende que la realidad no es como la percibimos, sino una interpretación que hace nuestro cerebro: lo mismo nos pasa cuando imaginamos que un LLM alucina o que entiende inherentemente lo que le preguntamos.

La cita de The Matrix funciona aquí como una metáfora clave: “No existe la cuchara” en el sentido de que el modelo no tiene ninguna percepción o concepto inherente de la realidad; está imitando patrones estadísticos sin una comprensión o creencia subyacente. Por eso en lugar de tratar de “ver la cuchara” (o una realidad concreta), un LLM se limita a procesar y reproducir correlaciones.

El “fallo” en el sistema es de nuestra percepción humana cuando se espera una precisión o intencionalidad que el modelo no puede ofrecer, no es un fallo del modelo.

Leer completa
| Inteligencia Artifical Rants
Tags:
AI IA innovación LLMs

OpenAI y las oportunidades inevitables

Esta semana el uso de inteligencia artificial en el cine es parte del reclamo en la huelga de los escritores, también el uso de inteligencia artificial en la creación de las animaciones en Secret Invasion desató quejas y amenazas de más huelgas…

Esta misma semana Carlos Banon, un arquitecto multi-premiado, decidió crear un curso para “expandir conceptos arquitectónicos con comandos de Midjourney y desarrollar skills de control de geometría, materiales y creación de atmósferas usando stable Difussion y ControlNet

It was the best of times, it was the worst of times, it was the age of wisdom, it was the age of foolishness, it was the epoch of belief, it was the epoch of incredulity, it was the season of light, it was the season of darkness, it was the spring of hope, it was the winter of despair.

Charles Dickens, A Tale of Two Cities

Esta misma semana salió un estudio donde se muestra que el 92% de los developers de software usan Copilot y “Over 80% of developers believe that AI-powered coding tools can enhance team collaboration, improve code quality, speed project completion and improve incident resolution

Mientras una industria abraza una tecnología como un copiloto que la ayuda a mejorar sus capacidades creativas (evitando lo repetitivo) y otra industria trata de buscar el espacio donde se puede mejorar (la idea de crear atmósferas en arquitectura usando motores OSS!) hay otras que tratan de frenar el uso de la tecnología y frenar a los que la están usando.

El cambio es inevitable… pero estas herramientas son un copiloto y amplían tu capacidad creativa y de protototipadp liberando espacio repetitivo y solitario.

| Inteligencia Artifical Rants
Tags:
Estrategias IA openai

La carta abierta con la inteligencia artificial

Ayer se conoció una carta abierta con mas de mil firmas pidiendo que se abra un período de "freno" al desarrollo y entrenamiento de modelos de inteligencia artificial (LLM) superiores a GPT-4 por seis meses porque "no se entienden los alcances de esta tecnología". Los medios corrieron a publicarlo en medio de advertencias sobre el poder de la Inteligencia Artificial General; en Linkedin varios gurús hablaron de un apocalipsis mientras otros pedimos calma.

Hoy se descubrió que la carta estaba financiada por Elon Musk, que en las "mil firmas de científicos e investigadores" había muchas falsificadas y que otros tampoco estaban de acuerdo con el texto final.

Primero lo importante: ¿tiene sentido pedir que se frene el avance de los LLM?

Realmente no tiene sentido, arrancando por el hecho de que un modelo de linguistico grande (LLM) está muy lejos de ser una inteligencia artificial general capaz de sustituir y dominar a los humanos; de hecho incluso los firmantes de esa carta lo reconocen con lo que de movida no tiene sentido el pedido.

Segundo, ¿están pidiendo que "el Estado establezca una moratoria de seis meses"? ¿Qué aplicabilidad real tiene el pedido de algo a escala mundial cuando ni siquiera se pueden regular conceptos básicos como la exportación de tecnología a "estados rebeldes"?

Pero más allá de eso los "threat actors" que descubrieron en esto una nueva herramienta para sus intereses ¿van a frenar porque lo piden académicos? Si era así de simple, deberían pedir que se dejen de cometer crímenes :)

¿Porque Elon financió esta carta?

En 2016 cuando se funda Open AI, Elon Musk estaba en el grupo fundador y se comprometió a poner 1.000 millones, pero en 2018 se imaginó que el podía hacer mejor trabajo que el equipo liderado por Sam Altam entonces quiso tomar control de la iniciativa.

Le dijeron que no (porque no podia manejar Tesla, Space X y encima OpenAI) y se enojó y retiró la plata que se había comprometido a poner en el proyecto. Hoy, casi 5 años después, se arrepiente y decide crear un nuevo startup que compita con OpenAI pero necesita tiempo para alcanzarlos. [Link a Semafor]

Y esta usando Twitter para avanzar su agenda; ahí reside el valor de la apuesta que hizo por la red social.

Pero mas allá de todo, este incidente es clave para entender que estamos en un momento de cambio y que hay muchos intereses tratando de frenar el avance de una herramienta que ya está activa y evolucionando.

| Inteligencia Artifical
Tags:
IA openai

Sobrevivir el hype de la IA

Hace ya un tiempo doy una charla/conferencia de que es la inteligencia artificial y como, algunos conceptos que van desde el deep learning hasta el reinforcement learning, son simples piezas en un rompecabezas que hoy está en nuestra vida cotidiana pese a que no le prestemos atención. Y esa es una de las pequeñas magias de la IA, estar cerca sin que lo notes... los ejemplos que uso no siempre son "sin controversias" :P

Este paper de LUCA son unas 13 páginas que expanden mi presentación [no, este paper no es de mi autoría ni nada por el estilo, solo que LUCA es una unidad de Telefonica y vaya esto como disclaimer :P] que les recomiendo leer porque es claro y son apenas 14 páginas que matan bastantes mitos :)

| Rants
Tags:
IA inteligencia artificial

El problema con los bots en medios: los humanos

chatbot-1-930x760

"People still want bots to be bots". Son interesantes las conclusiones que extrae Martin Belam, responsable de nuevos formatos en The Guardian, tras dos meses de experiencia con  Sous-chef, un bot de Facebook que recomienda recetas según lo que haya en tu nevera.

La promesa de los bots en los medios lleva un tiempo estancada en ese terreno incómodo que se encuentra "esto promete" y "sí, pero no sé cómo hacerlo". Tras la aparición de las primeras plataformas para bots en aplicaciones de mensajería (Facebook Messenger y Telegram son los principales exponentes, pero también hay algo más limitado en Slack y en Kik) fueron varios medios los que se subieron al carro de manera entusiasta. Techcrunch realizó una suerte de experimento con Chatfuel, ya inactivo o directamente cerrado/desactualizado, y Forbes lo propio en Telegram, pero también lo tiene cerrado y en estado de "revisión".

¿Cuál es el problema? La teoría es, en apariencia, sencilla: coges el canal, la aplicación de mensajería, coges tu contenido, producido de manera orgánica por el medio y a correr. La práctica, como apunta Belam, es en realidad muchísimo más compleja. Es una práctica que, irónicamente, tiene poco que ver con los bots en sí, con su complejidad o naturaleza misma, sino con los humanos.

Esperamos que un bot, una máquina controlada por una IA ciertamente primitiva, se comporte de manera muy similar a un humano precisamente porque lo encontramos en un contexto, nuestra aplicación de mensajería favorita, donde interactuamos exclusivamente con humanos. En el momento en el que la idea se desvía de esa particularidad, aparecen los problemas.

En un bot de medios parecen críticos aspectos como:

  • Conversación: dicho así parece obvio pero el tono de un bot tiene que ser conversacional. Es importante porque excluye mecánicas como "pegar titular" + "pegar entradilla" (varios bots de medios ya han caído en esto). Al final, cuando se cae en eso no solo se convierte en una especie de Twitter en una realidad paralela sino que para dicha mecánica ya hay una función mucho más adecuada: los canales de Telegram. Da que pensar, también, sobre la inmensa mayoría de medios que ponemos Titular+link+imagen en Twitter y ya.
  • Pero no tanto: Belam apunta que, en sus pruebas, observaron que cuando las respuestas predefinidas eran muy encorsetadas y robóticas el engage caía, pero cuando se iban al extremo opuesto, demasiado informal y conversacional, ocurría algo similar. Curioso. Encontrar el tono correcto probablemente lleve algún tiempo, pero experimentos como el de Quartz con su app parecen buenos comienzos.
  • La delgada línea entre la información y el spam: un bot en una aplicación de mensajería es algo realmente íntimo, una fracción de IA entre un universo de conversaciones orgánicas generadas por humanos. Matrix en un mundo de Neos. Y del mismo modo que se acaba por silenciar o directamente salir de ese grupo de WhatsApp que no para de sonar, en The Guardian observaron cómo tenía más valor enviar alertas a una hora determinada (como si fuesen boletines) en función de la ubicación del usuario y su huso horario en lugar de abrasarlos con breaking news como puede ocurrir en Twitter (hay un claro ejemplo: el bot de CNN hace precisamente eso).

Existen muchos elementos en los bots para medios (aquí hay otro buen texto sobre su aplicación y uso en marcas) que merecen la pena ser revisados y estudiados con cautela: el tono, la longitud, el formato, la temática, la frecuencia de publicación... elementos que, irónicamente y no hace tanto, también se evaluaban a la hora de aplicarlos en los medios digitales.

 

| Medios Rants
Tags:
bots IA Medios

Google Assistant, la inteligencia pervasiva de Google

“Pensamos en este asistente como una experiencia ambiental que se extiende a través de dispositivos, estará en sus teléfonos, en los dispositivos que usen, en sus autos y en sus casas.” Sundar Pichai CEO de Google, en Google IO 2016 hablando de Google Assistant

Google I/O está sucediendo en estos momentos pero la demostración de Google Assistant y Google Home al mismo tiempo que Allo como mensajero y su integración con el lenguaje natural es la forma de llevar la inteligencia artificial de Google a la vida cotidiana y es, más allá de los problemas que pueda tener su implementación, simplemente impresionante.

Si uno se queda con la demo que se vio, que es muy similar a Google Gboard es interesante porque parece tener no sólo un nivel más de entendimiento que los "robotic bots" que vimos en las demo de Facebook o Microsoft sino que su integración con aplicaciones de terceros y también con hardware de terceros de forma casi nativa (aprovechando Android como plataforma) lo hizo parecer mucho más natural... si, ya se que es una demo pero es una demo ambiciosa.

Ahora, el entendimiento del contexto sumado al "always on" que se testeó con Google Now, nos da una inteligencia transparente o pervasiva que es capaz de entender que si estás frente a al Cloud Gate y preguntás "¿Quien diseñó esto?" estás hablando de ese objeto y no del Millenium Park lo cual parece ¿mágico? pero es simplemente un avance impresionante en IA.

Si extendemos eso a Google Home como interfaz de Google Assistant y es capaz de entender multiples usuarios o perfiles que interactúan con Google y no con "una cuenta de Google" como pasaba hasta ahora es una verdadera pasada... y su primer gran desafío ¿como integrar UNA inteligencia a un ambiente multipersona con UNA sola interfaz? lo que no es fácil y nos lleva al segundo desafío ¿como definen que todo lo que se habla es público o se puede responder en público? que nos lleva a otro desafío ¿como se continúan conversaciones cuando son diferentes sujetos los que interactúan en un ambiente con diferentes dispositivos en una sola línea de tiempo? y finalmente ¿como hacer esto amigable y no un "robotic robot" como estamos acostumbrados? Son desafíos maravillosos!

Más allá de todos los debates que esto debería generar y no parece preocupar demasiado, repito ¿como definen que todo lo que se habla es público o se puede responder en público o es un query para alimentar sus sistemas de entrenamiento? porque esto es clave para que ese mundo ideal de información constante, contextual, transparente y pervasiva sea una realidad.

| Google
Tags:
Google Assistant Google Home IA inteligencia artificial

Viv y los nuevos asistentes personales

Ayer en TechCrunch Disrupt, el co-fundador de Siri,Dag Kittlaus presentó Viv, un asistente personal basado en Inteligencia Artificial que muestra bastante bien el porque Siri fue una primer generación y como el modo de interacción puede cambiar radicalmente; no sólo en cuanto a tipear texto versus hablar sino al hecho de no pensar siquiera en las búsquedas como tales ni en los proveedores de información como tales... VIV, conceptualmente, me hace acordar a Samantha de HER [1]

Si miran el video para ver la inteacción pueden arrancar directo en el minuto 3:40 y van a ver lo que denominan "conversational commerce" donde en lneguaje natural puede decir algo como "conseguime un lindo cuarto en Palm Springs para el fin de semana del dia del trabajador" y automáticamente traducirlo en una serie de ofertas de Hotels.com para ese fin de semana puente, en Palm Springs y con algo de entrenamiento, basado en tus historial/gustos... eso es un asistente y no un estúpido limitado Siri que sirve para mostrarme el tiempo en Madrid.

La idea de a) Un asistente, B) Personalizado, C) Multidispositivo, D) Abierto a desarrolladores... puede dejar a Google relegado, puede dejar a las apps relegadas y en vez de pensar en las 7 apps que tengo para tomar taxis, Uber o Lyft.. solo pido un auto y me llega sin siquiera pensar en quien es mi proveedor.

Grubhub chief executive Matt Maloney said he rushed to sign up with Viv two years ago, impressed with the idea of allowing consumers to perform different activities without having to toggle between services. “No one has been able to say, ‘I want the movie ticket, and the bottle of wine, and some flowers on the side’ — all in one breath,” he said.

El cambio en serio puede ser radical en la estructura actual de uso de internet y móviles en nuestra cabeza; y si VIV se convierte en una "app" o una plataforma multidispositivo la pelea de Microsoft Cortana, Apple Siri, Google Now y Amazon Alexa puede quedar en el olvido...o convertir a VIV en una adquisición billonaria.

Nota: [1] dije conceptualmente, no sean literales por favor :)

| Desarrollo Rants
Tags:
AI Asistenes Personales Cortana google now IA Siri VIV

Los fundamentos del diseño de experiencias

fundamentos del diseño

Excelente infografía de Stephen Anderson sobre los fundamentos básicos para diseñar "experiencias" sean estas desde una aplicación web hasta algo de diseño industrial, la infografía me aprece realmente genial aunque sea de 2009 porque toma en cuenta una frase que resume la misma forma en la que yo creo que el diseño debe darse:

"Todo está relacionado con la Gente, sus Actividades y el Contexto donde esas actividades suceden"

Es tan simple y básico como completo, y les recomiendo leer las consideraciones generales además de descargar la versión de 2mb en PNG o el PDF de 10MB para imprimir

| Desarrollo Destacadas
Tags:
arquitectura de información diseño IA