Rants

"There is no spoon": Por qué los LLMs no 'alucinan'

Recuerdo en The Matrix cuando Neo llega a conocer a The Oracle: ahí se da cuenta de que no hay una cuchara, sino solo la representación mental de una cuchara. Es entonces cuando comprende que la realidad no es como la percibimos, sino una interpretación que hace nuestro cerebro: lo mismo nos pasa cuando imaginamos que un LLM alucina o que entiende inherentemente lo que le preguntamos.

La cita de The Matrix funciona aquí como una metáfora clave: “No existe la cuchara” en el sentido de que el modelo no tiene ninguna percepción o concepto inherente de la realidad; está imitando patrones estadísticos sin una comprensión o creencia subyacente. Por eso en lugar de tratar de “ver la cuchara” (o una realidad concreta), un LLM se limita a procesar y reproducir correlaciones.

El “fallo” en el sistema es de nuestra percepción humana cuando se espera una precisión o intencionalidad que el modelo no puede ofrecer, no es un fallo del modelo.

TL;DR hablar de “alucinaciones” en el contexto de LLMs es engañoso, ya que implica una agencia o intención humana que los modelos no tienen. Cuando usamos ese término, parece que el modelo tiene consciencia o creatividad, cuando en realidad sólo está jugando una especie de juego de probabilidades en base a su entrenamiento y nos refuerza el antropomorfismo que nunca van a lograr.

Extrapolar no es alucinar

Sugerir “alucinación” crea la falsa impresión de que el modelo tiene una “intención” o “imaginación”; a veces creo tendemos a antropomorfizar a los LLMs, dándoles cualidades humanas que no poseen. Lo asimilo a la venta de espejitos de colores o humo que se ve en cada "discontinuidad tecnológica", por eso es importante entender esto:

  • Una alucinación es un fenómeno cognitivo donde el cerebro percibe cosas que no están ahí. Es decir, parte de un procesamiento sensorial alterado que crea algo de la nada.
  • Un LLM no “percibe” ni “crea de la nada”; más bien lee informacion que tiene en su base mostruosa de datos e infiere/extrapola qué es lo que viene a continuación. Claro que no está entrenado para decir "de esto no sé nada", asi que, si no encuentra algo claro o específico en los datos, llena los huecos basado en probabilidades.

Es super interesante ver que algo que "puede parecer simpático" es, realmente, contradictorio: una extrapolación estadística, no involucra percepción o creatividad. Lo que ves es el modelo proponiendo lo más probable, no imaginando una nueva realidad. Déjenme poner una analogía super clara:

Cuando un sistema de predicción meteorológica extrapola condiciones basadas en datos históricos: no “alucina” pronósticos, sino que aplica patrones que “cree” que tienen sentido, incluso si esos patrones pueden llevarlo a cometer errores.

Reconocer limitaciones para ajustar expectativas

La GenAI está en un momento donde pocos entienden hasta donde vamos a llegar, por eso entender que los LLMs funcionan en base a aproximaciones ayuda a reconocer sus limitaciones y a tener expectativas más alineadas con sus capacidades. Al llamar a sus fallos “errores de extrapolación” o “fallos de correlación”, se hace más claro el papel del usuario en la verificación de resultados.

La “precisión” en un modelo de lenguaje es siempre una cuestión de probabilidad, no de certeza. Por eso es super interesante el metamodelo de Perplexity AI.

Es una inteliencia artificial realmente creativa

Y sin embargo...

El error humano radica en pensar que el modelo es un “ser” con capacidad de decisión. Aunque sea más interesante decir que la IA alucina!" ya que, si aceptas, eso tendríamos que responder cosas como ¿Puede un LLM ser creativo? ¿como definimos "saber"? ¿Que es la realidad? ¿un corpus de datos?

Y no me vengan con "bueno, pero no pueden crear una obra de arte" porque tendrias que probar que VOS o yo somos capaz de crear una obra de arte.

| Inteligencia Artifical Rants
Tags:
AI IA innovación LLMs

AI: de LLMs y SLMs; eficiencia y ubicuidad

Con la demo de ChatGPT ya quedó claro que los LLM (modelos de lenguaje grandes) tienen nuestra atecion por sus capacidades en el procesamiento del lenguaje natural. Sin embargo, su tamaño y los recursos que requieren limitan su acceso y por eso es que es dificil ver nuevos jugadores en ese mercado y ahí es donde hay un espacio súper interesante para explorar los SLMs o modelos de lenguaje pequeños como alternativa.

¿Qué son los Modelos de Lenguaje Pequeños?

Leer completa
| Inteligencia Artifical Rants
Tags:
chatgpt inteligencia artificial llm ORCA Phi3

Seven Rings: lessons learned from seven years at Microsoft


LinkedIn me recuerda que hace 7 años dejé Wayra para entrar en Microsoft. En ese momento mi visión optimista era durar 4 años y volver a emprender, pero con apenas días en Microsoft me di cuenta de que estaba más perdido que nadie y que estaba entrando en una empresa con una escala lejos de lo que imaginaba.

Microsoft learnings
7 years.. not in tibet

Asi que pensando en estos 7 años, se me ocurrió escribir algunas de las cosas más interesantes y enfocarme en todo lo bueno que fui descubriendo

1. Impermanence and Empathy: More Than Just Buzzwords
Si hay una palabra que está de moda es empatía; todos hablan de empatía, todos dicen que son empáticos y similares, pero pocas veces vi un CEO que me haga entender y trabajar para sentirme cómodo con la impermanencia. Esto es lo más importante que me llevo de Microsoft:

“If you could understand impermanence deeply, you would develop more equanimity. You would not get too excited about either the ups or downs of life. And only then would you be ready to develop that deeper sense of empathy and compassion for everything around you.”

Satya Nadella

2. Speak Up: The Microphone Is Mightier Than the Sword
Esto es más general que particular, pero la capacidad que me da esta empresa de poder decir mis ideas y preocupaciones, es realmente increíble: ahí aprendí, gracias a Diego Bekerman, que podía hacer dos cosas:

  • Levantar la mano y decir "hey me equivoqué!" y buscar resolver el problema en vez de buscar el culpable.
  • Hablar y decir "estoy en desacuerdo" me obliga a proponer una alternativa, que va a ser escuchada y demostrar que puedo comprometerme aún estando en desacuerdo.

3. Scale: From Garage Band to Symphony Orchestra
Si pasás del mundo emprendedor al corporativo lo primero que vas a pensar es la escala y el alcance de tu trabajo, pero si entrás en Microsoft te vas a dar cuenta el verdadero sentido de escala: es pasar de Garage Band a una Sinfónica.
Complejo y con cacofonías, pero maravilloso.

4. The Power of Playbooks: Navigating the Corporate Playfield
Uno de los consejos que nunca me cansé de darle a startups es "build repeatable, sustainable, and scalable business...". Lo que aprendí en Microsoft es que el enfoque de crear playbooks (frameworks estructurados de trabajo) es la ÚNICA solución para crear impacto en una organización con esta escala. Nota: hay situaciones que merecen un caso particular, pero el valor/recompensa de los playbooks es innegable.

5. Constant Learning: School Never Ends
El growth mindset es algo que Microsoft te fuerza a aprender constantemente; la amplitud y profundidad de recursos que me dan es increíble, pero el edge está en el tiempo que te dan para que lo hagas. Y encima, en el mundo de AI, esto cambia más rápido que un camaleón on meth.

6. Execution Engine: Turning Ideas into Reality
"Being relentless not ruthless'. Es la mejor forma de entender como una empresa de esta escala y con esta cultura se anima a re-crearse (piensen en Soft, Cloud, AI) y las decisiones que hay que tomar constantemente. Sentirse cómodo con el caos, el churn y la sensación de generar impacto mientras no paramos es ser un motor de ejecución.

7. Innovation at the Margins: The Art of Peripheral Vision
Recientemente tuve que trabajar en un proyecto con aceleradoras y fondos, y en otro momento hubiese dicho "ya conozco este mercado": la realidad es que con todos los puntos anteriores termino buscando más allá de lo obvio, buscando la innovación que puede aparecer en el margen de un mercado o de una región; algo que es periférico me ayuda a veces a entender algún patrón o simplemente descubrir algo que no conocía.

Conclusión:
Es interesante que recién al escribir esto me di cuenta de que cada uno de las acciones que describo (playbooks, margin innovation, etc.) se despliegan de la cultura que describo en los puntos 1 y 2.

Tal vez lo más interesante que aprendí en estos años es que la cultura puede cambiar una empresa aún del tamaño y del éxito de Microsoft; como dirían por ahí uno se suma a un equipo por la empresa pero se va por el manager.


| Rants
Tags:
aprendizajes Microsoft personal Wayra

Salud mental y auto-control

Debe haber pocas más simples y más complicadas que tener control de uno mismo; en la lógica es algo súper simple :"control de los impulsos y reacciones propias". Esto implica que hay una toma de decisión consciente analizando beneficios y consecuencias de cada acción que tomamos.

depresion emprendedores

Esto implica algo simple, que es que el auto-control es un proceso que puede salir bien pero tiene algunas potenciales fallas/trampas, que como todo hoy en día está "preso" de muchos mitos que lo simplifican y que, más allá de sus ventajas, al ser un proceso implica que si perdés ese auto-control podés aprender de ese momento y mejorar sin quedar atado a un mal momento.

El auto-control es un proceso

El cínico diría "controlarse es fácil ¿por qué perderías el auto-control?". Pero la realidad es más compleja, porque el auto-control implica trabajo y necesitás entender algunos mitos del mismo:

  • "El autocontrol es innato": mentira, es como un músculo que se fortalece con la práctica.
  • "La fuerza de voluntad es ilimitada": creer que la fuerza de voluntad es inagotable ignora la realidad del agotamiento por decisiones a las que cualquier persona está expuesta constantemente, sin descanso, y sin dedicarle tiempo a tu salud mental el auto-control puede agotarse.
  • "Es resistir tentacion": esto es una sobresimplificación y deja de lado el entender las emociones, pensar a largo plazo, mantener hábitos positivos y, sobre todo, que esto es un proceso constante.

Las trampas del auto-control

Al mirarlo bien, entendés que el auto-control es como un músculo que tenés que ejercitar y que, como todo, implica un trabajo constante; de hecho hay 3 problemas de los que nadie habla, especialmente en el mundo emprendedor, donde parece que nadie se anima a hablar de salud mental, y que son consecuencia directa de buscar el auto-control pero sin una estrategia.

  • La dependencia excesiva puede conducir al estrés: ejercitar constantemente el autocontrol puede ser mentalmente agotador, y eso conduce al stress y agotamiento, una paradoja porque es lo que estás buscando evitar.
  • Puede reducir el disfrute: un auto-control estricto puede limitar la capacidad de disfrutar de momentos espontáneos o de darse pequeños placeres.
  • Efecto Rebote: constantemente analizar tus actos y suprimir los deseos puede llevar a un fuerte efecto rebote, donde el autocontrol se rompe y terminas dándote permiso para todo o explotás y tenés UN momento donde generás una situación inexplicable.

Las 3 ventajas del auto-control

Hay mil libros, estudios y artículos para leer sobre el autocontrol. Y aunque en general el auto-control se piensa como una forma de no caer en provocaciones la realidad es que hay 3 cosas que podés sacar si lo ejercés bien:

  • Mejor toma de decisiones: si sos capaz de reflexionar, vas a valorar beneficios y ventajas a largo plazo, sobre tentaciones a corto plazo.
  • Conseguir objetivos personales y profesionales: si tus decisiones toman en cuenta los beneficios a largo plazo, la consecución de objetivos se hace más simple (compounding!) y eso va a bajar tus niveles de estrés.
  • Mejora en relaciones: esto me parece clave a mí; si sos capaz de entender y manejar las emociones, el auto-control generará interacciones más saludables y empáticas con los demás.

“Remember, it is not enough to be hit or insulted to be harmed, you must believe that you are being harmed. If someone succeeds in provoking you, realize that your mind is complicit in the provocation. Which is why it is essential that we not respond impulsively to impressions; take a moment before reacting, and you will find it easier to maintain control.”

 Epictetus, The Art of Living: The Classical Manual on Virtue, Happiness and Effectiveness

Aprendé, perdoná, planificá

Nadie es perfecto: si perdiste el control tenés que entender que ya pasó y que no podes resolverlo, pero podés enfocarte en entender y mejorar. Quizás la mejor técnica es dividir en 3 partes el "post-explosión":

  • Reconocer y aprender: reconocé el desliz como una oportunidad de aprendizaje, no como un fracaso, para entender los desencadenantes y mejorar las estrategias.
  • Perdónate a vos mismo: practicá la autocompasión para evitar el diálogo interno negativo y la culpa, entendiendo que las recaídas son parte del proceso.
  • Planificar para futuras tentaciones: elaborá estrategias sobre cómo manejar situaciones similares de manera diferente en el futuro, reforzando tus mecanismos de autocontrol.

“Wise men are not pacifists; they are merely less likely to jump up and retaliate against their antagonizers. They know that needless antagonizers are virtually already insecure enough.”

Criss Jami, Killosophy
| Rants
Tags:
emprendedores salud mental

Daniel Kahneman (1924-2024)

Ayer murió Daniel Kahneman, Premio Nobel en Economía por su trabajo en Prospect Theory para toma de decisiones, conocido por muchos por su trabajo en, claro, toma de decisiones y economía conductual, y autor de "Think Fast Think Slow". Yo lo recuerdo como una de las pocas veces que me lamenté por haber descubierto tarde a un autor y el valor de su obra.

Hay dos libros claves para entender su valor; por un lado "Prospect Theory", que nos permite entender cómo tomamos decisiones bajo incertidumbre sin ser racionales siempre. Y en "Think Fast Think Slow" nos deja entender, en términos simples, que hay dos sistemas en permanente lucha en nuestro cerebro, uno automático y otro deliberado... lo que nos hace vivir con sesgos.

"Teoría del Prospecto" (Prospect Theory)

Hoy puede parecer intuitivo pensar que no siempre se toman decisiones racionales, pero en 1979, cuando se publica Propsect Theory, gran parte del mercado asumía que las personas tomaban decisiones racionales basadas en la maximización de la utilidad esperada.

Kahneman y Tversky (su socio de siempre) demostraron que hay valoraciones que influyen en la toma de decisiones y que, sobre todo, las personas valoran las ganancias y pérdidas de manera diferente, lo que significa que son más sensibles a las pérdidas que a las ganancias de magnitud equivalente, un fenómeno conocido como aversión a la pérdida. Un concepto clave en nuestra economía.

Lo otro que demostraron es que cuando uno toma decisiones (en cambios de riqueza) estas se toman con un punto de referencia diferente en cada caso; esto implica que el mismo resultado se percibe de formas diferentes dependiendo de ese punto de referencia y, por lo tanto, hay decisiones que serían consideradas irracionales desde la teoría tradicional.

Esto último ayuda a entender que hay un "framing" para entender la "curva de valor" que nos hace tomar decisiones financieras.

Les recomiendo leer el paper completo de ellos en JSTOR, vale la pena.

"Pensar Rápido, Pensar Despacio" (Thinking Fast, Thinking Slow)

Tal vez lo más conocido de Daniel Kahneman y Amos Tversky, porque siempre escribieron juntos, es el libro "Thinking Fast, Thinking Slow" (link en inglés que está gratis en Kindle Unlimited y en español que a veces está gratis) y la idea súper resumida de distinguir dos modos de pensamiento:

  • "Sistema 1". El Sistema 1 opera de manera automática y rápida, con poco o ningún esfuerzo y sin sentido de control voluntario, mientras que
  • "Sistema 2" implica deliberación, razonamiento y requiere actividades mentales más esforzadas.

Sobre esa base se explica cómo las personas toman decisiones, los sesgos que afectan nuestro pensamiento y las implicaciones para la economía, la política y las vidas personales. El famoso conflicto que tenemos entre intuición y razonamiento; y cómo esto nos lleva a errores y juicios erróneos que, luego, cuando lo pensamos, no entendemos cómo nos equivocamos.

Y de ahí a entender por qué es tan difícil predecir qué nos hará felices, cómo enfrentamos la toma de riesgos y nuestra aversión a la pérdida; tal vez lo mejor es que el libro tiene ejemplos súper simples de cómo cambiar nuestra perspectiva y tomar mejores decisiones

La felicidad y la satisfacción

People don't want to be happy the way I've defined the term – what I experience here and now. In my view, it's much more important for them to be satisfied, to experience life satisfaction, from the perspective of 'What I remember,' of the story they tell about their lives"

Daniel Kahneman en Haaretz

Esto que dijo Kahneman en una entrevista en el Haaretz es realmente una de las mejores muestras del valor de su obra: cómo estamos a veces sesgados por la "narrativa" que nos creamos y cómo nos ve el mundo, más que por el verdadero valor de lo que sucede.

De verdad, deberían leer más a Kahneman y tomar mejores decisiones porque esto impacta cada uno de nuestros mundos.

| Rants
Tags:
daniel kahneman prospect theory thinking fast thinking slow

La Dopamina de Un Mundo Feliz

Muchos de los que estamos en tecnología y leemos ciencia ficción imaginamos que 1984 era lo que representaba el peligro de una sociedad conectada, una sociedad controlada por un Gran Hermano: nos enfocamos tanto en eso que nunca vimos a la "economía de la atención" y la "cultura de la dopamina" llevarnos a la utopía de Un mundo feliz.

En Un mundo feliz el control de masas se da a través del placer y la manipulación genética; más allá del espacio de las castas condicionadas para aceptar su lugar a todos se les mantiene satisfechos mediante el consumo de una droga llamada "soma".

El "soma" les permite escapar de cualquier tipo de disconformidad o dolor; la felicidad superficial y la estabilidad social se logran a costa de la libertad individual y el pensamiento crítico... literalmente el efecto del endless scroll en nuestro cerebro.

Leer completa
| Rants Redes Sociales
Tags:
dopamina Redes Sociales salud mental

El peso geopolítico de Elon Musk

Todo el mundo habla de Elon Musk por la compra de Twitter y cada una de las decisiones que tomó con esa red social, pero no estoy seguro que se entienda el alcance real de sus empresas y sin entrar en el detalle de su fortuna calculada en $271.000 millones de dólares

Creo que deberian pensar por un momento lo que significa su poder mirando, aunque sea por arriba, lo que hacen sus empresas, en serio Twitter es sólo el conector, al proveer infraestructura eléctrica a los que compiten contra Tesla, infraestructura espacial a al menos 40 gobiernos del mundo y conectividad de Internet en zonas donde no hay otros jugadores.

Y luego entender que no estamos hablando de muchas empresas con este poder... es una persona la que las maneja.

Leer completa
| Rants
Tags:
elon musk SpaceX Starlink Tesla twitter

Texas le paga a una minera de bitcoin para que deje de operar en ola de calor

Riot Platforms, una empresa que mina bitcoin en Texas, hizo más dinero en 2022 con pagos del estado para que dejen de consumir energía que con el minado de bitcoin... y lo muestran como una evolucion de su modelo.

  • Riot’s latest credits consist of $24.2 million from energy sold back to the ERCOT grid and $7.4 million in demand response credits. Totalling: $31.6 million dollars
  • The company mined 333 bitcoin in August, worth about $8.9 million dollars as of the end of the month.

Por algo de contexto, ERCOT (el consejo de confiabilidad energética de Texas) tiene un programa donde le paga a grandes consumidores de energía si hay una ola de calor como en estos meses... esto se explica porque la red energética de Texas está desconectada de la red federal y no tiene interconexión para casos de emergencia.

bitcoin minin impacto ambiental

Con lo que cualquier gran consumidor de energía recibe créditos del estado para dejar de operar; pero no hay constancia de alguien que haya generado 3 veces mas ganancias por dejar de operar que por trabajar.

De hecho, esto podria ser un nuevo modelo de negocio.. "páguenme o les voy a usar toda su energía" ;)

| Rants
Tags:
bitcoin energia

OpenAI y las oportunidades inevitables

Esta semana el uso de inteligencia artificial en el cine es parte del reclamo en la huelga de los escritores, también el uso de inteligencia artificial en la creación de las animaciones en Secret Invasion desató quejas y amenazas de más huelgas…

Esta misma semana Carlos Banon, un arquitecto multi-premiado, decidió crear un curso para “expandir conceptos arquitectónicos con comandos de Midjourney y desarrollar skills de control de geometría, materiales y creación de atmósferas usando stable Difussion y ControlNet

It was the best of times, it was the worst of times, it was the age of wisdom, it was the age of foolishness, it was the epoch of belief, it was the epoch of incredulity, it was the season of light, it was the season of darkness, it was the spring of hope, it was the winter of despair.

Charles Dickens, A Tale of Two Cities

Esta misma semana salió un estudio donde se muestra que el 92% de los developers de software usan Copilot y “Over 80% of developers believe that AI-powered coding tools can enhance team collaboration, improve code quality, speed project completion and improve incident resolution

Mientras una industria abraza una tecnología como un copiloto que la ayuda a mejorar sus capacidades creativas (evitando lo repetitivo) y otra industria trata de buscar el espacio donde se puede mejorar (la idea de crear atmósferas en arquitectura usando motores OSS!) hay otras que tratan de frenar el uso de la tecnología y frenar a los que la están usando.

El cambio es inevitable… pero estas herramientas son un copiloto y amplían tu capacidad creativa y de protototipadp liberando espacio repetitivo y solitario.

| Inteligencia Artifical Rants
Tags:
Estrategias IA openai

El efecto o amnesia Gell-Mann

Michael Crichton escribió algunos de los libros de ciencia ficción más conocidos que hay dando vueltas, desde Westworld hasta Andromeda Strain y Jurassic Park, sin embargo una de sus creaciones menos conocidas es la creación del término "amnesia de Gell-Mann" para explicar nuestra falta de pensamiento crítico.

"A grandes rasgos, el efecto de la amnesia de Gell-Mann se describe de la siguiente manera. Abres el periódico y te encuentras con un artículo sobre algún tema que conoces bien. En el caso de Murray, la física. En el mío, el mundo del espectáculo. Lees el artículo y te das cuenta de que el periodista no tiene absolutamente ninguna comprensión de los hechos o los problemas. A menudo, el artículo está tan equivocado que presenta la historia al revés, invirtiendo la causa y el efecto. Yo los llamo 'historias de 'las calles mojadas causan la lluvia'. El periódico está lleno de ellas.

En cualquier caso, lees con exasperación o diversión los múltiples errores en una historia, y luego pasas a la página de asuntos nacionales o internacionales, y lees como si el resto del periódico fuera de alguna manera más preciso sobre Palestina que la tontería que acabas de leer. Pasas la página y olvidas lo que sabes".

Michael Crichton (1942-2008)

Una gran forma de reconocer el valor del pensamiento crítico y el escepticismo; si siendo exigentes cuando leemos información sobre un tema que dominamos y encontramos errores o falsedades, debemos ejercitar el pensamiento critico cuando leemos algo fuera de nuestro campo de conocimiento... o corremos el riesgo de seguir a los que saben comunicar en vez de los que saben de un tema.

| Rants
Tags:
filosofia Medios Rants

Artifact y el clickbait. Un gran uso de ChatGPT

Si hay una tendencia en los medios digitales que es terrible es el uso de titulos que sólo buscan generar clicks poniendo "preguntas" o explicando cosas a medias...

Un ejemplo básico esta en esta imagen, dice algo interesante, promete una explicación del tema en la nota; raramente eso se cumple y las notas son una basura que se pueden reemplazar con una solo palabra.

Y la realidad es que nadie logra resolver este tema; Techmeme logró algo editando los títulos de algunos links pero es difícil escalar cuando hay medios que se destacan por escupir notas solo pensadas para SEO y lograr clicks (afortunadamente algunos van a desaparecer).

Por eso el acercamiento de Artifact me parece realmente genial (en la imagen hay un ejemplo) y en este link esta la explicación exacta pero básicamente usan una combinación de "wisdom of crowds" y la función de sumarización de ChatGPT.

  • Los usuarios marcan un titulo/nota como "clickbait"
  • El algoritmo evalúa si hay suficientes votos en contra
  • Le pide a la API de OpenAI que se comporte como editor, haga un sumario del link y edite un titulo de menos de 15 palabras.
  • Profit :P

Hay algunos detalles más, como marcar los títulos editados con una estrella para saber que hay AI atrás y ver si hay que refinar, pero me parecio un caso de uso brillante por lo simple y como usa una tecnología en algo que sabe hacer exactamente y sumar valor al startup (una comunidad contenta genera engagement) sin enamorarse de la tecnología per-se.

Los casos de uso de AI van a seguir apareciendo y compitiendo constamentemente :)

| Rants

Matar al mejor socio

Mi postura sobre SVB es super clara, hice un post sobre el tema que es publico, pero estaría bueno leer otro punto de vista al simplificado que está dando vueltas por las redes sociales; por un lado Michael Moritz, partner de Sequoia en el Financial Times, y por otro Hemant Teja, CEO y MD de General Catalyst.

Pero antes que nada quiero dejar en claro 3 puntos que nadie puede negar y que haciendo el post mortem parecen no ser importantes:

  • El valor del SVB en el nacimiento del ecosistema de startups y VCs es innegable. Cuando las empresas tecnológicas nacen y son "una idea liderada por dos emprendedores" los bancos tradicionales no le prestan atención... y cuando estás armando tu primer vehículo de inversión ¿quién estaba ahí dándote servicios?
  • El manejo de riesgo fue terrible, aun con la excusa que los depósitos se triplicaron en la pandemia, diversificar mal fue estúpido y eso se paga; encima el CEO solo generó desconfianza con un timming terrible y una comunicación terriblemente mala.
  • La cámara de eco de nuestro mercado fue destructiva y mostró POCO profesionalismo. De 3 fondos que arrancaron la corrida, las redes sociales empujaron una corrida de 42.000 millones de dólares en menos de 2 días, 3 veces más que la segunda corrida bancaria de la historia y aún así todos los pedidos fueron honrados.

Ecosistema implica una interconexión

In a perverse way, SVB has paid a price for its loyalty. Much will be said about the reasons for its demise, but few will dwell on what made it special for those of us in Silicon Valley. SVB stayed close to its roots and its customers. When it collapsed almost all of its 40,000 customers were technology companies — a drop in the bucket for the big banks.

Michael Moritz - Sequoia en el FT

"What should have been sophisticated, systems-level thinking quickly gave way to the most basic human instinct to act in one’s own self-interest, not out of malice or greed, but to ensure survival." ... "But the losses SVB reported should not have been fatal. The value-generating parts of the business remained intact, as did the deep relationships and trust SVB enjoyed with nearly every actor in our industry."

The counternarrative—that those investors who panicked first were fulfilling a fiduciary duty—is incomplete. We were all shocked at the speed with which the events of last week unfolded. But causing a bank run at the most important institution in your sector can hardly be considered an act of fiduciary duty. While your own company may be able to recover most or all of its cash, what happens if the resulting collapse wipes out your customer base? Or your venture debt provider?

Hemant Taneja - CEO General catalyst @ The Information

Creo que esas notas dicen bastante claro que hay algo que se perdió en el momento donde algunos dejaron de "ayudar a emprendedores a crecer!" para crear FUD (Fear, Uncertainty and Doubt) en redes sociales. De nuevo, el management hizo una peor que otra, pero no estoy seguro de que el banco fuera a colapsar.

La industria se debe un gran debate, que afortunadamente se está dando pero a puertas cerradas, sobre cómo se manejan rumores en épocas de redes sociales y mentalidad de rebaño.

Si decimos que de los errores se aprende.... tenemos una gran oportunidad como ecosistema, aunque hayamos matado a uno de los mejores socios del ecosistema.

| Rants
Tags:
emprendedores innovación inversiones twitter

Brazil autoriza los pagos en Whatsapp

Brasil está haciendo casi todo bien en el mercado de fintech y payments, ahora el Banco Central acaba de darle la autorizacion formal a Meta para que Whatsapp Payments se lance en Brasil y pueda convertirse en un medio de pagos a PyMEs y, asumo, P2P.

¿Que es lo que tiene de bueno esto? la ubicuidad de Whatsapp es global, con lo que atando tu cuenta de banco a tu cuenta de Whatsapp tenes capilaridad que no creo que tenga ni siquiera Mercadopago... y todo incluido (hasta las tiendas de los negocios que van desde restaurantes hasta retail) integrado en una sola app.

Los pagos se hacen entre cuentas de banco, Facebook Pagamentos es la plataforma autorizada por el Banco Central de Brazil y la procesadora es Cielo.

| Rants

OpenAI, ChatGPT y la era hibrida de copilotos.

El experimento del Juez Juan Manuel Padilla Garcia, de Colombia, es de los mas interesantes que he visto con OpenAI en el mundo real, cuando el Juzgado 1º Laboral del Circuito de Cartagena, usó ChatGPT para dictar sentencia y lo fundamentó en el documento... usandolo como copiloto.

"...extender los argumentos de la decisión adoptada, conforme al uso de inteligencia artificial (IA). Por consiguiente, se procedió a incluir apartes del problema jurídico planteado en la presente sentencia y se ingresó en el aplicativo https://chat.openai.com/chat" ... "El propósito de incluir estos textos producto de la IA no es en manera alguna reemplazar la decisión del Juez. Lo que realmente buscamos es optimizar los tiempos empleados en redacción de sentencias, previa corroboración de la información suministrada por IA"

Fundamentos: Juez Juan Manuel Padilla Garcia, P5 y 7

En el link está el documento completo del juez pero la base es simple de entender; estos modelos (LLM y Transformers) son herramientas que necesitan corroboración de un humano para darle sentido a su respuesta.

inteligencia artificial Maschinenmensch

La base de todo es simple: la respuesta que uno ve en ChatGPT o cualquier otro modelo, se genera por un modelo estadístico que decide que palabra (o símbolo) va luego de otra, sin entrar en valoración del sentido de lo que esta entregando.

Eso es lo que genera mucha confusión alrededor de estos transformers: Sus respuestas hacen sentido, son rápidas y son asertivas pero no están orientadas a certeza sino a modelos estadísticos.

Por eso me gusta el concepto de "copilotos" como una herramienta que ayudan al piloto con datos y background que uno puede tomar para mejorar el producto final... el segundo punto que hay que entender que pocas veces esto es un one-off; hay valor en refinar prompts, en follow ups, en buscar hacks y así dandole verdadero valor al concepto conversacional.

Por eso Stack Overflow se prohibe copiar respuestas de ChatGPT sin verificacion y errores en sus respuestas matemáticas y por eso hay gente horrorizada de verlos sin entender las limitaciones que estos modelos tienen y no terminan de entender que estamos en una era hibrida de IA

Explainability and comprehensibility of AI are important requirements for intelligent systems deployed in real-world domains. Users want and frequently need to understand how decisions impacting them are made. Similarly it is important to understand how an intelligent system functions for safety and security reasons. In this paper, we describe two complementary impossibility results (Unexplainability and Incomprehensibility), essentially showing that advanced AIs would not be able to accurately explain some of their decisions and for the decisions they could explain people would not understand some of those explanations.

Roman V. Yampolskiy - Unexplainability and Incomprehensibility of AI
| Rants
Tags:
chatgpt innovación llm openai

Twitter y su eterno fracaso

Si hay algo que reconocerle a Elon Musk es que su personaje parece nacido para Twitter como plataforma, crear un persona con amor/odio para lograr fans en vez de audiencia y eso apalanca su imagen y negocios... solo por eso no termino de entender si la compra de Twitter por $44bn es una estupidez o no,

Pero esto muestra algo que está sucediendo en Twitter hace tiempo, se va el equipo fundador, cambian las políticas de uso de sus APIs en base a intereses comerciales, pierden miembros de su “Board of Directors” y los empleados suben a niveles de soberbia donde amenazan a usuarios de la red

Agosto 6, 2012 - La censura de Twitter y su necesidad de anunciantes

Twitter siempre estuvo buscando un modelo de negocio y cambio de administraciones constantemente porque nunca logro reconciliar dos cosas: crecer en usuarios y ser rentable. Súmenle a esto que su propia incapacidad de tener principios hizo que todos lo acusen de censura o woke-mafia o ahora "alt-right-heaven"

We started with a simple idea: share what you’re doing, 140 characters at a time. People took that idea and strengthened it by using @names to have public conversations, #hashtags to organize movements, and Retweets to spread news around the world. Twitter represents a service shaped by the people, for the people.

Octubre 3, 2013 - Twitter y su NO definición de principio en la IPO

Esto muestra que lo mejor que hizo el board de Twitter en muchos años fue forzar al bocón de Elon Musk a cumplir su oferta de comprar Twitter pagando $54.20 por cada acción que costaba... $35

Entonces pongamos claro algo, Twitter nunca iba a salir de su catch-22: "¿como logro rentabilidad en una plaza pública?" y pongamos otra cosa clara hacer una oferta de compra conociendo las reglas de la SEC y luego pensar que podías escaparte... no fue inteligente.

Enter Elnoverse

Es asi como Elon Musk y su aura de gran emprendedor se encontro comprando una empresa deficitaria como $TWTR apalancado en prestamos que generan intereses de $1bn al año... y tuvo que bajar costos y aumentar ingresos.

Primer paso: bajar los costos fanáticamente; Despidos masivos, Abandono de contratos y recortar gastos de infraestructura.

Sounds great... pero no.

Los despidos los hicieron sin analizar equipos y tuvieron hasta problemas de seguridad asociados; los contratos los abandonaron sin pagar (oficinas sin pagar, demoran o evitan pagos a los despedidos, etc.) y los gastos de infraestructura los bajaron... literalmente apagando servicios y viendo que funcionaba y que no.

Que Twitter siguiese funcionando en los primeros 45 dias es porque el equipo de ingeniería (al que el nuevo CEO dijo, literalmente, que eran malos y que podían chuparsela) creo un sistema resiliente.

Segundo paso: ampliar las fuentes de ingresos y aumentar el valor a anunciantes pasar a un modelo de suscripción (Twitter Blue) y ¿cambiar? el modelo de ads... sounds great pero: la cantidad de errores no forzados que están cometiendo es increíble y solo genera mas presión financiera sobre la empresa.

Hasta ahi los primeros pasos lógicos de una adquisición, con los que uno puede estar de acuerdo o no... pero, repito, están cometiendo errores no forzados y el principal es no pensar en los partners que crearon el ecosistema

Resultaría interesante es ver como Twitter se focaliza en ser una nueva plataforma de comunicación en serio y trabajar como si fuera una pieza de infraestructura que con el tiempo termine pensando en su esquema de servicios

Diciembre 21, 2009 - ¿Es twitter rentable?

Desprecio por los Partners: Cuando uno lee que "la publicidad en Twitter cayó un 42% en un trimestre y los anunciantes siguen reduciendo sus presupuestos para la plataforma" no puede dejar de pensar en todos los errores no forzados que está haciendo el "nuevo dueño"

  • Sacaron los equipos de CSAM (el que evita los nodos de pornografia infantil) porque no generaban revenue... dejando a marcas expuestas a aparecer cerca de ese contenido.
  • Despidieron a los equipos que manejaban las cuentas de anunciantes... dejando a cuentas que manejan decenas de millones sin un contacto con el cual trabajar en Twitter.
  • Cortaron el acceso a las APIs de twitter sin aviso, rompiendo no solo a los 3rd party clientes (como Twitterific o Tweetbot) que era su objetivo sino que durante horas servicios ajenos a eso estuvieron caídos y sin comunicación... aun siendo clientes pagos.

Prometieron ser una plaza publica porque la nueva administración es "absolutista de la libertad de expresión"... hasta que aparecieron parodias del nuevo dueño y decidieron que hay limites para esa libertad o prohibieron explícitamente links a Mastodon (el que aparece como rival a la vista) pero lo levantaron cuando amigos de la casa como Paul Graham caían en esa prohibición.

Es difícil manejar una red social y peor aún debe ser estar manejando una contra tu propia voluntad por bocón; pero esto no cambia el destino de algo como Twitter que es simplemente el megáfono de nuestros "shower-thoughts", simple, rápido y con un efecto de red increible... y desde 2007 sigo pensando que esto podria haber sido la mejor plataforma distribuida como endpoint de RSS y punto.

Que oportunidad perdida viendo su eterno fracaso.

| Rants Redes Sociales
Tags:
adquisiciones elon musk Rants Redes Sociales twitter

Podcast: Hablando con Jaime Novoa de Kfund

Me aburre escucharme y quizas por eso no me encuentro comodo en un podcast pero hablar de Madrid, la competencia con Miami, del momento de algunos fondos, de algunas personas a las que admiro y hasta de Telefonica.. me pareció interesante.

Sobre todo con Jaime Novoa de KFund uno de los 3 fondos que mas me gustan en España... Jaime es mas interesante que "someone at a fund" porque comunica demasiado bien y siempre logra noticias.

Sigo sosteniendo que Espana tiene mucho que ofrecer si mira con ganas, y de igual a igual, a Latinoamerica... Detalle, El Chiringuito y Salvame son placeres culposos... lo admito publicamente por primera vez.

| Rants

Putting my money where my mouth is…

Todo el mundo habla de startups…, emprendedores e inversiones pero me vino a mi cabeza… ¿cuantos productos de startups usamos? Esta lista no es exhaustiva pero son todos los que me solucionaron algo realmente:

  • Es increíble que el startup con mayor presencia en mi vida sea NotCo de Matías Muchnik. Los productos están en mi casa y hasta en stock
  • A nivel transaccional uso Belo de M. Beuadroit de forma ridícula; hasta esta en MercadoPago como opción por la cantidad de tarjetas virtuales y uso de cripto… aunque Lemon de Marcelo Cavazzol y Borja Martel fueron mi testbed para mi on-ramp cripto
  • Me quede pensando que hay dos plataformas que uso cuando las necesito; Workana de Tomas O’Farrell me resolvió temas de diseño e implementación de varios proyectos que tenía en la cabeza pero que no podía hacer yo solo 🙌🏻
  • Uso 123Seguro… para lo menos sexi del mundo que es asegurar cosas, pero lo bueno es que los hermanos Ferrari hicieron un gran producto para recomendar.
  • Pese a mis idas y vueltas no puedo dejar de mencionar Cabify de Juan de Antonio… y creo que es lo ÚNICO que uso creado en España.
  • El delivery es lo único que uso diariamente (no por elección, sino por acuerdo corporativo) con PedidosYa… antes usaba Rappi pero únicamente porque “Turbo” tenía un hub a 2 cuadras de mi casa y la entrega promedio era de 8 minutos. Comodidad mata servicio.
  • Y mención especial a CollectedNotes de Alejandro Crosa… que fue lo ÚNICO que estuvo cerca de desplazar a mi WordPress.

En 2023 voy a usar más cosas seguramente; por un lado porque no entiendo que haya tan poco share-of-wallet de emprendedores en mi vida cotidiana… pero por otro lado porque estamos aumentando la velocidad de inversión ángel y eso implica que quiero poner mi dinero donde está mi boca. Joder, esto suena mejor en inglés

| Rants
Tags:
inversiones startups

Timeo Danaos et dona ferentes... temanle a una ronda estructurada

2022 y 2023 son años donde el tsunami de capital barato y fondos que tenían tasas de retorno monstruosas en papel parecen haber terminado; estos últimos 5 años fueron una anomalía y es simple: con tasas altas algunos fondos se secan y levantar capital vuelve a ser el trabajo que fue siempre pero aprovechando el momento aparecen los que te dicen "no es necesario discutir ahora la valuación" (FT)

Y como emprendedor aparece una decision difícil: "Estoy quemando mas que lo que genero ¿acepto una ronda a menor valor que la anterior? ¿acepto una ronda con términos "estructurados"? ¿busco ser rentable a toda cosa?" no hay un consejo universal pero mi postura termina siendo casi siempre la misma que este titulo: una Ronda estructurada... es solo una ultima opción.

Los mismos que te convencían de levantar rondas a valuaciones altísimas, son los que hoy te ofrecen capital fresco "manteniendo la valoración sin discutirla en este momento

Mi razonamiento es bastante simple; enfocarse 100% en ser rentable es difícil e implica tomar decisiones duras pero tiene ¿que proyectos cortas? ¿que equipos son impactados? ¿que base de clientes/usuarios perderás? ¿como los compensas? y encima no todos pueden hacerlo... porque al enfocarte en el hoy, a veces tenes que matar parte de la vision que tenias para tu startup; pero si sale bien te deja en una posición envidiable.

Por otro lado, un downround, o levantar una ronda de inversion a un valor menor que la anterior, que tiene downsides muy claros (ej: sostener tu valuación convierte tu equity en ventaja competitiva para M&A o atracción de talento) no es es una sentencia de muerte y si pensáis en el largo plazo no importa realmente, solo estás difiriendo un poco el liquidity event que todos buscan.

De hecho estos son algunos casos de éxito (y también de survivorship bias :P):

  • Flipkart, down round a 1.6b en 2016... hoy respaldada por $WMT cerrando ronda a 40bn
  • Wealthfront, dowround a 500m en 2018... ronda en Sept/22 a 1.4bn
  • Facebook, down round a 10bn en 2019... hoy $META vale 333bn
  • Doordash, down round a 700m en 2016.. hoy $DASh 19.5bn
  • Square, fue down-exit... su IPO fue al 50% del valor de su ultima ronda.. hoy $SQ esta 20x arriba

¿Porque una ronda estructurada la creo una opción de ultima instancia? Porque en general el único objetivo del que levanta capital es sostener la valuación, mientras el objetivo del inversor que te trae una ronda estructurada no es tener ganancias financieras gracias al éxito del startup sino gracias a ventajas ganadas en cláusulas "escondidas".

The Procession of the Trojan Horse into Troy

Si el ROFO te parece complicado aprende el significado de ratchet, liquidity preference, veto a ofertas de M&A, el Dividendo con Pago en Especies, cláusulas basadas en series... el problema es que cada nuevo inversor, en cada nueva ronda, va a entender que alguien tiene a perpetuidad ventaja sobre el retorno de tu startup (*).

Pero no todo es negativo ¿quienes están hoy en un gran momento? los que levantaron capital de forma medianamente coherente, sin aceptar los cheques con 48horas de due diligence, sin dejarse guiar por el FOMO de inversores con necesidad de desplegar billions... o los que, con sacrificio, lograron ser cash-flow positive y pueden extender esa estructura en el tiempo sin necesidad de seguir enterrándose gracias a malos inversores :)

| Rants
Tags:
emprendedores inversiones
1 2 3 53