"En el desarrollo de software tradicional, planificarías la v1, v2, v3 del nuevo producto basado en la profundidad de las características o las necesidades del usuario. Con los sistemas de IA, la perspectiva cambia. Cada versión se define en función de cuánta autonomía tiene el sistema y cuánto control estás dispuesto a ceder. Comienza identificando un conjunto de características que tengan alto control y baja autonomía (versión 1 en la imagen de abajo). Estas deben ser pequeñas, testables y fáciles de observar. A partir de ahí, piensa en cómo esas capacidades pueden evolucionar con el tiempo aumentando gradualmente la autonomía, una versión a la vez. El objetivo es descomponer un estado final ambicioso en comportamientos tempranos que puedas evaluar, iterar y construir a partir de ellos. Por ejemplo, si tu objetivo final es automatizar el soporte al cliente en tu empresa, una forma de alto control para comenzar sería definir la v1 (versión 1) simplemente como redirigir tickets al departamento correcto, luego pasar a la v2 donde el sistema sugiere posibles resoluciones, y solo en la v3 permitir que se resuelva automáticamente con un respaldo humano. Aquí hay un par de ejemplos más: Asistente de marketing v1: Redactar correos electrónicos, anuncios o copias sociales a partir de indicaciones v2: Crear campañas de múltiples pasos y ejecutarlas v3: Lanzar, realizar pruebas A/B y optimizar automáticamente campañas en diferentes canales Asistente de codificación v1: Sugerir completaciones en línea y fragmentos de código estándar v2: Generar bloques más grandes (como pruebas o refactorizaciones) para revisión humana v3: Aplicar cambios específicos y abrir solicitudes de extracción (PRs) de forma autónoma Si has seguido cómo herramientas como GitHub Copilot o Cursor han evolucionado, este es exactamente el manual que utilizaron. La mayoría de los usuarios solo ven la versión actual, pero el sistema subyacente escaló esa escalera gradualmente. Primero completaciones, luego bloques, luego PRs, con cada paso ganado a través del uso, la retroalimentación y la iteración." Más aquí:
Lenny Rachitsky
Lenny Rachitsky20 ago, 00:21
No puedes construir productos de IA como otros productos. Los productos de IA son inherentemente no deterministas, y necesitas negociar constantemente el equilibrio entre la agencia y el control. Cuando los equipos no reconocen estas diferencias, sus productos enfrentan fallos inesperados, se quedan atascados depurando grandes sistemas complicados que no pueden rastrear, y la confianza del usuario en el producto se erosiona silenciosamente. Después de ver este patrón desarrollarse en más de 50 implementaciones de IA en empresas como @OpenAI, @Google, @Amazon y @Databricks, Aishwarya Naresh Reganti y Kiriti Badam desarrollaron una solución: el marco de Calibración Continua/Desarrollo Continuo (CC/CD). El nombre es una referencia a la Integración Continua/Despliegue Continuo (CI/CD), pero, a diferencia de su homónimo, está destinado a sistemas donde el comportamiento es no determinista y la agencia necesita ser ganada. Este marco te muestra cómo: - Comenzar con características de alto control y baja agencia - Construir sistemas de evaluación que realmente funcionen - Escalar productos de IA sin romper la confianza del usuario Está diseñado para reconocer la singularidad de los sistemas de IA y ayudarte a construir productos de IA más intencionados, estables y confiables. Lo están compartiendo públicamente por primera vez:
66,67K