"Nello sviluppo software tradizionale, pianificheresti v1, v2, v3 del nuovo prodotto in base alla profondità delle funzionalità o alle esigenze degli utenti. Con i sistemi AI, la prospettiva cambia. Ogni versione è invece definita da quanto potere decisionale ha il sistema e quanto controllo sei disposto a cedere. Inizia identificando un insieme di funzionalità che hanno un alto controllo e una bassa autonomia (versione 1 nell'immagine qui sotto). Queste dovrebbero essere piccole, testabili e facili da osservare. Da lì, pensa a come quelle capacità possono evolversi nel tempo aumentando gradualmente l'autonomia, una versione alla volta. L'obiettivo è suddividere uno stato finale ambizioso in comportamenti iniziali che puoi valutare, iterare e costruire. Ad esempio, se il tuo obiettivo finale è automatizzare il supporto clienti nella tua azienda, un modo ad alto controllo per iniziare sarebbe definire v1 (versione 1) semplicemente come il reindirizzamento dei ticket al dipartimento giusto, poi passare a v2 dove il sistema suggerisce possibili risoluzioni, e solo in v3 consentire di risolvere automaticamente con un fallback umano. Ecco un paio di altri esempi: Assistente marketing v1: Redigere email, annunci o testi per social media da suggerimenti v2: Creare campagne multi-step e gestirle v3: Lanciare, testare A/B e ottimizzare automaticamente le campagne su più canali Assistente alla programmazione v1: Suggerire completamenti in linea e frammenti di codice standard v2: Generare blocchi più grandi (come test o refactoring) per revisione umana v3: Applicare modifiche specifiche e aprire richieste di pull (PR) in modo autonomo Se hai seguito come strumenti come GitHub Copilot o Cursor si sono evoluti, questo è esattamente il manuale che hanno usato. La maggior parte degli utenti vede solo la versione attuale, ma il sistema sottostante ha scalato quella scala gradualmente. Prima completamenti, poi blocchi, poi PR, con ogni passo guadagnato attraverso l'uso, il feedback e l'iterazione." Di più qui:
Lenny Rachitsky
Lenny Rachitsky20 ago, 00:21
Non puoi costruire prodotti AI come altri prodotti. I prodotti AI sono intrinsecamente non deterministici e devi costantemente negoziare il compromesso tra agenzia e controllo. Quando i team non riconoscono queste differenze, i loro prodotti affrontano fallimenti inaspettati, rimangono bloccati a fare debug di sistemi complessi che non possono tracciare e la fiducia degli utenti nel prodotto si erode silenziosamente. Dopo aver visto questo schema ripetersi in oltre 50 implementazioni di AI in aziende come @OpenAI, @Google, @Amazon e @Databricks, Aishwarya Naresh Reganti e Kiriti Badam hanno sviluppato una soluzione: il framework Continuous Calibration/Continuous Development (CC/CD). Il nome è un riferimento a Continuous Integration/Continuous Deployment (CI/CD), ma, a differenza del suo omonimo, è destinato a sistemi in cui il comportamento è non deterministico e l'agenzia deve essere guadagnata. Questo framework ti mostra come: - Iniziare con funzionalità ad alta controllo e bassa agenzia - Costruire sistemi di valutazione che funzionano realmente - Scalare i prodotti AI senza compromettere la fiducia degli utenti È progettato per riconoscere l'unicità dei sistemi AI e aiutarti a costruire prodotti AI più intenzionali, stabili e affidabili. Lo stanno condividendo pubblicamente per la prima volta:
60,74K