ChatGPT Plugins e la Lettera Aperta per Mettere in Pausa Progetti AI Sperimentali
ChatGPT esce dal sandbox tramite I plugins, ora i LLMs possono interagire con la società. Il Future of Life Institute pubblica una lettera aperta.
Al termine di una delle masterclass su ChatGPT una delle domande che mi è stata chiesta era se ChatGPT sarebbe stato un “disruptor” di Google. Era il “lontano” Gennaio del 2023 (lontano nel senso iperbolico del termine, dato che il tempo nel mondo dell’intelligenza artificiale (AI) sembra muoversi ad una velocità relativa) e risposi che, per come era fatto ChatGPT, non sostituiva Google come motore di ricerca. Il motivo era che ChatGPT non aveva la possibilità di accedere ad Internet e quindi nel fornire informazioni in real-time. Infatti se da una parte ChatGPT è forte nel: 1) dare un significato alle informazioni testuali - sia in termini di dati che di sentiment; 2) generare una risposta basata sull'intento (ciò che l'utente ha chiesto) e sul contesto (ciò che è già stato discusso), dall’altra Google è un sistema di information retrieval specializzato nel fornire referenze in cui noi poi troveremo la risposta, queste informazioni (referenze) sono in real time. Suggerii poi che sembrava che Google stesse prendendo come direzione quella di passare dall'information retrieval motore di ricerca ai large language model (LLMs)(chatGPT, GPT etc). Questo perché gli utenti quando cercano una risposta alle loro domande vogliono avere a che fare con "esperti". Quindi per concludere, dissi che probabilmente Google sarebbe diventato uno strumento simile ChatGPT.
L’opinion paper in ci Google si espone su questo tema è intitolato Rethinking Search: Making Domain Experts out of Dilettantes è del 2021. Un mese dopo l’antefatto che ho appena raccontato, Google rilascia Bard e Microsoft dota sia Bing (Bing Chat) che Edge di AI generativa per condurre le ricerche. Ora qual’è il punto del discorso? Sicuramente non la celebrazione delle mie capacità predittive, ma il fatto che la combinazione di AI e motore di ricerca era già una direzione a cui si auspicava da tempo. L'implementazione di tecnologie di AI all'interno dei motori di ricerca, porterebbe ad un miglioramento significativo dell'esperienza dell'utente. In questo modo, non solo gli utenti possono trovare le informazioni che cercano più facilmente, ma possono anche interagire con il motore di ricerca in modo più naturale e intuitivo. L'utilizzo di AI ha anche permesso ai motori di ricerca di comprendere il contesto e l'intento dell'utente, offrendo risultati più rilevanti e personalizzati.
Poi a Marzo OpenAI annuncia ChatGPT plugins. I plugins conferiscono a ChatGPT la capacità di interagire con il mondo esterno tramite Internet, compresa la prenotazione di voli, l'acquisto di generi alimentari, la navigazione sul web e altro ancora. I plugins sono frammenti di codice che indicano a ChatGPT come utilizzare una risorsa esterna su Internet. I plug in per il momento non possono essere utilizzati da tutti ma solo da alcuni programmatori che sono stati scelti da una lista d’attesa. Comunque la potenzialità del prodotto rimane la stessa: in sostanza, se uno sviluppatore desidera fornire a ChatGPT la capacità di accedere a qualsiasi servizio di rete (ad esempio: "ricerca dei prezzi delle azioni in tempo reale") o di eseguire qualsiasi attività controllata da un servizio di rete (ad esempio: "ordinare una pizza tramite Internet"), ora è possibile, a condizione che non violi le regole di OpenAI.
Fino ad ora, la maggior parte dei LLMs come ChatGPT erano stati limitati in una sorta di bolla, in grado di interagire con il mondo solo attraverso conversazioni testuali con un utente. Come scrive OpenAI nel suo post introduttivo sui plugin di ChatGPT, "L'unica cosa che i modelli di linguaggio possono fare fuori dalla scatola (box) è emettere testo". Bing Chat (ovvero il motore di ricerca di microsoft + AI) aveva cambiato ulteriormente questo paradigma consentendo di cercare sul web informazioni più recenti, ChatGPT, però, sembrava sarebbe rimasto isolato dal mondo esterno ancora per un pò. Prima dei plugins ChatGPT poteva solo attingere dati dal suo set di addestramento (che contiene informazioni fino al 2021) e da eventuali informazioni fornite dall'utente durante la conversazione. Per questi motivi ChatGPT “soffre di allucinazioni”, ovvero commette errori soprattutto circa informazioni di tipo fattuale.
Per superare queste limitazioni, OpenAI ha fatto esplodere “la bolla” e creato una interfaccia per i plugin di ChatGPT (ciò che OpenAI chiama "occhi e orecchie" di ChatGPT) che consente agli sviluppatori di creare nuovi componenti che si "inseriscono" in ChatGPT e consentono al modello di AI di interagire con altri servizi su Internet. Questi servizi possono eseguire calcoli e riferirsi a informazioni di fatto per ridurre le allucinazioni, e possono anche potenzialmente interagire con qualsiasi altro servizio software su Internet - se gli sviluppatori creano un plugin per quella specifica attività. Nell’immagine qui sotto si possono vedere i plugin.
In particolare, il plugin Zapier sembra particolarmente “potente” in quanto consente a ChatGPT di accedere a un sistema di automazione software esistente. In sostanza si può cPotete chiedere a ChatGPT di eseguire una qualsiasi delle 50.000 azioni di Zapier (tra cui ricerca, aggiornamento e scrittura) con le oltre 5.000 app supportate da Zapier, trasformando la chat in azione". Può scrivere un'e-mail e inviarla per voi. Oppure trovare contatti in un CRM e aggiornarli direttamente. Oppure aggiungere righe a un foglio di calcolo e inviarle come messaggio Slack. Le possibilità sono infinite".
OpenAI ospita anche tre plugin, un browser web (che può raccogliere informazioni dal web in modo simile a Bing Chat), un interprete di codice per l'esecuzione di programmi Python (in una sandbox) e uno strumento di recupero che consente l'accesso a fonti di informazioni "personali o organizzative" ospitate altrove (in pratica, recuperando informazioni da documenti).
Questa nuova combinazione in cui c’è un motore di ricerca e un’AI generativa, fa parte di una direzione (e di un comfort) che erano già stati intravisti in passato (i.e., si pensi all’opinion paper di Microsoft del 2021). Nell’ultimo anno lo sviluppo di sistemi AI è diventato più che esponenziale (i.e., legge di Moore) e nel giro dei primi tre mesi del 2023 abbiamo visto un’escalation che, passando per la combinazione di motori di ricerca con AI generativa (Chat Bing), arriva ai plugin di ChatGPT.
Occorre fare un’osservazione di tipo sociale riguardo a questa escalation esponenziale, cioè che i LLMs degli ordini di grandezza pari a chatGPT (o superiori come GPT4) non sono più in un sandbox di manipolazione linguistica su dati circoscritti, ma sono ora all’interno del tessuto sociale dove ora ChatGPT plugin può agire ed interagire con umani, ma inoltre hanno accesso a tutta una serie di dati real-time a cui prima non aveva accesso. Poiché l’AI e altri ambiti sociali, come quello legislativo, si muovono seguendo tempistiche completamente diverse, non vi sono ancora le strutture politiche per accogliere un cambiamento di questa portata. Per questo è stata pubblicata una lettera aperta in cui si chiede a tutti i laboratori di AI di sospendere immediatamente per almeno 6 mesi l'addestramento di sistemi di AI più potenti del GPT-4, di tali sistemi e di AGI abbiamo parlato nel precedete issue. Rallentare il processo evolutivo dell’AI potrebbe permettere alle organizzazioni politico-sociali di mettersi in pari e farsi trovare preparati? Questa rimane una domanda aperta.