I chatbot possono diventare coscienti quanto gli esseri umani?
Miscellanea / / October 31, 2023
Due teorie opposte cercano di rispondere a questa domanda.
Christoph Koch
Neuroscienziato americano, direttore dell'Allen Institute for Brain Research.
Domande su cosa sia l'esperienza soggettiva, chi la possiede e come si relaziona con il mondo fisico che ci circonda hanno tormentato le menti dei filosofi per gran parte della storia umana. Tuttavia, solo negli ultimi decenni sono emerse teorie scientifiche sulla coscienza quantificabili ed empiricamente verificabili.
Molte moderne teorie sulla coscienza si concentrano sulle tracce lasciate dalle sottili reti cellulari del cervello da cui nasce la coscienza. Oggi, due di esse dominano: la teoria dell’informazione integrata e la teoria dello spazio di lavoro globale neurale.
Venticinque anni fa litigammo con il filosofo australiano David Chalmers. Gli avevo promesso una cassa di buon vino se queste tracce neurali, tecnicamente chiamate correlati neurali della coscienza, fossero state scoperte e chiaramente descritte entro giugno 2023.
Tuttavia, la contraddizione tra la teoria dell’informazione integrata e la teoria dello spazio di lavoro globale neurale rimane irrisolta. Ciò è dovuto a prove in parte contrastanti su quali aree del cervello siano responsabili dell'esperienza visiva e percezione soggettiva di volti o oggetti, sebbene l'importanza della corteccia prefrontale per l'esperienza cosciente sia stata confutato. Quindi ho perso la scommessa e ho mandato il vino a Chalmers.
Entrambe le teorie dominanti sono state create per spiegare la connessione tra coscienza e attività neurale negli esseri umani e negli animali affini come scimmie e topi. Ed entrambe le teorie fanno presupposti fondamentalmente diversi sull'esperienza soggettiva e giungono a conclusioni opposte sulla coscienza negli artefatti artificiali. La misura in cui queste teorie sono empiricamente confermate o confutate in relazione alla coscienza radicata cervello, ha importanti implicazioni per rispondere alla domanda irrisolta del nostro tempo: le macchine possono guadagnare? coscienza?
Cosa sono i chatbot di nuova generazione?
Prima di discuterne, permettimi di contestualizzarti e di confrontare una tecnica consapevole con una tecnica che esibisce solo un comportamento intelligente. Gli ingegneri informatici si sforzano di dotare le macchine dell'intelligenza altamente flessibile che un tempo consentiva persona lasciare l’Africa e popolare l’intero pianeta. Questa si chiama intelligenza generale artificiale (AGI).
Molti sostengono che l’AGI sia una prospettiva lontana. Gli straordinari progressi compiuti nel campo dell’intelligenza artificiale nell’ultimo anno hanno colto di sorpresa il mondo intero, compresi gli esperti. Con l'avvento di eloquenti software conversazionali, colloquialmente chiamati chatbot, da un argomento esoterico, discusse dai fan della fantascienza e dall'élite del settore IT della Silicon Valley, le discussioni sull'AGI si sono trasformate in una discussione che riflette il diffuso malcontento pubblico riguardo al rischio esistenziale per il nostro modo di vivere e per la nostra Tipo.
I chatbot si basano su enormi modelli linguistici. I più famosi di questi sono una serie di robot chiamati trasformatori generativi pre-addestrati o GPT. Sono stati creati da OpenAI a San Francisco. Considerando la flessibilità, l'alfabetizzazione e la competenza dell'ultima versione, GPT-4, è facile credere che abbia intelligenza e personalità. Anche i suoi strani problemi, noti come "allucinazioni", rientrano in questa teoria.
GPT-4 e i suoi concorrenti, come LaMDA e Bard di Google, sono addestrati su biblioteche di libri digitalizzati e miliardi di pagine web disponibili al pubblico. La particolarità del modello linguistico è che apprende senza supervisione, elaborando parola per parola e cercando di prevedere l'espressione mancante. Lo fa ancora e ancora, miliardi di volte, senza intervento esterno.
Una volta che il modello acquisisce conoscenza assimilando i dati digitalizzati dell’umanità, l’utente visualizza una frase sconosciuta: una o più. Il modello prevede la prima parola più probabile, poi quella successiva e così via. Questo semplice principio ha mostrato risultati incredibili in inglese, tedesco, cinese, hindi, coreano e altre lingue, compresi vari linguaggi di programmazione.
Qual è la differenza tra intelletto e coscienza
È significativo che il saggio fondamentale sull’intelligenza artificiale, “Computing and Intelligence”, scritto da Alan Turing nel 1950, evitò la domanda “Possono le macchine pensare?”, cioè la domanda se abbiano o meno coscienza. Turing ha proposto il "gioco dell'imitazione": può un osservatore distinguere oggettivamente l'output stampato da un essere umano da quello stampato da una macchina se le identità di entrambi sono nascoste.
Oggi questo è noto come test di Turing e i chatbot sono molto bravi in questo, anche se astutamente lo negano se glielo chiedi direttamente. La strategia di Turing diede inizio a decenni di inesorabile progresso che portarono alla creazione del GPT, ma ignorò il problema.
Implicito nel dibattito sui chatbot è il presupposto che l’intelligenza artificiale sia la stessa cosa della coscienza artificiale, che essere intelligenti sia la stessa cosa che essere coscienti. E sebbene negli esseri umani e in altri organismi sviluppati l'intelligenza e la coscienza siano collegate, non necessariamente si accompagnano sempre a vicenda.
L'intelligenza riguarda il pensiero e l'apprendimento delle azioni e delle azioni proprie e degli altri, al fine di prevedere con maggiore precisione il futuro e prepararsi meglio ad esso. Non importa se ciò significa i prossimi secondi ("Oh, quella macchina sta correndo verso di me") o i prossimi anni ("Ho bisogno di imparare a programmare"). L’intelligenza riguarda in definitiva l’azione.
La coscienza, d'altro canto, è associata agli stati dell'essere: vedere il cielo azzurro, sentire il canto degli uccelli, provare dolore, essere amanti. Non ha la minima importanza se un’intelligenza artificiale fuori controllo percepisce qualcosa. Tutto ciò che conta è che abbia uno scopo estraneo al benessere a lungo termine dell’umanità. E non importa se sa o meno quello che sta cercando di fare, ciò che le persone chiamano autoconsapevolezza. Perseguirà “senza pensarci” il suo obiettivo. Quindi, almeno concettualmente, anche se costruiamo un'AGI, non ci dirà molto se sente qualcosa.
Sapendo tutto questo, torniamo alla questione originale di come la tecnologia possa diventare cosciente. Cominciamo con la prima delle due teorie.
Quale spiegazione offre la teoria dell’informazione integrata?
Inizia articolando cinque proprietà assiomatiche di ogni concepibile esperienza soggettiva. E poi si pone la domanda di cosa ha bisogno un circuito neurale per implementare queste cinque proprietà, accendendo alcuni neuroni e spegnendone altri. O, in altre parole, di cosa ha bisogno un chip di computer per accendere alcuni transistor e spegnerne altri.
Interazioni di causa-effetto all'interno di un circuito in un determinato stato o il fatto che due siano attivi neurone può accendere o spegnere un altro neurone, a seconda delle circostanze, può essere dispiegato in una struttura causale multidimensionale. È identica alla qualità dell’esperienza: come viene vissuta, ad esempio come vengono vissuti il tempo e lo spazio o come vengono percepiti i colori.
All'esperienza è associata anche una quantità: la sua informazione integrata. Solo un circuito con un massimo di informazioni integrate diverse da zero esiste nel suo insieme e ha coscienza. Quanto più l'informazione è integrata, tanto più il circuito non è riducibile e tanto meno può essere considerato semplicemente una sovrapposizione di sottocircuiti indipendenti.
La teoria dell’informazione integrata enfatizza la ricca natura dell’esperienza umana. Basta guardarsi intorno e lo straordinario mondo visibile con le sue innumerevoli differenze e connessioni apparirà davanti a te. Oppure guarda un dipinto di Pieter Bruegel il Vecchio, un artista fiammingo del XVI secolo che raffigurava soggetti religiosi e scene di vita contadina.
Qualsiasi sistema che abbia le stesse connessioni interne e gli stessi poteri causali del cervello umano sarà, in linea di principio, altrettanto cosciente quanto la mente umana. Tuttavia, un tale sistema non può essere modellato. Deve essere progettato o costruito a immagine del cervello. I moderni computer digitali si basano su un accoppiamento estremamente lento (l'uscita di un transistor collegata all'ingresso di più transistor). confronto con il sistema nervoso centrale (il neurone della colonna corticale riceve dati in input e produce dati in output a decine di migliaia di altri neuroni).
Pertanto, i computer moderni, compresi i computer cloud, non saranno consapevoli di nulla, anche se col tempo saranno in grado di fare tutto ciò che le persone possono fare. Da questo punto di vista ChatGPT non sembrerà mai speciale. Si noti che questa affermazione non ha nulla a che fare con il numero totale di componenti, siano essi neuroni o transistor, ma piuttosto con il modo in cui sono collegati. È l'interconnessione che determina la complessità complessiva del circuito e il numero delle sue possibili configurazioni.
Quale spiegazione offre la teoria dello spazio di lavoro globale neurale?
Deriva dalla comprensione psicologica che intelligenza come un teatro dove gli attori si esibiscono su un piccolo palcoscenico illuminato, che è la coscienza. Le azioni degli attori sono osservate da un pubblico di addetti ai lavori che siedono dietro il palco nell'oscurità.
Il palcoscenico è lo spazio di lavoro centrale della mente, che ha una piccola capacità di memoria per rappresentare una singola percezione, pensiero o ricordo. Vari moduli di elaborazione (visione, udito, capacità motorie degli occhi e degli arti, pianificazione, giudizio, comprensione del linguaggio e conversazione) competono per l'accesso a questo spazio di lavoro centrale. Il vincitore sposta il vecchio contenuto, che diventa inconscio.
Secondo la teoria dello spazio di lavoro globale neurale, la scena metaforica, insieme ai moduli di elaborazione, è mappata nell’architettura della neocorteccia. Lo spazio di lavoro è una rete di neuroni corticali nella parte anteriore del cervello con proiezioni a lungo raggio neuroni simili distribuiti in tutta la neocorteccia nelle zone prefrontale, parietotemporale e cingolata corteccia associativa.
Quando l'attività nella corteccia sensoriale supera una certa soglia, si innesca un evento globale nelle aree corticali e, di conseguenza, l'informazione viene trasmessa all'intero spazio di lavoro. La diffusione globale dell’informazione la rende cosciente. I dati che non vengono trasmessi in questo modo, come la posizione precisa degli occhi o le regole sintattiche per costruire frasi alfabetizzate, possono influenzare il comportamento, ma non in modo cosciente.
Dal punto di vista della teoria dello spazio di lavoro globale neurale, l'esperienza è molto limitata, simile al pensiero e astratto - simile alla scarna descrizione che si può trovare in un museo sotto un dipinto di Bruegel: “Scena in al chiuso. I contadini in abiti rinascimentali bevono e mangiano durante un matrimonio."
Comprendendo la coscienza dal punto di vista della teoria dell'informazione integrata, l'artista trasmette brillantemente la fenomenologia del mondo circostante su una tela bidimensionale. Nella comprensione della teoria dello spazio di lavoro globale neurale, questa apparente ricchezza è un’illusione, un fantasma. E tutto ciò che si può oggettivamente dire al riguardo è indicato nella breve descrizione.
La teoria dello spazio di lavoro globale neurale tiene pienamente conto dei miti della nostra era informatica, secondo i quali tutto può essere ridotto a calcoli. Simulazioni computerizzate opportunamente programmate del cervello, con un enorme feedback e qualcosa come uno spazio di lavoro centrale, percepiranno consapevolmente il mondo. Forse non ora, ma molto presto.
Qual è la differenza inconciliabile tra le teorie?
In termini generali il discorso è il seguente. Secondo la teoria dello spazio di lavoro globale neurale e altre teorie del funzionalismo computazionale (the consideriamo la coscienza come una forma di calcolo), la coscienza non è altro che un insieme di algoritmi intelligenti eseguiti su una macchina Turing. Le funzioni sono importanti per la coscienza cervelloe non le sue proprietà causali. Se una versione avanzata di GPT accetta e produce gli stessi modelli di input e output degli esseri umani, tutte le nostre proprietà intrinseche verranno trasferite alla tecnologia. Compreso il nostro prezioso tesoro: l'esperienza soggettiva.
Al contrario, per la teoria dell’informazione integrata, il cuore della coscienza è il potere causale interno, non il calcolo. Non è qualcosa di etereo o intangibile. È specifico e funzionalmente determinato dalla misura in cui il passato del sistema determina il suo presente (il potere della causa) e dalla misura in cui il presente determina il suo futuro (il potere dell’effetto). Ed ecco il problema: la relazione di causa-effetto in sé, la capacità di forzare un sistema a eseguire una determinata azione, e non molte alternative, non può essere modellata. Non ora, non in futuro. Questo dovrebbe essere integrato nel sistema.
Consideriamo un codice informatico che modella le equazioni di campo della teoria generale della relatività di Einstein, che mettono in relazione la massa con la curvatura dello spaziotempo. Il software modella accuratamente il supermassiccio buco nero, che si trova al centro della nostra galassia. Questo buco esercita un'influenza gravitazionale così forte sull'ambiente circostante che nulla, nemmeno la luce, può sfuggire alla sua attrazione.
Tuttavia, un astrofisico che simula un buco nero non verrà risucchiato in un laptop dal campo gravitazionale simulato. Questa osservazione apparentemente assurda evidenzia la differenza tra modello e realtà: se il modello è completamente corrisponde alla realtà, lo spazio e il tempo dovrebbero essere distorti attorno al portatile, creando un buco nero che assorbe tutto in giro.
Naturalmente la gravità non è un calcolo. Ha una forza causale che gli permette di deformare il tessuto dello spazio-tempo e di attrarre tutto ciò che ha massa. Per simulare le forze causali di un buco nero è necessario un vero oggetto superpesante, non solo un codice informatico. Il potere causale non può essere modellato, deve essere creato. La differenza tra realtà e modello risiede nei loro poteri causali.
Ecco perché non piove all'interno di un computer che simula un temporale. Il software è funzionalmente identico al meteo, ma non ha il potere causale di rilasciare vapore e trasformarlo in goccioline d’acqua. Il potere causale, la capacità di creare o accettare il cambiamento per conto proprio, deve essere integrato nel sistema. È possibile.
Un cosiddetto computer neuromorfico, o bionico, potrebbe essere cosciente quanto un essere umano. Ma questo non è il caso dell'architettura standard di von Neumann, che è la base di tutti i PC moderni. Piccoli prototipi di computer neuromorfici sono stati creati nei laboratori, come il chip neuromorfico Loihi 2 di seconda generazione di Intel. Ma una macchina abbastanza sofisticata da produrre qualcosa che assomigli alla coscienza umana, o almeno alla coscienza di un moscerino della frutta, è ancora un sogno ambizioso per un lontano futuro.
Si noti che questa differenza inconciliabile tra teorie funzionaliste e causali non ha nulla a che fare né con l’intelligenza naturale né con quella artificiale. Come ho detto prima, l’intelligenza è comportamento. Tutto ciò che l'ingegno umano può produrre, compresi grandi romanzi come La parabola del seminatore di Octavia Butler e Guerra e pace di Lev Tolstoj, possono riprodurre l'intelligenza algoritmica se gli viene fornito materiale sufficiente formazione. L'avvento dell'AGI è un obiettivo raggiungibile in un futuro non troppo lontano.
Il dibattito non riguarda l’intelligenza artificiale, ma la coscienza artificiale. E questo dibattito non può essere risolto creando modelli linguistici più ampi o algoritmi di rete neurale più avanzati. Per rispondere a questa domanda dobbiamo comprendere l’unica soggettività di cui siamo assolutamente sicuri: la nostra. Una volta che abbiamo una spiegazione chiara dell'umano coscienza e le sue basi neurali, saremo in grado di estendere la nostra comprensione alle tecnologie intelligenti in modo coerente e basato sulla scienza.
Questa discussione ha poca influenza sul modo in cui i chatbot verranno percepiti dalla società in generale. Le loro abilità linguistiche, conoscenze di base e fascino sociale diventeranno presto impeccabili. Saranno dotati di perfetta memoria, competenza, equilibrio, ragionamento e intelligenza. Alcuni sostengono addirittura che queste creazioni della grande tecnologia costituiranno il prossimo passo nell'evoluzione, il "superuomo" di Nietzsche. Io ho una visione più oscura e credo che queste persone confondano il declino della nostra specie con l’alba.
Per molte, e forse la maggior parte, delle persone in una società sempre più atomizzata, disconnessa dalla natura e dalla natura organizzati attorno ai social network, sarà emotivamente difficile resistere alle tecnologie che vivono in essi telefoni. E in diverse situazioni, ordinarie e più gravi, le persone si comporteranno come se i chatbot avessero coscienza, possono davvero farlo essere innamorato, sofferenza, speranza e paura, anche se non sono altro che complesse tabelle di consultazione. Diventeranno per noi indispensabili, forse anche più importanti degli esseri veramente intelligenti. Anche se i chatbot hanno la stessa sensibilità di una TV o di un tostapane, nulla.
Cos'altro leggere sull'argomento🤖
- 6 motivi per cui non dovresti fidarti ciecamente dell'intelligenza artificiale
- Perché non dovremmo aver paura che le nuove tecnologie possano portarci via il nostro lavoro
- Singolarità tecnologica: è vero che presto la tecnologia sfuggirà al nostro controllo?
- 8 miti sull'intelligenza artificiale a cui credono anche i programmatori