“La voce artificiale. Un’indagine media-archeologica sul computer parlante”, di Domenico Napolitano, Editoriale Scientifica – Collana puntoOrg, Napoli, 2022

La voce artificiale ci riguarda tutti da vicino. Siri, Alexa, Google Home, dispositivi parlanti e ascoltanti, interfacce vocali tra umani e macchine, stanno trasformando il nostro rapporto con la tecnologia, quindi il nostro modo di stare in relazione, dentro e fuori le organizzazioni. La presenza della voce nel nostro agire e interagire schiude a interessanti possibilità di comunicazione anche alle persone con disabilità, ponendo sfide interessanti anche a chi svolge ricerca in questo campo, nell’ottica di una società sempre più inclusiva e attenta alle culture delle differenze. In breve, siamo di fronte a nuove forme espressive e comunicative.

Il volume di Domenico Napolitano è il primo testo in lingua italiana che si confronta in maniera rigorosa e approfondita con questo fenomeno caratteristico della nostra contemporaneità. Un lavoro pubblicato nella collana puntoOrg e impreziosito dall’introduzione di Luigi Maria Sicca, dalla prefazione di Davide Borrelli e dalla postfazione di Barbara Czarniawska. Come ci avverte l’autore sin dalle prime pagine, la voce artificiale è una tecnologia nel senso più ricco del termine, quindi anche una vera e propria pratica culturale che riguarda il modo di pensare le relazioni socio-organizzative e intersoggettive. Un approccio che si interroga sulla tecnologia come attore sociale e che, proprio perché affonda le sue basi negli studi di Organizzazione aziendale, non rinuncia a declinare le implicazioni del trasferimento alla macchina di ciò che per millenni ha costituito la specificità umana, ovvero il logos. Per entrare nella questione della voce artificiale, Napolitano ripropone infatti l’approccio socio-tecnico, caro alla tradizione delle ricerche di Organization and Information Technology, con riferimento anche ai Science and Technology Studies. Seguendo questa impostazione il lavoro si muove trasversalmente tra tecnologie, saperi, storie, desideri, interessi e immaginari, analizzando quindi – allo stesso tempo – strutture antropologiche e sociali interne alle teorie dell’agire organizzativo. Il libro indaga così, in parallelo, l’impatto della tecnologia vocale sull’immaginario tecnologico dell’Intelligenza Artificiale e le narrazioni che ne alimentano il mito, ma anche le pratiche di programmazione messe in campo per realizzare quelle tecnologie. Queste ultime, a propria volta, sono considerate non solo come meri strumenti, ma anche come dispositivi che promuovono determinati saperi e approcci epistemologici, i quali si traducono in modelli organizzativi che riguardano, non da ultimi, cambiamenti nei rapporti tra ricerca pubblica universitaria e ricerca privata nell’ambito delle grandi aziende tecnologiche.

Tematizzando un fecondo incontro tra metodologie della ricerca sociale consolidate in letteratura, questo lavoro entra nei processi di ideazione e sviluppo delle tecnologie fino a prenderne in considerazione gli aspetti più strettamente ingegneristici e informatici, in modo da restituire un’immagine articolata eppure chiara dei rapporti di co-costituzione tra tecnologia, cultura e impresa. A questo riguardo, di particolare interesse è il lavoro che l’autore ha svolto sul campo insieme ai programmatori di voci sintetiche sia in ambito commerciale che artistico, attraverso il quale egli mette in evidenza come le fantasie più antiche sulla disincarnazione della voce influenzino in maniera rilevante tanto le pratiche quanto le estetiche della tecnologia parlante.

L’autore ci ricorda, infatti, che «le tecnologie della voce sono realizzazioni di fantasie e desideri riguardanti la voce che precedono le attuali tecnologie» (p. 240). E così il lavoro di scavo “archeologico” qui proposto diviene il modo per indagare le complesse genealogie che hanno condotto dalle prime macchine parlanti settecentesche fino ai moderni sistemi computazionali e di IA, mettendo in evidenza continuità di tipo culturale ed epistemologico spesso latenti oppure nascoste dietro la retorica soluzionistica tipica degli ultimi decenni, che, come ci avverte Morozov, vorrebbe la tecnologia presa in un “progresso” lineare e indiscutibile, a tratti caricata addirittura di un carattere salvifico. In controtendenza con questo atteggiamento, questo lavoro ci ricorda che la tecnologia è una costruzione sociale che porta iscritti in sé precisi valori e visioni del mondo – e che uno dei compiti della ricerca è proprio “decostruire” ciò che è apparentemente autoevidente.

Date queste premesse, il lavoro ricostruisce un percorso che interseca numerosi luoghi della cultura tecnologica della modernità, dalla fonografia alla telecomunicazione, passando per la teoria dell’informazione, la linguistica, la fonetica e l’acustica. Interessanti approfondimenti sono dedicati alle tecnologie sonore e a quella branca dell’intelligenza artificiale che va sotto il nome di machine learning, ovvero apprendimento automatico, attraverso cui gli algoritmi “imparano” a parlare come gli umani partendo da dati e registrazioni vocali appositamente predisposti. Ma la finalità dell’indagine non è mai semplicemente strumentale: approfondendo il funzionamento delle tecnologie, l’autore ci permette di ricostruire il significato socio-culturale della voce sintetica così come esso è declinato dalle pratiche tecno-scientifiche e di laboratorio. Il che ha ricadute tanto sul mondo delle imprese e delle organizzazioni quanto su questioni etico-politiche. La sintesi vocale attraverso algoritmi di machine learning, ad esempio, presume la necessità tecnica di raccogliere dati biometrici sulla persona, i quali possono essere impiegati poi per scopi secondari e non espliciti, riconducibili a quel paradigma del “capitalismo della sorveglianza” di cui ha recentemente parlato Shoshana Zuboff.

Affianco a un approfondimento rivolto a quelle che Bruno Latour ha definito le agency non umane, questo libro riserva altrettanta attenzione alla percezione, alla fenomenologia del vocale, quindi a tutto ciò che da mondo acustico e sonoro si traduce in azione sociale, per definizione intersoggettiva e organizzativa. Alexa, ad esempio, trasporta con sé una serie di significati sociali: è maschio o femmina? Presumiamo sia femmina, quindi (non a caso) servile (è “assistente” vocale), peraltro seducente, e per non farci mancare nulla, dotata anche di una anche una buona dose di frivolezza: tutti aspetti, a ben riflettere, oggi al centro del dibattito sia su ciò che conosciamo come diversity management pensato in una accezione estensiva, sia sulla tendenza della tecnologia a riprodurre stereotipi di genere, classe, etnia, ecc. E uno dei meriti del lavoro di Domenico Napolitano è anche quello di intersecare questi due ambiti di analisi, spesso tenuti distanti e invece in questo caso intrecciati perché in effetti senza soluzione di continuità nei contesti aziendali entro cui operiamo tutti i giorni, come consumatori, clienti, imprenditori, manager o ricercatori.

In questo senso, la dimensione sonora diviene pretesto, occasione, medium di conoscenza che permette di approdare a ciò che non si vede, ovvero a valori e pregiudizi incorporati negli algoritmi e nelle materialità tecnologiche, quindi negli artefatti e nelle culture organizzative. È proprio questo, insomma, un contributo prezioso fornito da questo libro: l’attenzione riservata al suono divene qui il ponte tra il mondo dell’estetica e dell’immaginario e quello industriale-produttivo, sull’abbrivio della più qualificata letteratura che riconosce un ruolo pregnante alle dimensioni simboliche dell’agire (behavior), in dialettica con le logiche del progettare (design).

Il primo capitolo è un’introduzione teorico-critica al fenomeno del computer parlante dando conto ai lettori degli assunti epistemici e dell’impianto metodologico adottato, a partire dal costruzionismo sociale (richiamato nella postfazione di Czarniawska) e dai sound studies (tematizzati nella introduzione di Sicca).

Nel secondo capitolo, l’indagine mette in luce rapporti di continuità e discontinuità tra vecchi e nuovi sistemi di sintesi vocale incorporati e operazionalizzati all’interno delle loro black box algoritmiche e computazionali. I materiali per questa indagine sono ricavati dalla ricerca archivistica e includono documenti tecnici relativi alle tecnologie vocali, specialmente quelle legate alla “sintesi” del parlato della seconda metà del Novecento, brevetti, manuali di programmazione e di design, articoli accademici, archivi non discorsivi, depositari di specifiche operazioni, di specifici suoni e di agency non umane. A questi e alle loro evoluzioni storiche si rivolge la media analysis (come ci avverte nella prefazione Borrelli).

Il terzo capitolo è dedicato agli immaginari della voce artificiale e alle pratiche culturali che si manifestano sottotraccia tanto nelle rappresentazioni sociali contemporanee (qua il riferimento è alle pubblicità degli assistenti vocali e alle presentazioni giornalistiche), quanto nelle materialità tecniche e in quelle delle pratiche culturali: posture corporee, processi di embodiment, pratiche di raccolta dati e di programmazione, ecc. Per cogliere questi aspetti l’autore ha condotto un’osservazione etnografica di una serie di figure professionali che lavorano nell’ambito della sintesi vocale.

Il quarto capitolo analizza la voce artificiale come pratica comunicativa. Qui l’attenzione è rivolta alle interfacce vocali, di cui espressione di rilievo sono i cosiddetti assistenti virtuali, o smart speaker, si diceva Amazon Echo (Alexa) e Google Home. Partendo da una ricognizione sulle teorie dell’interfaccia, il capitolo indaga i presupposti teorici ed epistemologici che sottendono l’idea di “interfaccia naturale”, decostruendoli, spingendosi ad approfondire il rapporto tra ascolto macchinico e sorveglianza, quindi le connessioni tra pratiche di estrazione e raccolta dati attraverso la voce e pratiche di sorveglianza a fini di estrazione di valore, ma anche securitari e predittivi.

Le conclusioni calano le questioni emerse dall’indagine sulla voce artificiale nel più generale quadro di una riconfigurazione del concetto di comunicazione alla luce delle teorie del postumanesimo, in uno scenario caratterizzato dalla crescente presenza di macchine algoritmiche interconnesse.

Ulteriori informazioni sono reperibili al sito www.puntoorg.net

Autori

_

Ultimi articoli