Condividi

Il ROBOlibro: l’algoritmo crea contenuti

Fernand Léger, La Lecture, 1924, Centro Pompidou, Parigi. Nel dipinto Leger, che esplora il rapporto uomo-ambiente nel paesaggio meccanizzato e automatizzato, raffigura due figure femminili monumentali, una nuda e l’altra vestita, che tengono dei libri senza posarvi gli occhi che invece fissano direttamente l’astante.

Il ROBOlibro: l’algoritmo crea contenuti

Come mostra anche l’assemblaggio anatomico, le figure non sembrano neppure “umane”, ma, nella loro rappresentazione a colori freddi su fondale metafisico totalmente astratto, appaiono come appendici funzionali di un potente macchinario che ha anche prodotto i tre improbabili fiori recisi che tiene in mano la figura di destra. Come spiega la scheda che il museo dedica all’opera, La Lecture “è una delle prime realizzazioni, senz’altro la più impressionante, del principio della figura oggetto” che informa l’arte del pittore normanno.

Libri al volo

Immaginate di voler leggere di un qualunque argomento e a qualsiasi livello di approfondimento, i libri sono tutti disponibili ma ancora non esiste niente di reale, di tangibile; le parole, le migliaia di parole che costituiranno il libro giacciono ancora inanimate e scollegate all’interno di un database fino a che qualcuno non ordinerà il libro su Amazon o su altra libreria. A quel punto, in un tempo brevissimo, al massimo 20 minuti, il libro sarà pronto, generato a un costo bassissimo: quello della corrente elettrica servita a tenere acceso il computer…

Philip M. Parker, il più prolifico autore di tutti i tempi

L’idea di costruire libri al volo è di Philip M. Parker, docente di Marketing presso la Business School insead. Parker ha creato un software in grado di scrivere libri su argomenti specifici in circa 20 minuti.  L’algoritmo brevettato ha finora generato centinaia di migliaia di libri. In realtà, Amazon ha nei suoi elenchi oltre 100.000 libri attribuiti a Parker, e più di 700.000 opere alla sua azienda, la icon Group International, Inc.

Parker non è tanto un autore quanto un compilatore, ma il risultato finale è lo stesso: bastimenti pieni di opere scritte. Forse questi libri non sono quelli che la gente legge più di frequente. Le categorie più comuni riguardano infatti relazioni tecniche e di business, i dizionari di lingua con lo pseudonimo “Webster’s” (che è di dominio pubblico), panoramiche su malattie rare e libri cruciverba per imparare le lingue straniere. Ma tutti hanno una cosa in comune: sono generati automaticamente da un software. Il sistema automatizza questo processo attraverso la costruzione di banche dati da cui, tramite un’interfaccia che permette di personalizzare una query, attingere informazioni su un determinato argomento e generare modelli.

Dato che ebook digitali e servizi di print-on-demand sono oramai all’ordine del giorno, gli argomenti sono tutti elencati in Amazon senza nemmeno essere stati ancora scritti.

Ecco come un estratto del brevetto del 2007, descrive il sistema: «La presente invenzione prevede la creazione automatica, la commercializzazione e la distribuzione di contenuti. Un computer è l’autore dei contenuti. Il materiale viene automaticamente formattato in un formato desiderato per generare un contenuto. Il contenuto può anche essere distribuito automaticamente al destinatario. […] Inoltre, il titolo può essere scritto su richiesta, in una qualsiasi lingua e con contenuti aggiornati».

La formula costruiscicontenuto da query

Per essere chiari, questo non è solo un software, ma un vero e proprio sistema automatico, progettato per scrivere su un argomento specifico. Il database del sistema è riempito di contenuti rilevanti e modelli specifici codificati per riflettere le conoscenze generali, cioè risultare come scritto da un esperto di quel particolare settore o genere. Per scongiurare la violazione del copyright, il sistema è progettato in modo da evitare il plagio. Il brevetto mira infatti a creare opere originali che però non devono essere necessariamente creative. In altre parole, se qualsiasi tipo di contenuto può essere scomposto in una formula, allora con quella stessa formula si possono confezionare infiniti contenuti differenti.

Ecco come Parker descrive la procedura della creazione algoritmica di un libro.

Il successo (e la genialità) di questo sistema è che Parker ha progettato gli algoritmi simulando il processo mentale che un esperto dovrebbe necessariamente compiere per scrivere su un certo argomento. Si tratta “semplicemente” di decostruire contenuti all’interno di una categoria e Parker ha un po’ di esperienza in questo campo, dato che ha scritto almeno tre libri alla vecchia maniera. Il metodo con cui funziona l’algoritmo per la creazione di contenuti (nella maggior parte dei casi) permette di codificarlo come intelligenza artificiale.

Il catalogo è questo

Uno dei libri prodotti dall’algoritmo di Parker “Il mercato mondiale per i preservativi in gomma. A 2007 Global Perspective Trade” venduto su Amazon al prezzo di 325 dollari. Attualmente occupa la posizione #20.149.352 nella classifica generale delle vendite di libri di Amazon e la posizione #7024 in Books > Business & Money > Economics > Econometrics.

È istruttivo osservare un campione della lista dei libri attribuiti a Parker:

Webster, Slovacco-Dizionario Sinonimi inglese, prezzo 28,95 $

Il 2007–2012 World Outlook per i sedili da WC in legno, prezzo 795 $

Il mercato mondiale per i preservativi in gomma. A 2007 Global Perspective Trade, prezzo 325 $

La sindrome di Ellis-van Creveld — Dizionario e bibliografia per medici, pazienti e ricercatori del Genome Research, prezzo 28,95 $

Webster, Inglese-Creolo di Haiti. Cruciverba: Livello 1, prezzo $ 14.95

Considerando che produrre un titolo costa qualcosa come 0,20–0,50 $ (pari al costo di energia elettrica e hardware), i prezzi indicati sono quasi totalmente ricavi, anche se se ne vendono pochissime copie…

In realtà, molti libri di saggistica — come gli articoli di notizie — gli argomenti spesso si riducono alle formule “chi, cosa, dove, quando e perché”. Indipendentemente da come sono presentate le informazioni di attualità o ciò che con esse è correlato, devono essere presenti alcuni dati essenziali, anche per gli argomenti più sconosciuti. E Parker non è il solo ad automatizzare contenuti. La start up di Chicago Narrative Science produce notizie, sport e articoli finanziari per Forbes già da un po’.

Allora, quale sarà il prossimo genere di libro a cui Parker punterà per un nuovo prodotto software? Romanzi. Anche se un romanzo è un lavoro di finzione, non è un segreto che alcuni generi, come i romanzi rosa, si prestino anch’essi ad essere matematizzati. Ciò non può rendere queste opere importanti per il loro valore letterario, ma certamente esse hanno un grande valore di intrattenimento e, forse a sorpresa, il genere rosa ha la quota maggiore del mercato del libro con un fatturato di circa 1,37 miliardi di dollari nel 2011.

Ma può l’intelligenza artificiale realizzare opere creative come un essere umano? Sì… alla fine. In realtà le domande da porsi sono: quanto presto questo accadrà? E quanto sarà rilevante? Le risposte potrebbero essere già all’orizzonte se Parker sarà in grado sfornare romanzi che verranno letti dalle masse. Francamente, qualsiasi lavoro creativo prodotto da un’intelligenza artificiale sarà un “successo” se leggendolo si penserà che lo abbia scritto un essere umano o più precisamente che un’intelligenza umana sia all’origine del lavoro.

Adesso Parker sta pensando di creare un database di contenuti che vada oltre i libri e che possa utilizzare lo stesso motore del ROBOlibro.

Oltre i libri

Ma i libri possono essere solo l’inizio. Come osserva Parker nel suo video, il software non deve limitarsi alle sole opere scritte. Utilizzando animazioni 3D e avatar, si possono generare un’ampia varietà di formati audio e video che Parker afferma siano in fase di studio. Potrebbero diventare di moda avatar che leggono le nuove storie elaborate dal software, soprattutto se gli spettatori potranno personalizzarlo e decidere il livello di approfondimento.

La tecnologia per la generazione di contenuti potrebbe convergere con altri sviluppi, come la creazione automatica di sottotitoli per espandere il contenuto. La figura del traduttore diventerebbe fondamentale non solo per tradurre contenuti prodotti in precedenza ma anche audio e video in tempo reale. Inoltre con i social blog che consentono alle persone di catturare tutto ciò che dicono o viene detto su di loro, questi dati potrebbero essere utilizzati per costruire delle vere e proprie biografie personali.

Infine se al mix si aggiungono statistiche sui grandi numeri si potrebbe avere la capacità di generare contenuti importanti tutti realizzati da computer progettati allo scopo.

Il futuro dei contenuti sta diventando sempre più una cosa da fantascienza, tuttavia servono ancora alcuni anni prima che la loro creazione sia interamente nelle mani del software. Ma se avete dei dubbi su dove stiamo andando, considerate che il primo romanzo scritto da un computer è già stato pubblicato 7 anni fa.

Una nuova catena di montaggio? Finiremo anche noi ingoiati dagli algoritmi di Parker come il povero Charlot dagli ingranaggi della macchina utensile in Tempi Moderni?

 

Commenta