L'AI non capisce un tubo

Osservazioni di un non addetto ai lavori di intelligenza artificiale.

scritto da Chung Fei Wu il Monday, September 1, 2025

L’AI di oggi non capisce niente

La mia esperienza con la Gen AI mi porta a riassumere tutto con questa frase: “È ora di smetterla di pretendere che il computer capisce, perchè non capisce un tubo”. Questo articolo non ha alcuna velleità di divulgazione, ma vuole solo raccontare un aneddoto sull’AI con risvolti comici.

La Gen AI oggi

L’Intelligenza Artificiale Generativa (Gen AI) è un tipo di AI che, a differenza delle AI tradizionali che si limitano ad analizzare e classificare dati, è in grado di creare contenuti “nuovi” e “originali”. Questi contenuti possono essere testi, immagini, musica, video o codici sorgente.

L’AI può generare “alt text” senza senso

Per un sito web sto sperimentando la generazione dell’alt text (testo alternativo per le immagini) e parimenti la didascalia di una serie di immagini con la Gen AI per velocizzare alcuni processi con l’automazione. In breve una serie di agenti AI si interfacciano con l’API di un database di immagini e legandolo ad un prompt, generano il testo alternativo e la didascalia.

Su centinaia di iterazioni, il 95% dei risultati sono congrui a quello che mi aspetto. In alcuni casi però l’output è completamente senza senso e il lato positivo è che fa ridere. Di seguito alcuni esempi:

Vibrante vicolo di Napoli con colorati edifici e panni stesi, che cattura l’autentica atmosfera della città. Vibrante vicolo di Napoli

Maestose vette himalayane si ergono sopra un paesaggio montano nebbioso e mistico, perfetto per il trekking. Maestose vette himalayane

Piramide Canaa che svetta sopra la giungla, il cuore antico di Caracol, Belize. Piramide Canaa

Carovana di cammelli che attraversa le vaste dune di sabbia del deserto al tramonto, sotto un cielo dai colori caldi. Carovana di cammelli

Suggestiva vista urbana di Napoli da un balcone, che mostra l’architettura e il paesaggio cittadino. Suggestiva urbana di Napoli

Perchè accade questo? Qui voglio parafrasare Federico Faggin che dice: “I libri sono scritti non per manifestare simboli, sono scritti per manifestare significato, e il computer prende solo l’aspetto simbolico dell’informazione, le correlazioni tra simboli. Non capisce niente, non capirà mai niente. Ed è ora di smetterla di pretendere che il computer capisce, perchè non capisce un tubo!

In questo caso specifico, l’AI basandosi sui segnali legati all’immagine del database, come i tag (napoli, himalaya, etc.), la nomenclatura del file immagine (napoli.jpg, monti-himalayani.webp, etc.) e anche l’alt text dell’immagine stessa, fa delle associazioni, seleziona un’immagine e scrive una didascalia. Ma siccome l’AI non può comprendere il significato dell’immagine, non può sapere che un’automobile immersa in un’alluvione non è un vibrante vicolo di Napoli.

Ok, ma chi è Federico Faggin?

Federico Faggin è un fisico e inventore italiano. Negli Stati Uniti è stato uno dei pionieri della Silicon Valley dove ha progettato il primo microprocessore al mondo, l’Intel 4004. Questo ha dato il via a tutta la rivoluzione tecnologica che viviamo oggi, dai PC agli smartphone. Ha fondato aziende che hanno sviluppato tecnologie importanti, come i primi touchpad e touchscreen. Negli ultimi anni, si è anche dedicato a studiare la coscienza umana, esplorando il legame tra scienza e spiritualità.


Cookie Policy Privacy Policy