L’AI sbaglia spesso i link: nuovo studio lancia l’allarme

AI intelligenza artificiale

Nonostante gli importanti passi avanti, le allucinazioni dell’intelligenza artificiale generativa sono all’ordine del giorno. Ma c’è un aspetto – anch’esso allucinato – che fino ad ora è passato colpevolmente sotto traccia: una nuova ricerca condotta da Ahrefs su 16 milioni di URL rivela che le piattaforme di intelligenza artificiale invitano gli utenti verso pagine web non funzionanti tre volte più spesso di quanto non faccia Google.

I dati non sono una sorpresa. Ma, in fondo, sono la conferma che tutti attendevamo dopo aver sentito le voci di John Mueller, di Google, che aveva sensibilizzato proprio su questo pericolo.

ChatGPT è quella che fa peggio

In questa corsa poco invidiabile ai link “rotti”, è ChatGPT a fare peggio. La piattaforma è infatti quella che crea il maggior numero di URL falsi rispetto agli altri assistenti di intelligenza artificiale testati da Ahrefs, secondo cui l’1% di tutti gli URL su cui le persone hanno cliccato da ChatGPT ha portato a pagine con 404 error. Per intenderci, la media di Google è dello 0,15%.

Non solo. Il problema sembra essere ancora peggiore nel momento in cui si guardano tutti gli URL menzionati da ChatGPT, e non solamente quelli cliccati: in questo caso, infatti, la percentuale di link che avrebbe condotto a pagine di errore sale al 2,38%, mentre il dato dei primi risultati di ricerca di Google si ferma allo 0,84%.

Per quanto poi concerne le altre piattaforme di intelligenza artificiale, al secondo posto troviamo Claude con lo 0,58% di link rotti su URL cliccati, davanti a Copilot con lo 0,34%, Perplexity con lo 0,31% e Gemini con lo 0,21%. Mistral ha fatto meglio con lo 0,12% (ma è anche la piattaforma che invia il minore traffico verso i siti web rispetto ai concorrenti di cui sopra).

Perché l’AI fa così tanti errori

A questo punto ci possiamo ben domandare per quali motivi l’intelligenza artificiale faccia così tanti errori nel momento in cui deve costruire e pubblicare i link verso i siti web. I fattori scatenanti sono diversi.

Il primo è che alcuni URL esistevano nel momento in cui l’AI è stata addestrata, ma oggi non esistono più. Come noto, infatti, l’intelligenza artificiale si basa su vecchie informazioni, poiché non effettua ricerche in tempo reale. Pertanto, nel tempo alcune pagine potrebbero essere state eliminate o spostate.

C’è poi un secondo fattore molto frequente: l’intelligenza artificiale a volte inventa URL che sembrano reali, ma che in realtà non sono mai esistiti.

Per ora non è un dramma

Ad ogni modo, anche se la situazione è spiacevole e potenzialmente in grado di pregiudicare l’esperienza di utilizzo degli utenti del web, per il momento non siamo davanti a una situazione esplosiva.

Se infatti è vero che le percentuali di allucinazione dei link è relativamente alta, è anche vero che la maggior parte dei siti web non noterà alcun tipo di impatto: gli assistenti AI generano solamente lo 0,25% del traffico verso i siti web, contro il 39,35% del traffico generato da Google.

Insomma, in altri termini gli URL falsi dell’intelligenza artificiale riguardano solamente una piccola parte di una fonte di traffico già di per sé piccola. Attenzione, però: questo non deve far sottovalutare il problema, perché man mano che crescerà la platea di persone che userà l’intelligenza artificiale per la ricerca e l’informazione, i guai potrebbero diventare molto più seri.

Lo stesso studio ha inoltre rilevato che il 74% delle nuove pagine web contiene contenuti generati dall’intelligenza artificiale, e che questi contenuti spesso – per i motivi di cui sopra – includono link falsi, indicizzati dai web crawler, moltiplicando il problema succitato.

È però possibile che il problema possa essere gradualmente attenuato man mano che i servizi di intelligenza artificiale miglioreranno il modo in cui gestiscono gli URL. Nell’attesa, i siti web dovrebbero concentrarsi sul creare pagine 404 utili per gli utenti che hanno trovato link rotti, reindirizzando gli URL falsi che ottengono un traffico significativo, gestendo in tal modo il problema senza reagire in modo eccessivo a quello che invece rimane un disagio minore per la maggior parte dei siti web.