top of page

Madonna con Bambino e angeli
Francesco Curradi

Allucinazione: quando l'intelligenza artificiale sbaglia!

Allucinazione e decadimento generativo: instabilità tra le iterazioni

In questa animazione si manifesta in modo particolarmente evidente un fenomeno noto nei sistemi generativi come decadimento iterativo e instabilità di coerenza semantica. Dopo una prima fase relativamente stabile, le generazioni successive iniziano progressivamente a perdere precisione formale, coerenza narrativa e fedeltà iconografica.

Il modello non conserva una “memoria strutturata” dell’immagine precedente. Ogni nuova versione viene ricostruita attraverso un nuovo processo di campionamento probabilistico nello spazio latente, basato su distribuzioni statistiche apprese durante l’addestramento. Di conseguenza, piccoli scarti iniziali tendono ad amplificarsi nel tempo.

Questo fenomeno è legato alla natura stocastica dei modelli di diffusione e trasformazione video. Ogni iterazione introduce rumore controllato, successivamente ricostruito dal modello. Quando il processo viene ripetuto più volte, il bilanciamento tra denoising e ricostruzione semantica diventa instabile, producendo slittamenti progressivi nella forma, nelle proporzioni e nelle relazioni spaziali.

Nel caso specifico, il decadimento si manifesta attraverso deformazioni graduali dei corpi, alterazioni della postura, perdita di continuità nei gesti e ridefinizione impropria degli oggetti. L’algoritmo inizia a sostituire parti dell’immagine con pattern visivi più “probabili” secondo il proprio modello statistico, anche quando questi risultano incoerenti con la scena originaria.

Si osserva inoltre una riduzione della coerenza temporale (temporal consistency). I frame successivi non mantengono più una corrispondenza stabile con quelli precedenti, generando micro-disallineamenti che si accumulano fino a produrre vere e proprie allucinazioni visive.

Dal punto di vista tecnico, questo comportamento è riconducibile a una progressiva perdita di vincoli (constraint drift) tra rappresentazione visiva, struttura narrativa e riferimento iconografico. In assenza di un modello interno del mondo fisico e simbolico, il sistema tende a ri-ottimizzare continuamente l’immagine verso soluzioni statisticamente plausibili ma semanticamente errate.

L’allucinazione che emerge in questa fase non è quindi un errore casuale, ma il risultato sistemico di una catena di approssimazioni successive. Essa rende visibile il limite attuale dei modelli generativi nella gestione di processi iterativi prolungati e nella conservazione della coerenza a lungo termine.

In questo contesto, il decadimento non rappresenta un fallimento tecnico isolato, ma un fenomeno strutturale, che diventa parte integrante della ricerca. L’animazione documenta il punto in cui il sistema smette di “seguire” l’immagine di partenza e inizia a produrre una propria deriva visiva autonoma.

Hallucination and Generative Decay: Instability Across Iterations

In this animation, a phenomenon commonly observed in generative systems becomes particularly evident: iterative decay and semantic coherence instability. After an initial relatively stable phase, successive generations progressively lose formal precision, narrative coherence, and iconographic fidelity.

The model does not retain a structured memory of the previous image. Each new version is reconstructed through a fresh probabilistic sampling process within latent space, based on statistical distributions learned during training. As a result, small initial deviations tend to amplify over time.

This phenomenon is related to the stochastic nature of diffusion-based and video transformation models. Each iteration introduces controlled noise, which is subsequently reconstructed by the model. When the process is repeated multiple times, the balance between denoising and semantic reconstruction becomes unstable, producing gradual shifts in form, proportions, and spatial relationships.

In this specific case, decay manifests through progressive deformation of bodies, alterations in posture, loss of continuity in gestures, and improper redefinition of objects. The algorithm begins to replace parts of the image with visual patterns that are more “probable” according to its statistical model, even when these are inconsistent with the original scene.

A reduction in temporal consistency can also be observed. Successive frames no longer maintain stable correspondence with previous ones, generating micro-misalignments that accumulate and eventually produce genuine visual hallucinations.

From a technical perspective, this behavior can be attributed to a progressive loss of constraints (constraint drift) between visual representation, narrative structure, and iconographic reference. In the absence of an internal model of the physical and symbolic world, the system continuously re-optimizes the image toward statistically plausible but semantically incorrect solutions.

The hallucination that emerges at this stage is therefore not a random error, but the systemic result of a chain of successive approximations. It makes visible the current limitations of generative models in managing prolonged iterative processes and in preserving long-term coherence.

In this context, decay does not represent an isolated technical failure, but a structural phenomenon that becomes an integral part of the research. The animation documents the moment at which the system stops “following” the source image and begins to generate its own autonomous visual drift.

Questo lavoro è stato realizzato dall'artista Vanessa Rusci che ricerca sull'impatto delle nuove tecnologie sulla società contemporanea.

Per maggiori informazioni su questo progetto clicca sul seguente link:

This work was created by artist Vanessa Rusci, whose research focuses on the impact of new technologies on contemporary society.

For more information about this project, please click the following link:

bottom of page