top of page

Sacra Famiglia con San Giovannino

Ercole Procaccini il Vecchio

Allucinazione: quando l'intelligenza artificiale sbaglia!

Un caso di coerenza controllata: quando l’allucinazione è volontaria

Questa animazione, tratta dal dipinto Sacra Famiglia con San Giovannino di Ercole Procaccini il Vecchio, rappresenta uno dei casi più stabili dell’intero progetto. Fin dalle prime generazioni, il processo ha mostrato una notevole coerenza formale, senza produrre allucinazioni spontanee o interpretazioni incoerenti.

La scena presenta infatti una struttura compositiva estremamente chiara: il nucleo relazionale tra i personaggi è immediatamente leggibile attraverso gli sguardi, i gesti delle mani, la disposizione dei corpi e la direzione delle posture. Tutti questi elementi costruiscono una narrazione visiva lineare e ben definita.

Per i sistemi generativi, questa organizzazione risulta particolarmente accessibile. I movimenti suggeriti dall’immagine – accudire, indicare, sostenere un bambino, rispondere con un gesto – appartengono a schemi ampiamente presenti nei dataset di addestramento e risultano quindi statisticamente stabili.

Anche gli oggetti e gli elementi ambientali non svolgono funzioni ambigue o tecnicamente complesse. Non vi sono meccanismi da interpretare, superfici mobili o strumenti da “attivare”. Questo riduce in modo significativo il rischio di fraintendimenti.

Un ulteriore fattore determinante è la forte coerenza anatomica e luministica del dipinto. Le proporzioni dei corpi, la distribuzione della luce, la definizione dei volumi e la continuità cromatica forniscono al modello riferimenti solidi per mantenere l’identità visiva nel tempo.

Per queste ragioni, l’opera è stata inserita intenzionalmente nel percorso di ricerca come esempio di “caso favorevole”, in cui la struttura dell’immagine risulta compatibile con le capacità attuali dei sistemi generativi.

L’allucinazione qui presentata non è quindi il risultato di un errore del sistema, ma è stata generata volontariamente. È stata ottenuta attraverso la scrittura intenzionale di un prompt confuso e semanticamente scorretto, contenente espressioni come quadro surreale, tela bagnata, atmosfera liquida e altri riferimenti volutamente ambigui.

Questa sperimentazione dimostra come, anche in presenza di un’immagine altamente stabile, il linguaggio del prompt possa indurre derive interpretative e alterazioni visive significative. L’allucinazione diventa così uno strumento di ricerca, utile per osservare fino a che punto il sistema sia sensibile alle perturbazioni linguistiche.

L’assenza di allucinazioni spontanee in questo caso non indica una maggiore “intelligenza” dell’AI, ma una convergenza temporanea tra chiarezza compositiva, limiti tecnologici del modello e controllo umano. L’esperimento mostra come alcune immagini siano oggi più facilmente traducibili in movimento, mentre restino comunque vulnerabili a deviazioni indotte dal linguaggio.

A Case of Controlled Coherence: When Hallucination Is Intentional

This animation, based on Sacra Famiglia con San Giovannino by Ercole Procaccini the Elder, represents one of the most stable cases within the entire project. From the earliest generations, the process showed strong formal coherence, without producing spontaneous hallucinations or incoherent interpretations.

The main reason lies in the internal structure of the painting. The scene presents an exceptionally clear composition: the relational core between the figures is immediately legible through gazes, hand gestures, body positioning, and directional postures. All these elements construct a linear and well-defined visual narrative.

For generative systems, this organization is particularly accessible. The movements suggested by the image—caring, pointing, supporting a child, responding through gesture—belong to patterns widely present in training datasets and are therefore statistically stable.

The objects and environmental elements also lack ambiguous or technically complex functions. There are no mechanisms to interpret, moving surfaces, or tools to “activate.” This significantly reduces the risk of misinterpretation.

Another decisive factor is the strong anatomical and luminous coherence of the painting. Body proportions, light distribution, volumetric definition, and chromatic continuity provide the model with solid visual anchors for maintaining identity over time.

For these reasons, this work was intentionally included in the research path as an example of a “favorable case,” in which the structure of the image aligns well with the current capabilities of generative systems.

The hallucination presented here is therefore not the result of a system failure. It was deliberately produced. It was generated by intentionally writing a confused and semantically incorrect prompt, using deliberately ambiguous expressions such as surreal painting, wet canvas, liquid atmosphere, and other misleading references.

This experiment demonstrates how, even in the presence of a highly stable image, the language of the prompt can induce significant interpretative drift and visual alteration. In this context, hallucination becomes a research tool, allowing observation of how sensitive the system is to linguistic perturbations.

The absence of spontaneous hallucinations in this case does not indicate greater “intelligence” on the part of the AI, but rather a temporary convergence between compositional clarity, technological limitations, and human control. The experiment shows how certain images are currently more easily translatable into motion, while remaining vulnerable to deviations induced by language.

Questo lavoro è stato realizzato dall'artista Vanessa Rusci che ricerca sull'impatto delle nuove tecnologie sulla società contemporanea.

Per maggiori informazioni su questo progetto clicca sul seguente link:

This work was created by artist Vanessa Rusci, whose research focuses on the impact of new technologies on contemporary society.

For more information about this project, please click the following link:

bottom of page