Allegoria della musica
Giovanni Martinelli
Allucinazione: quando l'intelligenza artificiale sbaglia!
Ambiguità oggettuale e decadimento iterativo
Questa animazione, tratta dall’Allegoria della Musica di Rutilio Manetti, ha presentato una complessità specifica legata al riconoscimento degli strumenti musicali storici. In particolare, il flauto ligneo raffigurato nel dipinto non è stato interpretato correttamente dai sistemi generativi, nonostante la chiarezza formale dell’immagine e l’elevata qualità della scansione.
Per l’osservatore umano, lo strumento è immediatamente leggibile come un flauto d’epoca, coerente con il contesto storico e iconografico dell’opera. Per l’intelligenza artificiale, invece, questo oggetto risulta ambiguo: nel corso delle generazioni viene spesso trasformato in elementi diversi, talvolta irriconoscibili, ibridati con altri strumenti, oggetti decorativi o forme astratte.
Questa difficoltà deriva dal fatto che i dataset di addestramento contengono una quantità limitata di rappresentazioni accurate di strumenti musicali storici. Il modello tende quindi a ricondurre l’oggetto a categorie visive più frequenti e contemporanee, perdendo il riferimento materiale e culturale originale.
Il processo ha richiesto un numero molto elevato di generazioni. Con il progredire delle iterazioni, è emerso un progressivo decadimento: perdita di definizione dello strumento, instabilità delle proporzioni, alterazioni della postura dei personaggi e impoverimento della coerenza complessiva. Il sistema, invece di raffinare l’interpretazione, iniziava a produrre variazioni sempre più distanti dalla struttura iniziale.
Questo fenomeno è riconducibile alla natura probabilistica dei modelli generativi. Ogni nuova versione viene ricostruita ex novo, senza una memoria stabile dell’equilibrio precedente. Dopo numerosi cicli, l’accumulo di micro-scarti tende a compromettere la qualità globale del risultato.
Parallelamente, il processo ha messo in evidenza anche un limite operativo delle piattaforme commerciali. Le iterazioni prolungate comportano un consumo crescente di crediti o risorse, e non sempre sono accompagnate da un reale miglioramento qualitativo. In questo senso, il decadimento può essere accentuato anche da dinamiche economiche implicite, che incentivano la produzione continua di nuove versioni senza garantire un controllo progressivo più fine.
Non si tratta necessariamente di una strategia deliberata, ma di un effetto sistemico: modelli che non apprendono realmente dal fallimento e piattaforme che monetizzano la ripetizione del tentativo.
Per contenere questi effetti è stato necessario limitare il numero di iterazioni, semplificare drasticamente le istruzioni e rinunciare a una resa pienamente filologica dello strumento. Anche in questo caso, tuttavia, non è stato possibile ottenere una stabilità completa.
L’animazione finale, generata senza interventi manuali o software di montaggio, documenta il punto in cui il sistema smette di riconoscere l’oggetto come elemento storico e inizia a trattarlo come una forma generica. L’allucinazione qui presentata diventa così un documento critico, che mette in luce i limiti attuali delle intelligenze artificiali nella lettura della cultura materiale e della specificità storica.
Object Ambiguity and Iterative Degradation
This animation, based on Allegory of Music by Rutilio Manetti, presented a specific complexity related to the recognition of historical musical instruments. In particular, the wooden flute depicted in the painting was repeatedly misinterpreted by generative systems, despite the visual clarity of the image and the high quality of the scan.
For a human observer, the instrument is immediately recognizable as a period flute, consistent with the historical and iconographic context of the work. For artificial intelligence systems, however, this object remains ambiguous. Across multiple generations, it is frequently transformed into unrelated elements, hybridized with other instruments, decorative objects, or abstract forms.
This difficulty stems from the limited presence of accurate representations of historical musical instruments in training datasets. As a result, the model tends to map the object onto more frequent and contemporary visual categories, losing its original material and cultural specificity.
The process required a very high number of generations. Over time, a progressive degradation emerged: loss of instrument definition, unstable proportions, altered body posture, and a general decline in compositional coherence. Instead of refining its interpretation, the system began producing increasingly distant variations from the original structure.
This phenomenon is linked to the probabilistic nature of generative models. Each new version is reconstructed from scratch, without a stable memory of the previous equilibrium. After many cycles, the accumulation of micro-deviations compromises overall quality.
The workflow also highlighted an operational limitation of commercial platforms. Extended iteration consumes increasing amounts of credits or computational resources and is not necessarily accompanied by real qualitative improvement. In this sense, degradation may be amplified by implicit economic dynamics that encourage repeated generation without guaranteeing finer control.
This is not necessarily a deliberate strategy, but rather a systemic effect: models that do not truly learn from failure, combined with platforms that monetize repetition.
To mitigate these effects, it was necessary to limit the number of iterations, simplify instructions, and accept a reduced level of historical fidelity. Even so, complete stability could not be achieved.
The final animation, produced without manual editing or compositing, documents the moment at which the system stops recognizing the object as a historical element and begins treating it as a generic form. The hallucination presented here thus becomes a critical research artifact, exposing the current limitations of artificial intelligence in interpreting material culture and historical specificity.
Questo lavoro è stato realizzato dall'artista Vanessa Rusci che ricerca sull'impatto delle nuove tecnologie sulla società contemporanea.
Per maggiori informazioni su questo progetto clicca sul seguente link:
This work was created by artist Vanessa Rusci, whose research focuses on the impact of new technologies on contemporary society.
For more information about this project, please click the following link:
