Studija upozorava: Pesme otključavaju zabranjeni sadržaj u AI sistemima
Nova studija laboratorije Icaro Lab pokazala je da kreativnom upotrebom poezije mogu da se zaobiđu bezbednosne zaštite velikih jezičkih modela , čak i kada je reč o temama koje su izričito zabranjene, poput izrade nuklearne bombe. Istraživanje pod nazivom „Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models“ otkriva

