Salta al contenuto principale


Microsoft presenta POML per l’orchestrazione dei prompt LLM


Microsoft ha presentato POML (Prompt Orchestration Markup Language), un nuovo linguaggio di markup pensato per l’orchestrazione dei prompt e progettato specificamente per favorire la prototipazione rapida e strutturata di modelli linguistici di grandi dimensioni (LLM).

L’obiettivo di POML è affrontare le limitazioni dello sviluppo tradizionale dei prompt – spesso caratterizzato da mancanza di struttura, integrazione complessa dei dati e sensibilità al formato – offrendo un approccio modulare, leggibile e manutenibile. Tuttavia, la sua introduzione ha suscitato un vivace dibattito: per alcuni è un passo avanti nell’ingegneria dei prompt, per altri non è che una “rivisitazione” di XML, con una complessità che potrebbe ridurne l’adozione pratica.

Dal punto di vista sintattico, POML si avvicina a HTML: utilizza tag semantici come , , , e per scomporre prompt complessi in componenti riutilizzabili e chiaramente definiti. In questo modo gli sviluppatori possono organizzare sistematicamente i prompt, incorporare dati eterogenei (testo, tabelle, immagini) e gestire la formattazione dell’output attraverso uno stile separato simile a CSS, riducendo l’instabilità tipica dei modelli sensibili al layout dei prompt.

Oltre al linguaggio, Microsoft ha introdotto un ecosistema di strumenti di supporto. L’estensione per Visual Studio Code fornisce evidenziazione della sintassi, completamento automatico contestuale, anteprima in tempo reale e diagnostica degli errori. Inoltre, gli SDK per Node.js e Python permettono di integrare POML nei flussi di lavoro esistenti e nei framework basati su LLM. Un esempio tipico consiste nell’uso combinato di , e per definire attività multimodali che includono immagini e requisiti di output.

La comunità degli sviluppatori ha accolto POML in modo contrastante. Da un lato, c’è chi ne apprezza l’approccio strutturato, il motore di template (con variabili, cicli e condizioni) e la possibilità di semplificare la gestione di prompt complessi. Dall’altro, non mancano critiche sulla somiglianza con XML e sulla sensazione che la scrittura dei prompt si trasformi in una vera e propria attività di codifica, con un conseguente aumento della curva di apprendimento. Alcuni osservatori ritengono inoltre che, con il crescente impiego di agenti AI e invocazione di strumenti, la rigidità dei prompt sia oggi meno rilevante, ridimensionando così l’effettiva necessità di un linguaggio come POML.

Tra gli scenari applicativi più promettenti figurano la generazione di contenuti dinamici, i test A/B su formati di prompt e la creazione di istruzioni multimodali. Ad esempio, POML può essere utilizzato per generare report automatici a partire da dati tabellari o per sperimentare rapidamente diversi layout di output variando semplicemente i fogli di stile. Microsoft sottolinea come la separazione tra contenuto e presentazione renda POML adattabile a diversi LLM e contribuisca a migliorarne la robustezza complessiva.

Con l’espansione della community open source e il perfezionamento della toolchain, POML potrebbe affermarsi come uno standard di riferimento nell’ingegneria dei prompt, aprendo la strada a pratiche di sviluppo più solide e scalabili nel settore dell’IA generativa.

L'articolo Microsoft presenta POML per l’orchestrazione dei prompt LLM proviene da il blog della sicurezza informatica.