Anthropic lancia Claude Opus 4.5, il modello di intelligenza artificiale più avanzato
Anthropic ha rilasciato Claude Opus 4.5 , il suo nuovo modello di punta, che, secondo l’azienda, è la versione più potente finora rilasciata e si posiziona al vertice della categoria nella programmazione pratica, negli scenari basati su agenti di produttività.
Il modello ha inoltre registrato miglioramenti significativi nella ricerca approfondita, nell’analisi e nelle attività di presentazione. Opus 4.5 è ora disponibile tramite app, API e in tutti e tre le principali tecnologie cloud.
Il prezzo di Sonnet 4.5 parte da 3 dollari per milione di token in input e 15 dollari per milione di token in output, con un risparmio sui costi fino al 90% con il caching rapido e del 50% con l’elaborazione batch
SOTA nell’ingegneria reale
Nel test SWE-bench Verified, il nuovo modello mostra il risultato migliore tra tutti i modelli di frontiera : Anthropic sottolinea in particolare che Opus 4.5 rappresenta un significativo passo avanti rispetto a Sonnet 4.5, superando compiti che solo poche settimane fa erano considerati “quasi impossibili” per la generazione precedente.
Oltretutto:
- Opus 4.5 è leader in 7 linguaggi di programmazione su 8 su SWE-bench Multilingual.
- I miglioramenti non si limitano al codice: il modello ha registrato notevoli progressi nella visione, nella matematica, nel ragionamento e nelle attività multimodali.
- Su Aider Polyglot, BrowseComp-Plus, Vending-Bench – anche gli indicatori SOTA o simili.
Nel contesto delle intelligenze artificiali, “SOTA” (State of the Art) indica il modello o la tecnica che raggiunge le migliori prestazioni note su uno o più benchmark rilevanti.
Un esempio di miglioramento è stato un caso del benchmark τ²: il modello si sarebbe posizionato in settima posizione, dopo GPT 5.1.
Più forte, più intelligente, più sicuro
Secondo il team, Opus 4.5 è il modello Anthropic più sicuro e resistente alle iniezioni immediate. Ha superato tutti i concorrenti in una serie di test di resilienza alle richieste di attacco. Oltretutto:
- L’esame interno delle prestazioni di Opus 4.5 ha dato risultati migliori di qualsiasi altro test mai eseguito nella storia.
- Grazie a una pipeline di ragionamento migliorata, il modello impiega molti meno token per il ragionamento e la ricerca di soluzioni.
Controllo della forza, compattazione e multi-agente
Opus 4.5 introduce una nuova importante funzionalità per gli sviluppatori: il parametro effort, che determina la profondità del ragionamento:
- Con uno sforzo medio, il modello replica Sonnet 4.5 utilizzando il 76% di token in meno.
- Al massimo, supera Sonnet 4.5 di 4,3 punti percentuali, generando il 48% di token in meno.
Secondo Anthropic, tutto ciò comporta un incremento del 15% nelle attività di ricerca approfondita degli agenti.
Aggiornamenti della piattaforma e del prodotto
Con il rilascio di Opus 4.5 sono stati introdotti i seguenti aggiornamenti:
- Claude Code: la nuova modalità Plan genera piani dettagliati, formula eventuali domande di chiarimento e crea un file plan.md modificabile prima dell’esecuzione.
- Claude Code è ora disponibile anche nell’app desktop, con supporto per sessioni parallele sia locali sia remote.
- Nell’app Claude, le conversazioni estese non si “bloccano” più: il contesto precedente viene compresso automaticamente.
- Claude per Chrome è ora disponibile per tutti gli utenti Max.
- Claude per Excel è stato ampliato in versione beta per gli utenti Max, Team ed Enterprise.
Anthropic ha inoltre aumentato i limiti di utilizzo di Opus 4.5, rendendolo più adatto come strumento di lavoro principale. L’azienda ha dichiarato che gli utenti riceveranno approssimativamente lo stesso volume di token Opus rispetto ai token Sonnet disponibili in precedenza.
L'articolo Anthropic lancia Claude Opus 4.5, il modello di intelligenza artificiale più avanzato proviene da Red Hot Cyber.