Mythos contro curl: quando l’AI “troppo pericolosa” incontra la realtà del codice
#CyberSecurity
insicurezzadigitale.com/mythos…
Mythos contro curl: quando l’AI “troppo pericolosa” incontra la realtà del codice
Si parla di:
TogglePer settimane il nome “Mythos” è stato costruito come un oggetto quasi mitologico. Anthropic lo ha presentato come un modello AI capace di trovare vulnerabilità zero-day a un livello tale da risultare “troppo pericoloso” per una release pubblica. Una narrativa perfetta per il ciclo mediatico dell’AI security nel 2026: modello segreto, capacità offensive avanzate, accesso ristretto, migliaia di vulnerabilità individuate. Il genere di storytelling che nel mondo cyber si propaga in poche ore tra LinkedIn, Twitter/X, keynote e blog enterprise.
Poi però Mythos è stato testato contro uno dei progetti open source più scrutinati del pianeta: curl. E lì il racconto ha iniziato a incrinarsi.
Un software scritto come si deve
A raccontarlo è stato direttamente Daniel Stenberg, storico maintainer di curl e figura ormai centrale nel dibattito sulla collisione tra AI e vulnerability research. Nel suo lungo post pubblicato sul blog personale, Stenberg descrive il risultato dell’analisi effettuata con Mythos sul repository di curl: cinque vulnerabilità segnalate come “confirmed security vulnerabilities”. Dopo il triage umano del team sicurezza di curl, il bilancio finale si è ridotto a una sola vulnerabilità reale, classificata a bassa severità, tre falsi positivi e un semplice bug non-security. (daniel.haxx.se)Ed è qui che il tema diventa interessante, perché il punto non è tanto “Mythos non funziona”. Anzi. Stenberg stesso riconosce che il report contiene analisi tecniche solide e bug descritti bene, con un numero relativamente basso di falsi positivi rispetto alla media degli scanner AI attuali. Il problema è un altro: il gap enorme tra la narrativa costruita attorno al modello e i risultati concreti osservabili sul campo.
La frase più pesante dell’intero post è probabilmente questa:
“the big hype around this model so far was primarily marketing”
Un software largamente usato
Una dichiarazione che arriva non da un opinionista qualsiasi, ma da uno dei maintainer open source più esposti al fenomeno AI-assisted vulnerability hunting. Negli ultimi mesi Stenberg ha documentato pubblicamente l’esplosione di report generati da AI, il collasso qualitativo di molti bug bounty submission e il nuovo scenario che lui stesso definisce “high-quality chaos”.Il contesto infatti è fondamentale. curl non è un target qualunque. È software vecchio di decenni, onnipresente, analizzato continuamente da ricercatori, aziende, fuzzing infrastructure, static analyzer, LLM e offensive security team. Il progetto ha già attraversato una vera ondata di AI-powered auditing nel 2025 e 2026, con centinaia di issue segnalate e decine di CVE pubblicate.
In altre parole: Mythos non stava entrando in un territorio inesplorato. Stava arrivando su un codice già passato attraverso un livello di scrutiny estremo.
Ed è qui che la promessa implicita di Anthropic sembra perdere consistenza. Se un modello viene presentato quasi come una svolta paradigmatica nella vulnerability discovery offensiva, ci si aspetta almeno un salto qualitativo evidente rispetto agli strumenti precedenti. Non necessariamente centinaia di 0-day critici, ma almeno pattern nuovi, classi di bug differenti, chaining più sofisticati o insight architetturali difficili da intercettare con gli attuali sistemi AI-assisted SAST.
Secondo Stenberg, questo salto non si è visto.
Anzi, il maintainer di curl arriva a sostenere che altri strumenti AI usati in precedenza avevano già prodotto quantità maggiori di bugfix. Mythos forse è “leggermente migliore”, scrive, ma non abbastanza da cambiare realmente il paradigma della code analysis.
Questa distinzione è cruciale perché separa due fenomeni che oggi vengono continuamente confusi nel marketing AI security.
Il primo fenomeno è reale: i moderni LLM stanno diventando estremamente efficaci nell’analisi del codice. Stenberg lo dice chiaramente. Gli strumenti AI contemporanei trovano vulnerabilità meglio dei tradizionali static analyzer. La differenza rispetto a cinque anni fa è concreta e misurabile.
Il secondo fenomeno invece è narrativo: trasformare questo miglioramento incrementale in una retorica quasi apocalittica, dove ogni nuovo modello viene descritto come un cyber-weapon rivoluzionario capace di destabilizzare l’intero ecosistema software.
Ed è proprio questa seconda parte che il caso Mythos sembra mettere in discussione.
L’hype dell’AI ormai incontrollabile
Perché il rischio, nel settore cybersecurity, è che l’hype finisca per sostituire il metodo. La comunicazione attorno a Mythos ha funzionato perfettamente: accesso ristretto, dichiarazioni sulla pericolosità del modello, riferimenti a migliaia di zero-day trovati internamente, programma limitato a poche organizzazioni strategiche. Tutti elementi che costruiscono scarsità, percezione di superiorità tecnologica e senso di urgenza.Ma quando il modello viene finalmente osservato in un caso reale e pubblico, il risultato appare molto più ordinario: un buon AI-assisted code analyzer che trova un low severity issue in un progetto maturissimo e già massacrato da anni di auditing.
Non è poco. Ma non è nemmeno la rivoluzione promessa.
La parte forse più interessante dell’intera vicenda è che Stenberg non assume una posizione anti-AI. Al contrario. La sua analisi è molto più sofisticata della solita polarizzazione “AI sì / AI no”. Lui riconosce apertamente che gli LLM stanno cambiando il vulnerability research landscape. Il problema, semmai, è che il settore sta sovrastimando la distanza tra i nuovi modelli “frontier” e ciò che gli strumenti AI moderni già fanno oggi.
Ed è una riflessione che nel mondo offensive security merita attenzione.
Perché se Mythos — il modello presentato come troppo pericoloso per essere rilasciato — produce risultati sostanzialmente comparabili agli strumenti già esistenti, allora forse la vera trasformazione non è l’arrivo di un singolo modello “superiore”, ma la democratizzazione progressiva dell’AI-assisted vulnerability discovery.
Una differenza enorme.
Nel primo scenario, il vantaggio resta concentrato nelle mani di pochi laboratori frontier AI. Nel secondo, invece, la capacità offensiva si distribuisce rapidamente: più ricercatori, più scanner, più auditing, più rumore, più CVE, più triage umano necessario.
Ed è esattamente il futuro che Stenberg sembra vedere arrivare: non una singola AI onnipotente, ma un ecosistema saturo di agenti capaci di produrre contemporaneamente valore tecnico reale e quantità industriali di “security slop”.
Un mondo dove il problema non è più trovare vulnerabilità. È distinguere quelle importanti dal resto.
reshared this
Cybersecurity & cyberwarfare, The Pirate Post, The Privacy Post e Poliversity - Università ricerca e giornalismo reshared this.
Farshid Hakimy / فرشید
in reply to Signal • • •If it weren't for this chat, you could simply say that there will never be a Signal chat with Signal and every chat with Signal on the app is phishing.
Carlos Solís likes this.
lbcp 🦖
in reply to Signal • • •uridl
in reply to Signal • • •Marcel
in reply to Signal • • •Ganondalf
in reply to Signal • • •Nobody is XMPP, so we can't very well expect anyone to impersonate them. Yet another advantage of the XMPP protocol.
Everyone is glowing until proven innocent!
Carlos Solís likes this.
👊🇺🇸🔥
in reply to Signal • • •Gustavo
in reply to Signal • • •I hope you support some kind of optional verification in Keyoxide style.
E.g. "this Signal account verified they control this Mastodon account and this website", but with better wording so people don't just set up lookalike accounts and websites, but it still works to deter impersonation.
The main reason I use Keyoxide is because I got impersonated in Wordpress.org blogs (which do not provide any kind of authentication). AFAIK the only way to prevent that in that platform is using PGP signed messages, which are cumbersome, or using plugins that require login, which are annoying.
Carlos Solís likes this.
wraptile
in reply to Signal • • •suomynona1405
in reply to Signal • • •neutronstar
in reply to Signal • • •Please add the option to change someone’s profile picture even when they’re not in your contacts or are hiding their phone number. So like the nickname feature but for the profile picture.
Alternatively the option to link a signal contact to a contact in your phone contacts. Without needing to use phone numbers that is.
Daniel Böhmer
in reply to Signal • • •Enrico "meldrian" Michaelis
in reply to Signal • • •I am so embarresed by this and deeply sorry for the lost of trust you guys gained in media in press, based on the "hurr di durr" behaviour of those ... humans.
Blanker Hans 🇮🇱 🇺🇦 🇵🇸
in reply to Signal • • •Ryan Castellucci (they/them)
in reply to Signal • • •linrunner
in reply to Signal • • •Nudelstapler
in reply to Signal • • •That will not be effective.
This is way not IN YOUR FACE enough and on many cases will still feel not out of bounds enough for people.
My suggestion:
Look at the chat to a new account from me in the second image.
The client would locally substring match for certain security related keywords in the first 20 messages that are not deleted.
Nudelstapler
in reply to Nudelstapler • • •🌲
in reply to Signal • • •Ember is so tired of people.
in reply to Signal • • •Black Wolf
in reply to Signal • • •evelyn™
in reply to Signal • • •wod0bow
in reply to Signal • • •Will Signal comply with Canada authorities or remove app from Canada app stores if the C-22 bill will be implemented in Canada?
parl.ca/DocumentViewer/en/45-1…
Government Bill (House of Commons) C-22 (45-1) - First Reading - Lawful Access Act, 2026 - Parliament of Canada
www.parl.ca