Salta al contenuto principale


Un gruppo di ricercatori di intelligenza artificiale (AI) e matematici appartenenti a diverse istituzioni ha sviluppato un benchmark matematico che consente di testare la capacità dei sistemi di AI per risolvere problemi matematici eccezionalmente difficili.
Gli attuali modelli di AI all'avanguardia risolvono meno del 2% dei problemi matematici più complessi, rivelando il divario tra le capacità dell'AI e le capacità della comunità matematica.

arxiv.org/abs/2411.04872