Antonio

1 anno fa da Fedilab

Antonio
1 anno fa da Fedilab

Un gruppo di ricercatori di intelligenza artificiale (AI) e matematici appartenenti a diverse istituzioni ha sviluppato un benchmark matematico che consente di testare la capacità dei sistemi di AI per risolvere problemi matematici eccezionalmente difficili.
Gli attuali modelli di AI all'avanguardia risolvono meno del 2% dei problemi matematici più complessi, rivelando il divario tra le capacità dell'AI e le capacità della comunità matematica.

arxiv.org/abs/2411.04872

⇧

Antonio

Antonio 1 anno fa da Fedilab •

Antonio
1 anno fa da Fedilab