Salta al contenuto principale


Come Pensa la Macchina: un LLM smontato pezzo per pezzo. Tokenizzazione, embeddings, attention, hallucinations. Ollama in locale, zero fuffa

Smonto la macchina pezzo per pezzo. Ho #Ollama sul Mac con una decina di modelli. Scelgo il più piccolo: llama3.1:8b, 8 miliardi di parametri, 4.9 gigabyte su disco. Il più facile da maneggiare senza sbatti, e tanto l'architettura è identica per tutti: che siano 8 miliardi o 405 miliardi, il meccanismo è lo stesso. Cambiano le dimensioni delle matrici, non come funziona la macchina. Lo apro dal terminale, guardo i byte, e seguo il percorso completo: dal testo che entra al testo che esce. Ogni passaggio, ogni formula, ogni decisione matematica. Niente metafore del cervello. Niente fuffa. Se vuoi capire come funziona una cosa, la smonti. Non leggi chi ne scrive.

pinperepette.github.io/signal.…

Per conoscere altre notizie sulla #IntelligenzaArtificiale, segui il gruppo @Intelligenza Artificiale
in reply to Informa Pirata

Ma che bello ! Qualcuno che prova a smontarne una per guardarci dentro ! Mentalità hacker vecchia scuola !😍

(non c'entra nulla ma : nota di merito alla postazione di lavoro, bellissima).

Questa voce è stata modificata (35 minuti fa)

reshared this