All'inizio di quest'anno, Mainframe ha rilasciato l'app fullmoon, uno strumento gratuito e open source che consente agli utenti di eseguire modelli linguistici di grandi dimensioni, come Llama e DeepSeek, interamente sul proprio dispositivo. È stato lanciato il 13 gennaio 2025, opportunamente sincronizzato con la luna piena, un giocoso cenno al nome fullmoon (fuLLMoon).
Invece di fare affidamento sulle connessioni Internet, fullmoon esegue modelli di intelligenza artificiale localmente sul silicio Apple, il che migliora la velocità e mantiene privati i dati delle conversazioni. L'app funziona completamente offline su iPhone, iPad, Mac e Vision Pro e richiede iOS17.6, iPadOS17.6, macOS14.0 o visionOS2.0 o versioni successive.
Mentre molti strumenti di chat basati sull’intelligenza artificiale si basano su una connettività Internet costante, Fullmoon adotta un approccio diverso. Eseguendo i modelli localmente sul silicio Apple, offre tempi di risposta più rapidi e garantisce che i dati dell'utente rimangano sul dispositivo. Per gli utenti attenti alla privacy, ciò significa che le conversazioni rimangono interamente personali, senza il coinvolgimento di server di terze parti. La funzionalità offline lo rende utile anche in ambienti a bassa connettività o per coloro che preferiscono mantenere i propri flussi di lavoro autonomi.
L'app supporta diversi modelli tra cui Llama-3.2-1B-Instruct-4bit, Llama-3.2-3B-Instruct-4bit e DeepSeek-R1-Distill-Qwen-1.5B nelle versioni a 4 e 8 bit. Questi modelli sono ottimizzati per i chip della serie M di Apple, bilanciando prestazioni ed efficienza. Gli utenti possono personalizzare ulteriormente la propria esperienza attraverso temi, caratteri e istruzioni di sistema personalizzabili, mentre l'integrazione delle scorciatoie Apple consente loro di incorporare funzionalità AI in attività automatizzate.

Fullmoon è iniziato come una beta di TestFlight, dove oltre 3.500 partecipanti hanno contribuito a dare forma alla versione finale. Il feedback della community è stato parte integrante del suo sviluppo e la natura open source del progetto, ospitato su GitHub, garantisce che chiunque possa ispezionare, modificare o contribuire al codice. Questa trasparenza lo ha aiutato a guadagnare terreno sia tra gli sviluppatori che tra gli utenti quotidiani alla ricerca di strumenti di intelligenza artificiale affidabili.
Sin dal suo lancio, fullmoon ha ottenuto recensioni positive per la sua velocità, affidabilità e interfaccia intuitiva. La possibilità di utilizzare modelli avanzati senza accesso a Internet è stata particolarmente apprezzata dai viaggiatori, dai professionisti sul campo e da coloro che cercano la sperimentazione privata dell’IA. Anche con i modelli più potenti, le prestazioni rimangono fluide, evidenziando l’efficienza dell’esecuzione di LLM direttamente sull’hardware Apple.
Piuttosto che essere semplicemente un’altra app di chatbot, fullmoon rappresenta uno spostamento verso l’intelligenza artificiale personale: potente, privata e controllata localmente. Dimostra che l’esecuzione di modelli linguistici avanzati sui dispositivi consumer non è solo possibile ma anche pratica, aprendo la strada a esperienze di intelligenza artificiale più accessibili e incentrate sulla privacy.
IMPARENTATO:Google annuncia Gemini 1.0, un nuovo LLM per competere con ChatGPT-4
