No início deste ano, a Mainframe lançou o aplicativo fullmoon, uma ferramenta gratuita e de código aberto que permite aos usuários executar grandes modelos de linguagem, como Llama e DeepSeek, inteiramente em seus dispositivos. Foi lançado em 13 de janeiro de 2025, apropriadamente cronometrado com a lua cheia, uma homenagem divertida ao nome fullmoon (fuLLMoon).
Em vez de depender de conexões de Internet, o fullmoon executa modelos de IA localmente no silício da Apple, o que melhora a velocidade e mantém os dados das conversas privados. O aplicativo funciona totalmente offline em iPhone, iPad, Mac e Vision Pro e requer iOS17.6, iPadOS17.6, macOS14.0 ou visionOS2.0 ou posterior.
Embora muitas ferramentas de bate-papo de IA dependam de conectividade constante com a Internet, Fullmoon adota uma abordagem diferente. Ao executar modelos localmente em silício da Apple, ele oferece tempos de resposta mais rápidos e garante que os dados do usuário permaneçam no dispositivo. Para usuários preocupados com a privacidade, isso significa que as conversas permanecem totalmente pessoais, sem o envolvimento de servidores de terceiros. A capacidade offline também o torna útil em ambientes de baixa conectividade ou para aqueles que preferem manter seus fluxos de trabalho independentes.
O aplicativo suporta vários modelos, incluindo Llama-3.2-1B-Instruct-4bit, Llama-3.2-3B-Instruct-4bit e DeepSeek-R1-Distill-Qwen-1.5B nas versões de 4 e 8 bits. Esses modelos são otimizados para chips da série M da Apple, equilibrando desempenho com eficiência. Os usuários podem personalizar ainda mais sua experiência por meio de temas, fontes e prompts do sistema personalizáveis, e a integração dos atalhos da Apple permite incorporar funcionalidades de IA em tarefas automatizadas.

Fullmoon começou como um TestFlight beta, onde mais de 3.500 participantes ajudaram a moldar o lançamento final. O feedback da comunidade tem sido essencial para o seu desenvolvimento, e a natureza de código aberto do projeto – hospedado no GitHub – garante que qualquer pessoa possa inspecionar, modificar ou contribuir com o código. Essa transparência ajudou a ganhar força entre desenvolvedores e usuários comuns que procuram ferramentas de IA confiáveis.
Desde o seu lançamento, fullmoon recebeu críticas positivas por sua velocidade, confiabilidade e interface amigável. A capacidade de usar modelos avançados sem acesso à Internet tem sido particularmente apreciada por viajantes, profissionais de campo e por aqueles que buscam experimentação privada de IA. Mesmo com modelos mais capazes, o desempenho permanece suave, destacando a eficiência de executar LLMs diretamente no hardware Apple.
Em vez de ser apenas mais um aplicativo de chatbot, o Fullmoon representa uma mudança em direção à IA pessoal: poderosa, privada e controlada localmente. Ele demonstra que executar modelos de linguagem avançados em dispositivos de consumo não é apenas possível, mas também prático, abrindo caminho para experiências de IA mais acessíveis e focadas na privacidade.
RELACIONADO:Google anuncia Gemini 1.0, um novo LLM para competir com ChatGPT-4
