Apple lança OpenELM de código aberto para IA no dispositivo

A Apple fez um avanço significativo na inteligência artificial no dispositivo com OpenELM (Modelos de Linguagem Eficientes de Código Aberto). Este conjunto de modelos de linguagem grande e de código aberto foi projetado para ser executado diretamente no seu iPhone, iPad ou Mac, trazendo poderosos recursos de IA para mais perto de você. Essa abordagem prioriza a privacidade do usuário, mantendo seus dados no dispositivo, em vez de depender de servidores remotos.

OpenELM é uma família de oito modelos de linguagem compactos otimizados especificamente para operação eficiente em seus dispositivos Apple. Variando de 270 milhões a 3 bilhões de parâmetros em tamanho, esses modelos são treinados em conjuntos de dados disponíveis publicamente. Você pode acessá-los por meio do Hugging Face Hub, uma plataforma popular para desenvolvedores de IA compartilharem e colaborarem no código.

Mais leitura:O modelo de IA de código aberto da China ‘Goku’ desafia o domínio dos EUA

O que diferencia o OpenELM é o uso de uma estratégia de escalonamento em camadas. Isto se traduz em uma alocação mais eficiente de recursos dentro do modelo, resultando em maior precisão. A Apple lançou modelos pré-treinados e modelos ajustados com instruções específicas, demonstrando seu compromisso com a pesquisa aberta e a colaboração no campo da IA. Comodelineadopela Apple:

OpenELM, um modelo de linguagem aberta de última geração. OpenELM usa uma estratégia de escalonamento em camadas para alocar parâmetros com eficiência dentro de cada camada do modelo do transformador, levando a maior precisão. Por exemplo, com um orçamento de parâmetros de aproximadamente um bilhão de parâmetros, o OpenELM apresenta uma melhoria de 2,36% na precisão em comparação com o OLMo, ao mesmo tempo que requer 2x menos tokens de pré-treinamento.

Divergindo das práticas anteriores que fornecem apenas pesos de modelo e código de inferência e pré-treinamento em conjuntos de dados privados, nosso lançamento inclui a estrutura completa para treinamento e avaliação do modelo de linguagem em conjuntos de dados disponíveis publicamente, incluindo logs de treinamento, vários pontos de verificação e configurações de pré-treinamento.

Ao tornar o OpenELM de código aberto, a Apple convida a comunidade de pesquisa mais ampla a explorar e melhorar esses modelos. Isto promove a transparência, permitindo aos investigadores identificar e abordar potenciais preconceitos nos dados e na concepção do modelo. Além disso, desenvolvedores e empresas podem adaptar o OpenELM para aplicações específicas, acelerando a inovação.

Embora o OpenELM ainda não esteja integrado aos dispositivos Apple, rumores sugerem que o iOS 18 revelará novos recursos de IA interessantes. A expectativa é que a Apple aproveite o OpenELM para aprimorar as experiências do usuário em seus dispositivos, mantendo sua privacidade como prioridade máxima.

No geral, a introdução do OpenELM pela Apple marca um avanço significativo para o processamento de IA no dispositivo. Esta abordagem prioriza a privacidade do usuário e promove a colaboração dentro da comunidade de pesquisa em IA. Com a integração potencial do OpenELM no iOS 18, podemos esperar experiências de IA mais poderosas e seguras em nossos dispositivos Apple em um futuro próximo.