
Apple lanzó hoy varios modelos de lenguajes grandes (LLM) de código abierto que están diseñados para ejecutarse en el dispositivo en lugar de a través de servidores en la nube. Llamados OpenELM (Modelos de lenguaje eficientes de código abierto), los LLM están disponibles en Hugging Face Hub , una comunidad para compartir código de IA.
1. Introducción de OpenELM por Apple:
En un documento técnico reciente, Apple revela su lanzamiento de ocho modelos OpenELM, cuatro de ellos entrenados previamente con CoreNet y cuatro optimizados con instrucciones. La estrategia de escalamiento por capas de Apple busca mejorar la precisión y eficiencia de estos modelos.
Puede leer también | ¿Cuándo anunciará Apple los próximos AirPods? Esto es lo que tenemos entendido
2. Desarrollo y Características de OpenELM:
OpenELM es un modelo de lenguaje de última generación que emplea una estrategia de escalamiento por capas para asignar parámetros de manera eficiente dentro del modelo del transformador. Esta técnica conduce a una mayor precisión, como se demuestra con un presupuesto de aproximadamente mil millones de parámetros, donde OpenELM muestra una mejora del 2,36 % en la precisión en comparación con OLMo, pero requiere el doble de tokens de preentrenamiento.
Puede leer también | Ahora puedes adquirir un Apple Watch Series 7 con un descuento del 47%
3. Iniciativa de Compartir Información de Apple:
A diferencia de prácticas anteriores, donde solo se proporcionaban pesos de modelo y código de inferencia, Apple incluye el marco completo para el entrenamiento y la evaluación del modelo de lenguaje en conjuntos de datos disponibles públicamente, junto con registros de entrenamiento y configuraciones de entrenamiento. Esta iniciativa tiene como objetivo fomentar un progreso más rápido y resultados más confiables en el campo de la inteligencia artificial en lenguaje natural.
Puede leer también | Fixit: Desvela un Detallado Análisis de Desmontaje para el Apple Vision Pro.
4. Impacto y Potencial de OpenELM:
Apple busca empoderar y enriquecer la comunidad de investigación abierta al compartir modelos de lenguaje de última generación. El acceso a estos modelos de código abierto permite a los investigadores investigar riesgos y sesgos de datos y modelos, y brinda a desarrolladores y empresas la oportunidad de utilizar los modelos tal cual o realizar adaptaciones según sea necesario.
Puede leer también | Apple: Sobresale en Auriculares en la CES Sin Participar.
5. Futuro de OpenELM y Apple:
Aunque Apple aún no ha integrado estas capacidades de IA en sus dispositivos, se espera que iOS 18 introduzca nuevas funciones de IA. Los rumores sugieren que Apple planea ejecutar modelos de lenguaje grandes en dispositivos por motivos de privacidad, lo que señala un futuro prometedor para la implementación de IA de vanguardia en productos de la compañía.
Puede leer también | iPhones: Apple retira versión Beta de iOS tras reportes de bloqueos.

