“Una nueva era de IA móvil”. Así es como Samsung está promocionando su próxima gama de teléfonos inteligentes de la serie Galaxy S24."
Para su evento Unpacked que se celebrará a finales de este mes, la empresa promete "una experiencia móvil completamente nueva impulsada por IA". Samsung no será el primer nombre en sumergirse en el revuelo por la IA provocado por empresas como ChatGPT y . Los dos pesos pesados del silicio para teléfonos inteligentes, Qualcomm y MediaTek, recientemente hicieron un gran espectáculo sobre las capacidades de IA generativa en el dispositivo de sus últimos procesadores emblemáticos y de gama media.A mitad del viaje
El cambio es evidente. La IA será la palabra de moda en el marketing de teléfonos. Pero, ¿en qué nos espera exactamente? Sigue siendo un secreto cómo estos llamados “avances de la IA” agregarán algún valor significativo. O tal vez sea simplemente un truco existente que espera ser reempaquetado con un nombre diferente o una aplicación nativa.
Comencemos con los teléfonos de la serie Galaxy S24. Se enviarán con el chip Snapdragon 8 Gen 3 de Qualcomm. El fabricante de chips está haciendo algunas afirmaciones audaces sobre las capacidades de IA generativa de su nuevo chipset de primer nivel. Por ejemplo, se dice que produce una imagen a partir de mensajes de texto en un segundo utilizando la tecnología de IA de difusión estable.
Qualcomm ha ofrecido una explicación fascinantemente técnica sobre cómo optimizó la tecnología Stable Diffusion para el funcionamiento en el dispositivo. Su rival MediaTek también afirma que las funciones de IA en el dispositivo de su buque insignia Dimensity 9300 permitirán la generación de texto a imagen en menos de un segundo, cortesía de Stable. Difusión.En este momento, ya tenemos un teléfono con el último buque insignia de Qualcomm. El dispositivo en cuestión es el iQoo 12, pero es interesante ver que los materiales de marketing del teléfono no mencionan ningún truco de IA generativa, especialmente el tipo que promocionado por Qualcomm y MediaTek.
Puede leer también | Microsoft: Una Mirada a Productos Previos en Desuso y Novedades Recientes Disponibles a través de un Acuerdo de Licencia.
¿Qué hago con estas imágenes de gatos ninja generadas por IA?
Supongamos que Samsung será el destinado a ofrecer esa función de generación de texto a imagen. ¿Qué va a lograr al final del día? En este momento, no sabemos si el truco de conversión de texto a imagen se incluirá en una aplicación de terceros o si Samsung lo integrará en una de sus aplicaciones.
La verdadera pregunta es cuánto valor agregará a nuestros patrones de uso diario de teléfonos inteligentes. ¿Qué hará un comprador promedio de Galaxy S24 con las imágenes generadas con una sola línea de texto? Quizás utilicen esas imágenes generadas por IA para agregar algo de entusiasmo a los chats o generar algo de revuelo en las redes sociales.
Pero todavía hay algunas fricciones aquí. Tendrás que generar estas imágenes a partir de una línea de texto, guardarlas localmente (o copiarlas directamente en el portapapeles) y luego pegar esas imágenes de IA en la aplicación de chat de tu elección. La solución más óptima sería si Samsung de alguna manera integrara el truco de generación de imagen a texto directamente en el teclado.
Una vez más, ¿por qué tomarse tantas molestias cuando los emojis, los GIF y las pegatinas pueden hacer el trabajo? Además, la salida de 512 x 512 píxeles no es una resolución suficiente para colocar estas imágenes generadas por IA en una tarea universitaria o una presentación de trabajo.
Además, es probable que el sistema no sea gratuito. El video de demostración de MediaTek menciona que hay una opción Premium sobre la mesa. Los compradores de Galaxy S24 podrían terminar encontrándose con un límite de tokens de texto a imagen cuando alcancen una cierta cantidad de salidas, después de lo cual se les degradará a un nivel de velocidad de generación de imágenes más lento o se les pedirá que paguen una tarifa de suscripción.
Pero si esa es la realidad, entonces el punto es discutible porque ya tenemos soluciones como Dall-E de OpenAI. Puede obtenerlo para generar imágenes de forma gratuita o pagar por ChatGPT Plus para disfrutar de las ventajas de una generación de imágenes más rápida y detallada con el último Dall-E 3. modelo. Este es sólo uno de los muchos generadores de texto a imagen que existen.
Qualcomm dice que el Snapdragon 8 Gen 3 es el "primero en admitir modelos multimodales Gen AI". Eso significa que el chatbot (basado en el modelo Llama de Meta) que se ejecuta de forma nativa en un teléfono aceptará entradas en forma de texto e imágenes, así como voz. Una vez más, esto no es único, ya que ChatGPT-4 ya ofrece esa capacidad, aunque detrás de un muro de suscripción.
Puede leer también | Google Chrome: Actúa Contra las Cookies para Su Próxima Disponibilidad.
¿Realmente lo necesitamos?
Una de las características más prometedoras que anuncia Qualcomm es la expansión de imágenes mediante IA. Básicamente, puede expandir el lienzo de una imagen en cualquier dirección que desee, y la IA generativa del dispositivo generará píxeles de manera inteligente según su mensaje de texto y agregará más objetos al marco original.
Es sorprendente presenciar este truco: ver una imagen expandirse con la adición de más objetos y el horizonte ampliarse como si un maestro pintor estuviera retocando su obra. Pero no querrás hacerlo con las imágenes en las que haces clic en un teléfono para guardarlas como recuerdo. Usar la expansión de IA generativa en ellos es como contaminar tus recuerdos con imágenes y escenarios falsos que nunca experimentaste.
El resumen es otra gran apuesta para la implementación de IA generativa en dispositivos en teléfonos. Es fantástico para leer las noticias y mantenerse al tanto de los últimos avances en diferentes dominios. Sin embargo, este truco sólo destacaría si la fricción es mínima. Por ejemplo, si los usuarios pueden resumir un artículo de noticias en la misma página del navegador en lugar de abrir otra aplicación.
Si este último es el caso, ¿por qué no simplemente cambiar a una aplicación que ya lo haga? Por ejemplo, Artifact es una aplicación increíblemente diseñada por el cofundador de Instagram, Kevin Systrom, que utiliza inteligencia artificial para resumir artículos.
Ya existen aplicaciones y sitios web que ofrecen noticias en forma de pepitas resumidas, como Inshorts. Para tu bandeja de entrada, Shortwave es una aplicación excelente que puede hacer más que simplemente resumir cadenas de correo electrónico sin costo adicional.
La IA generativa en el dispositivo también promete trucos como la edición de fotografías basada en voz. Suena increíblemente útil, pero es difícil imaginar cuánta comodidad agregará a nuestras vidas cuando los filtros de un solo toque y los controles deslizantes granulares ofrezcan un flujo igualmente rápido y más gratificante para editar medios en los teléfonos.
Puede leer también | Teclado físico para iPhone: un accesorio que agrega nuevas teclas, ¿una opción para ti?.
A continuación, pasemos a la situación básica en torno al uso de la IA solo para iniciar algunos chats genéricos u obtener respuestas que de otro modo requerirían una investigación impulsada por Internet. Una vez más nos vamos a topar con problemas cualitativos.
Los modelos de IA generativa que se ejecutan de forma nativa en teléfonos, como Meta's Llama, no son los más avanzados de su tipo debido a la disponibilidad fundamental de recursos. No busques más allá de Google. El Pixel 8 Pro solo ejecuta el más pequeño de los grandes modelos de lenguaje de Google llamado Gemini Nano. ¿Por qué no pasar a algo como ChatGPT o Pi a través de sus aplicaciones móviles dedicadas en lugar de conformarse con un modelo de lenguaje menos capaz?
Dónde realmente debe estar la IA generativa
En este momento, donde veo que la IA generativa está haciendo su mejor truco es en desacoplar las tareas de los teléfonos inteligentes de la nube (y el requisito de estar en línea todo el tiempo) y ofrecer un toque extra de seguridad. Pero para hacer eso, estos trucos de IA en el dispositivo deben funcionar como un asistente, algo así como el Asistente de Google, Alexa o Siri.
O mejor aún, deben convertirse en parte del asistente. Dile a tu asistente de IA generativa que recoja todas las imágenes de gatos de tu biblioteca, las teja en un collage y se las envíe a tu papá. O pídale que planifique el mejor itinerario para una excursión de un día a Disneyland, encuentre el boleto más barato para el próximo fin de semana y organice cuidadosamente todos esos detalles en Google Calendar.
Además, si una herramienta de IA generativa en el dispositivo ya no envía sus datos a los servidores de la nube y mantiene todas las operaciones localmente en su teléfono inteligente, hay poco de qué preocuparse por la privacidad de los datos. Al menos teóricamente, eso es. Por ahora, no estoy seguro de la visión de Galaxy AI que Samsung está vendiendo, pero sería interesante ver si Samsung realmente puede ofrecer experiencias de IA generativas significativas o simplemente un montón de trucos efectistas apenas prácticos.