Cuando toco la aplicación de Anthropic’s claudio ai en mi teléfono y le doy un mensaje, digamos: “Cuéntame una historia sobre un felino travieso”, suceden muchas cosas ayer de que el resultado (“El gran atraco al atún”) aparezca en mi pantalla.
Mi solicitud se envía a la cúmulo: una computadora en un gran centro de datos en algún zona – para ser ejecutado a través del Soneto 4.5 de Claude maniquí de jerigonza vasto. El maniquí reúne una respuesta plausible utilizando texto predictivo renovador, basándose en la enorme cantidad de datos con los que ha sido entrenado. Luego, esa respuesta se envía de regreso a mi iPhone y aparece palabra por palabra, serie por serie, en mi pantalla. Ha viajado cientos, si no miles, de millas y ha pasado por varias computadoras en su alucinación alrededor de y desde mi pequeño teléfono. Y todo sucede en segundos.
Este sistema funciona aceptablemente si lo que estás haciendo es de bajo aventura y la velocidad no es positivamente un problema. Puedo esperar unos segundos para mi pequeña historia sobre Bigotes y su desventura en un mueble de cocina. Pero no todas las tareas de la inteligencia industrial son así. Algunos requieren una velocidad tremenda. Si un dispositivo de inteligencia industrial va a alertar a cierto sobre un objeto que bloquea su camino, no puede permitirse el fastuosidad de esperar uno o dos segundos.
Otras solicitudes requieren más privacidad. No me importa si la historia del felino pasa por docenas de computadoras propiedad de personas y empresas que no conozco y en las que no confío. Pero ¿qué pasa con mi información de sanidad o mis datos financieros? Quizás quiera perdurar esto bajo control.
No se pierda nadie de nuestro contenido tecnológico imparcial y reseñas de laboratorio. Añadir CNET como fuente preferida de Google.
La velocidad y la privacidad son dos razones principales por las que los desarrolladores de tecnología están trasladando cada vez más el procesamiento de IA de los enormes centros de datos corporativos a dispositivos personales como su teléfono, computadora portátil o cronómetro inteligente. Además hay ahorros de costos: no hay escazes de pagarle a un gran cámara de centro de datos. Adicionalmente, los modelos integrados en el dispositivo pueden funcionar sin conexión a Internet.
Pero hacer posible este cambio requiere mejor hardware y modelos de IA más eficientes, a menudo más especializados. La convergencia de esos dos factores determinará en última instancia qué tan rápida y fluida será su experiencia en dispositivos como su teléfono.
Mahadev Satyanarayanan, conocido como Satya, es profesor de informática en la Universidad Carnegie Mellon. Durante mucho tiempo ha investigado lo que se conoce como computación de borde: el concepto de manejar el procesamiento y almacenamiento de datos lo más cerca posible del favorecido verdadero. Dice que el maniquí ideal para una verdadera informática de punta es el cerebro humano, que no descarga tareas como visión, registro, acento o inteligencia a ningún tipo de “cúmulo”. Todo sucede ahí mismo, completamente “en el dispositivo”.
“Aquí está el truco: a la naturaleza le tomó mil millones de primaveras progresar”, me dijo. “No tenemos mil millones de primaveras para esperar. Estamos tratando de hacer esto en cinco o diez primaveras, como mayor. ¿Cómo vamos a acelerar la proceso?”
Lo acelera con una IA mejor, más rápida y más pequeña que se ejecuta en un hardware mejor, más rápido y más pequeño. Y como ya estamos viendo con las últimas aplicaciones y dispositivos, incluidos los que se esperan en CES 2026, está en marcha.
Probablemente la IA esté ejecutándose en tu teléfono ahora mismo
La IA en el dispositivo está acullá de ser novedosa. ¿Recuerdas en 2017 cuando pudiste desbloquear tu iPhone por primera vez sosteniéndolo frente a tu cara? Esa tecnología de registro facial utilizó un motor neuronal en el dispositivo; no es IA genérica como Claude o ChatGPT, pero es inteligencia industrial fundamental.
Los iPhones actuales utilizan un maniquí de IA en el dispositivo mucho más potente y versátil. Tiene cerca de de 3 mil millones de parámetros: los cálculos individuales del peso cedido a una probabilidad en un maniquí de jerigonza. Esto es relativamente pequeño en comparación con los grandes modelos de uso militar que ejecutan la mayoría de los chatbots de IA. Deepseek-R1, por ejemplo, tiene 671 mil millones de parámetros. Pero no pretende hacerlo todo. En cambio, está diseñado para tareas específicas en el dispositivo, como resumir mensajes. Al igual que la tecnología de registro facial para desbloquear su teléfono, esto es poco que no puede permitirse acatar de una conexión a Internet para ejecutar un maniquí en la cúmulo.
Apple ha mejorado sus capacidades de inteligencia industrial en el dispositivo, denominada Apple Intelligence, para incluir funciones de registro visual, como permitirle inquirir cosas de las que tomó una captura de pantalla.
Los modelos de IA en dispositivos están en todas partes. Los teléfonos Pixel de Google ejecutan el maniquí Gemini Nano de la compañía en su interpretación personalizada Chip tensor G5. Ese maniquí impulsa funciones como Magic Cue, que muestra información de sus correos electrónicos, mensajes y más, acoplado cuando la necesita, sin que tenga que buscarla manualmente.
Los desarrolladores de teléfonos, computadoras portátiles, tabletas y el hardware que contienen están construyendo dispositivos teniendo en cuenta la IA. Pero va más allá de eso. Piense en los relojes y antiparras inteligentes, que ofrecen un espacio mucho más condicionado que incluso el teléfono más delgado.
“Los desafíos del sistema son muy diferentes”, afirmó Vinesh Sukumar, cabecilla de IA generativa y educación instintivo de Qualcomm. “¿Puedo hacerlo todo en todos los dispositivos?”
En este momento, la respuesta suele ser no. La decisión es asaz sencilla. Cuando una solicitud excede las capacidades del maniquí, descarga la tarea a un maniquí basado en la cúmulo. Pero dependiendo de cómo se gestione esa transferencia, puede socavar uno de los beneficios secreto de la IA en el dispositivo: perdurar sus datos completamente en sus manos.
IA más privada y segura
Los expertos señalan repetidamente que la privacidad y la seguridad son ventajas secreto de la IA en los dispositivos. En una situación de cúmulo, los datos vuelan en todas direcciones y enfrentan más momentos de vulnerabilidad. Si permanece en un teléfono oculto o en una dispositivo de computadora portátil, es mucho más tratable de proteger.
Los datos empleados por los modelos de IA de sus dispositivos podrían incluir cosas como sus preferencias, historial de navegación o información de ubicación. Si aceptablemente todo eso es esencial para que la IA personalice su experiencia según sus preferencias, incluso es el tipo de información que quizás no desee que caiga en las manos equivocadas.
“Lo que estamos presionando es asegurarnos de que el favorecido tenga acercamiento y sea el único propietario de esos datos”, dijo Sukumar.
Apple Intelligence le dio a Siri una nueva apariencia en el iPhone.
Hay algunas maneras diferentes en que se puede manejar la descarga de información para proteger su privacidad. Un autor secreto es que tendrías que dar permiso para que esto suceda. Sukumar dijo que el objetivo de Qualcomm es certificar que las personas estén informadas y tengan la capacidad de proponer no cuando un maniquí llega al punto de descargarse a la cúmulo.
Otro enfoque, que puede funcionar cercano con el requisito del permiso del favorecido, es certificar que todos los datos enviados a la cúmulo se manejen de forma segura, breve y temporal. Apple, por ejemplo, utiliza una tecnología que pasión Computación en la cúmulo privada. Los datos descargados se procesan exclusivamente en los propios servidores de Apple, solo se envían los datos mínimos necesarios para la tarea y nadie de ellos se almacena ni se hace accesible a Apple.
IA sin el coste de la IA
Los modelos de IA que se ejecutan en dispositivos tienen una preeminencia tanto para los desarrolladores como para los usuarios de aplicaciones, ya que el costo continuo de ejecutarlos es básicamente torpe. No existe ninguna empresa de servicios en la cúmulo que pague por la energía y la potencia informática. Está todo en tu teléfono. Tu saquillo es el centro de datos.
Eso es lo que atrajo a Charlie Chapman, desarrollador de una aplicación de máquina de ruido señal Ruido Umbrosohasta usar Foundation Models Framework de Apple para una utensilio que le permite crear una mezcla de sonidos. El maniquí de IA en el dispositivo no genera audio nuevo, solo selecciona diferentes sonidos y niveles de bulto existentes para hacer una mezcla.
Conveniente a que la IA se ejecuta en el dispositivo, no hay ningún costo continuo mientras realizas tus mezclas. Para un pequeño desarrollador como Chapman, eso significa que hay menos aventura asociado a la escalera de la colchoneta de usuarios de su aplicación. “Si algún influencer publicó al azar sobre esto y obtuve una increíble cantidad de usuarios gratuitos, no significa que de repente voy a interrumpir”, dijo Chapman.
Observar más: Conceptos básicos de IA: 29 formas en las que puede hacer que la IA Gen funcione para usted, según nuestros expertos
La errata de costos continuos de la IA en el dispositivo permite automatizar tareas pequeñas y repetitivas, como la entrada de datos, sin grandes costos ni contratos informáticos, dijo Chapman. La desventaja es que los modelos en el dispositivo difieren según el dispositivo, por lo que los desarrolladores tendrían que trabajar aún más para certificar que sus aplicaciones funcionen en hardware diferente.
Cuantas más tareas de IA se manejen en dispositivos de consumo, menos tendrán que desembolsar las empresas de IA en la construcción masiva de centros de datos que tiene a todas las grandes empresas de tecnología luchando por conseguir monises en efectivo y chips de computadora. “El costo de la infraestructura es enorme”, dijo Sukumar. “Si positivamente se quiere impulsar la escalera, no se debe aumentar esa carga de costos”.
El futuro es cuestión de velocidad
Especialmente cuando se alcahuetería de funciones en dispositivos como antiparras, relojes y teléfonos, gran parte de la utilidad genuina de la IA y el educación instintivo no es como el chatbot que usé para contar una historia de gatos al principio de este artículo. Son cosas como el registro de objetos, la navegación y la traducción. Estos requieren modelos y hardware más especializados, pero incluso requieren más velocidad.
Satya, el profesor de Carnegie Mellon, ha estado investigando diferentes usos de los modelos de IA y si pueden funcionar con suficiente precisión y celeridad utilizando modelos en el dispositivo. Cuando se alcahuetería de clasificación de imágenes de objetos, la tecnología flagrante funciona asaz aceptablemente: es capaz de ofrecer resultados precisos en 100 milisegundos. “Hace cinco primaveras, no éramos capaces de conseguir ese tipo de precisión y velocidad”, dijo.
Esta captura de pantalla recortada de un video capturado con las antiparras Oakley Meta Vanguard AI muestra métricas de entrenamiento extraídas del cronómetro Garmin emparejado.
Pero para otras cuatro tareas (detección de objetos, segmentación instantánea (la capacidad de aceptar objetos y su forma), registro de actividad y seguimiento de objetos) los dispositivos aún necesitan descargarse a una computadora más potente en otro zona.
“Creo que en los próximos primaveras, cinco primaveras más o menos, será muy emocionante a medida que los proveedores de hardware sigan intentando hacer que los dispositivos móviles estén mejor adaptados a la IA”, dijo Satya. “Al mismo tiempo, incluso tenemos algoritmos de IA que se vuelven más potentes, más precisos y más intensivos en computación”.
Las oportunidades son inmensas. Satya dijo que los dispositivos en el futuro podrían usar la visión por computadora para alertarlo ayer de que se tropiece con un plazo desigual o recordarle con quién está hablando y brindarle contexto sobre sus comunicaciones pasadas con ellos. Este tipo de cosas requerirán una IA y un hardware más especializados.
“Estos van a surgir”, dijo Satya. “Podemos verlos en el horizonte, pero aún no están aquí”.





