Tecnología · Infraestructura · Datos

La IA dejó de competir por el mejor modelo: ahora la batalla es por la plataforma donde vive el agente

En una sola semana de junio de 2026, Nvidia metió un chip de un petaflop en el ordenador personal, Microsoft convirtió Windows en un entorno para agentes y varias empresas presentaron la infraestructura para que un agente autónomo viva en tu máquina. El anuncio importante ya casi nunca es un modelo nuevo. Esta es la anatomía de un cambio de terreno.

Por Natacha Prieto W. Reportera — Estados Unidos 13 min de lectura Publicado 12 de junio de 2026

inteligencia artificial agentes de IA Nvidia Microsoft chips runtime IA local infraestructura RTX Spark

Una semana en la que casi nadie habló de un modelo nuevo

En las primeras semanas de junio de 2026, las mayores empresas de tecnología hicieron sus anuncios más ruidosos del año, y casi ninguno fue un modelo de inteligencia artificial. Hubo un chip que entró en el ordenador personal, un sistema operativo que se reconvirtió en entorno para agentes y una serie de conferencias que convergieron en un mismo mensaje. La contienda de la IA, que durante dos años giró en torno a qué modelo era el más inteligente, se desplazó visiblemente hacia otro terreno: la plataforma donde ese modelo trabaja.

Ese desplazamiento tiene una consecuencia práctica para cualquiera que despliegue IA en una empresa, porque cambia lo que en realidad se está comprando. Si 2024 y 2025 fueron el momento de elegir un modelo, 2026 es el momento de elegir una plataforma: un chip, un entorno de ejecución, un plano de control y, cada vez más, una postura de seguridad. Y esas son decisiones mucho más pegajosas. Cambiar de modelo de IA puede hacerse en semanas; cambiar de plataforma de cómputo y de entorno de agentes es una decisión de varios años que ata a la organización a un proveedor y a su entorno técnico.

La distinción entre modelo y plataforma es el eje de todo lo que ocurrió esa semana. Un modelo es el cerebro: el sistema que razona, escribe o genera. La plataforma es el cuerpo: el chip que ejecuta, el sistema operativo que lo hospeda, el entorno donde un agente autónomo permanece activo y actúa. Durante años la atención se concentró en el cerebro; ahora la inversión y el ruido se han mudado al cuerpo, y eso dice mucho sobre la fase en la que entra la industria.

El chip que bajó al ordenador personal

El primer indicio del cambio vino del fabricante de chips que domina el sector. Nvidia llevó su tecnología más potente fuera del centro de datos y la metió directamente en la máquina del usuario. El 31 de mayo, en Computex, Nvidia anunció el RTX Spark, un superchip de consumo de un petaflop en formato FP4 con hasta 128 gigabytes de memoria unificada, y una versión para Windows de la estación DGX. Un petaflop de potencia —una capacidad reservada hasta hace poco a supercomputadoras— cabe ahora en un equipo de escritorio personal, lo que redefine qué se puede ejecutar localmente sin recurrir a la nube.

La importancia de ese chip no está solo en su potencia bruta, sino en lo que habilita: que un agente de IA pueda vivir y trabajar dentro de la máquina del usuario. Lo que cambió no es que se pueda ejecutar un modelo localmente, algo posible desde hace años, sino que el hardware, el sistema operativo y el entorno de ejecución del agente se diseñan ahora juntos con un único propósito: mantener vivo a un agente autónomo en la máquina, con la nube como una opción y no como un requisito. Esa integración de las tres capas —silicio, sistema operativo y entorno del agente— es la novedad real, más que cualquier salto en la inteligencia del modelo.

El movimiento no fue aislado, sino parte de una convergencia de varios actores en la misma dirección y en los mismos días. En cinco días, Nvidia presentó el RTX Spark y una estación DGX para Windows en Computex, Microsoft lanzó su agente Scout y dos modelos integrados en el dispositivo en Build, y Nous Research publicó Hermes Desktop, de modo que las piezas de una pila de agentes local —silicio, entorno de ejecución, motor de inferencia y marco de agentes— aterrizaron todas a la vez. Que tantas piezas complementarias aparecieran en la misma ventana de tiempo no es casualidad: es la señal de que el sector decidió, de forma coordinada, que el siguiente frente es la ejecución local de agentes.

Windows se reconvierte en un entorno para agentes

El segundo gran movimiento de la semana vino del software, y fue igual de revelador. Microsoft usó su conferencia para desarrolladores para redefinir su sistema operativo como una plataforma de agentes. En el corazón de Build 2026 estuvo la Windows AI Platform, un conjunto de servicios y APIs a nivel de sistema operativo que convierten cualquier máquina con Windows en un entorno de ejecución de agentes, que el consejero delegado Satya Nadella describió como ‘el punto final más capaz del mundo para la IA’. La idea es que el agente no sea una aplicación más, sino una capacidad incorporada al propio sistema operativo, capaz de actuar a través de múltiples programas.

El giro estratégico es notable porque marca un cambio de filosofía respecto de los años anteriores. Los anuncios señalan un giro estratégico: tras años de añadir IA a Windows con Copilot y APIs en la nube, Microsoft incrusta ahora modelos fundacionales, bases de datos vectoriales y motores de orquestación directamente en el sistema operativo. En lugar de tratar la IA como un servicio externo al que el sistema llama, la integra en su núcleo, de modo que los agentes pueden construirse, probarse y ejecutarse en el propio dispositivo y servirse de un grafo de contexto que cruza varias aplicaciones.

Junto a la plataforma, Microsoft presentó una pieza que apunta a un problema emergente: cómo gobernar a los agentes. Build 2026 introdujo Project Solara, un entorno de ejecución de agentes multiplataforma; el Surface RTX Spark Dev Box para desarrollo de agentes; APIs de búsqueda web pensadas para agentes; y la Agent Control Specification para gobernar agentes de IA. Esa especificación de control es significativa: cuando un agente actúa de forma autónoma, hace clics, ejecuta tareas y toma decisiones, surge la necesidad de supervisarlo y ponerle límites. Que la gobernanza del agente aparezca como producto, y no como un añadido posterior, indica que la industria ya asume la autonomía como el modelo por defecto.

Por qué la inteligencia del modelo se volvió casi rutinaria

Un dato llamativo de la semana es que las noticias estrictamente de modelos pasaron casi desapercibidas frente al ruido de la infraestructura. Los lanzamientos de modelos siguieron, pero con un tono mucho más rutinario. Las noticias de modelos de la semana fueron casi mundanas en comparación: Gemini 3.5 Flash de Google alcanzó disponibilidad general, OpenAI confirmó que retira GPT-4.5 de ChatGPT el 27 de junio, y Microsoft presentó su propio modelo de programación en el editor. Que el avance de los modelos se trate ya como una actualización de mantenimiento, y no como un acontecimiento, es en sí mismo una señal de madurez del mercado.

Las cifras de rendimiento de esos modelos siguen mejorando, pero su impacto narrativo se ha desplazado. Gemini 3.5 Flash, ya disponible, obtuvo una puntuación de 55 en el índice de inteligencia y funciona a 284 tokens por segundo, cuatro veces más rápido que los modelos de frontera competidores. La velocidad y la eficiencia importan, pero ya no por sí mismas: importan porque hacen viable que un agente ejecute muchos pasos de forma fluida. El modelo se ha convertido en un componente al servicio del agente, no en el protagonista.

Ese cambio de protagonismo se refleja también en cómo el propio mercado describe la competencia. Los reportes describen ahora a Microsoft y Google persiguiendo explícitamente a los líderes en modelos de programación, en una contienda que ya no se libra sobre qué modelo es más inteligente, sino sobre quién ofrece la plataforma más completa. La inteligencia bruta del modelo se ha vuelto una condición necesaria pero no suficiente: el factor diferencial es la plataforma que rodea a ese modelo y lo convierte en un agente capaz de actuar en el mundo real.

Lo que el cambio significa para quien adopta IA

Para una empresa de América Latina, o para cualquier organización fuera del núcleo tecnológico que fabrica esta infraestructura, el desplazamiento del modelo a la plataforma cambia la naturaleza de la decisión. Elegir un modelo era reversible: si uno no funcionaba, se cambiaba por otro con relativa facilidad. Elegir una plataforma de agentes —un chip, un entorno de ejecución, un sistema operativo y un marco de gobernanza— es comprometerse con un ecosistema durante años, con costos de migración mucho más altos. La decisión se vuelve estratégica, no táctica.

Ese cambio tiene una cara de oportunidad y una de dependencia, y conviene exponer ambas. La oportunidad es la autonomía técnica: ejecutar agentes localmente reduce la latencia, mejora la privacidad de los datos y disminuye la dependencia de la conectividad y de los costos por uso de la nube. Para regiones donde la conexión no siempre es fiable o el cómputo en la nube resulta caro, la ejecución local de agentes podría democratizar el acceso a capacidades antes reservadas a quien podía pagar grandes facturas de nube.

La cara de dependencia es la otra mitad del cuadro. Las plataformas que están construyendo este nuevo terreno —los chips, los sistemas operativos, los entornos de ejecución— las fabrican un puñado de empresas concentradas en pocos países. Quien adopta esta infraestructura queda atado a las decisiones de precio, disponibilidad y compatibilidad de esos proveedores, sin capacidad de influir en ellas. Para América Latina, que consume esta tecnología sin fabricarla, el desplazamiento del modelo a la plataforma profundiza una dependencia estructural: la región decide qué agentes usar, pero no las reglas del entorno donde esos agentes viven.

El chip pensado para mandar a otros agentes

Un detalle técnico de la nueva generación de silicio revela hasta qué punto el agente, y no el modelo, se ha vuelto el centro del diseño. Los nuevos procesadores no solo calculan más rápido: están concebidos para coordinar las tareas de un agente que interactúa con otros programas. El procesador central de la plataforma más reciente de Nvidia, sucesor de la arquitectura anterior, está específicamente afinado para actuar como el orquestador de las tareas de un agente, gestionando la lógica compleja y los protocolos de uso de herramientas que se requieren cuando un agente de IA interactúa con software o hardware externo. Es decir: el chip ya no se diseña solo para que el modelo piense, sino para que el agente actúe y coordine.

Esa orientación al agente atraviesa toda la pila tecnológica. Microsoft presentó nuevas máquinas virtuales en la nube con una mejora de rendimiento del 50 por ciento, plenamente optimizadas para cargas de trabajo de IA agéntica. La palabra clave que se repite en cada capa —del chip a la nube, del sistema operativo al entorno de ejecución— es la misma: agente. Cuando un término organiza simultáneamente el diseño del silicio, del sistema operativo y de la infraestructura de nube, es señal de que la industria ha fijado un objetivo común y está alineando todas sus capas para alcanzarlo.

Ese alineamiento total tiene una implicación competitiva que conviene entender. Una empresa que controla varias capas a la vez —el chip, el sistema operativo, la nube y el entorno del agente— puede ofrecer una experiencia más integrada que quien controla solo una. Eso favorece a los grandes actores con presencia en toda la pila y dificulta la entrada de competidores especializados en un solo eslabón. La contienda por la plataforma es, en el fondo, una contienda por integrar el mayor número de capas, y eso tiende a concentrar el mercado en pocas manos.

El coste oculto: energía, agua y centros de datos

Detrás del entusiasmo por los agentes y los chips hay un coste material que la propia industria empezó a reconocer en sus anuncios. Ejecutar IA a esta escala consume cantidades enormes de energía y agua, y los fabricantes ya no pueden ignorarlo. Nadella habló de construir centros de datos con un impacto ambiental mínimo, lo que significa minimizar el uso de agua al equivalente al de un solo restaurante, en asociación con AMD, Intel y Nvidia. Que el consumo de agua aparezca como argumento de venta en una conferencia de desarrolladores indica que el coste ambiental de la IA se ha vuelto un factor que las empresas deben abordar públicamente.

Ese coste material es, en parte, lo que impulsa el giro hacia la ejecución local. Si una porción de las tareas de IA se resuelve en el dispositivo del usuario en lugar de en un centro de datos remoto, se reduce la carga sobre la infraestructura centralizada y su consumo asociado. La IA local no es solo una cuestión de latencia o privacidad: es también una respuesta parcial al problema energético de una tecnología cuya demanda de cómputo crece más rápido que la capacidad de alimentarla de forma sostenible. El debate sobre dónde vive el agente —en la nube o en la máquina— tiene, por tanto, una dimensión ambiental que suele quedar fuera del foco.

Lo que la convergencia enseña sobre la fase de la IA

Más allá de los anuncios concretos, la semana ofrece una lectura sobre en qué fase entra la inteligencia artificial. Cuando una tecnología deja de competir por la calidad del componente central y empieza a competir por la plataforma que lo integra, suele indicar que el componente se ha vuelto suficientemente bueno y que el valor se ha desplazado hacia el entorno que lo rodea. Es un patrón conocido en la historia de la tecnología: ocurrió con los ordenadores personales, con los teléfonos inteligentes y con la nube. La IA parece haber llegado a ese punto: los modelos son ya tan capaces que la ventaja competitiva se juega en otro lado.

Ese patrón tiene una virtud y un riesgo que merecen exponerse con equilibrio. La virtud es la madurez: una tecnología que se estandariza en su núcleo y compite en la plataforma suele volverse más útil, más barata y más accesible para el usuario final. El riesgo es la concentración: cuando el valor se desplaza a la plataforma, el poder tiende a acumularse en quien controla esa plataforma, lo que puede reducir la competencia y aumentar la dependencia. La historia de la tecnología muestra ambos desenlaces, y cuál predomine dependerá de las decisiones regulatorias y de mercado de los próximos años.

Hay un matiz que conviene no perder de vista para no exagerar el alcance del cambio. La ejecución local de agentes no elimina la nube, sino que la reposiciona como una opción para las tareas más pesadas, mientras lo cotidiano se resuelve en el dispositivo. Lo cotidiano se resuelve en el dispositivo, con la nube como opción y no como requisito. Esa arquitectura híbrida —local para lo frecuente, nube para lo intensivo— es probablemente el modelo que se consolidará, y entenderla así evita tanto el entusiasmo de quien anuncia el fin de la nube como el escepticismo de quien niega que algo haya cambiado.

El balance de los datos

La semana de junio de 2026 condensa un cambio de fase en la inteligencia artificial: la contienda dejó de ser por el mejor modelo y pasó a ser por la mejor plataforma. Nvidia metió un petaflop en el ordenador personal con el RTX Spark, Microsoft convirtió Windows en un entorno de ejecución de agentes con su Windows AI Platform y Project Solara, y varias empresas presentaron, en la misma ventana, las piezas de una pila de agentes local. Las noticias de modelos —Gemini 3.5 Flash, la retirada de GPT-4.5— se trataron casi como rutina, lo que confirma que el protagonismo se mudó del cerebro al cuerpo de la IA.

El veredicto que dejan los datos es el de una industria que madura y, al hacerlo, eleva las apuestas. Para las empresas, la decisión ya no es qué modelo usar —algo reversible— sino qué plataforma adoptar, un compromiso de varios años con costos de cambio altos. La ejecución local de agentes promete menos latencia, más privacidad y menos dependencia de la nube, pero a cambio ata al adoptante a un ecosistema controlado por un puñado de fabricantes. Para América Latina, que usa esta tecnología sin producirla, el mensaje de fondo es que el terreno donde se libra la competencia de la IA se ha vuelto más estructural y más difícil de cambiar. La próxima ventaja no la dará el modelo más inteligente, sino la plataforma que mejor lo convierta en un agente capaz de actuar. Y elegir esa plataforma será una de las decisiones tecnológicas más consecuentes de la década.

Seguir leyendo

Tecnología · Soberanía tecnológica · Datos