Tecnología · Investigación

Cómo los modelos de lenguaje aprendieron a hablar como funcionarios: lo que encontramos al auditar contratos públicos de IA generativa en Argentina, México, España y Colombia

La administración pública iberoamericana firmó en 2024 y 2025 sus primeros contratos visibles con sistemas de IA generativa. Los textos que estos sistemas producen ahora —pliegos, resoluciones, notificaciones— tienen una huella reconocible. Este es el resultado del primer barrido sistemático sobre contratos detectables en plataformas oficiales de los cuatro países que más han comprado.

Por Alexandra A. Medina Experta en tecnología 16 min de lectura Publicado 12 de mayo de 2026

IA generativa contratación pública España México Argentina Colombia NextGenerationEU soberanía digital auditoría algorítmica Ley de Contratos del Sector Público

La pregunta de la que sale esta investigación

A finales de 2025, en una notificación rutinaria del Ayuntamiento de un municipio mediano del Estado de México, apareció una frase que llamó la atención de un funcionario. “Se le notifica que, conforme a lo previsto en la normativa aplicable, deberá comparecer en el plazo establecido para los efectos legales conducentes.” La frase no tenía nada de extraordinario salvo una cosa: cuatro líneas más abajo, en el mismo párrafo, aparecía otra vez con apenas una variación de orden. Y luego, dos párrafos después, una tercera variación con el mismo esqueleto sintáctico.

Eso lo notó un funcionario que llevaba veinte años revisando notificaciones. No lo había visto antes. Lo que ese funcionario detectó —sin tener el lenguaje técnico para nombrarlo— es la huella estilística de un modelo de lenguaje de gran tamaño produciendo texto administrativo en español. La pregunta que pusimos sobre la mesa al cierre del primer trimestre de 2026 fue: ¿cuántos contratos públicos se han firmado con sistemas de IA generativa en los cuatro países iberoamericanos con mayor volumen de contratación electrónica, y qué se puede aprender mirando los pliegos, las adjudicaciones y los textos que producen?

Esto es el resultado de la primera ronda. La auditoría completa, con los 47 contratos identificados, segmentados por uso, monto y arquitectura técnica, sigue abierta. Pero lo que aparece en esta primera capa ya cuenta una historia.

El método y sus límites

El barrido se hizo sobre cuatro plataformas oficiales y una base supranacional, cubriendo el periodo del 1 de abril de 2024 al 30 de abril de 2026:

España: Plataforma de Contratación del Sector Público y los anuncios de licitación publicados en TED Europa con identificador de origen español.
México: CompraNet y los registros de DOF (Diario Oficial de la Federación) sobre adjudicaciones de servicios tecnológicos con descriptor “inteligencia artificial generativa” o variantes.
Argentina: Compr.ar (plataforma de compras electrónicas del Estado) y boletines oficiales nacionales y provinciales.
Colombia: SECOP II y procesos del Sistema Electrónico de Contratación Pública.
TED Europa: anuncios europeos que afectan a entidades españolas con financiación de NextGenerationEU.

El filtro de búsqueda combinó los siguientes términos en español y los equivalentes técnicos: “inteligencia artificial generativa”, “modelos de lenguaje”, “asistente conversacional”, “ChatGPT”, “GPT-4”, “Claude”, “Gemini”, “LLM”, “transformer”, “automatización documental administrativa”.

El barrido identificó 127 procesos de contratación vinculados a IA o automatización en el periodo. De estos, 47 cumplen los criterios estrictos de uso de modelos de lenguaje generativo, no estar limitados a OCR o transcripción mecánica, y tener al menos el pliego técnico publicado. Esos 47 son la base de esta primera ronda. Los 80 restantes —usos de IA narrow, automatización de procesos sin generación de texto, sistemas de visión computacional— quedan fuera del corpus.

Lo que esta auditoría no afirma: no afirma haber identificado todos los contratos vigentes. Los contratos clasificados como reservados o tramitados por procedimiento negociado sin publicidad escapan al barrido. No afirma que el porcentaje detectable sea representativo del total real. La cifra detectable es un piso, no un censo.

Cuatro países, cuatro patrones

País	Contratos detectados	Plataforma principal	Patrón dominante
España	27 de 47	TED Europa + Plataforma SCSP	Servicios financiados por NextGenerationEU
México	10 de 47	CompraNet + DOF	Adjudicaciones directas a integradores locales
Colombia	7 de 47	SECOP II	Pilotos MinTIC con vendedor único
Argentina	3 de 47	Compr.ar + boletines	Resoluciones administrativas, no contratos formales

Las cifras tienen un sesgo evidente hacia España. Tres explicaciones operan en simultáneo: la Plataforma de Contratación del Sector Público español publica con mucho más detalle técnico que sus equivalentes latinoamericanos; los fondos NextGenerationEU obligan a la trazabilidad documental europea, lo que vuelve cada contrato un objeto público bien indexado; y AESIA, desde A Coruña, ha empujado a las administraciones a categorizar explícitamente sus sistemas de IA antes de licitar.

México aparece en segundo lugar por volumen de procesos, pero más de la mitad de sus adjudicaciones detectadas son contrataciones directas en las que el pliego no se publica con el detalle técnico habitual en España. Colombia mantiene un patrón de pilotos: MinTIC firma con un proveedor único, evalúa, decide si escala. Argentina apenas aparece en formato de contratos formales; lo que sí aparece son resoluciones administrativas que autorizan a organismos federales o provinciales a usar herramientas comerciales de IA generativa sin que medie un contrato público específico.

El contrato emblema: Madrid, transcripción médica con IA, 1.441.600 euros

El 5 de marzo de 2026, la Consejería de Digitalización de la Comunidad de Madrid publicó en TED Europa el anuncio del contrato 154988-2026: “Contrato mixto de servicios para la transcripción de voz y estructuración de informes en consultas médicas en los centros de atención primaria basado en inteligencia artificial, con cargo al Plan de Recuperación Transformación y Resiliencia del Gobierno de España, financiado por la Unión Europea NextGenerationEU (C11.I03.P14.S13)”.

Valor estimado IVA excluido: 1.441.600,00 euros. Duración estimada: 3 meses. CPV principal: 72212900 (Servicios de desarrollo de software y sistemas informáticos diversos). Identificador interno: A/SER-000964/2026. La adjudicación va al desarrollador que aporte la infraestructura y las soluciones de nube pública necesarias para la operativa del proyecto.

Es un contrato que importa por tres razones. Primera: opera sobre un caso de uso clasificado bajo el Anexo III del AI Act como sistema de alto riesgo (atención sanitaria), lo que significa que la PYME o consorcio que lo gane tendrá que documentar conformidad bajo el régimen de notified body, no de autoevaluación. Segunda: la financiación NextGenerationEU obliga a auditoría europea adicional sobre uso de fondos comunitarios, lo que añade una capa de control sobre el contratista. Tercera: el monto, en términos relativos, es alto para un piloto de tres meses; sugiere que el modelo de costes incluye la construcción del corpus de entrenamiento específico para español médico ibérico, no solo la integración de un LLM de propósito general.

El contrato es uno de los 27 españoles del corpus. La media de los contratos españoles detectados está en torno a 480.000 euros, con una mediana cercana a 220.000 euros. Madrid 154988-2026 está en el techo, no en el centro.

La huella estilística: cinco marcadores que detectamos

Lo que el funcionario del municipio mexiquense detectó intuitivamente tiene una explicación técnica. Los modelos de lenguaje de gran tamaño, cuando se les pide producir texto administrativo en español, repiten un patrón de cinco marcadores estilísticos que están ausentes —o presentes con frecuencia mucho menor— en textos administrativos escritos directamente por funcionarios humanos.

Marcador 1: redundancia sintáctica controlada. El modelo introduce variaciones de la misma idea con sinónimos jurídicos cercanos, en lugar de simplificar. “Conforme a lo previsto en la normativa aplicable” / “de acuerdo con lo establecido en la legislación vigente” / “según lo dispuesto en el marco normativo correspondiente”. Los tres aparecen en el mismo documento. Un funcionario humano elige uno y lo usa.

Marcador 2: enumeraciones exhaustivas innecesarias. El modelo enumera categorías cuando el texto solo necesita la categoría general. “Documentos, expedientes, registros, actas, resoluciones, notificaciones y demás” donde un humano escribiría “documentación”.

Marcador 3: pleonasmos jurídicos en cadena. “Los efectos legales conducentes”, “en tiempo y forma”, “para todos los efectos a que haya lugar” aparecen agrupados en una misma frase con frecuencia notablemente mayor. Un humano usa uno; el modelo apila.

Marcador 4: ausencia de variación dialectal regional. Los modelos de lenguaje en español están entrenados predominantemente sobre corpus español ibérico y mexicano normativo. Cuando producen texto para Colombia o Argentina, el resultado tiene una uniformidad léxica que delata el origen. Falta el “se hace saber” colombiano específico, el “atento a lo expuesto” argentino, los giros sintácticos regionales que un funcionario local incorporaría sin pensar.

Marcador 5: longitud de oraciones promedio elevada y estable. Los textos administrativos escritos por funcionarios humanos tienen alta dispersión de longitud de oraciones: oraciones cortas para encabezados, largas para considerandos, cortas para los resuelves. Los textos generados por modelos de lenguaje muestran longitud promedio elevada (28 a 35 palabras por oración) con desviación estándar significativamente menor que la media humana del corpus de control. El texto es más uniforme.

Estos cinco marcadores no son prueba forense definitiva. Son indicadores estadísticos. Aplicados a una muestra ciega de 200 textos administrativos producidos en los cuatro países entre enero y marzo de 2026, los marcadores identificaron correctamente el origen (humano vs. asistido por modelo de lenguaje) en el 78 por ciento de los casos, según la metodología que ampliamos en el anexo técnico.

El problema de la soberanía: dónde vive el corpus

Hay una pregunta que aparece en cada uno de los 47 contratos auditados, formulada con distintos grados de explicitud. ¿Dónde se procesa el texto que el funcionario escribe en el sistema, antes de que el sistema lo devuelva ampliado, corregido o resumido?

La respuesta, en 43 de los 47 contratos, es que el procesamiento ocurre en servidores ubicados fuera de las jurisdicciones latinoamericanas o europeas que firman el contrato. En el caso español, el 78 por ciento de los contratos detectados procesa el contenido en infraestructura de Microsoft Azure, AWS o Google Cloud, con instancias mayoritariamente ubicadas en regiones europeas (Frankfurt, Ámsterdam, Dublín) pero bajo jurisdicción contractual estadounidense. En el caso mexicano, el 90 por ciento procesa en regiones estadounidenses directamente. Colombia y Argentina muestran patrones similares.

Esto no significa que los datos clasificados de funcionarios públicos estén siendo entregados a operadores extranjeros sin consentimiento. La mayoría de los contratos auditados incluyen cláusulas explícitas que prohíben el envío de información clasificada a los modelos. Lo que significa es que la arquitectura técnica de los sistemas adoptados crea una asimetría estructural: el corpus de entrenamiento, los modelos base y los servidores de inferencia están en infraestructuras ajenas, y la administración pública local pierde control sobre cómo evolucionan las capacidades del sistema que está usando.

El blog de Internexa, en su análisis de noviembre de 2025, lo formuló con claridad: “Cuando un funcionario público sube un documento clasificado a ChatGPT para que lo resuma, esos datos pueden quedar almacenados en servidores de Microsoft Azure ubicados en Estados Unidos o Europa”. Esa es la versión cruda. La versión refinada, que es lo que muestran los contratos auditados, es que la mayor parte del tiempo el funcionario no sube nada clasificado, pero el flujo de trabajo cotidiano sí transita por una infraestructura sobre la que la administración local no tiene control técnico ni jurisdiccional.

Caso México: el contrato de un Estado al que no se le pueden ver los pliegos

Diez de los 47 contratos auditados son mexicanos. Cinco de esos diez son adjudicaciones directas, lo que significa que el pliego técnico —donde estarían las especificaciones del sistema, el modelo base contratado, la arquitectura de despliegue— no se publica con el detalle de las licitaciones abiertas.

El patrón mexicano es coherente con lo que el reporte del i-Lab México ha documentado desde 2023 sobre la implementación de IA generativa en gobierno municipal: pruebas piloto en municipios del Estado de México, con avances de implementación reportados entre 60 y 80 por ciento al cierre del primer trimestre del año correspondiente. El i-Lab opera dentro de la Universidad Autónoma del Estado de México y ha producido los diagnósticos más sistemáticos de e-gobierno municipal en el país.

Lo que no se ve, en los contratos directos mexicanos, es la arquitectura técnica. Lo que sí se ve, en los textos administrativos producidos por los municipios contratantes, son los cinco marcadores estilísticos descritos antes. La inferencia razonable —no demostrable sin acceso al pliego— es que los integradores adjudicatarios están desplegando GPT-4 o Claude vía API empresarial con un capa de personalización mínima.

La iniciativa de Karina Ruíz en el Senado mexicano, presentada el 11 de febrero de 2026, ataca exactamente esta opacidad: propone un registro obligatorio de sistemas de IA usados por administraciones públicas. Si el registro se aprueba, las adjudicaciones directas dejarán de poder evadir el detalle técnico. Por ahora, la opacidad es la norma.

Caso Colombia: la apuesta de MinTIC

Siete de los 47 contratos son colombianos. Seis están firmados por MinTIC o por entidades adscritas a MinCiencias, en formato de piloto con vendedor único. El séptimo es un proceso de SECOP II del Ministerio de Hacienda con un objeto técnico relacionado con análisis de documentos tributarios.

El patrón colombiano es el más coherente con el discurso oficial del gobierno Petro: pilotos de soberanía tecnológica donde el Estado contrata para aprender, no para escalar. Los montos son notablemente menores que los españoles, con promedio cercano a los 180.000 dólares por contrato. Los plazos también son cortos: la mediana está en cuatro meses, mientras la española está en doce.

El PL 043-25 que MinCiencias radicó en mayo de 2025, y que llegó al Primer Debate de Cámara con ponencia del representante Gerson Lisímaco Montaño Arizala publicada en la Gaceta 2349 de 2025, propone un régimen específico para contratación pública con IA. Si se aprueba antes de las presidenciales del 31 de mayo —cosa improbable—, marcaría un estándar de transparencia técnica que los contratos actuales no están obligados a seguir.

Caso Argentina: la regulación que no existe y los contratos que sí

Argentina aparece con solo tres contratos formales en el corpus. Pero el barrido detectó 19 resoluciones administrativas que autorizan a organismos federales o provinciales a usar herramientas de IA generativa comerciales sin que medie contrato público. Once de estas resoluciones provienen de la Provincia de Buenos Aires, después de la entrada en vigor de la Resolución 9/2025 de la Subsecretaría de Gobierno Digital, que regula el uso de IA en la administración pública provincial.

La situación argentina es el espejo invertido de la española. Donde España contrata formalmente, documenta exhaustivamente y publica en TED, Argentina autoriza por resolución administrativa, no publica detalle técnico y no exige conformidad regulatoria porque no hay marco nacional que la exija. El resultado para los textos administrativos producidos es similar: aparecen los cinco marcadores estilísticos. La diferencia está en la trazabilidad: en España se puede saber qué modelo se está usando; en Argentina, no.

Esa diferencia importa cuando el AI Act post-Omnibus active sus obligaciones de alto riesgo el 2 de diciembre de 2027, porque cualquier empresa argentina que opere sistemas de IA con efecto sobre ciudadanos europeos —o que provea infraestructura a operadores que lo hagan— tendrá que documentar conformidad bajo el régimen europeo aunque el régimen argentino siga sin existir.

Lo que aparece cuando se cruzan los contratos con los textos producidos

La intersección más reveladora de la auditoría es el cruce entre los pliegos técnicos publicados (en los 23 contratos que los tienen) y los textos administrativos producidos por las entidades contratantes después de la adjudicación. En 19 de esos 23 casos, los textos producidos muestran al menos tres de los cinco marcadores estilísticos descritos antes, con frecuencia significativamente mayor que la línea base de la entidad antes de la adjudicación.

Eso significa, en términos operativos, que los sistemas adquiridos están produciendo texto que sale al ciudadano. No solo asisten al funcionario internamente. Reescriben, amplían, completan los borradores de notificaciones, resoluciones y respuestas administrativas que la administración pública envía a la persona común.

En cuatro de esos 19 casos, el texto saliente contiene formulaciones que un análisis cuidadoso encuentra inconsistentes con el marco jurídico aplicable. No errores burdos. Inconsistencias sutiles: citas a normas derogadas, referencias a procedimientos que el código procesal local no contempla con esa denominación, ampliaciones interpretativas de competencias administrativas que el modelo asume por similitud con otras jurisdicciones.

La pregunta que esta auditoría deja abierta —y que el segundo barrido buscará responder— es cuántas decisiones administrativas que afectan a personas concretas están saliendo de la administración pública iberoamericana con texto producido o sustancialmente reescrito por un modelo de lenguaje sin supervisión humana significativa. Si el AI Act y sus equivalentes regionales clasifican el caso como sistema de alto riesgo —y lo hacen, casi todos, cuando el sistema produce efectos jurídicos sobre personas— entonces el cumplimiento operativo de la administración pública con sus propias regulaciones está, en este momento, sin certificar.

Lo que sigue

Los 47 contratos identificados son el corpus inicial de una investigación abierta. Los siguientes pasos son: ampliar la muestra a Perú, Chile y Brasil; cuantificar la proporción de adjudicaciones directas frente a procesos abiertos en cada país; documentar el cumplimiento de las cláusulas de protección de datos personales y de prohibición de envío de información clasificada; y, en el caso español, evaluar el cumplimiento del Real Decreto 817/2023 sobre sandbox regulatorio en los contratos que ya están en operación bajo las nuevas exigencias del AI Act.

El detalle individual de los 47 contratos, con monto, plazo, adjudicatario y descripción técnica del sistema, se publicará como base de datos abierta en dialogociudadano.com/datos/contratos-ia-iberoamerica en el segundo barrido. La metodología completa, con los pliegos consultados y la versión auditable del filtro de búsqueda, está disponible bajo solicitud al equipo editorial.

Mientras tanto, el funcionario que detectó la frase repetida en el municipio del Estado de México tenía razón. La administración pública iberoamericana ya está hablando, parcialmente, con la voz de los modelos de lenguaje. Lo que no está claro todavía es si esos modelos están hablando bien.

Metodología y transparencia

Fuentes primarias consultadas (con fecha y URL):

Plataforma de Contratación del Sector Público de España, búsqueda en periodo 1 abr 2024 al 30 abr 2026
TED Europa, anuncios con identificador de origen español relacionados con IA generativa
TED Europa contrato 154988-2026, Comunidad de Madrid Consejería de Digitalización, transcripción médica con IA
CompraNet México y registros DOF de adjudicaciones de servicios tecnológicos
Compr.ar Argentina y boletines oficiales nacionales y provinciales
SECOP II Colombia, procesos del Sistema Electrónico de Contratación Pública
i-Lab México, “Metaverso, E-gobierno municipal, IA generativa”, abril 2023 y diagnósticos de implementación 2024-2026
Tendios.com, “Inteligencia artificial en contratación pública 2026”, abril 2026
Gobierto, “Gobierto Asistente: el ChatGPT de la contratación pública”
Internexa Blog, “IA Generativa en Gobierno: Oportunidad o riesgo”, noviembre 2025
AIverso, “Aplicación de la Inteligencia Artificial Generativa (IAG) en Licitaciones ante la Administración Pública en España”, marzo 2025
Real Decreto 817/2023, sandbox regulatorio español de IA
Resolución 9/2025 de la Subsecretaría de Gobierno Digital, Provincia de Buenos Aires
Iniciativa de la senadora Karina Ruíz Ruíz, Senado mexicano, presentada 11 febrero 2026
PL 043-25 colombiano, MinCiencias, ponencia Gaceta 2349/2025

Datos modelados o estimaciones propias:

El número 47 de contratos identificados es resultado del barrido descrito en la sección “El método y sus límites”. Es una cifra observada sobre el corpus accesible, no un estimado.
Los cinco marcadores estilísticos descritos son construcción metodológica propia del equipo de Diálogo Ciudadano, validados sobre una muestra ciega de 200 textos administrativos con tasa de identificación correcta del 78 por ciento. La metodología completa se publicará junto con la base de datos final.
Las medias y medianas de montos por país son cálculo propio sobre los 23 contratos con pliego técnico publicado.
La cifra “78 por ciento de contratos españoles procesa en infraestructura Microsoft/AWS/Google” es cálculo propio sobre la sub-muestra española de 27 contratos.

Lo que esta investigación no afirma:

No afirma haber identificado todos los contratos públicos con IA generativa vigentes en los cuatro países. Los procesos negociados sin publicidad y los contratos reservados escapan al barrido.
No afirma que los cinco marcadores estilísticos sean prueba forense definitiva de uso de IA generativa. Son indicadores estadísticos con tasa de error documentada.
No identifica nominalmente a los adjudicatarios de los contratos auditados. La individualización aparecerá en la base de datos del segundo barrido.
No afirma que las inconsistencias jurídicas detectadas en cuatro textos sean producto exclusivo del modelo de lenguaje. Pueden ser revisiones humanas insuficientes sobre output del modelo, o errores preexistentes que el modelo no corrigió.

Conflictos de interés. Diálogo Ciudadano no recibe financiamiento de los proveedores de modelos de lenguaje mencionados (OpenAI, Anthropic, Google, Meta), ni de los integradores adjudicatarios identificados en el corpus, ni de las administraciones públicas auditadas. La línea editorial es bilingüe e independiente.

Producción editorial. Esta pieza fue producida en mayo de 2026 por el equipo editorial de Diálogo Ciudadano usando flujos de trabajo asistidos por software, incluyendo herramientas de búsqueda, organización de fuentes y redacción. La verificación de cada cifra, la atribución de cada fuente y la línea argumental son responsabilidad editorial humana. La autora de esta investigación es Alexandra A. Medina, experta en tecnología de Diálogo Ciudadano, con apoyo del equipo de datos y visualizaciones liderado por Juan D. Gonzáles. Cualquier error es responsabilidad de la redacción.

Última actualización: 21 de mayo de 2026, 18:00 GMT. Esta pieza se actualizará cuando: (a) se publique la base de datos completa con los 47 contratos individualizados; (b) se amplíe el corpus a Perú, Chile y Brasil; (c) las administraciones auditadas respondan a las solicitudes de información complementaria sobre arquitectura técnica de los sistemas contratados.

Seguir leyendo

Tecnología · Infraestructura · Datos