Acerca de Data360 News Agent
Data360 News Agent es una agencia de noticias con IA que vigila, entiende y contextualiza los indicadores del Banco Mundial — y entrega cada hallazgo como una pieza verificada, con perspectiva local, lista para que una redacción la edite y publique. Esta demo es el caso-piloto del software, construido por Abrimos.info para el Data360 Global Challenge.
Qué es
El agente sigue indicadores económicos, sociales y de gobernanza en cinco países de la región (Argentina, Ecuador, Guatemala, Honduras, México). Cada vez que el Banco Mundial actualiza un indicador, el agente revisa la serie en busca de cambios estadísticamente notables y, cuando los encuentra, los contextualiza para el país y escribe una nota. El resultado son dos formatos: Noticias sobre un único indicador y Reportajes que conectan varios. Cada afirmación numérica del texto está enlazada inline a su fila exacta en data360.worldbank.org — el lector puede verificar de un click.
Alcance de la demo
En la demo, el agente aplica dos estrategias de detección: cambios abruptos (z-score sobre la serie histórica) y anomalías cross-país (un país fuera del patrón regional). La watchlist incluye ~35 indicadores en tres ritmos — pulse (sub-anual), anual y forecast — para los cinco países. El procesamiento es replay sobre snapshots históricos: el algoritmo es el de producción, pero los hechos detectados son cambios que ya ocurrieron, recreados para la demo.
Metodología
Por cada indicador del catálogo, el agente: (1) descarga la serie histórica desde Data360; (2) detecta si hay un cambio estadísticamente relevante; (3) construye un contexto numerado con metodología, series, comparables regionales, titulares de prensa local, reglas editoriales y candidatos; (4) redacta la pieza con anclajes Reuters Handbook + AP Stylebook y eje país → LAC → mundo; (5) valida la pieza con un protocolo de auto-verificación y marca cada cifra con trazabilidad inline; (6) publica al feed del país y al chat por pieza. Si en cualquier paso la cifra no cuadra contra su fuente, la pieza no sale.
Cómo verificar una cifra
Si abrís cualquier nota del agente, vas a notar que algunos números están subrayados. Eso no es decoración: es trazabilidad inline. Cada cifra subrayada es un enlace al bloque exacto del dataset Data360 que la respalda.
Tocá una cifra y vas a ver:
- El indicador exacto (con su código Data360).
- El período al que corresponde la observación.
- El valor original, sin redondeos del agente.
- Un enlace a la página del dataset en data360.worldbank.org y a la descarga del CSV.
Si la cifra no aguanta el click, la nota no se publica.
Esta capa no es fact-checking semántico — el agente no juzga si lo que dijo un funcionario es "verdadero" o "falso". Es algo más modesto y más útil: trazabilidad mecánica. Cada número viaja con su prueba.
El componente que hace esto se llama PCN (Proof-Carrying Numbers) y es una librería open source del propio Banco Mundial. La integramos al pipeline; no la inventamos.
Funcionalidades implementadas
- Portada por país con reportaje destacado, titulares e indicadores recién actualizados.
- Artículo bilingüe (ES/EN) con sparkline de la serie y trazabilidad Data360 inline.
- Fecha del dato destacada; orden cronológico por periodo observado.
- Prensa local del país, integrada al contexto del agente vía GDELT.
- Chat por pieza para profundizar en datos y fuentes; exportable a Markdown o PDF.
Verificación
Cada pieza viaja con su prueba. Al final del artículo: enlace al dataset Data360, descarga del CSV y referencia a la metodología del indicador. Dentro del texto: cada cifra es un claim token que apunta al bloque exacto del contexto que el modelo usó para escribirla. No es fact-checking semántico — es trazabilidad mecánica: si abrís el token, ves de dónde sale el número.
El rol de la IA en estas notas
Todas las piezas que publica este agente son escritas por un modelo de lenguaje. No hay un editor humano leyendo cada nota antes de que salga. Es una decisión consciente — no un descuido — y conviene explicarla.
Por qué
El valor de una agencia automatizada es operar a una escala que ningún equipo humano puede mantener. Si cada pieza pasara por un editor antes de publicar, el agente dejaría de ser una agencia y se convertiría en un asistente de redacción.
Cómo compensamos la ausencia de editor humano
- Anclajes editoriales explícitos — el agente está atado al Reuters Handbook of Journalism (estructura, atribución, voz activa) y al AP Stylebook (microestilo, números, siglas). No es un LLM suelto; es un LLM con disciplina periodística codificada en el prompt.
- Eje narrativo obligatorio país → LAC → mundo — cada pieza tiene que ubicar al lector primero en su país, después en la región, después en el mundo. Sin eso, el validador la bloquea.
- Trazabilidad mecánica de cada cifra — el lector puede verificar de un click. Si el modelo se equivoca en un número, la fuente original está a un toque y la pieza pierde reputación, no aporta cifras inventadas al ecosistema.
- Protocolo Q1–Q12 que bloquea piezas con cifras sin fuente, inferencias sin etiqueta, citas a noticias sin URL, o ausencia de cualquiera de los tres ejes narrativos. Detalle completo en metodología.
- Aviso al pie de cada pieza sobre el rol de la IA — el lector siempre sabe qué está leyendo.
Lo que esto implica para una redacción que use estas piezas
- No republicar tal cual — usar como insumo para nota propia, con criterio editorial humano. La página Cómo usar estas piezas detalla cómo.
- Verificá las cifras — el sistema lo facilita; el último paso lo hace el periodista.
- Citá la fuente original — el indicador Data360, no este agente.
El roadmap incluye una capa opcional de revisión humana para redacciones que requieran piezas listas-para-publicar sin pasos intermedios. Si tu medio está interesado, escribinos a contacto@abrimos.info.
Limitaciones
- Cobertura: ~35 indicadores en 5 países, no los 12.000 / 200+ de Data360.
- Ritmo: replay sobre snapshots históricos, no monitoreo continuo.
- Infraestructura: datos en CSV local; sin orquestación de ingesta ni almacenamiento canónico.
- Idioma de prensa: titulares vía GDELT solo en español.
- Newsletter: en construcción (MVP funcional previsto para el lanzamiento del Challenge).
- Latencia del chat: el análisis profundo por indicador puede tardar minutos.
- Todo lo anterior está en el roadmap público del repositorio en GitHub.
Roadmap
Próximos pasos: detectar divergencias entre discurso oficial y dato; monitoreo continuo con ingesta orquestada (Apache NiFi) y almacenamiento canónico (OpenSearch); cobertura completa de los 12.000 indicadores; replicabilidad B2B open source para publicadores de datos.
Esta demo fue desarrollada por Abrimos.info, una organización virtual y distribuida fundada en México que trabaja desde y para América Latina con perspectiva global. Construimos infraestructura digital con información verificable al servicio de las democracias de la región. Combinamos experiencia abriendo datos con capacidades narrativas, investigativas y de desarrollo de software. Acompañamos a organizaciones, gobiernos y redacciones para convertir datos en insumos de decisión y narrativas con respaldo. Tenemos años de colaboración con redacciones de la región y acuerdos activos con varias.
Quiénes lo construyen
Esta demo la hicieron tres personas con base en LAC.
Eduard Martín-Borregón — Lead, narrativa y UX
Director Ejecutivo de Abrimos.info. Mozilla Fellow 2024–2026, Sigma Award 2020. 15+ años en periodismo de datos y tecnología cívica en América Latina. En este proyecto: define el producto, escribe los textos del sitio y produce el material del Challenge.
Martín Szyszlican — Agentes LLM, RAG y dashboard
CTO de Abrimos.info. Cofundador de QuiénEsQuién.Wiki. 10+ años construyendo infraestructura open source para transparencia, incluyendo TorreDeControl y MexicoLeaks. En este proyecto: diseña la arquitectura agentic, integra los modelos de lenguaje y construye el frontend del agente.
LinkedIn ↗ · martin@abrimos.info
Fernando Matzdorf Colina — Arquitectura de datos
Chief Data Officer de Abrimos.info. Arquitecto de TeseoETL, el motor open source que usamos en Sociedad.info y Plaza Pública. 15+ años en pipelines de datos periodísticos. En este proyecto: diseña el conector a Data360, normaliza el catálogo y define el esquema de indicadores.
Abrimos.info es una organización de tecnología cívica con sede en México que construye infraestructura digital independiente para la rendición de cuentas democrática. Llegamos a más de 80.000 usuarios únicos mensuales a través de Sociedad.info, Pídala.info, Gobernantes.info y Amnesia.lat.
abrimos.infoLicencia
Código: open source bajo GPLv3 — pensado para que cualquier institución que publique catálogos de datos pueda instalarlo sobre los suyos.
Contenido publicado: CC BY 4.0 (ver Cómo usar estas piezas). Cómo usar estas piezas
Documentación: CC BY 4.0.
Repositorio: abrimos-info/abrimos-data360-monitor en GitHub. GitHub