Alcance
Los datos de anunciantes llegaban desde CRM, pasarelas de pago y hojas de cálculo manuales, creando duplicados y errores en los identificadores fiscales.
Enfoque
- Pipeline en Python que normaliza campos clave, corrige signos y empata registros combinando clustering y uniones probabilísticas.
- Reportes de calidad en CSV/Excel mientras agentes LangChain consultan Azure OpenAI para validar CIF y completar direcciones faltantes.
- La tabla limpia se publica en Azure SQL y los alertas llegan a dashboards de Databricks.
Impacto
Se consiguió una vista única y auditada del anunciante, se detectaron anomalías para finanzas y se automatizaron informes periódicos.