
Idioma
Python
Tipo de herramienta
Algoritmo
Licencia
The MIT License
Versión
0.2.1
Jefatura de Gabinete de Ministros

Data cleaner es una herramienta desarrollada por el gobierno argentino para optimizar la gestión y federación de metadatos de catálogos de datos públicos. Facilita a los usuarios la tarea de limpiar archivos CSV mediante un conjunto de reglas predefinidas, promoviendo la transparencia y accesibilidad de la información gubernamental. Data cleaner forma parte de una iniciativa más amplia de datos abiertos que busca mejorar la precisión, organización y utilidad de los datos disponibles públicamente.
Data cleaner soluciona el problema de la desorganización y errores en los metadatos de registros públicos, facilitando una gestión más eficiente y transparente de datos abiertos. Esta mejora es vital para la integridad y accesibilidad de la información gubernamental, fomentando la transparencia pública.
Limpieza de datos automatizada basada en reglas predefinidas. Métodos para tareas de limpieza de datos individuales, como normalización de cadenas y formato de correo electrónico. Reglas personalizables para la limpieza de datos, incluido el cambio de nombre y la eliminación de columnas, y el manejo de duplicados. Soporte para varios formatos de datos, incluidos archivos CSV y SHP. Integración con pandas para manipulación de DataFrame.
Desarrollado en Python 3.6, aprovecha pandas y geopandas para la manipulación eficiente de datos. Cumple con los estándares de codificación UTF-8, asegurando una gestión de datos precisa. Soporta formatos de archivo CSV, GeoJson y KML, promoviendo la interoperabilidad. Emplea flecha para el análisis y formato de fechas, optimizando el procesamiento temporal.

Conéctese con el equipo de Código para el Desarrollo y descubra cómo nuestras herramientas de código abierto, cuidadosamente curadas, pueden apoyar a su institución en América Latina y el Caribe. Escríbanos para explorar soluciones, resolver dudas de implementación, compartir éxitos de reutilización o presentar una nueva herramienta. Escríbenos a [email protected]

Gráfico de dispersión con puntos rojos "Raw Data" y línea verde para "Cleaned Data". Ejes: "Data Attribute 1" (0 a 10) y "Data Attribute 2" (0 a 10). Título: "Data Cleaning: From Chaos to Order".

Imagen de texto sobre la "Data Cleaner Library": optimiza tareas de procesamiento de datos, sigue estándares de Argentina, automatiza limpieza, en desarrollo, maneja cadenas, correos, fechas, busca precisión y estándar.

Esta imagen contiene un texto en español y un código de Python relacionado con la limpieza de datos, especificando reglas para capitalizar y formatear la fecha en un archivo CSV.
Página de documentación básica
Información sobre herramientas relacionadas con datos abiertos
