Skip to content

PDNMX/Dataton2023-IntegriDAT

Repository files navigation

DatatonAnticorrupcion-IntegriDAT

Miembros

Britany Castillo Sarmienta Oscar García Julian Preciado Verduzco Marina Olvera Martínez

Guia de ejecuccion

Descargar los archivos del s1, s3 y el s6 con el botón de "Descarga todos los datos" en root y extraerlos.
Utilizar venv y requirements.txt para levantar el ambiente de python, puede consultar esta guía.
Ejecutar los archivos en el siguiente orden, programas con el mismo número pueden ser corridos en paralelo:

1. procesar_s1.ipynb
1. procesar_s6_pandas.ipynb
2. generar-periodos-invalidacion.ipynb
2. procesar_fechas_s6.ipynb
2. procesar_declaraciones.ipynb
3. cruzar_s1_s3.ipynb -> posesion_durante_inhabilitacion_IntegriDAT.xlsx
3. cruzar_s6_s3.ipynb -> contrato_durante_inhabilitacion_IntegriDAT.xlsx

Después de correr los archivos la estructura del directorio quedara parecido a esto, note que las carpetas del S6, S1 y S3 tienen que ser extraídas previamente:

├───bulk-s6

├───s1

├───s3p

├───s3s
contrato_durante_inhabilitacion_IntegriDAT.xlsx
cruzar_s1_s3.ipynb
cruzar_s6_s3.ipynb
generar-periodos-invalidacion.ipynb
inhabilitaciones.pkl
posesion_durante_inhabilitacion_IntegriDAT.xlsx
procesar_declaraciones.ipynb
procesar_fechas_s6.ipynb
procesar_s1.ipynb
procesar_s6.ipynb
procesar_s6_pandas.ipynb
requirements.txt
s1_declaracion.pkl
s1_df_raw.pkl
s1_fecha_toma_posesion.h5
s6_hdf.h5
s6_hdf_dates.h5
s6_parquet.h5

Reportes generados

Después de ejecutar los archivos de python se generan los siguientes reportes con posibles casos de corrupción indebida. Se pueden encontrar en Drive con su diccionario de datos en una de las hojas.

posesion_durante_inhabilitacion_IntegriDAT.xlsx

Columna Proviene Explicacion
nombre_declaracion S1/S3 El nombre en su declaración, ya fue cruzada con el S3. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo
id S3 id de el registro de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3
expediente S3 El identificador del expediente de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3
fechaTomaPosesion S1 La fecha de toma de posesión segun la declaración
inhabilitacion_fechaInicial S3 La fecha inicial en el que el funcionario es inhabilitado
inhabilitacion_fechaFinal S3 La fecha final en el que el funcionario estara inhabilitado
posesion_durante_inhabilitacion Generado Si la fecha de toma de posesión se encuentra entre la inhabilitación, solo se presentan los casos positivos marcados con 1

contrato_durante_inhabilitacion_IntegriDAT.xlsx

Columna Proviene Explicacion Nota
sancion_tipoPersona S3 Si el sujeto encontrado es una persona física o moral de acuerdo al S3
sancion_objetoSocial S3 El objeto social de el sujeto encontrado de acuerdo al S3
inhabilitacion_fechaInicial S3 La fecha inicial en el que el funcionario es inhabilitado
inhabilitacion_fechaFinal S3 La fecha final en el que el funcionario estará inhabilitado
earliest_contractPeriod_startDate S6 La fecha mas antigua de todas las encontradas en el apartado de contractPeriod
latest_contractPeriod_endDate S6 La fecha mas reciente de todas las encontradas en el apartado de contractPeriod
parties_name S6/S3 El nombre de una de las partes en la declaración, puede ser persona física o moral. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo. Los datos presentados requieren un cruce al menos uno de parties_name o con parties_contactPoint_name con el nombre encontrado en S3
parties_contactPoint_name S6/S3 El nombre de contacto de una de las partes en la declaración. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo
ids3 S3 id de el registro de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3
expediente S3 El identificador del expediente de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3
_id.$oid S6 Identificador en el archivo de la contratación, usada para identificar exactamente el documento de la contratación
ocid S6 Identificador en el archivo de la contratación, usada para identificar exactamente el documento de la contratación
ids6 S6 Identificador en el archivo de la contratación, usada para identificar exactamente el documento de la contratación
contrato_durante_inhabilitacion Generado Si el periodo del contrato se cruza con el periodo de inhabilitación, solo se presentan los casos positivos marcados con 1

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published