Britany Castillo Sarmienta Oscar García Julian Preciado Verduzco Marina Olvera Martínez
Descargar los archivos del s1, s3 y el s6 con el botón de "Descarga todos los datos" en root y extraerlos.
Utilizar venv y requirements.txt para levantar el ambiente de python, puede consultar esta guía.
Ejecutar los archivos en el siguiente orden, programas con el mismo número pueden ser corridos en paralelo:
1. procesar_s1.ipynb
1. procesar_s6_pandas.ipynb
2. generar-periodos-invalidacion.ipynb
2. procesar_fechas_s6.ipynb
2. procesar_declaraciones.ipynb
3. cruzar_s1_s3.ipynb -> posesion_durante_inhabilitacion_IntegriDAT.xlsx
3. cruzar_s6_s3.ipynb -> contrato_durante_inhabilitacion_IntegriDAT.xlsx
Después de correr los archivos la estructura del directorio quedara parecido a esto, note que las carpetas del S6, S1 y S3 tienen que ser extraídas previamente:
├───bulk-s6
│
├───s1
│
├───s3p
│
├───s3s
contrato_durante_inhabilitacion_IntegriDAT.xlsx
cruzar_s1_s3.ipynb
cruzar_s6_s3.ipynb
generar-periodos-invalidacion.ipynb
inhabilitaciones.pkl
posesion_durante_inhabilitacion_IntegriDAT.xlsx
procesar_declaraciones.ipynb
procesar_fechas_s6.ipynb
procesar_s1.ipynb
procesar_s6.ipynb
procesar_s6_pandas.ipynb
requirements.txt
s1_declaracion.pkl
s1_df_raw.pkl
s1_fecha_toma_posesion.h5
s6_hdf.h5
s6_hdf_dates.h5
s6_parquet.h5
Después de ejecutar los archivos de python se generan los siguientes reportes con posibles casos de corrupción indebida. Se pueden encontrar en Drive con su diccionario de datos en una de las hojas.
Columna | Proviene | Explicacion |
---|---|---|
nombre_declaracion | S1/S3 | El nombre en su declaración, ya fue cruzada con el S3. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo |
id | S3 | id de el registro de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3 |
expediente | S3 | El identificador del expediente de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3 |
fechaTomaPosesion | S1 | La fecha de toma de posesión segun la declaración |
inhabilitacion_fechaInicial | S3 | La fecha inicial en el que el funcionario es inhabilitado |
inhabilitacion_fechaFinal | S3 | La fecha final en el que el funcionario estara inhabilitado |
posesion_durante_inhabilitacion | Generado | Si la fecha de toma de posesión se encuentra entre la inhabilitación, solo se presentan los casos positivos marcados con 1 |
Columna | Proviene | Explicacion | Nota |
---|---|---|---|
sancion_tipoPersona | S3 | Si el sujeto encontrado es una persona física o moral de acuerdo al S3 | |
sancion_objetoSocial | S3 | El objeto social de el sujeto encontrado de acuerdo al S3 | |
inhabilitacion_fechaInicial | S3 | La fecha inicial en el que el funcionario es inhabilitado | |
inhabilitacion_fechaFinal | S3 | La fecha final en el que el funcionario estará inhabilitado | |
earliest_contractPeriod_startDate | S6 | La fecha mas antigua de todas las encontradas en el apartado de contractPeriod | |
latest_contractPeriod_endDate | S6 | La fecha mas reciente de todas las encontradas en el apartado de contractPeriod | |
parties_name | S6/S3 | El nombre de una de las partes en la declaración, puede ser persona física o moral. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo. | Los datos presentados requieren un cruce al menos uno de parties_name o con parties_contactPoint_name con el nombre encontrado en S3 |
parties_contactPoint_name | S6/S3 | El nombre de contacto de una de las partes en la declaración. Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo. | Considere que durante el cruzamiento el sujeto encontrado puede ser un homónimo |
ids3 | S3 | id de el registro de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3 | |
expediente | S3 | El identificador del expediente de inhabilitacion, usada para identificar exactamente el documento de inhabilitacion en S3 | |
_id.$oid | S6 | Identificador en el archivo de la contratación, usada para identificar exactamente el documento de la contratación | |
ocid | S6 | Identificador en el archivo de la contratación, usada para identificar exactamente el documento de la contratación | |
ids6 | S6 | Identificador en el archivo de la contratación, usada para identificar exactamente el documento de la contratación | |
contrato_durante_inhabilitacion | Generado | Si el periodo del contrato se cruza con el periodo de inhabilitación, solo se presentan los casos positivos marcados con 1 |