open-contracting · yolile · Nov 5, 2024 · Nov 4, 2024 · Nov 5, 2024 · jpmckinney
diff --git a/kingfisher_scrapy/spiders/mexico_nuevo_leon_records.py b/kingfisher_scrapy/spiders/mexico_nuevo_leon_records.py
@@ -1,23 +1,28 @@
-import scrapy
+from kingfisher_scrapy.base_spiders import PeriodicSpider
+from kingfisher_scrapy.util import browser_user_agent, parameters
 
-from kingfisher_scrapy.base_spiders import SimpleSpider
 
-
-class MexicoNuevoLeonRecords(SimpleSpider):
+class MexicoNuevoLeonRecords(PeriodicSpider):
     """
     Domain
       Secretaría de Movilidad y Planeación Urbana de Nuevo León
+    Spider arguments
+      from_date
+        Download only data from this year onward (YYYY format). Defaults to '2013'.
+      until_date
+        Download only data until this year (YYYY format). Defaults to the current year.
     Bulk download documentation
       https://smpu.nl.gob.mx/transparencia/publicaciones
     """
 
     name = 'mexico_nuevo_leon_records'
+    user_agent = browser_user_agent  # to avoid HTTP 403
 
     # SimpleSpider
     data_type = 'record_package'
 
-    def start_requests(self):
-        yield scrapy.Request(
-            'https://smpu.nl.gob.mx/siasi_ws/api/ocds/DescargarRecordPackage',
-            meta={'file_name': 'records.json'}
-        )
+    # PeriodicSpider
+    date_format = 'year'
+    pattern = 'https://smpu.nl.gob.mx/siasi_ws/api/ocds/ListarProduccionXAnio?anio=%5B%7B"value":"{0}"%7D%5D'
+    formatter = staticmethod(parameters('anio'))
+    default_from_date = '2013'
diff --git a/kingfisher_scrapy/spiders/mexico_nuevo_leon_releases.py b/kingfisher_scrapy/spiders/mexico_nuevo_leon_releases.py
@@ -1,12 +1,16 @@
-import scrapy
+from kingfisher_scrapy.spiders.mexico_nuevo_leon_records import MexicoNuevoLeonRecords
+from kingfisher_scrapy.util import components
 
-from kingfisher_scrapy.base_spiders import CompressedFileSpider
 
-
-class MexicoNuevoLeonReleases(CompressedFileSpider):
+class MexicoNuevoLeonReleases(MexicoNuevoLeonRecords):
     """
     Domain
       Secretaría de Movilidad y Planeación Urbana de Nuevo León
+    Spider arguments
+      from_date
+        Download only data from this year onward (YYYY format). Defaults to '2013'.
+      until_date
+        Download only data until this year (YYYY format). Defaults to the current year.
     Bulk download documentation
       https://smpu.nl.gob.mx/transparencia/acerca-del-proyecto
     """
@@ -19,9 +23,11 @@ class MexicoNuevoLeonReleases(CompressedFileSpider):
     # SimpleSpider
     data_type = 'release_package'
 
-    # CompressedFileSpider
-    file_name_must_contain = 'ReleasePackage'
+    # PeriodicSpider
+    start_requests_callback = 'parse_list'
 
-    def start_requests(self):
-        url = 'https://smpu.nl.gob.mx/acceso/DatosAbiertos/JSONsInfraestructuraAbierta.rar'
-        yield scrapy.Request(url, meta={'file_name': 'all.rar'})
+    def parse_list(self, response):
+        for record_package in response.json():
+            for record in record_package['records']:
+                for release in record['releases']:
+                    yield self.build_request(release['url'], formatter=components(-1))