-
Notifications
You must be signed in to change notification settings - Fork 3
/
Copy pathtest_conteme.py
22 lines (16 loc) · 1.23 KB
/
test_conteme.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from contamehistorias.datasources.webarchive import ArquivoPT
from contamehistorias.engine import TemporalSummarizationEngine
from datetime import datetime
domains = [ 'http://publico.pt/', 'http://www.dn.pt/', 'http://www.rtp.pt/', 'http://www.cmjornal.xl.pt/', 'http://www.iol.pt/', 'http://www.tvi24.iol.pt/', 'http://noticias.sapo.pt/', 'http://expresso.sapo.pt/', 'http://sol.sapo.pt/', 'http://www.jornaldenegocios.pt/', 'http://abola.pt/', 'http://www.jn.pt/', 'http://sicnoticias.sapo.pt/', 'http://www.lux.iol.pt/', 'http://www.ionline.pt/', 'http://news.google.pt/', 'http://www.dinheirovivo.pt/', 'http://www.aeiou.pt/', 'http://www.tsf.pt/', 'http://meiosepublicidade.pt/', 'http://www.sabado.pt/', 'http://dnoticias.pt/', 'http://economico.sapo.pt/' ]
params = { 'domains':domains, 'from':datetime(year=2016, month=3, day=1), 'to':datetime(year=2018, month=1, day=10) }
query = 'Dilma Rousseff'
language = "pt"
#instantiate ArquivoPT search engine
apt = ArquivoPT()
print('Perform search')
search_result = apt.getResult(query=query, **params)
print('Compute important dates')
#instantiate temporal summarization class
cont = TemporalSummarizationEngine()
intervals = cont.build_intervals(search_result, language)
cont.pprint(intervals)