Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

locmechan опять падает #5

Open
ptah-alexs opened this issue Apr 6, 2012 · 9 comments
Open

locmechan опять падает #5

ptah-alexs opened this issue Apr 6, 2012 · 9 comments

Comments

@ptah-alexs
Copy link

Checking http://2ch.so/sf/res/12351.html - no updates
Checking http://2ch.so/sf/res/17535.html - 1 new posts
Adding post #21260 (0 left)
Traceback (most recent call last):
File "./grab.py", line 336, in
commandssys.argv[1]
File "./grab.py", line 125, in get
output_writer.add_post(newpost)
File "/var/www/locmechan/output.py", line 40, in add_post
if not 'postnumber' in post:
TypeError: argument of type 'NoneType' is not iterable

@ptah-alexs
Copy link
Author

после обновления вот такая картина:

Checking http://2ch.so/sci/res/71671.html - 1 new posts
Adding post #93685 (0 left)
Traceback (most recent call last):
File "./grab.py", line 336, in
commandssys.argv[1]
File "./grab.py", line 124, in get
newpost = _activeparser.get_post(post)
File "/var/www/locmechan/parsers/wakaba.py", line 78, in get_post
_basetag = self.source.xpath('//td[@id= + postNumber + ]')
File "lxml.etree.pyx", line 1447, in lxml.etree._Element.xpath (src/lxml/lxml.etree.c:41728)
File "xpath.pxi", line 321, in lxml.etree.XPathElementEvaluator.call (src/lxml/lxml.etree.c:117734)
File "xpath.pxi", line 239, in lxml.etree._XPathEvaluatorBase._handle_result (src/lxml/lxml.etree.c:116911)
File "xpath.pxi", line 225, in lxml.etree._XPathEvaluatorBase._raise_eval_error (src/lxml/lxml.etree.c:116780)
lxml.etree.XPathEvalError: Invalid expression

@etw
Copy link
Collaborator

etw commented Apr 7, 2012

Пофиксила в 69e8ab2

@ptah-alexs
Copy link
Author

etw - после твоего патча locmechan не падает, но не сохраняет текст. Пример: http://rghost.ru/37460495

@etw
Copy link
Collaborator

etw commented Apr 7, 2012

Вот пока что однострочник

for i in $(cat list); do
   NAME=$(printf "pirach_%s_%s\n" $(echo $i | cut -d\/ -f4) $(echo $i | cut -d\/ -f6 | cut -d\. -f1))
   rm -fr threads/images/$NAME threads/thumbs/$NAME threads/$NAME.html
done

Как выкачу фикс (уже написан), примени (из корня каталога с локмечаном) однострочник и перекачай треды заново.

@ptah-alexs
Copy link
Author

OK, теперь все в норме, спасибо etw

@ptah-alexs
Copy link
Author

Снова что-то сбоит:

Checking http://2ch.so/b/res/26949090.html - thread died.
Checking http://2ch.so/b/res/26971075.htmlTraceback (most recent call last):
File "./grab.py", line 336, in
commandssys.argv[1]
File "./grab.py", line 115, in get
_toDownload.sort(cmp = lambda x,y: int(x) - int(y)) # make strict post order
File "./grab.py", line 115, in
_toDownload.sort(cmp = lambda x,y: int(x) - int(y)) # make strict post order
ValueError: invalid literal for int() with base 10: ''

@etw
Copy link
Collaborator

etw commented Apr 17, 2012

Гм. У меня ща норм все фетчится. Ревизия из гита последняя?

@ptah-alexs
Copy link
Author

Как оказалось у меня не последняя ревизия была. Сейчас все нормально

@ptah-alexs
Copy link
Author

Хотя он теперь странно сохраняет. В одном из тредов он вместо текста всех постов записал текст последнего поста (пик: http://rghost.ru/37648216/image.png ), в остальных случаях сохраняет посты, но без текста.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants