Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

сделать возможность учитывать веса документов каким-то образом #12

Open
baranov1ch opened this issue Oct 30, 2014 · 3 comments

Comments

@baranov1ch
Copy link
Contributor

Сценарий такой, что:

а) у нас есть автомат. Или на первом шаге нету.
б) у нас есть пачка документов с различными частотами.

на выходе мы хотим, чтобы наш автомат учитывал частоты, и предпочитал выбирать подстроки, входящие в наиболее частотные документы

@PavelSavchenkov
Copy link
Contributor

Это оптимизация, чтобы не добавлять полностью идентичные документы несколько раз?
Откуда берутся эти частоты?
А вообще, дописать метод, который принимает вместе с документом его вес никаких сложностей не представляет.

@skipor
Copy link
Contributor

skipor commented Oct 30, 2014

Веса нам будет давать прокся, может в файлик записывать, или ещё что. Как понимаю это будет количество запросов документов

@PavelSavchenkov
Copy link
Contributor

А, у нас вроде концепция, что в словарь не по одному пихаем, а пачкой.
Тогда, наверное, да.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants