Привет всем!
Набросал скриптик для добычи сервисов с логов.
Python v3, зависимости:
Справка:
Так же в комплекте скрипт для удаления дубликатов:
Пожелания и баги принимаються.
Надеюсь софт кому нить пригодиться)
А если пригодиться поблагодарить можно ниже)
ПыСы: так же в поиске работы, Python, C++, пишите.
Набросал скриптик для добычи сервисов с логов.
Python v3, зависимости:
pip install tldextractСправка:
Код:
Usage: extractor.py [-h] [-t [thread_count]] [-u [ADD_URL]] [-s [splitter]] [-d [domain]] [-f [domain_list]] input_dir out_dir
Extract data from logs directory.
positional arguments:
input_dir input dir with logs | папка с логами
out_dir out_dir dir for extracted data | папка под дату
optional arguments:
-h, --help show this help message and exit
-t [thread_count] count of workers (default 10) | количество потоков
-u [ADD_URL] 1 - add url to output string, host:user:pass (default 0 - user:pass) | формат вывода, -u 1 - url:user:pass
-s [splitter] splitter for data(default ":") | разделитель
-d [domain] extract only specified domain | извлекать только указанный домен -d "facebook.com"
-f [domain_list] extract only specified in file domains | извлечь домены указанные в файле, формат строка - домен
Так же в комплекте скрипт для удаления дубликатов:
python3 dublkiller.py input_dir out_dirПожелания и баги принимаються.
Надеюсь софт кому нить пригодиться)
А если пригодиться поблагодарить можно ниже)
bc1qngss0dd966q79rg5p286hgmnfhqnemtwps9r9mПыСы: так же в поиске работы, Python, C++, пишите.