Написал небольшой, но полезный софт, хочу поделиться с форумом.
P.S. когда будет настроение + свободное время, добавлю ещё сайты для парсинга (код впринципе легко поддерживается, так что и вам самим не составит большого труда это сделать, если есть необходимость)
Как работает программа
- Создаются объекты сайтов, которые будут парситься
- Парсятся сайты и готовые прокси собираются в массив для их проверки на работоспособность, скорость подключения и т.д.
- Асинхронно посылаем запросы через прокси из готового массива, используя check_url (куда посылаем запросы), headers и timeout (макс. время ожидания ответа) из конфига
- После того как все запросы выполнились, на выходе имеем 2 массива с http и socks5 прокси
- Проходимся по этим массивами и записываем их в текстовые файлы
Запуск
Для запуска программы надо сначала выполнить 2 шага:- Установить в виртуальную среду зависимости из requirements.txt
pip install -r requirements.txt - Добавить config.yaml и задать в нём значения для check_url, headers, timeout (пример конфига прилагается)
python main.py и получаем на выходе http_proxies.txt и socks5_proxies.txtЗаметки
Если есть какие-то недочёты, замечания или предложения, можем пообщаться в комментах.P.S. когда будет настроение + свободное время, добавлю ещё сайты для парсинга (код впринципе легко поддерживается, так что и вам самим не составит большого труда это сделать, если есть необходимость)