Приветствую! Пишу парсер на Python и никак не могу довести его до конца. Пробовал разные библиотеки, но постоянно сталкиваюсь с проблемой: Google возвращает обфусцированный HTML, из которого парсер не может извлечь ссылки на сайты.
Парсер создаю для сбора сайтов по доркам, так как хочу найти первые цели для пентеста. Однако на данный момент я достаточно посредственный кодер. Хотел бы узнать у более опытных коллег, как можно решить подобную проблему. Также пробовал обойти капчу, но это сработало лишь частично. Нормальных решений в сети не нашел.
Использовал следующие библиотеки для Python:
Парсер создаю для сбора сайтов по доркам, так как хочу найти первые цели для пентеста. Однако на данный момент я достаточно посредственный кодер. Хотел бы узнать у более опытных коллег, как можно решить подобную проблему. Также пробовал обойти капчу, но это сработало лишь частично. Нормальных решений в сети не нашел.
Использовал следующие библиотеки для Python:
- Selenium
- Requests
- Beautiful Soup (bs4)