Выучил основы Python 3. А куда дальше?

iconWIN95 · 06.03.2023

Освоил основную информацию для работы в Python, а какую библиотеку нужно изучить чтобы писать чекеры и парсеры и тд? Являюсь в программировании новичком, хочу продвигаться в этом деле дальше, но пока поставил свою начальную цель написать свой первый чекер и парсер, а вот что для этого нужно на Python 3 не знаю.... Заранее огромное спасибо

Wolverine · 06.03.2023

iconWIN95 сказал(а):

Освоил основную информацию для работы в Python, а какую библиотеку нужно изучить чтобы писать чекеры и парсеры и тд? Являюсь в программировании новичком, хочу продвигаться в этом деле дальше, но пока поставил свою начальную цель написать свой первый чекер и парсер, а вот что для этого нужно на Python 3 не знаю.... Заранее огромное спасибо

Попробуй с selenium поиграться

Quake3 · 06.03.2023

Была такая книга, веб скрапинг python , вот изучи ее.

C0mpet1t10n · 07.03.2023

https://xss.pro/threads/62753/

https://xss.pro/threads/44616/

Frank Andrade - Курс веб-парсинга на Python: BS4, Selenium и Scrapy (2021)

Папка из Облака Mail.ru

Облако Mail.ru - это ваше персональное надёжное хранилище в интернете.

cloud.mail.ru

Peace · 07.03.2023

рекомендую к просмотру такие каналы, как pythontoday, zproger, python hub studio. Рассмотри видосы по парсингу, а далее разработай бота телеграмм. Хороший курс у последнего канала. Бот с базой данных, который парсит например какие-то цены. И тогда придет большое осонание в работе сервера, парсинга и т.д. Удачи в разработке !

-Babaduk- · 07.03.2023

beri proyekt i delay

CCod · 07.03.2023

request для хттп запросов и beautifulsoap для парсинга хтмл

arkhan · 10.03.2023

Изучите эти:

requests
beautifulsoup
selenium/pyppeteer
aiohttp это асинхронные запросы

elliot21invoker · 10.03.2023

Изучи библиотеки bs4 + requests

Николай Лихачёв · 10.03.2023

Да пиши код как и все элитные кодеры - запросами в стокаверфлоуууу
Они только и делают что ищут код, потом разбирают его сами, что то поправят, что то удалят, что то добавят, что то изменят и вуаля - софт готов.

89t0rIhnt · 10.03.2023

Николай Лихачёв сказал(а):

Да пиши код как и все элитные кодеры - запросами в стокаверфлоуууу
Они только и делают что ищут код, потом разбирают его сами, что то поправят, что то удалят, что то добавят, что то изменят и вуаля - софт готов.

стаковерфлоу уже устарел, сейчас в моде chatgpt

Unique Projects · 18.03.2023

89t0rIhnt сказал(а):

сейчас в моде chatgpt

А уж если комбинировать. Год лайк

P84ty5 · 30.03.2023

ChatGPT либо you.com - chat. И кодь на здоровье.

DarkBLUP · 10.05.2023

iconWIN95 сказал(а):

Освоил основную информацию для работы в Python, а какую библиотеку нужно изучить чтобы писать чекеры и парсеры и тд? Являюсь в программировании новичком, хочу продвигаться в этом деле дальше, но пока поставил свою начальную цель написать свой первый чекер и парсер, а вот что для этого нужно на Python 3 не знаю.... Заранее огромное спасибо

для парсинга подойдут эти либы: bs4, requests, aiohttp, selenium, fake-useragent ( не обязательная либа, из неё нужна всего 1 функция ).
bs4 - либа парсер, считай ядро твоего парсера.
requests / aiohttp - либы для связи с сайтом с которого собираешься что то парсить.
selenium - к ней нужен драйвер ( нужен для обхода cloudflare и для эмитирования реального пользователя, а не бота или для отработки js скриптов сайта ).
fake-useragent - создаёт рандомный User-Agent.

Остальное уже можешь посмотреть в гугле, там много информации по этому поводу.

Kotiki · 14.05.2023

iconWIN95 сказал(а):

чекеры и парсеры

request

mlx · 14.05.2023

вот что чат gpt тебе ответил))

Привет! Для написания чекеров и парсеров на Python рекомендуется использовать библиотеку BeautifulSoup. Она предоставляет удобный интерфейс для работы с HTML- и XML-данными.

Для начала работы с BeautifulSoup необходимо установить ее с помощью pip. Откройте терминал и выполните следующую команду:

Copy code
pip install beautifulsoup4

После установки библиотеки можно начинать работу. Приведу простой пример парсинга HTML-страницы:

pythonCopy code
from bs4 import BeautifulSoup
import requests

url = 'https://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

print(soup.title.string)

В этом примере мы получаем заголовок страницы по ее URL-адресу. Мы отправляем запрос на сервер с помощью библиотеки requests, получаем HTML-код страницы и передаем его в объект BeautifulSoup. Затем мы выводим заголовок страницы, используя метод string для получения его содержимого.

Для написания чекеров можно использовать стандартную библиотеку Python, например, модуль re для работы с регулярными выражениями. Для парсинга структурированных данных, таких как JSON, можно использовать модуль json.

Надеюсь, это поможет вам начать работу с чекерами и парсерами на Python. Удачи!

DarkBLUP · 14.05.2023

mlx сказал(а):

вот что чат gpt тебе ответил))

Привет! Для написания чекеров и парсеров на Python рекомендуется использовать библиотеку BeautifulSoup. Она предоставляет удобный интерфейс для работы с HTML- и XML-данными.

Для начала работы с BeautifulSoup необходимо установить ее с помощью pip. Откройте терминал и выполните следующую команду:

Copy code
pip install beautifulsoup4

После установки библиотеки можно начинать работу. Приведу простой пример парсинга HTML-страницы:

pythonCopy code
from bs4 import BeautifulSoup
import requests

url = 'https://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

print(soup.title.string)

В этом примере мы получаем заголовок страницы по ее URL-адресу. Мы отправляем запрос на сервер с помощью библиотеки requests, получаем HTML-код страницы и передаем его в объект BeautifulSoup. Затем мы выводим заголовок страницы, используя метод string для получения его содержимого.

Для написания чекеров можно использовать стандартную библиотеку Python, например, модуль re для работы с регулярными выражениями. Для парсинга структурированных данных, таких как JSON, можно использовать модуль json.

Надеюсь, это поможет вам начать работу с чекерами и парсерами на Python. Удачи!

Тут на самом деле даже chatgpt и не нужен, использование bs4, requests / aiohttp это дефолт модули для любого парсера, для обхода cloudflare и для отработки js скриптов уже можно добавить selenium.

Patr1ck · 25.05.2023

requests морально устарела, так как не поддерживает асинхронные запросы.
Используй httpx

BLUA · 25.05.2023

Иногда вот это помогает, чтобы клауд победить

GitHub - ultrafunkamsterdam/undetected-chromedriver: Custom Selenium Chromedriver | Zero-Config | Passes ALL bot mitigation systems (like Distil / Imperva/ Datadadome / CloudFlare IUAM)

Custom Selenium Chromedriver | Zero-Config | Passes ALL bot mitigation systems (like Distil / Imperva/ Datadadome / CloudFlare IUAM) - GitHub - ultrafunkamsterdam/undetected-chromedriver: Custom Se...

github.com

DarkBLUP · 25.05.2023

patrick_star_dust сказал(а):

requests морально устарела, так как не поддерживает асинхронные запросы.
Используй httpx

Не сказал бы, requests синхронная либа и всегда её была, есть также aiohttp, она уже асинхронная. Устареть они могут только если бы не поддерживали связь с каким либо версиями HTTP или с версиями SSL, а то что она старая это даже + потому что уже проверена временем.

Выучил основы Python 3. А куда дальше?

floppy-диск

(L2) cache

TPU unit

RAID-массив

Frank Andrade - Курс веб-парсинга на Python: BS4, Selenium и Scrapy (2021)​

(L3) cache

floppy-диск

(L3) cache

HDD-drive

CD-диск

(L3) cache

RAM

HDD-drive

HDD-drive

(L2) cache

Всем кискам пис

(L3) cache

(L2) cache

All Your Base Are Belong To Us

CPU register

(L2) cache

Frank Andrade - Курс веб-парсинга на Python: BS4, Selenium и Scrapy (2021)