- Автор темы
- Добавить закладку
- #21
Круто бро. Спасибо. Заюзаю как понадобитсясвежая методика
Скрытое содержимое
Круто бро. Спасибо. Заюзаю как понадобитсясвежая методика
Скрытое содержимое
import time
from datetime import datetime
from bs4 import BeautifulSoup
from random import randint
from selenium.webdriver import Firefox
import re
def main():
browser = Firefox(executable_path='utils/geckodriver')
try:
page = fetch_page(browser)
initial_title = get_last_article_title(page)
print(initial_title)
while True:
page2 = fetch_page2(browser)
title = get_last_article_title(page2)
print(title)
def fetch_page(browser):
url = 'https://upbit.com/service_center/notice'
browser.get(url)
time.sleep(15)
return browser.page_source
def fetch_page2(browser):
url = 'https://upbit.com/service_center/notice'
browser.get(url)
time.sleep(randint(1, 4))
return browser.page_source
def get_last_article_title(page):
soup = BeautifulSoup(page, features="lxml")
all_articles = soup.find_all("td", {"class": "lAlign"})[5]
title = all_articles.contents[0].contents[0]
return title
if name == "main":
print('bot started.')
main()
Это самый первый и самый медленный метод и это тоже парсинг и решенеие задания.Это не обход cloudflare обход клоудфларе используется модуль cloudscraper
свежая методика
Скрытое содержимое
excuse me.does it works now?渲染器获取使用 JS 显示的文本。我把它花在了它。非常适合云火焰背后的网站。