Для решения данной задачи вам потребуется использовать библиотеку для парсинга веб-страниц BeautifulSoup и библиотеку для выполнения HTTP-запросов requests в Python.
Первым делом, установите эти библиотеки, если они у вас еще не установлены. Выполните следующие команды в командной строке:
pip install beautifulsoup4 pip install requests
Далее, импортируйте эти библиотеки в вашем скрипте:
from bs4 import BeautifulSoup import requests
Следующим шагом будет написание функции, которая будет ждать появления заголовка, переходить по ссылке и нажимать на кнопку. Давайте назовем эту функцию parse_website
:
def parse_website(url): # Отправляем GET-запрос на указанный URL и получаем HTML-страницу response = requests.get(url) # Создаем объект BeautifulSoup для парсинга HTML-страницы soup = BeautifulSoup(response.text, 'html.parser') # Ждем появления заголовка while not soup.find('h1'): # Если заголовок не найден, обновляем страницу и парсим ее снова response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # Находим ссылку и переходим по ней link = soup.find('a')['href'] response = requests.get(link) soup = BeautifulSoup(response.text, 'html.parser') # Находим кнопку и нажимаем на нее button = soup.find('button') response = requests.post(url, data=button) # Выводим результат print(response.text)
Теперь вы можете вызвать функцию parse_website
с любым URL-адресом в качестве аргумента:
url = 'https://example.com' parse_website(url)
Этот код будет ожидать появления заголовка на указанной странице, затем перейдет по найденной ссылке и нажмет на кнопку. В результате будет выведен HTML-код возвращаемой страницы от нажатия на кнопку.
Обратите внимание, что код выше предоставляет только основу для решения вашей задачи. В зависимости от конкретных требований, возможно, потребуется внести дополнительные изменения и доработки.