Как получить URL страницы:
Для получения URL страницы в Python есть несколько способов, в зависимости от вашей цели. Если вам нужно получить URL текущей страницы, то вы можете использовать модуль urllib в стандартной библиотеке Python. Вот пример:
import urllib.request url = urllib.request.urlopen('https://example.com') print(url.geturl())
Если вам нужно получить URL из какого-то HTML-кода, вы можете использовать библиотеку BeautifulSoup. Она предоставляет простой способ анализировать и извлекать данные из HTML:
from bs4 import BeautifulSoup import requests html = """ <html> <head> <title>Example</title> </head> <body> <a href="https://example.com">Link</a> </body> </html> """ soup = BeautifulSoup(html, 'html.parser') link = soup.find('a') url = link['href'] print(url)
В этом примере мы строим BeautifulSoup объект для парсинга HTML-кода и используем метод find для поиска тега <a>. Затем мы получаем атрибут href и сохраняем URL в переменной.
Как изменить HTML-код через Python:
Существует множество способов изменять HTML-код с использованием Python. Некоторые из самых популярных инструментов включают библиотеки BeautifulSoup, lxml и html5lib.
Ниже приведен пример, показывающий, как изменить атрибуты и содержимое HTML-тега с использованием BeautifulSoup:
from bs4 import BeautifulSoup html = """ <html> <head> <title>Example</title> </head> <body> <div class="container"> <h1 id="title">Hello, World!</h1> </div> </body> </html> """ soup = BeautifulSoup(html, 'html.parser') h1_tag = soup.find('h1') # Изменяем атрибут id тега h1 h1_tag['id'] = 'new-title' # Изменяем содержимое тега h1 h1_tag.string = 'New Heading' print(soup.prettify())
В этом примере мы ищем тег <h1> с помощью метода find и изменяем его атрибут id на 'new-title' и содержимое на 'New Heading'. Затем мы выводим измененный HTML-код с помощью метода prettify для красивого форматирования.