In questo articolo vedremo come selezionare con i CSS gli elementi di un documento HTML con BeautifulSoup in Python.
Il metodo select()
accetta come argomento un valido selettore CSS e restituisce l'elemento o gli elementi individuati nell'albero del documento.
from bs4 import BeautifulSoup
with open('./doc.html', 'r') as f:
html = f.read()
soup = BeautifulSoup(html, 'html.parser')
nav_links = soup.select('#nav > a')
print(nav_links)
Esiste anche il metodo select_one()
che restituisce solo il primo elemento selezionato tramite l'espressione CSS.
header = soup.select_one('#site-header')
print(header)