In questo articolo vedremo come selezionare con i CSS gli elementi di un documento HTML con BeautifulSoup in Python.

Il metodo select() accetta come argomento un valido selettore CSS e restituisce l'elemento o gli elementi individuati nell'albero del documento.

from bs4 import BeautifulSoup

with open('./doc.html', 'r') as f:
    html = f.read()
    soup = BeautifulSoup(html, 'html.parser')
    nav_links = soup.select('#nav > a')
    print(nav_links)

Esiste anche il metodo select_one() che restituisce solo il primo elemento selezionato tramite l'espressione CSS.

header = soup.select_one('#site-header')
print(header)