BozzaScrapeJE.py

import requests
from bs4 import BeautifulSoup
import cloudscraper

nome=[]
desc=[]
npezzi=[]
prezzo=[]
n=0

#scrape html
# scraper = cloudscraper.create_scraper(browser={'browser': 'firefox','platform': 'windows','mobile': False})
# page = scraper.get("https://www.justeat.it/restaurants-saporedialeppo/menu").content
# with open('aleppo.html', 'wb') as f:
#     f.write(page)

with open('aleppo.html', 'rb') as f:
    page = f.read()

soup = BeautifulSoup(page, "html.parser")
menu = soup.find(attrs={"data-test-id": "menu-item"})


for menu in soup.find_all(attrs={"data-test-id": "menu-item"}):
    att=menu

    #riempie la lista "nome" 
    for att in menu.find(attrs={"data-test-id": "menu-item-name"}):
        if att != " ":
            nome.append(att.lstrip().splitlines()[0])

    #riempie la lista "desc" 
    att=menu.find("p", class_="c-menuItems-description")
    if att != None:
        for att in menu.find("p", class_="c-menuItems-description"):
            desc.append(att.lstrip().splitlines()[0])
    else:
        desc.append(None)

    # #riempie la lista "npezzi" 
    # for att in menu.find_next(attrs={"data-test-id": "menu-item-description"}):
    #     npezzi.append(att.lstrip().splitlines()[0])

    #riempie la lista "prezzo" 
    for att in menu.find("p", class_="c-menuItems-price notranslate"):
        prezzo.append(att.lstrip().splitlines()[0])

#stampa liste
for x in range(len(nome)):
    print("\n")
    print(nome[x])
    print(desc[x])
#    print(npezzi[x])
    print(prezzo[x])

#stampa lunghezza liste
print("\nlista nomi:",len(nome))
print("lista desc:",len(desc))
print("lista npezzi:",len(npezzi))
print("lista prezzi:",len(prezzo))
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00			`import requests`
			`from bs4 import BeautifulSoup`
			`import cloudscraper`

			`nome=[]`
			`desc=[]`
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`npezzi=[]`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00			`prezzo=[]`
			`n=0`

			`#scrape html`
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`# scraper = cloudscraper.create_scraper(browser={'browser': 'firefox','platform': 'windows','mobile': False})`
			`# page = scraper.get("https://www.justeat.it/restaurants-saporedialeppo/menu").content`
			`# with open('aleppo.html', 'wb') as f:`
			`# f.write(page)`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00
			`with open('aleppo.html', 'rb') as f:`
			`page = f.read()`

			`soup = BeautifulSoup(page, "html.parser")`
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`menu = soup.find(attrs={"data-test-id": "menu-item"})`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00

Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`for menu in soup.find_all(attrs={"data-test-id": "menu-item"}):`
			`att=menu`

			`#riempie la lista "nome"`
			`for att in menu.find(attrs={"data-test-id": "menu-item-name"}):`
			`if att != " ":`
			`nome.append(att.lstrip().splitlines()[0])`

			`#riempie la lista "desc"`
			`att=menu.find("p", class_="c-menuItems-description")`
			`if att != None:`
			`for att in menu.find("p", class_="c-menuItems-description"):`
			`desc.append(att.lstrip().splitlines()[0])`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00			`else:`
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`desc.append(None)`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`# #riempie la lista "npezzi"`
			`# for att in menu.find_next(attrs={"data-test-id": "menu-item-description"}):`
			`# npezzi.append(att.lstrip().splitlines()[0])`

			`#riempie la lista "prezzo"`
			`for att in menu.find("p", class_="c-menuItems-price notranslate"):`
			`prezzo.append(att.lstrip().splitlines()[0])`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`#stampa liste`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00			`for x in range(len(nome)):`
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`print("\n")`
Bozza scrape JustEat menu Scrape nomeProdotto descrizione descrizione2 (es 1 pezzo, 2 pezzi, 3 pezzi, tipo di falafel) prezzo 2022-09-27 18:47:25 +02:00			`print(nome[x])`
			`print(desc[x])`
Update 'BozzaScrapeJE.py' 2022-09-29 19:07:26 +02:00			`# print(npezzi[x])`
			`print(prezzo[x])`

			`#stampa lunghezza liste`
			`print("\nlista nomi:",len(nome))`
			`print("lista desc:",len(desc))`
			`print("lista npezzi:",len(npezzi))`
			`print("lista prezzi:",len(prezzo))`