diff --git a/scrapeje.py b/scrapeje.py index 8e461a7..3cd4152 100644 --- a/scrapeje.py +++ b/scrapeje.py @@ -25,10 +25,10 @@ print ("\nesempio: https://www.justeat.it/restaurants-pizzeria-la-garganica-bolo restaurant_url = input('INSERISCI IL LINK DELLA PAGINA DEL RISTORANTE: ') #PER DEBUG -#restaurant_url = 'https://www.justeat.it/restaurants-pizzeria-la-garganica-bologna/menu' +#restaurant_url = 'https://www.justeat.it/restaurants-pizzeria-del-mercato-bologna/menu' -#INIZIALLIZZO PARSER +#SCRAPE driver = webdriver.Chrome() driver.get(restaurant_url) @@ -40,11 +40,11 @@ page = driver.page_source with open('JEmenu.html', 'w') as f: f.write(page) -#apre e legge il file + +#PARSER with open('JEmenu.html', 'r') as f: page = f.read() -#PARSER soup = BeautifulSoup(page, "html.parser") @@ -112,6 +112,7 @@ for menu in soup.find_all(attrs={"data-test-id": "menu-item"}): # #stampa liste +print("\n") for x in range(len(nome)): # print("\n") print(nome[x]) @@ -120,10 +121,11 @@ for x in range(len(nome)): print(prezzo[x]) #stampa info ristorante -print("\n") +print("-" * (len(desc)) + "\n") print(nrist) -print("telefono:",tel) -print(restaurant_address.strip() + "\n") +print(restaurant_address.strip()) +print("Telefono:",tel,"\n") + doppione = "" for i in range(len(result)): if re.search(r"[a-zA-Z]", result[i]): @@ -134,15 +136,10 @@ for i in range(len(result)): elif re.search(r"\d", result[i]): print(result[i], result[i+1]) doppione = (result[i+1]) - -#stampa lunghezza liste -print("lista nome:",len(nome)) -print("lista desc:",len(desc)) -print("lista npezzi:",len(npezzi)) -print("lista prezzi:",len(prezzo)) #sono stringhe ovvero ci sono anche prezzi come "da 1,00 €" +print("\n" + "-" * (len(desc))+ "\n") -#Genera la lista prezzoN[] che è un clone di "prezzo[] ma con i valori double azichè string" +#Genera la lista prezzoN[] che è un clone di "prezzo[] ma con i valori float anzichè string" prezzoN = prezzo.copy() for i in range(len(prezzo)): if "€" in prezzo[i]: @@ -152,39 +149,52 @@ for i in range(len(prezzo)): prezzoN[i] = float(prezzoN[i]) else: prezzoN[i] = 99999 -#per debug + + +# #PER DEBUG # for x in range(len(nome)): # print(prezzoN[x]) -# print (len(prezzo)) -# print (len(prezzoN)) -# print(len(nome)) +# print("\n" + "-" * 25 + "\n") +# print ("lista prezzo: ",len(prezzo)) +# print ("lista prezzoN: ",len(prezzoN)) +# print ("lista nome: ",len(nome)) + +# #PER DEBUG +# #stampa lunghezza liste +# print("\n" + "-" * 25 + "\n") +# print("lista nome: ",len(nome)) +# print("lista desc: ",len(desc)) +# print("lista npezzi: ",len(npezzi)) +# print("lista prezzi: ",len(prezzo)) #sono stringhe" +# print("\n" + "-" * 25 + "\n") +# # Genera codice HTML +# html = "" +# for x in range(len(nome)): +# html += "

" + nome[x] + "

" +# html += "

" + str(desc[x]) + "

" +# html += "

N. pezzi disponibili: " + str(npezzi[x]) + "

" +# html += "

Prezzo: €" + str(prezzoN[x]) + "

" +# html += "" +# html += "

" -# Genera codice HTML -html = "" -for x in range(len(nome)): - html += "

" + nome[x] + "

" - html += "

" + str(desc[x]) + "

" - html += "

N. pezzi disponibili: " + str(npezzi[x]) + "

" - html += "

Prezzo: €" + str(prezzoN[x]) + "

" - html += "" - html += "

" - -html += "

Prodotti aggiunti

" -html += "
" -html += "" -html += "" +# html += "

Prodotti aggiunti

" +# html += "
" +# html += "" +# html += "" -# Salvataggio su file -with open("pagina.html", "w") as file: - file.write(html) +# # Salvataggio su file +# with open("pagina.html", "w") as file: +# file.write(html) -#os.remove("JEmenu.html") \ No newline at end of file +#Pulisce +#ToDo:PROPORRE DI SALVARE IN RUBRICA +os.remove("JEmenu.html") \ No newline at end of file