517
Comment:
|
885
|
Deletions are marked like this. | Additions are marked like this. |
Line 13: | Line 13: |
Serie di pomeriggi di sperimentazione libera, segue workshop aperto al pubblico. == Temi == |
|
Line 17: | Line 21: |
* Beautiful-soup per il parsing delle pagine | * Beautiful-soup e/o lxml per il parsing delle pagine * Web spider con scrapy |
Line 19: | Line 24: |
== Riferimenti Sparsi == * https://elitedatascience.com/python-web-scraping-libraries * https://first-web-scraper.readthedocs.io/en/latest/ * https://medium.com/@kaismh/extracting-data-from-websites-using-scrapy-e1e1e357651a |
Costruzione Utensili
La Cultura è la nostra Natura, siamo cacciatori e raccoglitori in un mondo di dati.
Prerequisiti
- Un'idea vaga di HTML
- Saper scrivere, o anche solo leggere un qualsiasi linguaggio
Programma
Serie di pomeriggi di sperimentazione libera, segue workshop aperto al pubblico.
Temi
Ancora da definire, ma a grandi linee:
- Orientarsi con l'inspector del Browser
- Rudimenti di web scraping con Python:
- GET e fake-user agent con requests
- Beautiful-soup e/o lxml per il parsing delle pagine
- Web spider con scrapy
- wget e qualcosa di bash?