Differences between revisions 2 and 3
Revision 2 as of 2017-03-03 15:34:34
Size: 517
Editor: crudo
Comment:
Revision 3 as of 2017-03-10 16:27:20
Size: 885
Editor: uid
Comment:
Deletions are marked like this. Additions are marked like this.
Line 13: Line 13:
Serie di pomeriggi di sperimentazione libera, segue workshop aperto al pubblico.

== Temi ==
Line 17: Line 21:
  * Beautiful-soup per il parsing delle pagine   * Beautiful-soup e/o lxml per il parsing delle pagine
  * Web spider con scrapy
Line 19: Line 24:

== Riferimenti Sparsi ==
 * https://elitedatascience.com/python-web-scraping-libraries
 * https://first-web-scraper.readthedocs.io/en/latest/
 * https://medium.com/@kaismh/extracting-data-from-websites-using-scrapy-e1e1e357651a

Costruzione Utensili

La Cultura è la nostra Natura, siamo cacciatori e raccoglitori in un mondo di dati.

Prerequisiti

  • Un'idea vaga di HTML
  • Saper scrivere, o anche solo leggere un qualsiasi linguaggio

Programma

Serie di pomeriggi di sperimentazione libera, segue workshop aperto al pubblico.

Temi

Ancora da definire, ma a grandi linee:

  • Orientarsi con l'inspector del Browser
  • Rudimenti di web scraping con Python:
    • GET e fake-user agent con requests
    • Beautiful-soup e/o lxml per il parsing delle pagine
    • Web spider con scrapy
  • wget e qualcosa di bash?

Riferimenti Sparsi

CostruzioneUtensili (last edited 2017-03-18 01:13:13 by subnixr)