Desenvolvimento web e frameworks
Transparência Hacker: Web Scraping fácil com lxml e webpy
Sala Eric Idle
29/09
17:30
Resumo
Language
Português
Level:
Iniciante
Resumo:
A Web é desenhada para ser semântica: os conteúdos estão lá marcadinhos e organizadinhos, prontos para serem utilizados nos nossos projetos de transparência... mas como?
É preciso saber programar, mas todo webdesigner já sabe construir seletores de CSS. Isso é meio caminho andado: a biblioteca lxml usa esses seletores para procurar os dados na web.
E graças ao scraperwiki, criar bancos de dados é moleza. O próximo passo é expor os dados cruzados na web, bonitinhos: o webpy resolve essa demanda no ato, com uma pitada de python.
Detalhes sobre o palestrante
Capi Etheriel
Web Developer using Free/OpenSource technologies. Media and Cyberculture researcher at State University of Campinas. Lead Developer of FSM2011.org and Wikileaksroundtable.org. Currently working at Esfera, Data Transparency think (and do) tank.
Web Developer using Free/OpenSource technologies. Media and Cyberculture researcher at State University of Campinas. Lead Developer of FSM2011.org and Wikileaksroundtable.org. Currently working at Esfera, Data Transparency think (and do) tank.