scRubyt
Scrubyt es una simple pero potente conjunto de herramientas web para hacer scraping escrito en Ruby. El propósito es de liberarte de la monotonía de hacer scraping en una página web este busca a traves de etiquetas HTML, atributos, XPaths, la forma típica de los nombres.
Screen scraping con Ruby
Screen scraping es el nombre en inglés de una técnica de programación que consiste en tomar una presentación de una información (normalmente texto, aunque puede incluir información gráfica) para, mediante ingeniería inversa, extraer los datos que dieron lugar a esa presentación. Por ejemplo:
Extraer de la página web de un diario el tiempo meteorológico previsto.
Extraer los datos originales a partir de la imagen de una gráfica elaborada.
Hacer una consulta automática a la página de gestión de nuestro banco para verificar si el saldo es inferior a un umbral.
Extraer los datos de un informe en PDF para volcarlos en una hoja de cálculo.