Continuous Diggin'

プログラミングと音楽のトピックを中心に書いてます

rubyでスクレイピングコード書くときの雛形

ウェブサイトをスクレイピングするときのsnippet

hpricotっていうgemが便利でいいです。

require "hpricot"
require "net/http"
url = URI.parse('[URL]')
req = Net::HTTP::Get.new(url.path)
res = Net::HTTP.start(url.host, url.port) {|http| http.request(req)}
src = res.body
doc = Hpricot(src)
(doc/'[XPATH]').each do |item|
    puts item.inner_html
end