2014-01-08から1日間の記事一覧

rubyでPDF解析(テキスト抽出)

pdf-readerを使用。 https://github.com/yob/pdf-readerrubyバージョン: 1.9.3 OS: Windows7 gem install pdf-reader以下のコードでPDF内のテキスト吐き出し。 require 'pdf/reader' reader = PDF::Reader.new "test.pdf" reader.pages.each do |page| puts…