memorandums

日々のメモです。

スキャンした画像ファイルのPDF化手順(自己メモ)

自作文書スキャナを用いて、2つの国際シンポジウムの予稿集をそれぞれ5年分をスキャンしてみました。

厚いものでは4cmくらいの厚さのものもありました。現在、肩こりに悩まされています。。。

で、デジカメで撮影したJPGファイルを集めてPDF化するまでの手順を書きます。環境に依存すると思いますが、とりあえず忘れっぽいので手順を自己メモとして残しておきたいと思います。

環境は、デジカメがEP-1、パソコンがmacです。

デジカメで撮影したファイルは撮影順に連番になっていますのでmacに取り込んで論文集単位でJPGファイルをフォルダに入れておきます。

EP-1では文書撮影モードで撮影しましたので、カラー画像になっています。iPadなどが大容量になったとはいえ色情報は必要ないのでグレー化したいと思います。

macで使える一括でグレー化するアプリが見つからなかったので、imagemagickを使うことにしました。私はbrewを使っているので以下でインストールします。

brew install imagemagick

グレイ化する文法は以下のようになります。

convert 変換元.jpg -type GrayScale 変換先.jpg

参考:ImageMagickでグレースケール・白黒・セピア調変換

たくさん画像ファイルがありますのでRubyでちょっとしたプログラム(a.rb)を作りました。

  • a.rb
if ARGV[0] == nil then
  puts "Usage: a.rb dirname"
  exit
end

begin
  dir = []
  Dir::entries("./"+ARGV[0]).each {|e|
    dir.push(e) if e =~ /JPG/ and not e =~ /_/
  }
rescue
  puts "ERROR: wrong dirname"
  exit
end

dir.each_with_index {|e, idx|
  cmd = "convert ./#{ARGV[0]}/#{e} -type GrayScale ./#{ARGV[0]}/_#{e}"
  print "(" + (idx+1).to_s + "/" + dir.size.to_s + ") " + cmd + "\n"
  system(cmd)
}

使い方は画像フォルダと同じ階層にこのファイルを置き、以下のように実行します。

ruby a.rb フォルダ名

オリジナルのJPGファイルを残しつつ、オリジナルのファイル名の前にアンダースコアを付加したグレイ化したファイルが生成されます。

あとは、macの機能でPDF化します。

アンダースコアーのついたファイル群をマウスで選択して「開く」を選択します。自動的に選択されたプレビュー.appで画像がまとめて開き、メニューからプリントを選択してPDFを生成します。

PDFを開くと画像が横になって表示されます。これでは具合が悪いので全ページまとめて選択して⌘+rを押します。

180ページで160MBくらいでした。1ページ1MBくらいですね。撮影するカメラによると思います。

ページめくりすぎて肩こりが酷いです。。。頭痛が。。。