PDFをSVGに変換する

別名 : JISのPDFから画像を抽出する

portageではmedia-gfx/pdf2svgを導入する。
pdf2svgは、poppler(PDF処理ライブラリ)によってCairoに出力させ、CairoのSVGバックエンドから出力を得る。つまり、evince等他のpopplerベースPDFビューアが正常に動作している必要があり、フォントなどの設定もそのまま適用される。
JISのPDFはPDFビューアがECMAScriptに対応していないと正常に閲覧できないが、pdf2svgによって得たSVGからPNGイメージを含むオブジェクトを抽出することで閲覧できる*1
ちなみに、ghostscriptのSVGやCairoバックエンドは望む結果を得られない(イメージをピクセル単位のオブジェクトとして書き出す等セマンティクスが保たれない)。
pdf2svgはテキストハンドリングに問題があるが、ベクタグラフィックスは正常に保持される。

*1:今まではpdftkを使ってデコードした後自前のパーサを使っていた。