電子書籍用ファイル EPUB の文書フィルタを試作しました。
DRM フリーなものに限りますが、DRM がかけられたものも文書情報ぐらいは取れると思います。(未確認)
フィルタディレクトリに epub.pl を入れて、mknmz コマンドに -a オプションを付けると EPUB ファイルを処理することができます。
$ mknmz -a epub2.epub
epub.pl は、EXT_ZIP, EXT_UTF8 をサポートしている環境でのみ 動作します。NKF や Compress::Zlib Perl モジュールがインストール されておれば大丈夫です。
荒削りなところもありますが、致命的な問題がなければ Namazu 2.0.22 に含めたいと思います。
セコメントをする