« みんなで作る旅行ガイド | トップページ | ベトナムとイラクと »

2004.02.02

Million Book Project と DjVu 画像配信

http://www.archive.org/のテキスト関連アーカイブにあるMillion Book Project ― 文字おこしではなく、スキャンした画像の形で底本を電子化して蓄積しています。表示を信じるならば、現在、10,551点を所蔵。

画像配信形式の一つにDjVuが採用されています。DjVuは、書籍の版下やスキャン画像の電子配信に特化した画像圧縮形式で、TiffやGifなどに比べ、かなり小さいファイルサイズで、かなり大きく拡大してもボケの少ない画像が提供されるようです。これからの注目株ではないかと思います。

私は十二月に開かれた某見本市でhttp://www.zassi.net/という、日本で販売されている雑誌の電子配信デモを見て、興味を持っていました。そこで受けた説明では、版下のレイヤーごとに処理できる、検索可能な文字情報の埋め込みも可能である、ということでした。

Million Book Projecthttp://www.zassi.net/も、表示にはDjVuプラグインが必要です。(それぞれのページにリンクがあります。私はzassi.netのページからダウンロードした日本語版(?)プラグインを使っていますが、Million Book Projectの書籍も問題なく表示できました。

書籍の画像アーカイブとしては、日本では、青空文庫の活動にも参加している大阪大学の岡島昭浩さんが「うわづら文庫」で、PDF形式で明治以降の文学書籍の画像を多く公開していらっしゃいます。また、国会図書館の「近代デジタルライブラリー」が独自形式で書籍の画像を収納しています。DjVuなら、圧縮率や可搬性の点で、もっと使いやすくなるのではないかと思いますが、ファイル作成のためのソフトウェアが高価(LizardTech社日本支社の価格表を参照)であるのが残念なところです。こういう優れた技術の普及のためにも、産学連携やメセナなどの動きがもっとあるといいのですが。

2004年 2月 2日 午後 02:33 | | この月のアーカイブへ

トラックバック


この記事へのトラックバック一覧です: Million Book Project と DjVu 画像配信:

コメント

私の理解では、公共の目的であれば、LizardTech社はそのDjVuのソフトを無償提供するはずです。これは原特許権者であるATT社と譲渡を受けたLizardTech社との間の契約条件の一つであると理解しています。同社にお問い合わせ下さい。

投稿: 藤本琢磨 | 2004/03/13 17:03:51

藤本さん、情報ありがとうございます。問い合わせてみます。

投稿: うに | 2004/03/14 11:15:02

コメントを書く