|
发表于 2007-9-22 01:46:21| 字数 1,368| - 肯尼亚
|
显示全部楼层
|阅读模式
头次听说,google了一下,自己是孤陋寡闻了,贴点资料这里:
现在国内扫描的电子图书都是使用一些自己开发的格式, caj(中国期刊网), nlc(国家图书馆), ... 这些格式大部分体积庞大,质量很低,几乎不能舒服的屏幕阅读,而且各种格式混战,人们不得不安装各种各样的浏览程序。而且大部分程序只有 windows 版本
DjVu是由美国AT&T实验室于1996年开发成功的一项新的图片压缩技术。
DjVu的主要技术是将图像分为背景层(纸的纹理和图片)和前景层(文本和线条)。通过将文字和背景分离开来,DjVu可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。使用DjVu格式,用户首先会很快得到页面的一个最初版本,这个版本主要是含有文字的前景层。随着后续信息的到达,图像质量不断提高(这一点与JPEG格式的逐级提高精度的方法有类似之处)。
这种格式采用小波分析的先进压缩技术,特别适合保存扫描的图书。同时可以对扫描的数据进行 OCR, 这样可以在文档里保存text信息。这样的电子图书制造成本低,可以search, copy&paste,而且保存了图书的原样, 体积非常之小,显示速度很快,效果很好,没有任何“缺少字体”之类的问题。
而且它的浏览器很小,只有几百K(想想 acrobatreader 有多大?)。可以嵌入到主流浏览器: Netscape, Mozilla, IE, Phoenix, ... 这种浏览器已经移植到几乎所有操作系统,浏览文档时,它可以按需下载文档某一页,不需要一次性下载整个文档。而且它会预览,有可能帮你预先下载相临或者相关的页。
DjVu的应用非常广泛,任何扫描的高分辨率图像和数字生成的文件都可以通过DjVu的方式在网上进行发布。有了DjVu,网络内容提供商们就可以将大量宝贵的书籍、杂志、索引、手稿、报纸和古代历史资料通过扫描而在网上发布了。原来被保存在这些物质载体上的信息,现在可以更高效率地被更为广泛的受众获取。
Djvu 在扫描图书方面可以取代 PS 和 PDF.
值得注意的是,虽然DjVu的原始专利归AT&T所有,但是LizardTech公司已经获得了相关专利的广泛授权,可以把这些专利无矛盾地应用于GPL许可证中(LizardTech关于DjVu开放源码许可方式的声明)。现在DjVuLibre实际上就是由它支持的一个GPL开放源码软件项目。
http://citeseer.nj.nec.com
已经可以提供各种论文的 djvu 文件下载
具体信息请看 http://www.djvuzone.org
在那里你可以看到扫描下来的泰坦尼克号出事时的新闻,报纸,图片,《独立宣言》原稿, Thomas Jefferson 的信,餐厅菜谱, 乐谱, 扫描下来的那些14**年的手稿都是那么的清晰。
http://www.lizardtech.com/products/doc/datasheets.php
这里提供了一个Djvu和PDF文件的比较。相同的文件,显然Djvu小的多了。
Djvu Document Express用于将文件扫描为Djvu文件,将其它格式的文件转换为Djvu格式,制作完全可以搜索的文档,Index with Microsoft Index Sever |
|