これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド djvu です。
プログラム:
NAME
DjVu - DjVu および DjVuLibre。
はじめに
インターネットは私たちに、
ユニバーサル図書館には、世界の知識、歴史、文学の多くがまだ閉じ込められています
世界の伝統的な図書館の地下室に紙の上で保管されています。 多くのライブラリとコンテンツ
所有者はコレクションのデジタル化を進めています。 そういった取り組みがたくさんある中で、
紙の文書をコンピュータに適した形式に変換するという骨の折れるプロセスが含まれます。
SGML ベースの形式など、そのような変換にはコストがかかるため、変換範囲が制限されます。
文書をスキャンし、その結果得られた画像を電子的に配布するだけではありません。
かなり安価ですが、オリジナルの文書が保存されるため、より忠実になります。
そのビジュアル面。
ネットワーク接続とコンピュータの速度は急速に向上しているにもかかわらず、
現在、Web 上でアクセスできるスキャンされた文書画像は比較的小さいです。 いくつかあります
その理由。
XNUMX つ目の理由は、綴じられていないシート以外のスキャンには比較的コストがかかることです。
黒と白で。 この問題は、高速かつ低コストの製品の登場により徐々に解消されつつあります。
シートフィーダを備えたコストの高いカラースキャナ。
XNUMX 番目の理由は、長年確立されてきた画像圧縮規格とファイル形式です。
特にスキャンした文書を高解像度で配布するには不十分であることが判明しています。
カラーの書類。 ファイル サイズとダウンロード時間が非現実的であるだけでなく、デコードも不可能です。
レンダリング時間も法外に長くなります。 典型的な雑誌のページを 100 倍のカラーでスキャンした
JPEG の dpi は通常 100 KB ~ 200 KB を占めますが、テキストはほとんどありません。
可読性: 画面表示には不十分で、印刷にはまったく耐えられません。 同じ
300 dpi のページは表示や印刷には十分な品質ですが、ファイル サイズが
最大でも 300 KB ~ 1000 KB となり、リモート アクセスには非現実的です。 もう一つのメジャー
問題は、レターサイズのページの完全にデコードされた 300 dpi カラー画像が 24 MB を占めることです。
メモリが不足し、ディスクの交換が容易に発生します。
XNUMX 番目の理由は、デジタル文書は単なる個人のコレクションではないということです。
ページの画像。 スキャンされたドキュメントのページには、自然な順序があります。 特別条項
ページをめくる動作が瞬時かつ楽に行えるようにする必要があります。
良好なユーザーエクスペリエンスを維持します。 さらに重要なのは、ほとんどの既存のドキュメント形式では、
ユーザーは、選択したページを表示する前に、まずドキュメント全体をダウンロードする必要があります。 しかし、
ユーザーは多くの場合、
ドキュメント全体をダウンロードします。 効率的なブラウジングには、効率的なランダム ページ アクセスが必要です。
高速連続ページめくり、素早いレンダリング。 これは次の方法で実現できます。
高度な圧縮、プリフェッチ、プリデコード、キャッシュ、プログレッシブの組み合わせ
レンダリング。 DjVu は各ページを複数のコンポーネント (テキスト、背景、画像、
一般的な形状のライブラリ...) 複数のページで共有され、ダウンロードされる場合があります。
要求。 これらすべての要件には、非常に洗練された、しかし倹約的な制御が必要です
オンデマンドのダウンロード、プリフェッチ、デコード、キャッシュ、および
ページ画像のプログレッシブレンダリング。 ここで検討されているのは単なる問題ではありません
ドキュメント画像圧縮技術ですが、ドキュメント配信のためのプラットフォーム全体です。
DjVu は、画像圧縮技術、ドキュメント形式、およびソフトウェア プラットフォームです。
上記の要件を満たすドキュメント画像をインターネット経由で配信する。
DJVU IMAGE 圧縮
DjVu 画像圧縮は XNUMX つのテクノロジーに基づいています。
DjVu写真
IW44 としても知られる DjVuPhoto は、ウェーブレットベースの連続階調画像圧縮です。
プログレッシブ デコード/レンダリングを使用する技術。 写真のエンコードに最適です
カラーまたはグレーの色合いの画像。 画像は通常、JPEG の半分のサイズです。
同じ歪み。
DjVuBitonal
JB2 としても知られる DjVuBitonal は、次の利点を利用するモノクロ画像圧縮です。
ページ上でほぼ同じ形状(文字など)を繰り返して効率的に表示する
テキスト画像を圧縮します。 白黒画像を圧縮するのに最適です。
テキストと簡単な図。 DjVuBitonal の一般的な 300 dpi ページは 5 ~ 25 KB (3 ~
TIFF-G8 や PDF よりも 4 倍優れています)。
DjVuドキュメント
DjVuDocument は、カラー デジタル ドキュメント用に特別に設計された圧縮技術です。
雑誌のページなど、写真とテキストの両方を含む画像。 DjVuドキュメント
画像を個別に圧縮されたレイヤーに表現します。 前景レイヤーは通常、
DjVu Bitonal で圧縮されており、テキストと描画が含まれています。 背景レイヤーは、
通常は DjVuPhoto で圧縮されており、背景テクスチャと画像が含まれています。
解像度が低くなります。
DJVU ドキュメント デリバリー PLATFORM
DjVu テクノロジーは、効率的な配信をサポートするためにゼロから設計されています。
インターネット上のデジタル文書。 複数ページを処理するためのさまざまな方法を提供します
ドキュメント、およびハイパーリンク、メタデータ、検索可能なコンテンツを強化するさまざまな方法
テキストなど
MIME
DjVu 形式の公式 MIME タイプは次のとおりです。 画像/vnd.djvu、これが好ましいです
DjVu ファイルに対して http サーバーによって与えられる content-type。 使用されている非公式の MIME タイプ
歴史的には 画像/x.djvu と 画像/x-djvu、まだ遭遇する可能性があります。 理想的には、
クライアントは XNUMX つすべてを処理できるように構成する必要があります。 (Web サーバー設定のヘルプについては、を参照してください。
http://www.djvuzone.org/support/tutorial/chapter-authoring1.html.)
バンドル マルチページ ドキュメント
バンドルされた複数ページの DjVu ドキュメントは、単一のファイルを使用してドキュメント全体を表します。
この XNUMX つのファイルには、すべてのページと補助情報 (例: ページ) が含まれています。
ディレクトリ、複数のページで共有されるデータ、サムネイルなど)。 単一のファイル形式を使用することは、
書類の保管や電子メールの添付ファイルの送信に非常に便利です。
複数ページのドキュメントの URL を入力すると、DjVu ブラウザ プラグインのダウンロードが開始されます。
ファイル全体を表示しますが、最初のページは利用可能になるとすぐに表示されます。 あなたはできる
DjVu ツールバーを使用して、すぐに他のページに移動します。 ただし、
ドキュメントはリモート Web サーバーに保存されます。 最初のページに簡単にアクセスして見ることができます
これはあなたが望んでいた文書ではないということです。 他のページを表示することはありませんが、
ブラウザはこれらのページのデータを転送しており、帯域幅を無駄にしています。
サーバー (およびインターネットの帯域幅も)。 の概要もご覧いただけます
最初のページの文書を選択すると、100 ページにジャンプします。ただし、100 ページは表示されるまで表示されません。
1ページから99ページまでのデータを受信しました。 送信までお待ちいただく場合がございます
不要なページデータ。 この XNUMX 番目の問題 (不必要な待機) は、次の方法を使用して解決できます。
HTTP/1.1 プロトコルの「バイト サービング」オプション。 このオプションは、
Web サーバー、プロキシ、キャッシュ、ブラウザー。 バイトサービングでも解決しない
最初の問題 (帯域幅の無駄)。
間接的な マルチページ ドキュメント
間接的な複数ページの DjVu ドキュメントは両方の問題を解決します。 間接的な複数ページの DjVu
ドキュメントは複数のファイルで構成されています。 メインファイルにはインデックスファイルという名前が付けられます。 あなたはできる
バンドルされたマルチファイルの場合と同様に、インデックス ファイルの URL を使用してドキュメントを参照します。
ページのドキュメント。 ただし、インデックス ファイルは非常に小さいです。 単にドキュメントが含まれているだけです
ディレクトリとページデータを含む二次ファイルの URL。 閲覧すると、
間接的な複数ページのドキュメントの場合、ブラウザは現在のページのデータのみにアクセスします。
閲覧中。 ブラウザはキャッシュを維持するため、これは適切な速度で実行できます。
ページを読み込み、場合によっては現在のページよりも数ページ先をプリフェッチします。 このモデルが使用しているのは、
Web は帯域幅をより効率的に提供します。 不要な遅延も解消します
長い文書内の任意の場所にあるページにジャンプするとき。
注釈
すべての DjVu 画像には、いわゆる注釈チャンクがオプションで含まれます。 注釈チャンクは
他のドキュメント ページまたは任意の Web ページへのハイパーリンクを定義するためによく使用されます。
注釈チャンクは、初期表示の設定などの他の目的にも使用できます。
ページのモード、強調表示されたゾーンの定義、またはページに関する任意のメタデータの保存
または文書。
隠されました 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
すべての DjVu 画像には、オプションで、グラフィックに関連付けられた隠しテキスト レイヤーが含まれます。
機能と対応するテキスト。 隠しテキストレイヤーは通常、次のように生成されます。
光学式文字認識ソフトウェアを実行しています。 このテキスト情報は次のことを提供します。
DjVu ドキュメントのインデックス作成と DjVu ページ画像からのテキストのコピー/ペースト。
サムネイル
DjVu ドキュメントには、事前に計算されたページのサムネイルが含まれる場合があります。
目次
DjVu ドキュメントには、アウトラインを含むナビゲーション チャンクが含まれる場合があります。
対応する文書ページへのポインターを含む階層的な目次。
DJVUZONE そして DJVULIBRE
DjVu テクノロジーは、1995 年に AT&T Labs の数人の研究者によって最初に作成されました。
および 1999 年。リザードテック社 ( http://www.lizardtech.com )その後、コマーシャルを取得しました
AT&Tからライセンスを取得し、開発を続けた。 彼らは現在、次のようなさまざまなソリューションを用意しています。
DjVu テクノロジーを使用したドキュメントの作成と配布。
DjVuZone Web サイト ( http://www.djvuzone.org ) は少数の AT&T Labs によって管理されています
最初に DjVu テクノロジーを作成した研究者。 私たちはDjVuを推進します
DjVu に関する独立した情報源を提供することにより、テクノロジーを強化します。
独自のドキュメント形式を採用する余地がいかに少ないかを理解している、Lizardtech
は、2000 年 XNUMX 月に GNU Public License に基づいて DjVu Reference Library をリリースしました。
ライブラリは、圧縮形式と基本コーデックを完全に定義します。 XNUMXヶ月
その後、Lizardtech は更新された DjVu リファレンス ライブラリとソース コードをリリースしました。
Unix ビューア。
これら XNUMX つのリリースは、初期の DjVuLibre ソフトウェアの基礎を形成します。 私たちは、
オープンソース コミュニティの期待に応えるシステムを構築します。 いろいろなバグ
移植性の問題も修正されました。 また、より使いやすくなるように努めました。
Lizardtech リリースの基本的な構造を維持しながら、インストールします。
DjVuLibre ソフトウェアには次のコンポーネントが含まれています。
ブズ(1) 汎用の圧縮コマンド ライン プログラム。 多くの内部 DjVu データ
構造はこの技術を使用して圧縮されます。
c44(1) DjVuPhoto コマンド ライン エンコーダー。 この最先端のウェーブレット コンプレッサーは、
PPM または JPEG 画像からの DjVuPhoto 画像。
CJB2(1)
DjVuBitonal コマンド ライン エンコーダー。 このソフトパターンマッチングコンプレッサーは、
PBM 画像からの DjVuBitonal 画像。 画像を損失なくエンコードできる、または
圧縮率を向上させるために小さな変更を加えます。 ロスレス
エンコード モードは、Lizardtech 商用エンコーダのエンコード モードと競合します。
cpaldjvu(1)
色の少ない画像用の DjVuDocument コマンド ライン エンコーダー。 このエンコーダは、
少数の異なる色の画像を圧縮するのに適しています (例:
スクリーンショット)。 主要な色は背景レイヤーによってエンコードされます。 もう一つは
色は前景レイヤーによってエンコードされます。
csepdjvu(1)
分離された画像用の DjVuDocument コマンド ライン エンコーダー。 このエンコーダは
事前にセグメント化された前景画像と背景画像を含むファイルを生成し、
DjVuDocument イメージ。
djvu(1)
DjVu イメージ用のコマンド ライン デコーダ。 このプログラムは PNM イメージを生成します
任意の解像度での DjVu ドキュメントの任意のページの任意のセグメントを表します。
DJビュー(1)
DjVu 画像用のスタンドアロン ビューア。 DjVu を表示する高機能ビューア
書類。 ドキュメント ナビゲーション、高速ズームおよびパンを実装します。
ナスデジャヴ(1)
DjVu 画像を表示するための Web ブラウザー プラグイン。 この小さなプラグインにより、
Web ブラウザからの DjVu ドキュメント。 内部的には djview を使用して実際の処理を実行します。
作業。
DJVUP(1)
DjVu ドキュメントを PostScript に変換するためのコマンド ライン ツール。
DJVM(1)
バンドルされた複数ページの DjVu ドキュメントを操作するためのコマンド ライン ツール。 これ
プログラムは、個々のページを収集し、バンドルされたドキュメントを作成するためによく使用されます。
DJVMCVT(1)
バンドルされたドキュメントを間接ドキュメントに変換するためのコマンド ライン ツール
逆に。
djvused(1)
複数ページのドキュメントを操作したり、作成したり、
注釈チャンクの編集、非表示のテキストレイヤーの作成または編集、事前計算
サムネイル画像など...
djvutxt(1)
DjVu ドキュメントから隠しテキストを抽出するコマンド ライン ツール。
ジュヴダンプ(1)
DjVu ファイルを検査し、その内部を表示するためのコマンド ライン ツール
構造。
djvuextract(1)
DjVu イメージ ファイルを逆アセンブルするためのコマンド ライン ツール。
djvmake(1)
DjVu イメージ ファイルを組み立てるためのコマンド ライン ツール。
ジェヴサーブ(1)
間接的な複数ページの DjVu ドキュメントをオンザフライで生成するための CGI プログラム。
djvtoxml(1) djvuxmlパーサー(1)
DjVu メタデータを XML ファイルとして編集するためのコマンド ライン ツール。
DJVU エンコーダー そして ANY2DJVU
DjVuLibre にはさまざまな特殊なエンコーダーが付属しています。 c44(1) 写真画像の場合、
CJB2(1) モノクロ画像の場合、および cpaldjvu(1) 明確な色がほとんどない画像の場合。 それでも
これらのエンコーダは、特殊な領域では良好に動作しますが、複雑なタスクを処理することはできません
セグメンテーションと複数ページのエンコードが含まれます。
Lizardtech の商用製品 (「 http://www.lizardtech.com/solutions/document)することができます
これらの複雑なエンコードタスクを実行する
別のソリューションは、圧縮サーバー (http://any2djvu.djvuzone.org).
このマシンは、AT&T Labs の lizardtech 以前のプロトタイプ エンコーダを使用しており、ほぼ同等の性能を発揮します。
市販の Lizardtech エンコーダも同様です。 Any2DjVu の圧縮には注意してください。
サーバーには、ドキュメントが確実に保存されることを保証するために何も行われないという保証はありません。
秘密は守られ、地球全体で動作するコンピューターは XNUMX 台だけです。
CREDITS
過去 XNUMX 年間に多くの人々が DjVu ソース コードに貢献してきました。
次のリストを更新するには、sourceforge バグ レポートを送信してください。
ヨシュア・ベンジオ、レオン・ボットー、チャクラダール・チャンダルリ、レジス・M・チャップリン、ミン・チェン、パラグ
デシュムク、ロイス エドワーズ、アンドリュー エロフェエフ、プラヴィーン グドゥル、パトリック ハフナー、ポール G.
ハワード、オーランド・ケイセ、ヤン・ル・クン、アルテム・ミヘエフ、フロリン・ニシャ、ジョセフ・M・オロスト、
スティーヴン・ピジョン、ビル・リーマーズ、パトリス・シマール、ジェフリー・トリッグス、リュック・ヴィンセント、パスカル
ヴィンセント。
onworks.net サービスを使用してオンラインで djvu を使用する