英語フランス語スペイン語

OnWorksファビコン

herold - クラウドでオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターを介して、OnWorks の無料ホスティング プロバイダーで herold を実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド herold です。

プログラム:

NAME


herold - HTML から DocBook へのコンバーター

SYNOPSIS


ヘラルド [オプション]

DESCRIPTION


プレゼンテーションに中立な形式で HTML コンテンツを再利用することは、よくある問題です。 XNUMXつの可能性
DocBook はセマンティック マークアップ言語であるため、解決策は HTML を DocBook XML に変換することです。
これにより、ユーザーは、ドキュメントをキャプチャするドキュメント コンテンツを作成できます。
コンテンツの論理構造。 コマンド ライン ツール herold を使用して HTML を変換できます。
DocBookに。 HTML 要素は意図したとおりに使用されないことが多いため、
このような変換は多少制限されます。 herold は、dbdoclet ツール スイートの一部です。
詳しい情報は http://www.dbdoclet.org.

OPTIONS


--docbook-add-index、-x
ドキュメントの末尾に index 要素を自動的に追加します。

--docbook-decompose-tables、-T
表を HTML コードから単一の段落に分解します。 これは便利です。
フォーマット上の理由から、文書に多くの表が含まれている場合。

--docbook-encoding、-d
生成された DocBook XML ファイルのエンコーディングを指定します。

--docbook-root-element、-r
ドキュメントのルート要素。 可能な値は次のとおりです: book、article、reference、part、
章またはセクション。 このオプションのデフォルト値は「記事」です

--docbook-title、-t
結果のドキュメントのタイトル。

--in、-i
HTML 入力ファイルを指定します。

-ヘルプ、-h
コンソールにヘルプ ページを出力します。

--html-エンコーディング、-s
ISO-8859-1 など、HTML ソース ファイルのエンコーディングを指定します。

--アウト、-o
DocBook XML 宛先ファイルを指定します。

--プロファイル、-p
定義済みの設定を含むプロファイル ファイル。

--冗長、v
コンソール出力の冗長性を有効にします。

--バージョン、-V
herold のバージョンを表示します。

CONFIGURATION


変換の詳細は、プロファイル ファイルによって制御されます。 プロファイル ファイルが提供するもの
コマンドライン引数よりも変換に影響を与える可能性が高くなります。 の
次の例は、一般的なプロファイル ファイルを示しています。

変換 html2docbook;

セクション セクション検出 {
属性クラス = ["^MsoHeading(\d+)$"];
section-numbering-pattern = "((\d+\.)+)?\d*\.?\p{Z}*";
}

セクション リスト検出 {
itemized-attribute-class = ["^MsoListBullet(\w*)$", "Aufzhlung(\w+)$];
itemized-strip-prefix = [ "-", "o", "\u00b7" ];
順序付けられた属性クラス = ["^MsoListNumbered(\w*)$"];
順序付けられたストリップ接頭辞 = [「\d+\.\s+」];
}

セクション HTML {
encoding = "windows-1252";
exclude = [ "//p[starts-with(@class, 'MsoToc')]", "" ];
}

セクション DocBook {
抽象 = """ロレム・イプサム
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed
do eiusmod tempor incididunt ut Labore et dolore magna aliqua. ユト
enim ad minim veniam, quis nostrud exercitation ullamco Laboris
nisi ut aliquip ex ea comodo consequat。 Duis aute irure dolor in
voluptate velit esse cillum dolore eu fugeat nulla での再現
パリトゥール。 Exceptioneur sint occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim id est labourum.sed, dolor
アメット。 """;
追加インデックス = true;
著者の電子メール = "[メール保護]";
author-firstname = "マイケル";
author-surname = "フックス";
崩壊保護スペース=「真」;
copyright-holder = "Ingenieurbüro Michael Fuchs";
著作権年 = "2012";
株式会社 = "";
作成条件属性 = false;
作成プロローグ = true;
作成リマップ属性 = false;
作成-xref-label = false;
分解テーブル = false;
検出トラップ br = true;
ドキュメンテーション ID = "doc01";
ドキュメント要素 = "本";
エンコーディング = "UTF-8";
ハイフネーション文字 = "ソフト ハイフン";
画像データ形式 = [「gif」、「base64」];
image-path = "./figures";
language = "デ";
リリース情報 = 「バージョン 3.1」;
テーブルスタイル = "すべて";
タイトル = "チュートリアル";
タイトル正規化スペース = true;
使用絶対イメージ パス = false;
}

構文
プロファイル ファイルは、主にセクションで構成されます。 セクションは、パラメーターをグループ化するために使用されます。
同じコンテキストを共有します。 すべてのセクションはキーワードで始まる必要があります 続いて
セクションの名前。 名前の後には、パラメータのブロックが続きます。
中括弧。 パラメーターは、文字列、数値、ブール、または配列の型にすることができます。 文字列は
二重引用符で囲みます。 文字列に改行が含まれる場合は、XNUMX つの二重引用符を使用します
XNUMXつの代わりに。 配列は角括弧で囲まれています。 配列内では、要素は
カンマで区切ってください。 すべての割り当ては、セミコロンで終了する必要があります。 複数行コメント
形を持っている /* my コメント */ 、一行コメントは次のようになります // my コメント\n.

必須の 要素
herold のプロファイルは、行変換 html2docbook; で開始する必要があります。

セクション セクション検出
セクション セクション検出 HTMLコードのセクション要素を検出し、削除するために使用されます
タイトルからの番号付けプレフィックスをオフにします。

多くのオーサリング ツールでは、セクションを深くネストできます。 HTML のエクスポート中に、次のことが起こります。
入れ子は XNUMX レベルよりも深くなります。 HTML は、最大 XNUMX つのヘッダー要素を提供します
レベルは h1 ~ h6 ですが、h7 またはそれ以上はありません。 この時点で、フォーマットは通常
CSS と div または p 要素の助け。 herold は、のヘッダー要素を検出できます
HTML ですが、特定のツールのエクスポート形式についてはわかりません。 これを解決するには
問題がある場合でも、パラメーターを指定できます 属性クラス。 それはで構成されています
各 HTML の class 属性と照合される正規表現のリスト
エレメント。 一致が見つかった場合、要素はセクション要素と見なされます。 レギュラー
式には、レベル インジケーターとして解釈されるグループを含めることができます。 グループは
最初のグループであり、^heading(\d+)$ などの数字と一致する必要があります。 できないレベルなら
検出されない場合、レベル XNUMX が想定されます。

DocBook XSL スタイルシートは、
DocBook XML を特定の出力に変換する場合、すでに番号付けを削除する必要があることがよくあります
HTML ページで定義されます。 そうしないと、番号の前に XNUMX つの番号付けテキストが表示されます。
タイトル。 herold が番号付けパターンを検出できるようにするには、パラメーターを使用します。
セクション番号付けパターン.

属性クラス
すべての p および div 要素に適用される正規表現。 式の場合
一致する場合、現在の要素はセクション要素として扱われます。 通常の場合
式にはグループがあり、最初のグループがネスト レベルとして使用されます。それ以外の場合はレベル
XNUMX を想定しています。

セクション番号付けパターン
通常、HTML データに付属するセクション番号を取り除きたいのですが、
DocBook のタイトル テキストの一部になるためです。 セクション番号は、
ターゲット メディアに XNUMX 回表示されます。 XNUMX つは HTML から、もう XNUMX つは DocBook XSL から
処理。 パラメータ section-numbering-pattern は、正規表現を定義します。
これは、すべてのセクション タイトルの先頭と照合されます。 一致する場合、
一致する部分が削除されます。

セクション リスト検出
リストは ul、ol、または dl タグで表されないことがありますが、p として表されます。
追加の css 形式のタグ。 HTML を作成またはエクスポートするツールを使用する場合
そのような構成では、変換は、代わりに para 要素で終了します。
DocBook の対応するリスト要素。 場合によってはリストを再作成するには、次を使用できます
セクション リスト検出。 パラメータ 項目属性クラス
順序付けられた属性クラス 一致する正規表現のリストを定義できます
HTML のリスト項目。 herold は、これから適切なリスト構造を再構築しようとします。
ネストされたリストの場合でも、情報。

セクション HTML
セクション HTML は、HTML の読み込みと解析を制御するパラメーターを定義します。
入力データ。

エンコーディング
入力ストリームの読み取りに使用される文字セット。

除外する
xpath 式の配列を定義します。 すべての一致が HTML DOM ツリーから削除されます
変身前。

セクション DocBook
抽象的な
情報セクションの抽象要素のテキスト。 テキストが次のように構成されている場合
改行、区切り文字として XNUMX つの二重引用符を使用します。 テキストが「<」で始まる場合
文字、抽象要素に埋め込まれます。それ以外の場合、テキストが埋め込まれます
抽象要素内の para 要素に。 テキストは解析され、
DocBook 要素を含みます。

追加インデックス
true に設定すると、DocBook XML の最後に index 要素が挿入されます。

外部参照ラベルの作成
false に設定すると、アンカー要素は xreflabel 属性を取得しません。

分解テーブル
true に設定すると、テーブル構造は無視されます。 表のセルの内容は
一連の段落として DocBook XML に挿入されます。 このパラメーターは、
HTML に書式設定用の表が含まれている場合に便利です。 通常、取得したい
それらは論理構造を改ざんするため、それらを取り除きます。

ドキュメント要素
使用するドキュメント要素。 記事、書籍、部品、または参考文献のいずれかである必要があります。

エンコーディング
出力ファイルの書き込みに使用される文字セット。

画像データ形式
画像フォーマットの配列。 これらの形式は、imageobject 要素として挿入されます。
対応する img の src 属性にある形式に加えて
エレメント。 元の形式は、"html" と "fo" の役割で XNUMX 回挿入されます。 の
他の形式は「html- "および"fo- "。

タイトル
結果のドキュメントのタイトル。 このパラメータが定義されていない場合、herold は次のことを試みます。
HTML データの head セクションからタイトルを検出しました。

絶対イメージパスを使用
imagedata 要素の fileref 属性に絶対画像パスが必要な場合は、
このパラメーターを true に設定します。

COPYRIGHT


Copyright 2001-2013 Michael Fuchs. ライセンス GPLv3+: GNU GPL バージョン 3 以降
http://gnu.org/licenses/gpl.html. これはフリー ソフトウェアです。自由に変更できます。
それを再配布します。 法律で認められる範囲においては、いかなる保証もありません。

onworks.net サービスを使用して herold online を使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

  • 1
    XMLTV
    XMLTV
    XMLTVは、処理する一連のプログラムです。
    TV(tvguide)のリストと管理の支援
    あなたのテレビ視聴、リストの保存
    XMLベースのフォーマット。 にユーティリティがあります
    行う...
    XMLTV をダウンロード
  • 2
    ストライカー
    ストライカー
    Strikr フリー ソフトウェア プロジェクト。 アーティファクト
    「インテントベース」でリリース
    デュアル ライセンス: AGPLv3 (コミュニティ) および
    CC-BY-NC-ND 4.0 国際
    (商業)...
    strikr のダウンロード
  • 4
    GIFLIB
    GIFLIB
    giflib は、読み書き用のライブラリです。
    gif画像を書いています。 APIとABIです
    にあったlibungifと互換性があります
    LZW圧縮中の幅広い使用
    アルゴリズムは...
    GIFLIBをダウンロード
  • 5
    Alt-f
    Alt-f
    Alt-F は無料のオープン ソースを提供します
    DLINK の代替ファームウェア
    DNS-320/320L/321/323/325/327L and
    DNR-322L。 Alt-F には Samba と NFS があります。
    ext2/3/4...をサポート
    Alt-F をダウンロード
  • 6
    usm
    usm
    Usm は slackware の統合パッケージです。
    自動を扱うマネージャー
    依存関係の解決。 統一する
    を含むさまざまなパッケージリポジトリ
    slackware、slacky、p...
    usm をダウンロード
  • 詳細»

Linuxコマンド

Ad