これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド SIBsim4 です。
プログラム:
NAME
SIBsim4 - イントロンを考慮して、RNA 配列を DNA 配列と整列させます
SYNOPSIS
SIBsim4 [ オプション ] DNA rna_db
DESCRIPTION
SIBsim4 は、発現配列のコレクションをアラインメントするための類似性ベースのツールです (EST、
mRNA) とゲノム DNA 配列。
発射 SIBsim4 引数を指定しないと、オプション リストが出力されます。
デフォルト値。
SIBsim4 ブラストベースの技術を採用して、最初に基本的な一致ブロックを決定します
「エクソンコア」を表します。 この最初の段階では、考えられるすべての完全一致を検出します。
XNUMX つの配列間の W-mer (つまり、サイズ W の DNA ワード) を分割し、それらを次のように拡張します。
最大スコアのギャップのないセグメント。 第 XNUMX 段階では、エクソン コアが次のように拡張されます。
貪欲なアライメントアルゴリズムとヒューリスティックを使用した、まだ一致していない隣接するフラグメント
スプライス部位認識シグナルに適合する構成を支持するために使用されます
(例:GT-AG)。 必要に応じて、より厳密でないパラメータを使用してプロセスが繰り返されます。
比類のない断片。
デフォルトでは、 SIBsim4 両方のストランドを検索し、最適な一致を報告します。
アラインメントで見つかった一致するヌクレオチドの数。 の R コマンドラインオプションは
検索を XNUMX つの方向 (ストランド) のみに制限するために使用されます。
現在、XNUMX つの主要な配置表示オプションがサポートされており、 A オプションを選択します。
デフォルトでは、イントロンのエンドポイント、全体的な類似性、および向きのみが表示されます。
報告。 矢印記号 ('->' または '<-') は、イントロンの向きを示します。 記号
`==' は、その位置から始まる cDNA フラグメントのアライメントが存在しないことを示します。
以下の説明では、用語 MSP 最大得点ペア、つまり
XNUMX つの配列内の非常に類似したフラグメント。
一致する W-mer ヒットとおそらくいくつかの不一致を拡張します。
OPTIONS
-A
出力フォーマット
0: エクソンエンドポイントのみ
1: 配置テキスト
3: エクソン エンドポイントとアライメント テキストの両方
4: polyA 情報を含むエクソンエンドポイントとアラインメントテキストの両方
2 は実装されていないことに注意してください。
デフォルト値は0です。
-C
XNUMX 番目のパスの MSP スコアのしきい値。
デフォルト値は12です。
-c
最小スコア カットオフ値。 この値を下回るスコアを持つアラインメントは、
報告した。
デフォルト値は50です。
-E
カットオフ値。
デフォルト値は3です。
-f
スコア フィルター (パーセント単位)。 同じ RNA 要素に対して複数のヒットが検出された場合、
その RNA の最大スコアのこのパーセンテージ内のスコアを持つもののみ
要素が報告されています。 この値を 0 に設定すると、フィルタリングが無効になり、すべてのヒットが
スコアが c
オプションを選択します。
デフォルト値は75です。
-g
ゲノム上のギャップと RNA 上のギャップの長さが最大でこれだけ異なる場合、エクソンを結合します。
パーセンテージ。
デフォルト値は10です。
-H
最高のスコアがこのパーセンテージよりも低い場合、キメラ転写産物を報告します。
全体的な RNA カバレッジとキメラ スコアがこのパーセンテージよりも大きい
RNA の長さ (0 はこのレポートを無効にします)
デフォルト値は75です。
-私
イントロンスプライシングを検索するウィンドウ幅。
デフォルト値は6です。
-K
最初のパスの MSP スコアしきい値。
デフォルト値は16です。
-L
フォワード スプライス タイプのコンマ区切りリスト。
デフォルト値は「GTAG、GCAG、GTAC、ATAC」です。
-M
スプライス部位をスコアリングし、M ヌクレオチド内の一致を評価します。
デフォルト値は10です。
-o
結果を印刷するとき、この量だけ DNA シーケンスの nt 位置をオフセットします。
デフォルト値は0です。
-q
ヌクレオチドミスマッチのペナルティ。
デフォルト値は-5です。
-R
検索方向
0: '+' (直接) ストランドのみを検索します
1: '-' ストランドのみを検索
2: 両方のストランドを検索
デフォルト値は2です。
-r
ヌクレオチドマッチの報酬。
デフォルト値は1です。
-S
スプライス サイト インデルの検索範囲。 スプライスの最適な位置を決定しながら
サイト、 SIBsim4 最大でこの数の挿入と削除の追加を評価します
スプライス ジャンクションの両側の DNA 鎖上。
デフォルト値は2です。
-s
分割スコア (パーセント)。 MSP をリンクしている間、エクソンの XNUMX つの連続したグループ
それらは同じ遺伝子の XNUMX つの異なるコピーの一部である可能性があるように見えます。
個々のグループのスコアが最高の総合成績と比較しているかどうかを確認するためにテストされます。
スコアがこの値より大きい。 両方のグループの相対スコアがこれより高い場合
それらが分割されるしきい値。
デフォルト値は75です。
-W
ワードサイズ。
デフォルト値は12です。
-バツ
単語拡張子を終了するための値。
デフォルト値は12です。
onworks.net サービスを使用してオンラインで SIBsim4 を使用する