این دستور abyss-pe است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
abyss-pe - خوانده شده را به contigs جمع کنید
خلاصه
abyss-pe [گزینه]... [پارامتر=ارزش]... [MAKE_TARGET] ...
شرح
خواندن فایل های ورودی را در contig ها جمع آوری کنید. خواندن ممکن است در FASTA، FASTQ،
فرمت qseq، export، SRA، SAM یا BAM و ممکن است با gz، bz2 یا xz فشرده شود و ممکن است
قیر شده
abyss-pe یک اسکریپت Makefile است. هر گزینه ساخت ممکن است با abyss-pe نیز استفاده شود.
پارامترهای of abyss-pe
نام, اسم شغل
نام این مجلس. داربست های به دست آمده در آن ذخیره می شوند
${name}-scaffolds.fa.
in فایل های ورودی از این متغیر هنگام جمع آوری داده ها از یک کتابخانه استفاده کنید.
لوب یک لیست نقل قول از نامهای کتابخانههای انتهای جفتی جدا شده با فضای خالی. از این متغیر استفاده کنید
هنگام مونتاژ داده ها از چندین کتابخانه با پایان جفت. برای نام هر کتابخانه در
lib، کاربر باید متغیری را در خط فرمان با همین نام تعریف کند که
فایل های خوانده شده برای آن کتابخانه را نشان می دهد. دیدن مثال ها زیر برای یک بتن
نمونه استفاده
pe فهرستی از کتابخانه های جفتی که فقط برای ادغام واحدها در آنها استفاده می شود
ادامه دارد و به دنباله اجماع کمک نخواهد کرد.
mp فهرستی از کتابخانه های جفت جفتی که برای داربست استفاده خواهند شد. کتابخانه های Mate-Pair
به دنباله اجماع کمک نکنید.
طولانی فهرستی از کتابخانه های توالی طولانی که برای داربست استفاده می شود. دنباله طولانی
کتابخانه ها به دنباله اجماع کمک نمی کنند.
se فایل های حاوی خواندن های تک پایانی
a حداکثر تعداد شاخه های یک حباب [2]
b حداکثر طول یک حباب (bp) [10000]
c حداقل میانگین پوشش k-mer یک واحد [sqrt(متوسط)]
d خطای مجاز تخمین فاصله (bp) [6]
e حداقل پوشش فرسایش k-mer [sqrt(متوسط)]
E حداقل پوشش فرسایش k-mer در هر رشته [1]
j تعداد رشته ها [2]
k اندازه یک k-mer (وقتی K تنظیم نشده است) یا دهانه یک جفت k-mer (زمانی که K تنظیم شود)
K اندازه یک k-mer منفرد در یک جفت k-mer (bp)
l حداقل طول تراز خواندن (bp) [k]
m حداقل همپوشانی دو واحد (bp) [30]
n حداقل تعداد جفت مورد نیاز برای ساخت contigs [10]
N حداقل تعداد جفت مورد نیاز برای داربست های ساختمانی [n]
p حداقل هویت توالی یک حباب [0.9]
q حداقل کیفیت پایه هنگام پیرایش [3]
پایه هایی را از انتهای قرائت هایی که کیفیت آنها q کمتر است را برش دهید.
Q حداقل کیفیت پایه [0]
همه پایه های خوانده شده را که کیفیت آنها کمتر از Q است به عنوان "N" بپوشانید.
s حداقل اندازه واحد مورد نیاز برای contigs ساختمان (bp) [200]
طول بذر باید حداقل دو برابر مقدار k باشد. اگر دنباله بیشتر باشد
مونتاژ شده از اندازه ژنوم مورد انتظار، سعی کنید s را افزایش دهید.
S حداقل اندازه کانتیگ مورد نیاز برای داربست های ساختمانی (bp) [s]
SS SS=--SS برای مونتاژ در حالت رشته خاص
مستلزم این است که همه کتابخانه ها کتابخانه های RNA-Seq خاص رشته باشند. فرض می کند که
اولین خواندن در یک جفت خوانده شده با WRT معکوس می شود و رونوشت ها توالی می شوند.
t حداقل اندازه نوک (bp) [2k]
v v=-v برای فعال کردن گزارش کامل
np, شکاف ها
تعداد فرآیندهای یک مجموعه MPI
mpirun مسیر رسیدن به امپیرون
هم تراز
برنامه مورد استفاده برای تراز خواندن با contigs [نقشه].
مقادیر مجاز عبارتند از: map، kaligner، bwa، bwasw، bowtie، bowtie2، dida. را ببینید
DIDA بخش زیر برای اطلاعات بیشتر در مورد گزینه dida.
cs پس از مونتاژ، کانتیگهای فضای رنگی را به شکلهای نوکلئوتیدی تبدیل کنید
گزینه of ساخت
-n, -- خشک اجرا شود
دستوراتی را که باید اجرا شوند چاپ کنید، اما آنها را اجرا نکنید.
ساخت اهداف برای abyss-pe
به طور پیش فرض
معادل 'scaffolds scaffolds-dot stats'.
واحدها
واحدها را جمع آوری کنید
واحد-نقطه
خروجی نمودار همپوشانی واحد.
pe-sam نقشه جفت شده به واحدها می خواند و یک فایل SAM را خروجی می دهد. فایل SAM فقط خواهد بود
شامل نگاشت خوانده شده به کانتیگ های مختلف و شناسه، ترتیب و کیفیت خواندن است
رشته ها با کاراکترهای '*' جایگزین می شوند.
پ-بام نقشه جفت پایان به واحدها می خواند و یک فایل BAM را خروجی می دهد. فایل BAM فقط خواهد بود
شامل نگاشت خوانده شده به کانتیگ های مختلف و شناسه، ترتیب و کیفیت خواندن است
رشته ها با کاراکترهای '*' جایگزین می شوند.
pe-index
یک شاخص از واحدهای مورد استفاده توسط abyss-map ایجاد کنید.
contigs
contigs را جمع آوری کنید.
contigs-dot
خروجی نمودار همپوشانی contig.
mp-sam Map mate-pair روی contigs می خواند و یک فایل SAM را خروجی می دهد. فایل SAM فقط خواهد بود
شامل نگاشت خوانده شده به کانتیگ های مختلف و شناسه، ترتیب و کیفیت خواندن است
رشته ها با کاراکترهای '*' جایگزین می شوند.
mp-bam Map mate-pair روی contigs می خواند و یک فایل BAM را خروجی می دهد. فایل BAM فقط خواهد بود
شامل نگاشت خوانده شده به کانتیگ های مختلف و شناسه، ترتیب و کیفیت خواندن است
رشته ها با کاراکترهای '*' جایگزین می شوند.
mp-index
یک شاخص از contig های مورد استفاده توسط abyss-map ایجاد کنید.
داربست ها
داربست ها را جمع کنید.
داربست-نقطه
خروجی نمودار همپوشانی داربست.
چوب بست
داربست ها را بشکنید و فایل AGP تولید کنید.
داربست های بلند
داربست مجدد با استفاده از کانتیگ های مونتاژ شده RNA-Seq.
دراز-scaffs-dot
خروجی نمودار همپوشانی داربست RNA.
آمار نمایش آمار مجاورت مونتاژ.
تمیز حذف فایل های میانی
نسخه
نمایش نسخه abyss-pe.
نسخه
نمایش نسخه های تمام برنامه های مورد استفاده توسط abyss-pe.
کمک نمایش یک پیام مفید
DIDA
ABySS از استفاده از DIDA (Distributed Indexing Dispatched Alignment) مبتنی بر MPI پشتیبانی می کند.
چارچوب تراز برای محاسبه ترازهای توالی در چندین ماشین. برای استفاده
DIDA با ABySS، ابتدا DIDA را دانلود و نصب کنید
http://www.bcgsc.ca/platform/bioinfo/software/dida، سپس "dida" را به عنوان مقدار مشخص کنید
la هم تراز پارامتر به abyss-pe.
مربوط به DIDA abyss-pe پارامترهای
DIDA_MPIRUN
دستور 'mpirun' برای اجرای کارهای DIDA استفاده می شود.
DIDA_RUN_OPTIONS
گزینه های زمان اجرا مانند تعداد رشته ها در هر رتبه MPI و مقادیر برای محیط
متغیرها (به عنوان مثال PATH، LD_LIBRARY_PATH). برای لیستی از «abyss-dida --help» را اجرا کنید
گزینه های موجود.
DIDA_OPTIONS
گزینه هایی که مستقیماً به باینری DIDA ارسال می شوند. به عنوان مثال، می توان از این استفاده کرد
برای کنترل حداقل آستانه طول تراز. "dida-wrapper --help" را برای a اجرا کنید
لیست گزینه های موجود
لامپ ها COMPATIBILITY
به دلیل استفاده از چند رشته، DIDA مشکلات بن بست را با OpenMPI شناخته است. استفاده كردن
کتابخانه MPICH MPI هنگام اجرای مجموعه ها با DIDA به شدت توصیه می شود. آزمایش کردن
با MPICH 3.1.3، کامپایل شده با --enable-threads=funneled انجام شد.
مثال
پیکربندی زمان اجرا توصیه شده برای DIDA 1 رتبه MPI در هر دستگاه و 1 رشته در هر دستگاه است.
هسته CPU به عنوان مثال، برای اجرای یک اسمبلی در 3 گره خوشه ای با هر کدام 12 هسته، این کار را انجام دهید:
abyss-pe k=64 name=ecoli in='reads1.fa reads2.fa' aligner=dida
DIDA_RUN_OPTIONS='-j12' DIDA_MPIRUN='mpirun -np 3 -ppn 1 -bind-to board'
این مثال از گزینه های خط فرمان MPICH برای «mpirun» استفاده می کند. در اینجا، «-np 3» نشان میدهد
تعداد رتبههای MPI، «-ppn 1» نشاندهنده تعداد رتبههای MPI در هر «گره» است، و
"-bind-to board" یک "node" را به عنوان یک مادربرد (یعنی یک ماشین کامل) تعریف می کند.
محیط زیست متغیرها
هر پارامتری که ممکن است در خط فرمان مشخص شود ممکن است در یک نیز مشخص شود
متغیر محیطی.
PATH باید حاوی دایرکتوری باشد که فایل های اجرایی ABySS در آن نصب شده اند. از Abyss استفاده کنید
pe versions` برای بررسی اینکه PATH به درستی پیکربندی شده است.
TMPDIR دایرکتوری را برای استفاده برای فایل های موقت مشخص می کند
زمان بند ادغام
ABySS به خوبی با زمانبندیهای کار خوشهای، مانند:
* SGE (موتور خورشیدی گرید)
* سیستم دسته ای قابل حمل (PBS)
* تسهیلات اشتراک بار (LSF)
* IBM LoadLeveler
متغیرهای محیطی SGE JOB_NAME، SGE_TASK_ID و NSLOTS ممکن است برای تعیین
نام پارامترها، k و np، به ترتیب، و به طور مشابه برای زمانبندهای دیگر.
مثال ها
یک جفت شده کتابخانه
abyss-pe k=64 name=ecoli in='reads1.fa reads2.fa'
چندین جفت شده کتابخانه ها
abyss-pe k=64 name=ecoli lib='lib1 lib2' \
lib1='lib1_1.fa lib1_2.fa' lib2='lib2_1.fa lib2_2.fa' \
se='se1.fa se2.fa'
پایان جفت شده و جفت جفت کتابخانه ها
abyss-pe k=64 name=ecoli lib='pe1 pe2' mp='mp1 mp2' \
pe1='pe1_1.fa pe1_2.fa' pe2='pe2_1.fa pe2_2.fa' \
mp1='mp1_1.fa mp1_2.fa' mp2='mp2_1.fa mp2_2.fa' \
se='se1.fa se2.fa'
از جمله RNA-Seq مجامع
abyss-pe k=64 name=ecoli lib=pe1 mp=mp1 long=long1 \
pe1='pe1_1.fa pe1_2.fa' mp1='mp1_1.fa mp1_2.fa' \
long1=long1.fa
لامپ ها
abyss-pe np=8 k=64 name=ecoli in='reads1.fa reads2.fa'
SGE
qsub -N ecoli -t 64 -pe openmpi 8 \
abyss-pe n=10 in='reads1.fa reads2.fa'
با استفاده از خدمات onworks.net از abyss-pe آنلاین استفاده کنید