هذا هو الأمر pbsim الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
com.pbsim - جهاز محاكاة لقراءات تسلسل PacBio
موجز
com.pbsim الخيارات
الوصف
إنّ com.pbsim ينتج الأمر محاكاة لقراءات PacBio للتسلسل المرجعي FASTA
.
ملفات النموذج (معلمات ملف --نموذج مراقبة الجودة الخيار) يمكن العثور عليها في
/usr/share/pbsim/models الدليل.
OPTIONS
يمكن تقسيم خيارات pbsim إلى خيارات عامة وقائمة على أخذ العينات وقائمة على النموذج
خيارات المحاكاة.
أسئلة عامة الخيارات
--اختصار
بادئة ملفات الإخراج (sd).
--نوع البيانات
نوع البيانات. CLR أو CCS (CLR).
--عمق
عمق التغطية (CLR: 20.0، CCS: 50.0).
--طول دقيقة
الحد الأدنى للطول (100).
- الطول - ماكس
الحد الأقصى للطول (CLR: 25000، CCS: 2500).
--دقة-دقيقة
الحد الأدنى من الدقة (CLR: 0.75، CCS: ثابت عند 0.75). يمكن استخدام هذا الخيار فقط في
حالة CLR.
--الدقة القصوى
أقصى قدر من الدقة (CLR: 1.00، CCS: ثابت على 1.00). يمكن استخدام هذا الخيار فقط في
حالة CLR.
--نسبة الفرق
نسبة الاختلافات. الاستبدال: الإدراج: الحذف. كل قيمة تصل إلى 1000 (CLR:
10:60:30, CCS:6:21:73).
--بذرة لمولد أرقام عشوائية زائفة (توقيت يونكس).
مزيد من الخيارات لـ على أساس أخذ العينات محاكاة
- عينة- fastq
ملف بتنسيق FASTQ للعينة.
--sample-profile-id
معرف الملف الشخصي Sample-fastq (المفلتر). عند استخدام - عينة- fastq، يتم تخزين الملف الشخصي.
عينة الملف الشخصي_ .فاستقو عينة الملف الشخصي_ _.الإحصائيات تم انشاؤها. عندما لا
استخدام - عينة- fastq، يتم إعادة استخدام الملف الشخصي. لاحظ أنه عند استخدام ملف التعريف،
--الطول-الدقيقة، الحد الأقصى, --دقة-دقيقة، ماكس سيكون نفس الملف الشخصي.
مزيد من الخيارات لـ على أساس النموذج محاكاة
--model_qc
نموذج كود الجودة
--طول متوسط
متوسط نموذج الطول (CLR: 3000.0 ، CCS: 450.0).
--طول-SD
نموذج الانحراف المعياري للطول (CLR: 2300.0، CCS: 170.0).
- يعني الدقة
متوسط نموذج الدقة (CLR: 0.78، CCS: ثابت عند 0.98). يمكن استخدام هذا الخيار
فقط في حالة CLR.
--دقة-sd
الانحراف المعياري لنموذج الدقة (CLR: 0.02، CCS: ثابت عند 0.02). هذا الخيار
يمكن استخدامه فقط في حالة CLR.
أمثلة
لتشغيل المحاكاة القائمة على النموذج:
pbsim --نوع البيانات CLR \
- العمق 20 \
--model_qc /usr/share/pbsim/models/model_qc_clr \
المرجع
في المثال أعلاه، يتم أخذ عينات من تسلسلات القراءة المحاكاة بشكل عشوائي من مرجع
يتم عرض التسلسل ("reference.fasta") والاختلافات (الأخطاء) في القراءات التي تم أخذ عينات منها.
نوع البيانات هو CLR، وعمق التغطية هو 20. إذا كان التسلسل المرجعي عبارة عن ملف متعدد FASTA،
يتم إنشاء البيانات المحاكاة لكل FASTA. يتم إنشاء ثلاثة ملفات إخراج لكل منها
فاستا. "sd_0001.ref" هو ملف FASTA فردي يتم نسخه من التسلسل المرجعي.
"sd_0001.fastq" عبارة عن مجموعة بيانات قراءة تمت محاكاتها بتنسيق FASTQ. "sd_0001.maf" هي قائمة
المحاذاة بين التسلسل المرجعي والقراءات المحاكاة بتنسيق MAF. الطول
ويتم محاكاة دقة القراءات بناءً على نموذج قراءة PacBio الخاص بنا.
لتشغيل المحاكاة القائمة على أخذ العينات:
pbsim --نوع البيانات CLR \
- العمق 20 \
--sample-fastq Sample.fastq \
مرجع
في المحاكاة القائمة على أخذ العينات، يكون طول القراءة ونقاط الجودة هي نفس تلك الموجودة في أ
القراءة مأخوذة بشكل عشوائي في نموذج مجموعة بيانات PacBio ("sample.fastq").
استخدم pbsim عبر الإنترنت باستخدام خدمات onworks.net