זהו הפקודה snap-aligner-single שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו בחינם כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
snap-aligner_single - תוכנית יישור נוקלאוטידים ניתנת להרחבה
תיאור
ברוכים הבאים לגירסת SNAP 1.0beta.18.
מעט מדי פרמטרים. שימוש: יחידת הצמדת יישור [ ] איפה
היא רשימה של קבצים לעיבוד.
אפשרויות
-o יישור פלט של שם קובץ לשם הקובץ בפורמט SAM או BAM, בהתאם לקובץ
הרחבה או מפרט סוג מפורש (ראה להלן). השתמש במקף עם סוג מפורש
מפרט לכתוב ל-stdout, כך למשל -o -סאם - יכתוב פלט SAM ל
stdout
-d מרחק עריכה מקסימלי מותר לכל קריאה או זוג (ברירת מחדל: 14)
-n מספר הזרעים לשימוש בכל קריאה
-sc כיסוי זרעים (כלומר, readSize/seedSize). נקודה צפה. בלעדי עם -n.
(שימושי ברירת מחדל -n)
-h מקסימום כניסות שיש לקחת בחשבון לכל זרע (ברירת מחדל: 300)
-גברת מינימום התאמות סיד לכל מיקום (ברירת מחדל: 1)
-t מספר שרשורים (ברירת המחדל היא אחד לכל ליבה)
-b לאגד כל חוט למעבד שלו (זו ברירת המחדל)
--ב אל תקשור כל חוט למעבד שלו (שים לב למקף הכפול)
-P משבית את שליפת המטמון מראש בגנום; עשוי להיות מועיל עבור מכונות עם קטן
מטמונים או הרבה ליבות/מטמון
-לכן מיין את קובץ הפלט לפי מיקום יישור
-sm זיכרון לשימוש למיון ב-Gb
-x חקור כמה להיטים של זרעים פופולריים מדי (שימושי לסינון)
-f עצירה במשחק הראשון בתוך מגבלת מרחק עריכה (מצב סינון)
-F פלט מסנן (a=מיושר בלבד, s=מכה בודדת בלבד (MAPQ >= 10), u=לא מיושר בלבד,
l=ארוך מספיק כדי ליישר (ראה -מרל))
-S לדכא עיבוד נוסף (פלט BAM ממוין בלבד) i=index, d=duplicate
סימון
-I התעלם מזהים שאינם תואמים ביישור הקצה המזווג
-Cxx חייבים לבוא אחריו שני סימנים + או - שאומרים אם לקליד באיכות נמוכה
בסיסים מלפנים ומאחור של קריאה בהתאמה; ברירת מחדל: חזרה בלבד (-ג-+)
-M מציין שמחרוזות CIGAR בקובץ SAM שנוצר צריכות להשתמש ב-M (יישור
התאמה) במקום = ו-X (התאמה של רצף (שגוי). זוהי ברירת המחדל
-= השתמש במחרוזות CIGAR בסגנון החדש עם = ו-X במקום M. ההפך מ -M
-G ציין עונש פער לשימוש בעת יצירת מחרוזות CIGAR
-pf ציין את שם הקובץ שיכיל את מהירות הריצה
- hp מציין לא להשתמש בדפים ענקיים (הדבר עלול להאיץ את טעינת האינדקס ולהאט את הקצב
יישור)
זו ברירת המחדל
-הפ מציין שימוש בדפים ענקיים (הדבר עלול להאיץ את היישור ולהאט את טעינת האינדקס).
-D מציין את עומק החיפוש הנוסף (מרחק העריכה מעבר לפגיעה הטובה ביותר באותו SNAP
משמש לחישוב MAPQ). ברירת מחדל 2
-רג ציין את קבוצת הקריאה המוגדרת כברירת מחדל אם היא לא צוינה בקובץ הקלט
-R ציין את כל שורת קבוצת הקריאה עבור פלט SAM/BAM. זה חייב לכלול תעודה מזהה
תָג. אם זה לא מתחיל עם '@RG' SNAP יוסיף את זה. ציין כרטיסיות לפי \t. שתיים
נטוי אחורי יפיק לוכסן אחורי בודד. נטוי אחורי ואחריו כל דבר אחר
אינו חוקי. אז, '-R @RG\tID:foo\tDS:my data' ייצור קריאות עם תג ברירת מחדל
foo, ושורת @RG שכללה גם את שדה הנתונים DS:my.
-זה כלול קריאות מקובצי SAM או BAM עם המשני (0x100) או המשלים
(0x800) סט דגל; ברירת המחדל היא לשחרר אותם.
-אומ פלט יישורים מרובים. לוקח כפרמטר את מרחק העריכה המקסימלי הנוסף
ביחס ליישור הטוב ביותר כדי לאפשר יישורים משניים
-omax הגבל את מספר היישורים לכל קריאה שנוצרת על ידי -אומ.
פירוש הדבר שאם -אומ ייצור יותר
מֵאֲשֶׁר -omax יישורים משניים, SNAP יכתוב רק את הטובים ביותר -omax שלהם,
כאשר 'הטוב ביותר' פירושו 'עם מרחק העריכה הנמוך ביותר'. הקשרים נשברים באופן שרירותי.
-mpc הגבל את מספר היישורים שנוצרו על ידי -אומ להרבה כל כך
(כניסת כרומוזום/FASTA);
'mpc' פירושו 'מקסימום לכל קונטיג'; ברירת מחדל בלתי מוגבלת.
מסנן זה מוחל לפני -omax. היישור העיקרי
נספר.
-מחשב שמור על הגזירה הרכה לקריאה שמגיעה מקובצי SAM או BAM
-xf הגדל את מקדם ההרחבה עבור קבצי BAM ו-GZ (ברירת מחדל 1.0)
-hdp השתמש בקידומות בסגנון Hadoop (reporter:status:...) בהודעות שגיאה, ופלוט
הודעות התקדמות בסגנון hadoop
-מרל ציין את אורך הקריאה המינימלי ליישור, הקריאה קצרה מזה (לאחר גזירה)
להישאר לא מיושר.
זה צריך להיות
קצת יותר גדול מאורך הזרע או שאתה עשוי לקבל כמה יישורים מפוקפקים.
ברירת מחדל 50
-מַפָּה השתמש במיפוי קבצים כדי לטעון את האינדקס במקום לקרוא אותו.
זה עשוי להאיץ את טעינת האינדקס במקרים
כאשר SNAP מתנהל שוב ושוב על אותו אינדקס, והאינדקס גדול ממחצית
גודל הזיכרון של המכשיר. במערכות הפעלה מסוימות, טעינת אינדקס עם
-מַפָּה הוא הרבה יותר איטי מאשר בלי אם האינדקס אינו בזיכרון. אולי תשקול
מוסיף -מִרֹאשׁ כדי לשלוף מראש את האינדקס למטמון המערכת בעת טעינה עם -מַפָּה כאשר אתה
אל תצפה שהאינדקס יהיה במטמון.
-מִרֹאשׁ שלף מראש את האינדקס למטמון המערכת.
זה משמעותי רק עם -מַפָּה, ועוזר רק אם האינדקס לא
כבר בזיכרון ומערכת ההפעלה שלך איטית בקריאת קבצים ממופים (כלומר,
גרסאות מסוימות של לינוקס, אך לא Windows).
-lp הפעל SNAP בעדיפות תזמון נמוכה (מיושם רק ב-Windows)
-נו No Ukkonen: אל תפחית עריכת חיפוש מרחוק בהתבסס על מועמדים קודמים. זֶה
האפשרות מיועדת אך ורק להערכת השפעת הביצועים של השימוש באלגוריתם של Ukkonen
במקום Smith-Waterman, וציון זה יאט את הביצוע ללא
שיפור היישורים.
-לא אין הזמנה: אל תזמין הערכת קריאות כדי לבחור סביר יותר
מועמדים תחילה. אפשרות זו מיועדת אך ורק להערכת השפעת הביצועים של
סדר הערכת הקריאה, וציונו יאט את הביצוע ללא
שיפור יישורים.
-nt אל תקצץ חיפושים על סמך כניסות זרעים שהוחמצו. אפשרות זו מיועדת אך ורק עבור
הערכת השפעת הביצועים של חיתוך מועמד, וציון זה יהיה
להאט את הביצוע מבלי לשפר יישורים.
-wbs כתוב גודל מאגר במגה בייט. אל תציין זאת אלא אם קיבלת שגיאה
הודעה שאומר להגדיל את זה. ברירת מחדל 16.
אתה יכול לעבד יותר מיישור אחד מבלי להפעיל מחדש את SNAP, ואם אפשר גם בלי
טוען מחדש את האינדקס. על מנת לעשות זאת, רשום בשורת הפקודה את כל הפרמטרים
עבור היישור הראשון, ואחריו פסיק (מופרד ברווח מהשני
פרמטרים) ואחריהם הפרמטרים ליישור הבא (כולל יחיד או
מְזוּוָג). יכול להיות שיש לך כמה כאלה שתרצה. אם שני יישורים עוקבים משתמשים
אותו אינדקס, הוא לא ייטען מחדש. אז, למשל, אתה יכול לעשות 'הצמדת יישור
יחיד hg19-20 foo.fq -o foo.sam , מזווג hg19-20 end1.fq end2.fq -o paired.sam' וזה
לא יטען מחדש את האינדקס בין היישור היחיד והצמד. כאשר מציינים א
קובץ קלט או פלט, אתה יכול פשוט לרשום את שם הקובץ, ובמקרה זה SNAP יסיק את
סוג הקובץ מסיומת הקובץ (.sam או .bam למשל), או שאתה יכול במפורש
ציין את סוג הקובץ על ידי הקדמת שם הקובץ עם אחד מה-
מפרטי הסוגים הבאים (הרגישים לאותיות גדולות):
-fastq
-compressedFastq
-סאם
-באם
-pairedFastq
-pairedInterleavedFastq
-pairedCompressedInterleavedFastq
אז, למשל, אתה יכול לציין -באם input.file כדי לגרום ל-SNAP להתייחס ל-input.file כאל BAM
קובץ, למרות שבדרך כלל הוא מניח קובץ FASTQ לקלט או קובץ SAM עבור
פלט כאשר הוא אינו מזהה את סיומת הקובץ. כדי להשתמש בשם קובץ זה
מתחיל ב-'-' ולא ש-SNAP יתייחס אליו כאל מתג, עליך לציין במפורש את
סוּג. אבל באמת, זה פשוט מבלבל ואתה לא צריך לעשות את זה. קלט ופלט עשויים
להיות גם מ/אל stdin/stdout. כדי לעשות זאת, השתמש ב - עבור שם קובץ הקלט או הפלט ו
תן מפרט סוג מפורש. אז, למשל, snap-aligner aligner single myIndex
-fastq - -o -סאם - יקרא FASTQ מ-stdin ויכתוב SAM ל-stdout.
השתמש ב-snap-aligner-single באינטרנט באמצעות שירותי onworks.net