זוהי הפקודה sigma שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
sigma - יישור מרובה בצע פשוט של רצפי DNA שאינם מקודדים
תַקצִיר
סיגמא [אפשרויות] [inputfile.fasta] [inputfile2.fasta ...]
כל קובץ fasta עשוי להכיל רצף בודד או רצפים מרובים; כל הרצפים יהיו
מיושרים יחד.
תיאור
סיגמא ("יישור מרובה בצע פשוט") היא תוכנית יישור עם אלגוריתם חדש
וסכימת ניקוד שתוכננה במיוחד עבור רצף DNA שאינו מקודד. הוא משתמש באסטרטגיה
של חיפוש אחר היישורים המקומיים ללא פערים הטובים ביותר, בכל שלב לעשות את הטוב ביותר
יישור אפשרי עקבי עם יישורים קיימים, וציון את המשמעות של
יישור מבוסס על אורכי השברים המיושרים ומודל רקע שעשוי
להיות מסופק או מוערך מקובץ עזר של DNA בין-גני. עם נתונים אמיתיים, תוך כדי
לא ניתן לכמת "נכונות" ישירות עבור היישור, תוך הפעלת מוטיב PhyloGibbs
Finder על רצף מיושר מראש מצביע על כך שהיישורים של Sigma עדיפים.
אפשרויות
-A --aligned_output
פלט מיושר, מודפס יפה (השווה עם -F אפשרות) (ברירת מחדל: רק זה). ראה גם
-C.
-b --bgprobfile שם הקובץ
קובץ עזר (בפורמט fasta) שממנו ניתן לקרוא רצפי רקע (נעקף על ידי
-B). בדרך כלל זהו קובץ המכיל כמויות גדולות של אי-קידוד דומה
רצף, שממנו עשויות להיות הסתברויות רקע של יחידים ודי-נוקלאוטידים
מְשׁוֹעָר.
-B --bgseqfile שם הקובץ
קובץ המכיל הסתברויות רקע. הפורמט מתואר בהמשך.
-C --כפות_בלבד
השתמש רק באותיות גדולות ברצף הפלט, לצורך תאימות עם פלט של חלק
תוכניות אחרות כמו ClustalW ו-MLagan. כברירת מחדל, הפלט הוא רישיות מעורבת (כמו ב
Dialign), ובסיסים באותיות קטנות מטופלים כלא מיושרים.
-F --fasta_output
פלט רב-פאסטה (יכול להשתמש בשניהם -A ו -F בכל אחד מהסדרים). ראה גם -C.
-n --ncorrel מספר
מתאם רקע (ברירת מחדל 2=דינוקלאוטיד; 1=מספרי בסיס של אתר יחיד, 0=0.25 לכל
בסיס).
-x, --מַשְׁמָעוּת מספר
הגדר מגבלה למידת הסבירות להתאמה במקרה (ברירת מחדל 0.002, קטן = יותר
קַפְּדָנִי).
-h, - עזרה
מציג רשימה זו של אפשרויות.
נוסף עזרה
הפרמטר "משמעות" (-x) קובע אם יישורים מקומיים יתקבלו או
נִדחֶה. ברירת המחדל כרגע היא 0.002. ניסויים על נתונים סינתטיים (מתוארים ב
נייר) מציעים ש-0.002 הוא בערך הסף שבו סיגמא לא מצליחה להתיישר
נתונים לא קשורים מבחינה פילוגנטית שיש להם מתאם דינוקלאוטיד מתון (דמוי שמרים).
שימוש ב"מודל רקע" המתאים לרצפים המתיישרים מפחית מאוד
יישורים מזויפים על נתונים סינתטיים (ואפשר לקוות גם על נתונים אמיתיים). הדרך הפשוטה ביותר
כדי להבטיח שזה יהיה לספק, דרך -b פרמטר, קובץ בפורמט FASTA המכיל large
כמויות של נתוני רצף דומים (למשל, אם אחד מיישר רצפי שמרים, ספק קובץ
מכיל את כל רצף השמרים הבין-גניים).
במקום זאת, אם תדרים של אתר יחיד ודינוקלאוטיד ידועים כבר, הם
עשוי להיות מסופק בקובץ דרך -B אוֹפְּצִיָה. פורמט הקובץ צריך להיות: ערך אחד לכל
קו, עם המונונוקלאוטיד או הדינוקלאוטיד (לא רגיש לאותיות גדולות) ואחריו
תדירות. (למשל, "A 0.3", "AT 0.16" וכו' בשורות עוקבות.) קובץ לדוגמה נמצא ב-
ספריית המשנה "רקע" של הפצת המקור (במערכות דביאן, קובץ זה יכול להיות
נמצא ב /usr/share/doc/sigma-align/Background מַדרִיך). קובץ כמו
"yeast.nc.3.freq" בספריית המשנה "בדיקות" של הפצת המקור של MEME עובד מצוין
(מתעלמים מספירת טרינוקלאוטידים).
הפניה
נא לצטט את Sigma: Rahul Siddharthan (2006) יישור מרובה של חלש-שמור
רצף DNA לא מקודד BMC Bioinformatics 2006, 7:143 doi:10.1186/1471-2105-7-143
פורסם ב-16 במרץ 2006, זמין באינטרנט בכתובת http://www.biomedcentral.com/1471-2105/7/143/
מחברים
Rahul סידהרתן <[מוגן בדוא"ל]>
כתב סיגמא. אם אתה משתמש ב-Sigma למחקר ממשי, אנא הודע למחבר זאת
שהוא יכול להתריע על תיקוני באגים או מהדורות חדשות.
צ'ארלס פלסי <[מוגן בדוא"ל]>
כתב את ה-manpage ב-DocBook XML עבור הפצת Debian.
זכויות יוצרים
זכויות יוצרים © 2006-2007 Rahul Siddharthan
זכויות יוצרים © 2006-2007 Charles Plessy
סיגמא היא תוכנה חופשית. אתה יכול להפיץ אותו מחדש ו/או לשנות אותו תחת התנאים של
רישיון הציבור הכללי של GNU כפי שפורסם על ידי קרן התוכנה החופשית.
במערכות דביאן, ניתן למצוא את הטקסט המלא של הרישיון הציבורי הכללי של GNU ב
/usr/share/common-licenses/GPL.
השתמש ב-sigma באינטרנט באמצעות שירותי onworks.net