ריי - אונליין בענן

זוהי הפקודה Ray שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות החינמיות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS.

תָכְנִית:

שֵׁם


ריי - הרכבת גנומים במקביל באמצעות ממשק העברת המסרים

תַקצִיר


mpiexec -n NUMBER_OF_RANKS ריי -k אורך קמר -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o מבחן

mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # עם פקודות בקובץ

תיאור:


אסמבלר הגנום של Ray בנוי על גבי RayPlatform, תוסף גנרי מבוסס תוסף
מנוע חישוב מבוזר ומקביל המשתמש בממשק העברת הודעות עבור
העברת הודעות.

ריי מכוון למספר יישומים:

- הרכבת גנום דה נובו (עם ריי וניל) - הרכבת מטא-גנום דה נובו (עם
ריי מטא) - הרכבת טרנסקריפטום דה נובו (עובדת, אך לא נבדקה הרבה) -
כימות של שפע של קבוצות מיקרוביום - כימות של קונסורציומים
חברים (עם קהילות ריי) - כימות ביטוי תמליל - טקסונומיה
יצירת פרופיל של דגימות (עם קהילות ריי) - יצירת פרופיל של דגימות באונטולוגיה גנטית
(עם Ray Ontologies)

עזרה

מציג דף עזרה זה.

-הפך

מציג גרסת Ray ואפשרויות קומפילציה.

שימוש בקובץ תצורה

ניתן להפעיל את Ray באמצעות mpiexec -n 16 Ray Ray.conf קובץ התצורה יכול
כלול הערות (החל מ-#).

אורך K-mer

-k אורך ק"מ

בוחר את אורך ה-k-mers. ערך ברירת המחדל הוא 21. הוא חייב להיות אי-זוגי מכיוון
קודקודים בעלי השלמה הפוכה מאוחסנים יחד. האורך המקסימלי מוגדר ב
קומפילציה על ידי MAXKMERLENGTH k-mers גדולים יותר משתמשים ביותר זיכרון.

תשומות

-p קובץ רצף שמאלי קובץ רצף ימני [ממוצע מרחק חיצוני סטייה סטנדרטית]

מספק שני קבצים המכילים קריאות זוגיות. averageOuterDistance ו-
standardDeviation מחושבים אוטומטית אם לא סופקו.

-i קובץ רצף משולב [סטיית תקן ממוצעת של מרחק חיצוני]

מספק קובץ אחד המכיל קריאות זוגיות משולבות. averageOuterDistance
ו-standardDeviation מחושבים אוטומטית אם לא סופקו.

-s קובץ רצף

מספק קובץ המכיל קריאות חד-צדדיות.

יציאות

-o ספריית פלט

מציין את הספרייה עבור קבצי הפלט. ברירת המחדל היא RayOutput

אפשרויות הרכבה (ברירות המחדל פועלות היטב)

-השבתת-מיחזור

מבטל מיחזור קריאה במהלך ההרכבה, הקריאות ישוחררו ב-3 מקרים: 1.
2. המרחק לא תאם עבור זוג 3. הקריאה לא פגשה את בן זוגה XNUMX. ה
אכלוס ספרייה מצביע על מיקום שגוי ראה חצייה מוגבלת של חזרות
עם רצפים זוגיים. סבסטיאן בויסוורט, אלני גודזארידיס, פרנסואה לוויולט
וז'אק קורביל. סדנת RECOMB השנתית הראשונה בנושא לוויינים מקבילים באופן מסיבי
ריצוף, 26-27 במרץ 2011, ונקובר, קולומביה הבריטית, קנדה.

פיגומים-השבתה

משבית את בונה הפיגומים.

אורך מינימלי של רצף אורך קונטיק מינימלי

משנה את אורך החיבור המינימלי, ברירת המחדל היא 100 נוקלאוטידים

-מרחב-צבעים

פועל במרחב צבעים. דורש קבצי csfasta. מופעל אוטומטית אם קבצי csfasta
מסופקים.

-שימוש בכיסוי זרעים מקסימלי עומק כיסוי זרעים מקסימלי

מתעלם מכל זרע עם עומק כיסוי מעל סף זה. ברירת המחדל היא
4294967295.

השתמש בכיסוי זרעים מינימלי עומק כיסוי זרעים מינימלי

קובע את עומק כיסוי הזרעים המינימלי. כל נתיב עם עומק כיסוי נמוך מ
זה יימחק. ברירת המחדל היא 0.

מנוע אחסון מבוזר (כל הערכים הללו הם עבור כל דירוג MPI)

-bloom-filter-bits ביטים

קובע את מספר הביטים עבור מסנן Bloom. ברירת המחדל היא 268435456 ביטים, 0 ביטים.
מבטל את מסנן בלום.

דליים של טבלת גיבוב דליים

קובע את המספר ההתחלתי של דליים. חייב להיות חזקה של 2! ערך ברירת מחדל:
268435456

דליים-לכל-קבוצה - טבלת-hash דליים

קובע את מספר הדליים לכל קבוצה עבור אחסון דליל. ערך ברירת מחדל: 64, חייב להיות
בין >=1 ל-<= 64

סף גורם העומס של טבלת גיבוב סף

קובע את סף גורם העומס לשינוי גודל בזמן אמת. ערך ברירת מחדל: 0.75, חייב להיות
>= 0.5 ו-< 1

-hash-table-verbosity

מפעיל את רמת המלל עבור מנוע האחסון המבוזר

שפע ביולוגי

-לחפש מדריך חיפוש

מספק ספרייה המכילה קבצי fasta לחיפוש בגרף דה ברוין.
שפע ביולוגי ייכתב ל-RayOutput/BiologicalAbundances ראה
תיעוד/שפע ביולוגי.txt

צבע אחד לכל קובץ

מגדיר צבע אחד לכל קובץ במקום אחד לכל רצף. כברירת מחדל, כל רצף ב
לכל קובץ יש צבע שונה. עבור קבצים עם מספר רב של רצפים, באמצעות
צבע אחד בודד לכל קובץ עשוי להיות יעיל יותר.

פרופיל טקסונומי עם גרפים צבעוניים של דה Bruijn

עם טקסונומיה גנום-לטקסון.tsv TreeOfLife-Edges.tsv שמות-טקסון.tsv

מספק טקסונומיה. מחשב וכותב פרופילים טקסונומיים מפורטים. ראה
לפרטים נוספים, בקרו ב-Documentation/Taxonomy.txt.

אונטולוגיה גנטית קובץ OntologyTerms.txt
קובץ הערות.txt

מספק אונטולוגיה והערות. קובץ OntologyTerms.txt נלקח מ-
http://geneontology.org Annotations.txt הוא קובץ בן שתי עמודות (EMBL_CDS handle &
מזהה אונטולוגיה גנטית) ראה תיעוד/GeneOntology.txt

פלטים אחרים

-אפשר-שכונות

מחשב שכונות קונטיג בקובץ הפלט של גרף דה Bruijn:
RayOutput/NeighbourhoodRelations.txt

עמוס

כותב את קובץ AMOS בשם RayOutput/AMOS.afg קובץ AMOS מכיל מיקומי קריאה
ניתן לפתוח באמצעות תוכנה עם ממשק משתמש גרפי.

-כתיבה-קמרים

כותב גרף k-mer ל- RayOutput/kmers.txt הקובץ שנוצר אינו מנוצל על ידי
ריי. הקובץ שנוצר גדול מאוד.

סמני כתיבה-קריאה

כותב סמני קריאה לדיסק.

-כתיבה-זרעים

כותב רצפי DNA של זרעים ל-RayOutput/Rank .RaySeeds.fasta

הרחבות-כתיבה

כותב רצפי DNA של הרחבה ל-RayOutput/Rank .RayExtensions.fasta

-write-contig-paths

כותב נתיבי contig עם ערכי כיסוי ל-RayOutput/Rank .RayContigPaths.txt

סיכום סמן-כתיבה

כותב סטטיסטיקות של סמנים.

שימוש בזיכרון

-הצג-שימוש-בזיכרון

מציג את ניצול הזיכרון. הנתונים נלקחים מ / proc על גנו/לינוקס צריך __linux__

-הצג-הקצאות-זיכרון

מציג אירועי הקצאת זיכרון

רמת המפורטות של האלגוריתם

-הצג-בחירת-הרחבה

מציג את הבחירה שנעשתה (יחד עם בחירות אחרות) במהלך ההרחבה.

הקשר של סוף המופע

מציג את ההקשר הסיום של כל הרחבה. מציג את ילדי הקודקוד שבו
ההרחבה הייתה קשה מדי.

סיכום מרחק -show-distance-succession

מציג סיכום של מרחקים חיצוניים המשמשים עבור נתיב הרחבה.

-הצגת-קונצנזוס

מראה את הקונצנזוס כאשר נעשית בחירה.

נקודת ביקורת

נקודות בדיקה -כתיבה מדריך נקודות ביקורת

כתיבת קבצי נקודת ביקורת

נקודות בדיקה -קריאה מדריך נקודות ביקורת

קריאת קבצי נקודת ביקורת

נקודות בדיקה של קריאה-כתיבה מדריך נקודות ביקורת

קריאה וכתיבה של קבצי נקודת ביקורת

ניתוב הודעות עבור מספר רב של ליבות

הודעות-מסלול

מפעיל את נתב ההודעות של Ray. מושבת כברירת מחדל. ההודעות ינותבו
בהתאם כך שכל דרגה תוכל לתקשר ישירות עם מעטים אחרים בלבד.
ללא הודעות-מסלול, כל דרגה יכולה לתקשר ישירות עם כל דרגה אחרת.
קבצים שנוצרו: Routing/Connections.txt, Routing/Routes.txt ו-
קובץ Routing/RelayEvents.txt וקובץ Routing/Summary.txt

סוג-חיבור סוג

קובע את סוג החיבור עבור נתיבים. ערכים מקובלים הם debruijn, hypercube,
פוליטופ, קבוצה, אקראי, kautz ושלם. ברירת המחדל היא debruijn.

debruijn: גרף מלא של דה Bruijn של אלפבית נתון וקוטר היפרקובייה: א
היפרקוביה, האלפבית היא {0,1} והקודקודים הם חזקה של 2 פוליטופ: קמור
פוליטופ רגיל, האלפבית הוא {0,1,...,B-1} והקודקודים הם חזקה של חבורה B:
מודל טיפשי שבו נציג אחד מכל קבוצה יכול לתקשר עם זרים
אקראי: מודל ארדוש-רני קאוץ: גרף קאוץ מלא של דה, שהוא תת-גרף של דה
גרף ברוין שלם: גרף מלא עם כל הקשרים האפשריים

עם הטיפוס debruijn, מספר הדרגות חייב להיות חזקה של משהו.
דוגמאות: 256 = 16*16, 512=8*8*8, 49=7*7, וכן הלאה. אחרת, אין להשתמש ב-debruijn.
ניתוב אבל השתמש בניתוב אחר. עם הסוג kautz, מספר הדרגות n חייב להיות
n=(k+1)*k^(d-1) עבור k ו-d מסוימים

-ניתוב-גרף-מעלות תוֹאַר

מציין את המעלה היוצאת עבור גרף הניתוב. ראה Documentation/Routing.txt

בדיקת חומרה

רשת-בדיקה-בלבד

בודק את הרשת ומחזיר.

-כתיבת-נתוני-גלם-בדיקת-רשת

כותב קובץ נוסף אחד לכל דרגה המפרט את בדיקת הרשת.

-החלפות מספר חילופי דברים

קובע את מספר ההחלפות

-השבתת בדיקת רשת

דילוג על בדיקת הרשת.

Debugging

אימות שלמות ההודעה

בודק את מהימנות נתוני ההודעה עבור כל הודעה שאינה ריקה. הוסף '-D CONFIG_SSE_4_2'
בקובץ Makefile לשימוש בהוראת חומרה (SSE 4.2)

-run-profiler

מפעיל את הפרופילר בזמן שהקוד פועל. כברירת מחדל, מציג רק אזהרות פירוט.
הפעלת הפרופילר מגדילה את זמני הריצה.

עם פרטי הפרופילר

מציג את מספר ההודעות שנשלחו והתקבלו בכל שיטה במהלך כל זמן
פרוסות (תקופות). צרכים -run-profiler.

אירועי תקשורת-מופעים

מציג את כל ההודעות שנשלחו והתקבלו.

-הצג-קריאה-מיקום

מציג את מיקום הקריאה בגרף במהלך ההרחבה.

בועות ניפוי שגיאות

ניפוי באגים בקוד בועות. בועות יכולות לנבוע מאתרים הטרוזיגוטיים או משגיאות ריצוף.
או אירועים אחרים (לא ידועים)

-ניפוי-זרעים

ניפוי באגים בקוד seed. Seeds הם נתיבים בגרף שסביר להניח שהם ייחודיים.

-ניפוי-באגים-היתוכים

ניפוי באגים בקוד היתוך.

-ניפוי שגיאות-פיגומים

ניפוי באגים בבניית הפיגומים.

קבצים

קבצי קלט

הערה: פורמט הקובץ נקבע לפי סיומת הקובץ.

.fasta .fasta.gz (צריך HAVE_LIBZ=y בעת הקומפילציה) .fasta.bz2 (צריך HAVE_LIBBZ2=y)
(בקומפילציה) .fastq .fastq.gz (צריך HAVE_LIBZ=y בקומפילציה) .fastq.bz2
(צריך HAVE_LIBBZ2=y בעת הקומפילציה) .sff (יש לחלץ ידנית את הקריאות המזווגות)
.csfasta (קריאת מרחב צבעים)

קבצים שנפלטו

פיגומים

RayOutput/Scaffolds.fasta

רצפי הפיגום בפורמט FASTA

RayOutput/ScaffoldComponents.txt

הרכיבים של כל פיגום

RayOutput/ScaffoldLengths.txt

אורך כל פיגום

קישורי RayOutput/ScaffoldLinks.txt

קישורי פיגומים

קונטיגס

RayOutput/Contigs.fasta

רצפים רציפים בפורמט FASTA

RayOutput/ContigLengths.txt

אורכי הרצפים הרציפים

<br> סיכום

RayOutput/OutputNumbers.txt

מספרים כוללים עבור האסיפה

גרף דה ברוין

RayOutput/CoverageDistribution.txt

התפלגות ערכי הכיסוי

ניתוח תפוקת קרניים/הפצת כיסוי.txt

ניתוח התפלגות הכיסוי

RayOutput/degreeDistribution.txt

התפלגות תארים נכנסים ויוצאים

RayOutput/kmers.txt

גרף k-mer, אפשרות נדרשת: -כתיבה-קמרים

הקובץ שנוצר אינו בשימוש על ידי ריי. הקובץ שנוצר גדול מאוד.

שלבי הרכבה

RayOutput/SeedLengthDistribution.txt

התפלגות אורך הזרעים

תפוקת ריי/דירוג .OptimalReadMarkers.txt

קרא סמנים.

תפוקת ריי/דירוג .RaySeeds.fasta

רצפי DNA של זרעים, אפשרות חובה: -כתיבה-זרעים

תפוקת ריי/דירוג .RayExtensions.fasta

רצפי DNA של הרחבה, אפשרות חובה: הרחבות-כתיבה

תפוקת ריי/דירוג .RayContigPaths.txt

נתיבי קונטיג עם ערכי כיסוי, אפשרות נדרשת: -write-contig-paths

קריאות מזווגות

RayOutput/LibraryStatistics.txt

הערכת מרחקים חיצוניים עבור קריאות מזווגות

RayOutput/ספרייה קובץ .txt

תדרים עבור מרחקים חיצוניים נצפים (גודל הכנס + אורכי קריאה)

חלוקה

RayOutput/NumberOfSequences.txt

מספר הקריאות בכל קובץ

RayOutput/SequencePartition.txt

מחיצת רצף

תוכנת ריי

RayOutput/RayVersion.txt

הגרסה של ריי

RayOutput/RayCommand.txt

אותה פקודה בדיוק שניתנה

AMOS

RayOutput/AMOS.afg

ייצוג הרכבה בפורמט AMOS, אפשרות נדרשת: עמוס

תקשורת

RayOutput/MessagePassingInterface.txt

מספר ההודעות שנשלחו

RayOutput/NetworkTest.txt

השהיות במיקרו-שניות

תפוקת ריי/דירוג נתוני בדיקת רשת.txt

נתונים גולמיים של בדיקת רשת

תיעוד

- mpiexec -n קרן אחת עזרה|less (תמיד מעודכן) - דף עזרה זה (תמיד
מעודכן) - מדריך התיעוד/ - מדריך (פורמט מסמך נייד):
InstructionManual.tex (בתיעוד) - ארכיון רשימת תפוצה:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-users

AUTHOR

נכתב על ידי סבסטיאן בואיברט.

דיווח על באגים

דווח על באגים ל denovoassembler-users@lists.sourceforge.net דף הבית:
<http://denovoassembler.sourceforge.net/>

זכויות יוצרים

תוכנית זו היא תוכנה חופשית: ניתן להפיץ אותה מחדש ו/או לשנות אותה תחת
תנאי הרישיון הציבורי הכללי של GNU כפי שפורסמו על ידי התוכנה החופשית
קרן, גרסה 3 של הרישיון.

תוכנית זו מופצת בתקווה שהיא תהיה שימושית, אך ללא כל
אַחֲרָיוּת; אפילו ללא האחריות המשתמעת של סחירות או התאמה ל-A
מטרה מסוימת. ראה את הרישיון הציבורי הכללי של GNU לפרטים נוספים.

קיבלת עותק של הרישיון הציבורי הכללי של GNU יחד עם תוכנית זו.
(ראה רישיון).

ריי 2.1.0

רישיון עבור Ray: רישיון ציבורי כללי של GNU גרסה 3, רישיון RayPlatform גרסה: רישיון 1.1.0
עבור RayPlatform: רישיון ציבורי כללי קטן של GNU גרסה 3

MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 עומק כיסוי מקסימלי המאוחסן על ידי CoverageDepth:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 בתים FORCE_PACKING = n ASSERT = n
HAVE_LIBZ = y HAVE_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y תקן MPI
גרסה: MPI 2.1 ספריית MPI: Open-MPI 1.4.2 מהדר: GNU gcc/g++ 4.4.5

השתמשו ב-Ray באופן מקוון באמצעות שירותי onworks.net



התוכניות המקוונות האחרונות של לינוקס ו-Windows