الإنجليزيةالفرنسيةالإسبانية

OnWorks فافيكون

سرب - عبر الإنترنت في السحابة

قم بتشغيل swarm في مزود استضافة OnWorks المجاني عبر Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

هذا هو سرب الأوامر الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


سرب - ابحث عن مجموعات من أمبليكونات النوكليوتيدات المتطابقة تقريبًا

موجز


سرب [ الخيارات ] اسم الملف

الوصف


تولد الدراسات الجزيئية البيئية أو السريرية كميات كبيرة من الأمبليكون (على سبيل المثال ، 16S
أو 18S SSU-rRNA) التي تحتاج إلى تجميعها في تصنيف تشغيلي جزيئي
الوحدات (OTUs). تعتمد طرق التجميع الشائعة على الجشع الذي يعتمد على ترتيب المدخلات
الخوارزميات ، مع الاختيار التعسفي لحجم الكتلة العالمي والنقاط المركزية العنقودية. ل
معالجة هذه المشكلة ، قمنا بتطويرها سرب، وهي طريقة سريعة وقوية تتجمع بشكل متكرر
أمبليكونس مع d أو أقل من الاختلافات. سرب تنتج مجموعات طبيعية ومستقرة تتمحور
على قمم الوفرة المحلية ، وخالية من التبعية التي يسببها الاختيار النقطي لأمر المدخلات.

التجميع الدقيق غير عملي على مجموعات البيانات الكبيرة عند استخدام نهج ساذج للجميع مقابل الكل
(بتعبير أدق 2 تركيبة بدون تكرار) ، لأنها تشير إلى أعداد غير واقعية من
مقارنات زوجية. سرب يستند إلى أقصى عدد من الاختلافات d بين اثنين
amplicons ، ويركز فقط على العلاقات المحلية الوثيقة جدًا. ل d = 1 (القيمة الافتراضية) ،
يستخدم السرب خوارزمية التعقيد الخطي التي تؤدي مطابقة السلسلة بدقة بواسطة
مقارنة قيم التجزئة. ل d = 2 أو أكثر ، يستخدم السرب خوارزمية تربيعية
التعقيد الذي يقوم بإجراء مقارنات سلسلة زوجية. فعال kالتصفية على أساس التجارة
والاستخدام الذكي لنتائج المقارنات التي تم الحصول عليها أثناء عملية التجميع يسمح بذلك
تجنب معظم مقارنات amplicon اللازمة في نهج ساذج. لتسريع
مقارنات amplicon المتبقية ، سرب تنفذ Needleman-Wunsch سريع للغاية
خوارزمية تستخدم امتدادات SIMD المتدفقة (SSE2) لوحدات المعالجة المركزية الحديثة x86-64. لو
تعليمات SSE2 غير متوفرة ، سرب يخرج برسالة خطأ.

سرب يقرأ المدخلات المسماة اسم الملف، ملف فاستا من أمبليكون النوكليوتيدات. أمبليكون
المعرف هو السلسلة المكونة بين الرمز ">" والمسافة الأولى
أو نهاية السطر ، أيهما يأتي أولاً. مثل سرب قوائم مخرجات amplicon
المعرفات ، يجب أن تكون معرفات amplicon فريدة لتجنب الغموض ؛ سرب مخارج مع
رسالة خطأ إذا لم تكن المعرفات فريدة. يجب أن تنتهي معرّفات Amplicon بـ "_"
متبوعًا بعدد صحيح موجب يمثل رقم نسخة amplicon (أو الوفرة
حاشية. ملاحظة؛ يمكن لمستخدمي usearch / vsearch استخدام الخيار -z لتغيير هذا السلوك).
تلعب التعليقات التوضيحية الوفيرة دورًا حاسمًا في عملية التجميع ومخارج السرب مع
رسالة خطأ إذا كانت هذه المعلومات غير متوفرة. يتم تعريف تسلسل amplicon على أنه
سلسلة من الرموز [acgt] أو [acgu] (غير حساسة لحالة الأحرف) ، تبدأ بعد نهاية
سطر المعرف وينتهي قبل سطر المعرف التالي أو نهاية الملف ؛ سرب مخارج
مع ظهور رسالة خطأ في حالة وجود أي رمز آخر.

أسئلة عامة الخيارات
-b, - الحدود إيجابي عدد صحيح
عند استخدام الخيار - ثابت (-f) ، حدد الحد الأدنى لكتلة OTU كبيرة
كرقم معطى مع هذا الخيار. القيمة الافتراضية هي 3 ، مما يشير إلى أي
تعتبر OTU ذات الكتلة 3 أو أكثر "كبيرة". بشكل افتراضي ، تكون OTU "صغيرة" إذا
كتلته 2 أو أقل ، مما يعني أنه يتكون من أمبليكون واحد من
وفرة 2 أو أمبليكونان بكثرة 1. أي قيمة موجبة أكبر من 1
يمكن تحديدها. سيؤدي استخدام قيم حد أعلى إلى تسريع التمرير الثاني ، لكن
يقلل أيضًا من الدقة التصنيفية لـ سرب النتائج.

-c, --سقف إيجابي عدد صحيح
عند استخدام الخيار - ثابت (-f) ، حدد سربالبصمة القصوى للذاكرة
(بالميجابايت). سرب سيعمل على ضبط قيمة - bloom-bits (-y) لمرشح Bloom
لتتناسب مع المقدار المحدد من الذاكرة. هذا الخيار غير نشط بواسطة
افتراضي.

-d, --اختلافات صفر or إيجابي عدد صحيح
أقصى عدد مسموح به للاختلافات بين أمبليكونين ، مما يعني أن اثنين
سيتم تجميع أمبليكونس إذا كان لديهم عدد صحيح (أو أقل) الاختلافات. هذا هو
سربالمعلمة الأكثر أهمية. يتم حساب عدد الاختلافات على أنها
عدد حالات عدم التطابق (الاستبدالات أو عمليات الإدراج أو الحذف) بين الاثنين
amplicons بمجرد العثور على المحاذاة العامة الزوجية المثلى (انظر
"خيارات المحاذاة الزوجية المتقدمة" للتأثير على تلك الخطوة). أي عدد صحيح
بين 0 و 256 يمكن استخدامها ، لكنها عالية d سوف تقلل القيم التصنيفية
قرار من سرب نتائج. الاكثر استعمالا d القيم هي 1 أو 2 أو 3 ، ونادراً ما تكون أعلى.
عند استخدام d = 0، سرب ستخرج النتائج المطابقة لـ صارم
إلغاء نسخ مجموعة البيانات ، أي دمج أمبليكونات متطابقة. تحذير، سرب
لا يزال يتطلب إدخالات fasta لتقديم قيم الوفرة. الرقم الافتراضي لـ
الاختلافات هي 1.

-f, - ثابته
عند العمل مع d = 1 ، قم بإجراء تمريرة تجميع ثانية لتقليل عدد
OTUs الصغيرة (الخيار الموصى به). أثناء عملية التجميع باستخدام d = 1 ، أ
يمكن أن يكون amplicon الوسيط مفقودًا لأسباب عشوائية بحتة ، المقاطعة
عملية التجميع. سيؤدي هذا الخيار إلى إنشاء أمبليكونات افتراضية ، مما يسمح لـ
الكسب غير المشروع OTUs الصغيرة على الأكبر منها. بشكل افتراضي ، تكون OTU "صغيرة" إذا كانت لها كتلة
من 2 أو أقل (راجع خيار الحدود لزيادة تلك القيمة). لتسريع الأمور
فوق، سرب يستخدم مرشح Bloom لتخزين النتائج الوسيطة. تحذير ، تلك الثانية
يمكن أن يكون التمرير أبطأ مرتين إلى ثلاث مرات من التمريرة الأولى ويتطلب أكثر من ذلك بكثير
ذاكرة. انظر الخيارات - bloom-bits (-y) أو --ceiling (-c) للتحكم في الذاكرة
بصمة مرشح بلوم. تحذير ، يعدل الخيار شديد الحساسية التجميع
نتائج. الملفات الناتجة التي تنتجها الخيارات --log (-l) ، --output-file (-o) ،
--mothur (-r) و --uclust-file و- البذور (-w) يتم تحديثها لتعكس هذه
التعديلات. تم تحديث الملف - ملف الإحصائيات جزئيًا (الأعمدة 6
و 7 لم يتم تحديثها) ؛ ملف الإخراج - لم يتم تحديث البنية الداخلية (-i).

-h, --مساعدة
عرض هذه المساعدة والخروج.

-n, - لا-كسر
قم بإلغاء تنشيط تحسين OTU المدمج (غير مستحسن). وفرة Amplicon
يتم استخدام القيم لتحديد الانتقالات بين OTUs أثناء الاتصال والفصل
منهم ، مما يؤدي إلى نتائج تجميع عالية الدقة. هذا الخيار يمنع ذلك
يسمح الفصل ، وعمليًا ، بإنشاء ارتباط بين الأمبليونات أ
و B ، حتى لو كانت وفرة B أعلى من وفرة A.

-t, --الخيوط إيجابي عدد صحيح
عدد الخيوط الحسابية المراد استخدامها. يجب أن يكون عدد الخيوط أقل أو
يساوي عدد أنوية وحدة المعالجة المركزية المتاحة. العدد الافتراضي للخيوط هو 1.

-v, --الإصدار
إخراج معلومات الإصدار والخروج.

-y, - بت ازدهار إيجابي عدد صحيح
عند استخدام الخيار - ثابت (-f) ، حدد الحجم (بالبتات) لكل إدخال
في مرشح بلوم. يسمح هذا الخيار بموازنة الكفاءة (أي السرعة)
وبصمة ذاكرة مرشح Bloom. القيم الكبيرة ستجعل التفتح
مرشح أكثر كفاءة ولكنه يتطلب المزيد من الذاكرة. أي قيمة بين 4 و 20
ممكن استخدامه. القيمة الافتراضية هي 16. راجع الخيار --ceiling (-c) للحصول على ملف
طريقة بديلة للتحكم في بصمة الذاكرة.

الإدخال / الإخراج الخيارات
-a, - وفرة إيجابي عدد صحيح
تعيين قيمة الوفرة لاستخدامها عند نقص بعض أو كل الأمبليكونات في ملف الإدخال
قيم الوفرة. تحذير ، لا ينصح باستخدامه سرب على مجموعات البيانات حيث
قيم الوفرة كلها متطابقة. نحن نقدم هذا الخيار على سبيل المجاملة
المستخدمين المتقدمين ، يرجى استخدامه بعناية. سرب يخرج مع رسالة خطأ إذا
قيم الوفرة مفقودة وفي حالة عدم استخدام هذا الخيار.

-i, --الهيكل الداخلي اسم الملف
إخراج جميع أزواج أمبليكونات متطابقة تقريبًا إلى اسم الملف باستخدام خمسة أعمدة
تنسيق محدد بعلامات جدولة:

1. amplicon التسمية.

2. تسمية أمبليكون ب.

3. عدد الفروق بين الأمبليكسين A و B (إيجابي عدد صحيح).

4. رقم OTU (إيجابي عدد صحيح). يتم ترقيم OTUs بترتيبهم من
ترسيم ، بدءًا من 1. جميع أزواج الأمبليونات التي تنتمي إلى
سيحصل نفس OTU على نفس الرقم.

5. عدد الخطوات من بذرة OTU إلى amplicon B (إيجابي عدد صحيح).

-l, --سجل اسم الملف
إخراج جميع الرسائل إلى اسم الملف بدلا من معيار خطأ، فيما عدا
رسائل الخطأ بالطبع. هذا الخيار مفيد في المواقف التي يكون فيها الكتابة
معيار خطأ إشكالية (على سبيل المثال ، مع جدولة وظائف معينة).

-o, --ملف إلاخراج اسم الملف
نتائج تجميع الإخراج إلى اسم الملف. تتكون النتائج من قائمة OTUs ، OTU واحد
في كل سطر. OTU هي قائمة معرفات amplicon مفصولة بمسافات. تقصير
هو الكتابة إلى الإخراج القياسي.

-r, - موثر
ينتج تجميع الإخراج بتنسيق متوافق مع Mothur. هذا الخيار
يعدل سربتنسيق الإخراج الافتراضي.

-s, - ملف الإحصاء اسم الملف
إحصاءات الإخراج إلى اسم الملف. الملف عبارة عن جدول مفصول بعلامات جدولة مع وحدة OTU واحدة لكل ملف
صف وسبعة أعمدة للمعلومات:

1. عدد الأمبليكونات الفريدة في OTU ،

2. إجمالي عدد نسخ الأمبليكون في OTU ،

3. معرف البذور الأولية ،

4. رقم النسخة الأولية ،

5. عدد أمبليكونس مع رقم نسخة 1 في OTU ،

6. الحد الأقصى لعدد التكرارات قبل أن تصل OTU إلى طبيعتها
حدود) ،

7. أقصى نصف قطر نظري لـ OTU (أي عدد المحولات
الفروق بين البذرة و amplicon الأبعد في OTU).
غالبًا ما يكون نصف القطر الأقصى الفعلي لـ OTU أصغر بكثير.

-u, - ملف اسم الملف
ينتج عن تجميع الإخراج بتنسيق ملف يشبه uclust إلى الملف المحدد. الذي - التي
الخيار لا يعدل سربتنسيق الإخراج الافتراضي.

-w, --بذور اسم الملف
ممثلو الإخراج OTU إلى اسم الملف في شكل فاستا. قيمة الوفرة
كل ممثل هو مجموع وفرة جميع الأمبليكونات في OTU.

-z, - وفرة البحث
قبول قيم وفرة amplicon في أسلوب usearch / vsearch
(> التسمية ؛ الحجم =عدد صحيح[؛]). يؤثر هذا الخيار على أسلوب التعليق التوضيحي الوفير
تستخدم في ملفات الإخراج.

ثنائي اكتساب متقدم الخيارات
عند استخدام d > 1 ، سرب يتعرف على خيارات سطر الأوامر المتقدمة التي تعدل الزوج
معلمات تسجيل المحاذاة العامة:

-m, - مباراة-مكافأة إيجابي عدد صحيح
تعيين المكافأة لمباراة النوكليوتيدات. الافتراضي هو 5.

-p, - ركلة جزاء إيجابي عدد صحيح
تعيين عقوبة لعدم تطابق النوكليوتيدات. الافتراضي هو 4.

-g, - ركلة جزاء فتح فجوة إيجابي عدد صحيح
تعيين عقوبة الفجوة المفتوحة. الافتراضي هو 12.

-e, - فجوة-تمديد-جزاء إيجابي عدد صحيح
تعيين عقوبة تمديد الفجوة. الافتراضي هو 4.

As سرب يركز على العلاقات الوثيقة (أي d = 2 أو 3) ، نتائج التجميع هي
مرنة لتعديل معلمات نموذج المحاذاة الزوجية. تعديل معلمات النموذج
له تأثير أقوى عند التجميع باستخدام أعلى d .

أمثلة


تجميع مجموعة البيانات myfile.fasta في OTUs بأعلى دقة ممكنة (1
فرق ، كسر مدمج ، خيار صعب) باستخدام 4 خيوط حسابية. OTUs هي
مكتوب في الملف myfile.swarms، وممثلي OTU مكتوبون إلى
myfile.representatives.fasta.

سرب -ر 4 -و -ث myfile.representatives.fasta < myfile.fasta > myfile.swarms

مؤلفون


مفهوم من قبل فريديريك ماهي ، وتنفيذه توربيورن روجنيس.

الاقتباس


Mahé F ، Rognes T ، Quince C ، de Vargas C ، Dunthorn M. (2014) Swarm: قوي وسريع
طريقة التجميع للدراسات المستندة إلى amplicon. PeerJ 2: e593
<http://dx.doi.org/10.7717/peerj.593>

Mahé F ، و Rognes T ، و Quince C ، و de Vargas C ، و Dunthorn M. (2015) Swarm v2: قابل للتطوير بدرجة عالية و
تجميع amplicon عالي الدقة. PeerJ 3: 1420 هـhttp://dx.doi.org/10.7717/peerj.1420>

التبليغ بق


إرسال الاقتراحات وتقارير الأخطاء على ، ارسل
طلب سحب على ، أو يؤلف كتابًا ودودًا أو فظًا
بريد إلكتروني إلى Frédéric Mahé[البريد الإلكتروني محمي]> و Torbjørn Rognes[البريد الإلكتروني محمي]>.

التوفر


البرنامج متاح من

حقوق الطبع والنشر


حقوق النشر (C) 2012 ، 2013 ، 2014 ، 2015 Frédéric Mahé & Torbjørn Rognes

هذا البرنامج هو برنامج مجاني: يمكنك إعادة توزيعه و / أو تعديله بموجب شروط
رخصة جنو أفيرو العامة كما نشرتها مؤسسة البرمجيات الحرة ، أيضًا
الإصدار 3 من الترخيص ، أو أي إصدار لاحق.

يتم توزيع هذا البرنامج على أمل أن يكون مفيدًا ، ولكن بدون أي ضمان ؛
حتى بدون الضمان الضمني لقابلية التسويق أو الملاءمة لغرض معين.
راجع رخصة جنو أفيرو العمومية لمزيد من التفاصيل.

يجب أن تكون قد تلقيت نسخة من رخصة جنو أفيرو العمومية مع هذا
برنامج. إذا لم يكن كذلك ، انظرhttp://www.gnu.org/licenses/>.

استخدم السرب عبر الإنترنت باستخدام خدمات onworks.net


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

  • 1
    مدير PAC
    مدير PAC
    PAC هو بديل Perl / GTK لـ
    SecureCRT / المعجون / إلخ (لينكس
    ssh / telnet / ... gui) ... يوفر واجهة المستخدم الرسومية
    لتكوين الاتصالات: المستخدمين ،
    كلمات المرور ، توقع التنظيم ...
    تنزيل مدير PAC
  • 2
    GeoServer
    GeoServer
    GeoServer هو برنامج مفتوح المصدر
    خادم مكتوب بلغة Java يسمح للمستخدمين
    لمشاركة البيانات الجغرافية المكانية وتحريرها.
    مصممة للتشغيل البيني
    تنشر دا ...
    تنزيل GeoServer
  • 3
    اليراع الثالث
    اليراع الثالث
    تمويل شخصي مجاني ومفتوح المصدر
    إدارة. ميزات Firefly III أ
    نظام مسك الدفاتر مزدوج القيد. تستطيع
    أدخل بسرعة ونظم ملفات
    المعاملات ط ...
    تحميل فايرفلاي III
  • 4
    ملحقات أباتشي أوبن أوفيس
    ملحقات أباتشي أوبن أوفيس
    الكتالوج الرسمي لأباتشي
    ملحقات OpenOffice. ستجد
    امتدادات تتراوح من القواميس إلى
    أدوات لاستيراد ملفات PDF والاتصال
    مع تحويلة ...
    قم بتنزيل ملحقات Apache OpenOffice
  • 5
    السرعوفBT
    السرعوفBT
    فرس النبي هو موقع ويب يمكن نشره بسهولة
    تعتمد bugtracker لمساعدة علة المنتج
    تتبع. يتطلب PHP و MySQL و a
    قاعدة بيانات للانترنت. تحقق من العرض التوضيحي لدينا واستضافته
    عرض ...
    تحميل MantisBT
  • 6
    LAN رسول
    LAN رسول
    LAN Messenger هو تطبيق دردشة p2p
    لاتصالات الإنترانت ولا تفعل ذلك
    تتطلب الخادم. مجموعة متنوعة من يدوية
    الميزات مدعومة بما في ذلك
    تنبيهات ...
    قم بتنزيل LAN Messenger
  • أكثر "

أوامر لينكس

Ad