นี่คือคำสั่ง sumaclust ที่สามารถเรียกใช้ในผู้ให้บริการโฮสติ้งฟรีของ OnWorks โดยใช้หนึ่งในเวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
sumaclust - การจัดกลุ่มดาวของลำดับพันธุกรรม
เรื่องย่อ
ซูมาคลัสเตอร์ [ตัวเลือก]
DESCRIPTION
ด้วยการพัฒนาการจัดลำดับยุคหน้า จึงจำเป็นต้องมีเครื่องมือที่มีประสิทธิภาพในการจัดการ
หลายล้านลำดับในเวลาที่เหมาะสม Sumaclust เป็นโปรแกรมที่พัฒนาโดย
เลก้า Sumaclust มุ่งหวังที่จะจัดลำดับคลัสเตอร์ในลักษณะที่รวดเร็วและแม่นยำในเวลาเดียวกัน
เวลา. เครื่องมือนี้ได้รับการพัฒนาเพื่อปรับให้เข้ากับประเภทของข้อมูลที่สร้างโดยDNA
metabarcoding กล่าวคือ เรียงลำดับทั้งหมด เครื่องหมายสั้น ลำดับคลัสเตอร์ Sumaclust โดยใช้
อัลกอริธึมการทำคลัสเตอร์เดียวกันกับ UCLUST และ CD- HIT อัลกอริธึมนี้มีประโยชน์อย่างมากกับ
ตรวจจับลำดับที่ 'ผิดพลาด' ที่สร้างขึ้นระหว่างโปรโตคอลการขยายสัญญาณและการจัดลำดับ
มาจากลำดับ 'จริง'
OPTIONS
-h [H]ช่วย - พิมพ์ ช่วย
-l : ความยาวลำดับอ้างอิงสั้นที่สุด
-L ความยาวลำดับอ้างอิงสูงสุด
-a ความยาวลำดับอ้างอิงคือความยาวการจัดตำแหน่ง (ค่าเริ่มต้น)
-n คะแนนจะถูกทำให้เป็นมาตรฐานโดยความยาวลำดับอ้างอิง (ค่าเริ่มต้น)
-r : คะแนนดิบ ไม่ได้ทำให้เป็นมาตรฐาน
-d : คะแนนจะแสดงเป็นระยะทาง (ค่าเริ่มต้น : คะแนนจะแสดงในความคล้ายคลึงกัน)
-t ##.## : เกณฑ์คะแนนสำหรับการจัดกลุ่ม หากคะแนนเป็นมาตรฐานและแสดงเป็น
ความคล้ายคลึงกัน (ค่าเริ่มต้น)
มันเป็นข้อมูลประจำตัว เช่น 0.95 สำหรับข้อมูลประจำตัว 95% หากคะแนนเป็นมาตรฐานและ
แสดงระยะทาง มันคือ (1.0 - เอกลักษณ์) เช่น 0.05 สำหรับเอกลักษณ์ 95%
หากคะแนนไม่เป็นมาตรฐานและแสดงออกมาในลักษณะเดียวกัน ให้เท่ากับความยาวของ
ลำดับต่อมาที่ยาวที่สุด หากคะแนนไม่เป็นมาตรฐานและแสดงเป็น
ระยะทางก็คือ (ความยาวอ้างอิง - ความยาว LCS) เฉพาะซีเควนซ์ที่มีความคล้ายคลึงกันเท่านั้น
ด้านบน ##.## โดยมีลำดับศูนย์กลางของคลัสเตอร์ถูกกำหนดให้กับคลัสเตอร์นั้น
ค่าเริ่มต้น: 0.97.
-e ตัวเลือกที่แน่นอน: ลำดับถูกกำหนดให้กับคลัสเตอร์ที่มีลำดับตรงกลาง
นำเสนอคะแนนความคล้ายคลึงกันสูงสุด > เกณฑ์ ตรงข้ามกับค่าเริ่มต้น
ตัวเลือก 'เร็ว' ที่ลำดับถูกกำหนดให้กับคลัสเตอร์แรกที่พบกับศูนย์
ลำดับการแสดงคะแนน > เกณฑ์
-R ## อัตราส่วนสูงสุดระหว่างการนับของสองลำดับเพื่อให้จำนวนที่น้อยกว่าสามารถ
นับว่าเป็นตัวแปรที่มีมากอีกประการหนึ่ง ค่าเริ่มต้น: 1.0
-p ## มัลติเธรดด้วย ## เธรดโดยใช้ openMP
-s ####
จัดเรียงตาม #### ต้องเป็น 'ไม่มี' สำหรับการไม่เรียงลำดับ หรือคีย์ในส่วนหัว fasta ของ
แต่ละลำดับ ยกเว้นการนับที่สามารถคำนวณได้ (ค่าเริ่มต้น: sorting by
นับ).
-o การเรียงลำดับอยู่ในลำดับจากน้อยไปมาก (ค่าเริ่มต้น: จากมากไปน้อย)
-g n จะถูกแทนที่ด้วย a (ค่าเริ่มต้น: ลำดับที่มี n จะถูกละทิ้ง)
-B ### เอาต์พุตของตาราง OTU ในรูปแบบ BIOM เปิดใช้งานและเขียนลงในไฟล์ ###
-O ### เอาต์พุตของแผนที่ OTU (แผนที่การสังเกต) เปิดใช้งานและเขียนลงในไฟล์ ###
-F ### เอาต์พุตในรูปแบบ FASTA ถูกเขียนไปยังไฟล์ ### แทนที่จะเป็นเอาต์พุตมาตรฐาน
-f เอาต์พุตในรูปแบบ FASTA ถูกปิดใช้งาน
อาร์กิวเมนต์ : ชุดข้อมูลนิวคลีโอไทด์ไปยังคลัสเตอร์
ใช้ sumaclust ออนไลน์โดยใช้บริการ onworks.net