นี่คือคำสั่ง maq ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
Maq - การทำแผนที่และการประกอบด้วยคุณภาพ
เรื่องย่อ
MAQ คำสั่ง [ตัวเลือก] ข้อโต้แย้ง
maq.pl คำสั่ง [ตัวเลือก] ข้อโต้แย้ง
DESCRIPTION
Maq เป็นซอฟต์แวร์ที่สร้างแอสเซมบลีการทำแผนที่จากการอ่านสั้นๆ ที่สร้างขึ้นโดย
เครื่องเรียงลำดับการสร้าง ได้รับการออกแบบมาโดยเฉพาะสำหรับ Illumina-Solexa 1G Genetic
วิเคราะห์และมีฟังก์ชันเบื้องต้นในการจัดการข้อมูล AB SOLiD
ด้วย Maq คุณสามารถ:
· Fast align Illumina/SOLiD อ่านจีโนมอ้างอิง ด้วยตัวเลือกเริ่มต้น one
สามารถจับคู่การอ่านล้านคู่กับจีโนมมนุษย์ในเวลาประมาณ 10 ชั่วโมงของ CPU โดยใช้เวลาน้อยกว่า
กว่าหน่วยความจำ 1G
· วัดความน่าจะเป็นของข้อผิดพลาดของการจัดตำแหน่งการอ่านแต่ละครั้งอย่างแม่นยำ
· เรียกจีโนไทป์ที่เป็นเอกฉันท์ รวมทั้งพหุสัณฐานแบบโฮโมไซกัสและเฮเทอโรไซกัสด้วย
คุณภาพความน่าจะเป็นของ Phred ที่กำหนดให้กับแต่ละฐาน
· ค้นหาอินเดลสั้น ๆ ที่มีการอ่านปลายคู่
· ค้นหาการลบจีโนมขนาดใหญ่และการโยกย้ายอย่างแม่นยำด้วยการอ่านปลายคู่
· ค้นพบ CNV ที่อาจเกิดขึ้นโดยการตรวจสอบความลึกในการอ่าน
· ประเมินความถูกต้องของคุณภาพฐานดิบจากซีเควนเซอร์และช่วยตรวจสอบ
ข้อผิดพลาดอย่างเป็นระบบ
อย่างไรก็ตาม Maq can ไม่:
· ทำ de โนโว การประกอบ. (Maq สามารถเรียกฉันทามติได้โดยการทำแผนที่อ่านไปยังที่รู้จัก
อ้างอิง.)
·กางเกงขาสั้นแผนที่อ่านกับตัวเอง (Maq สามารถค้นหาการทับซ้อนที่สมบูรณ์ระหว่างการอ่านเท่านั้น)
· จัดตำแหน่งการอ่านของเส้นเลือดฝอยหรือ 454 อ่านค่าอ้างอิง (Maq ไม่สามารถจัดแนวอ่านได้นานกว่า
63bp.)
MAQ คำสั่ง
คีย์ คำสั่ง
fasta2bfa MAQ fasta2bfa in.ref.fasta out.ref.bfa
แปลงลำดับในรูปแบบ FASTA เป็นรูปแบบ BFA ของ Maq (FASTA ไบนารี)
รวดเร็วq2bfq MAQ รวดเร็วq2bfq [-n ด้าย] ใน.read.fastq ออก.read.bfq⎪out.คำนำหน้า
แปลงการอ่านในรูปแบบ FASTQ เป็นรูปแบบ BFQ ของ Maq (ไบนารี FASTQ)
ตัวเลือก:
-n INT จำนวนการอ่านต่อไฟล์ [ไม่ระบุ]
แผนที่ MAQ แผนที่ [-n นมิส] [-a แม็กซิน] [-c] [-1 len1] [-2 len2] [-d ปรับตัว3] [-m กลายพันธุ์]
[-u ไม่ได้แมป] [-จ แม็กซ์] [-M ค⎪g] [-N] [-H ทั้งหมด] [-C สูงสุด] out.aln.map
in.ref.bfa ใน.read1.bfq [ใน.read2.bfq] 2> ออก.map.log
แผนที่อ่านไปยังลำดับการอ้างอิง
ตัวเลือก:
-n INT จำนวนไม่ตรงกันสูงสุดที่สามารถพบได้ตลอดเวลา [2]
-a INT ระยะห่างภายนอกสูงสุดสำหรับคู่การอ่านที่ถูกต้อง [250]
-A INT ระยะภายนอกสูงสุดของสอง RF จ่ายที่อ่าน (0 สำหรับการปิดใช้งาน) [0]
-c แผนที่อ่านในปริภูมิสี (สำหรับ SOLiD เท่านั้น)
-1 INT ความยาวของการอ่านครั้งแรก 0 สำหรับอัตโนมัติ [0]
-2 INT อ่านความยาวสำหรับการอ่านครั้งที่สอง 0 สำหรับอัตโนมัติ [0]
-m ลอย อัตราการกลายพันธุ์ระหว่างลำดับอ้างอิงและการอ่าน [0.001]
-d ไฟล์ ระบุไฟล์ที่มีลำดับ 3'-adapter บรรทัดเดียว
[โมฆะ]
-u ไฟล์ ดัมพ์การอ่านและการอ่านที่ไม่ได้แมปที่มีมากกว่า นมิส ไม่ตรงกับ
ไฟล์แยกต่างหาก [null]
-e INT เกณฑ์ผลรวมของคุณสมบัติพื้นฐานที่ไม่ตรงกัน [70]
-H ไฟล์ ดัมพ์หลายรายการ/ทั้งหมด 01 รายการที่ไม่ตรงกันไปที่ ไฟล์ [โมฆะ]
-C INT จำนวน Hit สูงสุดที่จะส่งออก ไม่จำกัดถ้ามากกว่า 512. [250]
-M โหมดการจัดตำแหน่งเมทิลเลชั่น c⎪g C (หรือ G) ทั้งหมดบนเกลียวไปข้างหน้าจะเป็น
เปลี่ยนเป็น T (หรือ A) ตัวเลือกนี้ใช้สำหรับการทดสอบเท่านั้น
-N เก็บตำแหน่งที่ไม่ตรงกันในไฟล์เอาต์พุต out.aln.map. เมื่อเป็นเช่นนี้
ใช้งานตัวเลือกอยู่ ความยาวสูงสุดในการอ่านคือ 55bp
หมายเหตุ:
* การอ่านปลายคู่ควรเตรียมเป็น XNUMX ไฟล์ โดยแต่ละไฟล์จะมีไฟล์
การอ่านจะถูกจัดเรียงในลำดับเดียวกัน นี่หมายถึงการอ่านครั้งที่ k ในครั้งแรก
ไฟล์ถูกจับคู่กับการอ่านครั้งที่ k ในไฟล์ที่สอง การอ่านที่สอดคล้องกัน
ชื่อต้องเหมือนกันจนถึงส่วนท้าย `/1' หรือ `/2' ตัวอย่างเช่น เช่น
อนุญาตให้อ่านชื่อคู่: `EAS1_1_5_100_200/1' และ
`EAS1_1_5_100_200/2' หาง `/ [12]' มักจะสร้างโดย
GAPipeline เพื่อแยกความแตกต่างของปลายทั้งสองเป็นคู่
* ผลลัพธ์เป็นไฟล์ไบนารีที่ถูกบีบอัด มันได้รับผลกระทบจาก endianness
* วิธีที่ดีที่สุดในการรันคำสั่งนี้คือให้อ่านประมาณ 1 ถึง 3 ล้านเป็น
ป้อนข้อมูล. การอ่านมากขึ้นใช้หน่วยความจำมากขึ้น
* ตัวเลือก -n ควบคุมความไวของการจัดตำแหน่ง โดยค่าเริ่มต้น ตีด้วย
สามารถค้นหาไม่ตรงกันได้ถึง 2 รายการเสมอ สูงกว่า -n พบเพลงฮิตมากขึ้นและยัง
ปรับปรุงความถูกต้องของคุณภาพการทำแผนที่ อย่างไรก็ตามทำได้โดยเสียค่าใช้จ่าย
ของความเร็ว
* การจัดแนวที่มีความไม่ตรงกันคุณภาพสูงจำนวนมากควรละทิ้งเป็นเท็จ
การเรียงตัวหรือการปนเปื้อนที่เป็นไปได้ พฤติกรรมนี้ถูกควบคุมโดย option
-e. -e เกณฑ์จะคำนวณโดยประมาณเท่านั้นเนื่องจากคุณสมบัติพื้นฐาน
จะถูกหารด้วย 10 ในขั้นตอนหนึ่งของการจัดตำแหน่ง NS -Q ตัวเลือกใน
รวบรวม คำสั่งกำหนดเกณฑ์อย่างแม่นยำ
* การอ่านคู่หนึ่งกล่าวกันว่าจับคู่อย่างถูกต้องก็ต่อเมื่อ
ปฐมนิเทศคือ FR และระยะห่างภายนอกของคู่มีค่าไม่เกิน
แม็กซิน. ไม่มีการจำกัดขนาดเม็ดมีดขั้นต่ำ การตั้งค่านี้คือ
กำหนดโดยอัลกอริธึมการจัดตำแหน่งปลายคู่ที่ใช้ใน Maq ต้องการ
ขนาดเม็ดมีดขั้นต่ำจะทำให้เกิดการจัดตำแหน่งที่ไม่ถูกต้องด้วยสูง
คุณภาพการทำแผนที่ที่ประเมินค่าสูงไป
* ปัจจุบัน คู่การอ่านจากไลบรารีการแทรกแบบยาวของ Illumina/Solexa มีการอ่าน RF
ปฐมนิเทศ. ขนาดเม็ดมีดสูงสุดถูกกำหนดโดยตัวเลือก -A. อย่างไรก็ตาม ยาว-
ไลบรารีการแทรกยังผสมกับการอ่านส่วนแทรกสั้น ๆ เล็กน้อย
คู่ -a ควรตั้งค่าให้ถูกต้องด้วย
* บางครั้ง 5'-end หรือแม้แต่ลำดับ 3'-adapter ทั้งหมดอาจถูกจัดลำดับ
หาก -d ทำให้ Maq กำจัดการปนเปื้อนของอแด็ปเตอร์
* ให้ 2 ล้านอ่านเป็นอินพุต MAQ มักจะใช้หน่วยความจำ 800MB
แผนที่ผสาน MAQ แผนที่ผสาน out.aln.map in.aln1.แผนที่ in.aln2.แผนที่ [ ... ]
รวมชุดการจัดตำแหน่งการอ่านเข้าด้วยกัน
หมายเหตุ:
* ตามทฤษฎีแล้ว คำสั่งนี้สามารถรวมการจัดตำแหน่งได้ไม่จำกัดจำนวน อย่างไรก็ตาม as
mapmerge จะอ่านอินพุตทั้งหมดพร้อมกันอาจกด
จำกัดจำนวนไฟล์เปิดสูงสุดที่กำหนดโดยระบบปฏิบัติการ ปัจจุบันนี้
จะต้องได้รับการแก้ไขด้วยตนเองโดยผู้ใช้ปลายทาง
* สั่งการ แผนที่ผสาน สามารถใช้เพื่อรวมไฟล์การจัดตำแหน่งด้วย read . ที่แตกต่างกัน
ความยาว การวิเคราะห์ที่ตามมาทั้งหมดจะไม่ถือว่ามีความยาวคงที่อีกต่อไป
rmdup MAQ rmdup out.rmdup.map ใน.ori.map
ลบคู่ที่มีพิกัดภายนอกเหมือนกัน โดยหลักการแล้ว จับคู่กับ
พิกัดภายนอกที่เหมือนกันควรเกิดขึ้นไม่บ่อยนัก อย่างไรก็ตาม เนื่องจาก
การขยายสัญญาณในการเตรียมตัวอย่าง ซึ่งเกิดขึ้นบ่อยกว่าโดย
โอกาส. การวิเคราะห์เชิงปฏิบัติแสดงให้เห็นว่าการลบรายการที่ซ้ำกันช่วยปรับปรุง
ความแม่นยำโดยรวมของการโทร SNP
รวบรวม MAQ รวบรวม [-sp] [-m แม็กมิส] [-Q แม็กซ์] [-r เฮตเตรต] [-t ค่าสัมประสิทธิ์] [-q นาทีQ] [-N
ฮับ] ออก.cns in.ref.bfa ใน.aln.map 2> out.cns.log
เรียกลำดับฉันทามติจากการอ่านแผนที่
ตัวเลือก:
-t ลอย ค่าสัมประสิทธิ์การพึ่งพาข้อผิดพลาด [0.93]
-r ลอย เศษส่วนของเฮเทอโรไซโกตในทุกไซต์ [0.001]
-s ใช้คุณภาพการทำแผนที่ด้านเดียวเป็นคุณภาพการทำแผนที่ขั้นสุดท้าย
มิฉะนั้นคุณภาพการสิ้นสุดการจับคู่จะถูกใช้
-p ละทิ้งการอ่านสิ้นสุดที่จับคู่ที่ไม่ได้แมปในคู่ที่ถูกต้อง
-m INT จำนวนไม่ตรงกันสูงสุดที่อนุญาตสำหรับการอ่านที่จะใช้ใน
การเรียกร้องฉันทามติ [7]
-Q INT ผลรวมค่าคุณภาพสูงสุดของเบสที่ไม่ตรงกัน [60]
-q INT คุณภาพการทำแผนที่ขั้นต่ำที่อนุญาตสำหรับการอ่านเพื่อใช้เป็นเอกฉันท์
โทร [0]
-N INT จำนวน haplotypes ในสระ (>=2) [2]
หมายเหตุ:
* ตัวเลือก -Q กำหนดขีดจำกัดของผลรวมสูงสุดของคุณภาพฐานที่ไม่ตรงกัน
การอ่านที่มีเนื้อหาไม่ตรงกันคุณภาพสูงจำนวนมากควรละทิ้งไป
* ตัวเลือก -N กำหนดจำนวนของ haplotypes ในพูล มันถูกออกแบบมาสำหรับ
การหาลำดับตัวอย่างใหม่โดยการรวมหลายสายพันธุ์/บุคคลเข้าด้วยกัน สำหรับ
การจัดลำดับจีโนมซ้ำ ตัวเลือกนี้เท่ากับ 2
เกลฟเกน MAQ เกลฟเกน [-sp] [-m แม็กมิส] [-Q แม็กซ์] [-r เฮตเตรต] [-t ค่าสัมประสิทธิ์] [-q นาทีQ] [-N
ฮับ] ออก.cns in.ref.bfa ใน.aln.map 2> out.cns.log
คำนวณความเป็นไปได้ของบันทึกสำหรับจีโนไทป์ทั้งหมดและเก็บผลลัพธ์ในรูปแบบ GLF
(รูปแบบความน่าจะเป็นของจีโนไทป์) โปรดตรวจสอบเว็บไซต์ MAQ สำหรับรายละเอียด
คำอธิบายของรูปแบบไฟล์และยูทิลิตี้ที่เกี่ยวข้อง
อินเดลเป MAQ อินเดลเป in.ref.bfa ใน.aln.map > ออก indelpe
เรียกอินเดลที่สอดคล้องกันจากการอ่านปลายคู่ ผลลัพธ์ถูกคั่นด้วย TAB ด้วย
แต่ละเส้นประกอบด้วยโครโมโซม ตำแหน่งเริ่มต้น ประเภทของอินเดล หมายเลข
ของการอ่านข้ามอินเดล ขนาดของอินเดลและนิวคลีโอไทด์ที่แทรก/ลบ
(คั่นด้วยทวิภาค) จำนวนอินเดลบนเกลียวหลัง จำนวนอินเดล
บนเกลียวไปข้างหน้า 5 'ลำดับข้างหน้าของอินเดล 3' ลำดับต่อไป
อินเดล จำนวนการอ่านที่เรียงกันโดยไม่มีอินเดลและคอลัมน์เพิ่มเติมอีกสามคอลัมน์
สำหรับตัวกรอง
ที่คอลัมน์ที่ 3 ประเภทของอินเดล ดาวระบุว่าอินเดลได้รับการยืนยัน
โดยการอ่านจากทั้งสองเส้น a plus หมายถึง indel ถูกอ่านอย่างน้อยสองครั้ง
แต่จากเกลียวเดียวกัน เครื่องหมายลบแสดงว่าอินเดลมีการอ่านเพียงครั้งเดียว
และจุดหมายความว่าอินเดลอยู่ใกล้กับอินเดลอื่นมากเกินไปและถูกกรองออก
ขอแนะนำให้ผู้ใช้เรียกใช้ผ่าน `maq.pl indelpe' เพื่อแก้ไขจำนวน
อ่านที่แมปโดยไม่มีอินเดล สำหรับรายละเอียดเพิ่มเติม โปรดดูที่ `maq.pl indelpe'
มาตรา.
อินเดลโซ MAQ อินเดลโซ in.ref.bfa ใน.aln.map > ออก อินเดลโซอา
เรียก indels homozygous ที่อาจเกิดขึ้นและจุดแตกหักโดยการตรวจจับสิ่งผิดปกติ
รูปแบบการจัดตำแหน่งรอบอินเดลและจุดแตกหัก ผลลัพธ์ยังเป็นTAB
คั่นด้วยแต่ละเส้นประกอบด้วยโครโมโซม พิกัดโดยประมาณ
ความยาวของพื้นที่ผิดปกติ จำนวนการอ่านที่แมปข้ามตำแหน่ง
จำนวนการอ่านทางด้านซ้ายของตำแหน่งและจำนวนการอ่านบน
ทางด้านขวามือ คอลัมน์สุดท้ายสามารถละเว้นได้
ผลลัพธ์ประกอบด้วยผลบวกปลอมจำนวนมาก ตัวกรองที่แนะนำอาจเป็น:
awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa
โปรดทราบว่าคำสั่งนี้ไม่ได้มุ่งหมายที่จะเป็นตัวตรวจจับอินเดลที่แม่นยำ แต่
ส่วนใหญ่ช่วยหลีกเลี่ยงผลบวกที่ผิดพลาดในการเรียกทดแทน ใน
นอกจากนี้ มันใช้งานได้ดีเมื่อมีความลึกเท่านั้น (เช่น ~ 40X); มิฉะนั้น
อัตราลบเท็จจะสูงมาก
รูปแบบ แปลง
โซลทูแซงเจอร์ MAQ โซลทูแซงเจอร์ in.sol.fastq out.sanger.fastq
แปลง Solexa FASTQ เป็นรูปแบบมาตรฐาน/Sanger FASTQ
bfq2fastq MAQ bfq2fastq ใน.read.bfq ออก.read.fastq
แปลงรูปแบบ BFQ ของ Maq เป็นรูปแบบ FASTQ มาตรฐาน
mapass2maq MAQ mapass2maq ใน.mapass2.map out.maq.map
แปลงรูปแบบแผนที่ของ mapass2 ที่ล้าสมัยเป็นรูปแบบแผนที่ของ Maq รูปแบบเก่าไม่
ไม่มีชื่อที่อ่าน
ข้อมูล สกัด
มุมมองแผนที่ MAQ มุมมองแผนที่ [-บีเอ็น] ใน.aln.map > ออก.aln.txt
แสดงการจัดตำแหน่งการอ่านในข้อความธรรมดา สำหรับการอ่านที่สอดคล้องก่อน Smith-
การจัดตำแหน่ง Waterman แต่ละบรรทัดประกอบด้วย อ่านชื่อ โครโมโซม ตำแหน่ง
เกลียว, ขนาดเม็ดมีดจากโคออร์นีเอตด้านนอกของคู่, ธงคู่, การทำแผนที่
คุณภาพ, คุณภาพการทำแผนที่ด้านเดียว, คุณภาพการทำแผนที่ทางเลือก, จำนวน
ผลรวมของเบสที่ไม่ตรงกันของเบสที่ดีที่สุด
ตี จำนวนครั้ง 0 ไม่ตรงกันของ 24bp แรก จำนวน 1 ฮิตไม่ตรงกันของ
24bp แรกในการอ้างอิง ความยาวของการอ่าน ลำดับการอ่านและ
คุณภาพ. คุณภาพการทำแผนที่ทางเลือกจะเท่ากับคุณภาพการทำแผนที่เสมอหาก
การอ่านจะไม่จับคู่ หากการอ่านถูกจับคู่ จะเท่ากับการแมปที่เล็กกว่า
คุณภาพของปลายทั้งสอง คุณภาพการทำแผนที่ทางเลือกนี้เป็นจริง
คุณภาพการทำแผนที่ของคู่ที่ผิดปกติ
คอลัมน์ที่ห้า แฟล็กคู่ เป็นแฟล็กระดับบิต 4 บิตที่ต่ำกว่าของมันให้
การปฐมนิเทศ: 1 ย่อมาจาก FF, 2 สำหรับ FR, 4 สำหรับ RF และ 8 สำหรับ RR โดยที่ FR หมายถึง
ว่าการอ่านที่มีพิกัดน้อยกว่าอยู่บนเกลียวไปข้างหน้าและคู่ของมันคือ
บนเกลียวย้อนกลับ อนุญาตให้ใช้ FR เท่านั้นสำหรับคู่ที่ถูกต้อง บิตที่สูงขึ้น
ของธงนี้ให้ข้อมูลเพิ่มเติม หากคู่นั้นมาบรรจบกัน
ความต้องการ 16 จะถูกกำหนด หากการอ่านทั้งสองถูกแมปไปที่ต่างกัน
โครโมโซม 32 จะถูกตั้งค่า หากการอ่านค่าใดค่าหนึ่งจากสองค่านี้ไม่สามารถจับคู่ได้เลย
64 จะถูกตั้งค่า แฟล็กสำหรับคู่ที่ถูกต้องจะเท่ากับ 18 เสมอ
สำหรับการอ่านที่จัดเรียงโดยการจัดตำแหน่ง Smith-Waterman ในภายหลัง ธงคือ
เสมอ 130 บรรทัดประกอบด้วยชื่ออ่าน โครโมโซม ตำแหน่ง เกลียว แทรก
ขนาด, แฟล็ก (130 เสมอ), ตำแหน่งของอินเดลที่การอ่าน (0 หากไม่มีอินเดล),
ความยาวของอินเดล (บวกสำหรับการแทรกและค่าลบสำหรับการลบ)
คุณภาพการจับคู่ของคู่ของมัน จำนวนครั้งของการตีที่ดีที่สุดที่ไม่ตรงกัน ผลรวมของ
คุณภาพของฐานที่ไม่ตรงกันของการโจมตีที่ดีที่สุด สองศูนย์ ความยาวของการอ่าน
อ่านลำดับและคุณภาพของมัน คู่ของการอ่านค่าสถานะ 130 จะได้รับ a . เสมอ
ธง 18.
แฟล็ก 192 ระบุว่าการอ่านไม่ได้ถูกแมป แต่จับคู่คู่ของมันแล้ว สำหรับการดังกล่าว
คู่การอ่าน การอ่านหนึ่งครั้งมีแฟล็ก 64 และอีกคู่หนึ่งมี 192
ตัวเลือก:
-b ไม่แสดงลำดับการอ่านและคุณภาพ
-N แสดงตำแหน่งที่เกิดไม่ตรงกัน แฟล็กนี้ใช้ได้เท่านั้น
ด้วยไฟล์ .map ที่สร้างโดย `maq map -N'
ตรวจสอบแผนที่ MAQ ตรวจสอบแผนที่ [-s] [-m แม็กมิส] [-q นาทีQ] in.ref.bfa ใน.aln.map > out.mapcheck
อ่านการตรวจสอบคุณภาพ mapcheck รายงานองค์ประกอบและความลึกของ .ก่อน
ข้อมูลอ้างอิง หลังจากนั้นก็มีแบบ คอลัมน์แรกระบุว่า
ตำแหน่งในการอ่าน ตามสี่คอลัมน์ที่แสดงนิวคลีโอไทด์
องค์ประกอบอัตราการทดแทนระหว่างการอ้างอิงและการอ่านจะได้รับ
อัตราเหล่านี้และตัวเลขในคอลัมน์ต่อไปนี้ถูกปรับขนาดเป็น 999 และ
ปัดเศษเป็นจำนวนเต็มที่ใกล้ที่สุด คอลัมน์กลุ่มถัดไปแสดงการแจกแจงของ
คุณสมบัติพื้นฐานพร้อมการอ่านที่ช่วงคุณภาพ 10 การสลายตัวของคุณภาพ
มักจะสังเกตได้ ซึ่งหมายความว่าฐานที่ส่วนท้ายของการอ่านมีค่าน้อยกว่า
แม่นยำ. คอลัมน์กลุ่มสุดท้ายแสดงเศษส่วนของการแทนที่สำหรับ
อ่านฐานในช่วงเวลาคุณภาพ เป็นการวัดความแม่นยำของคุณภาพฐาน
ประมาณการ เป็นการดีที่เราคาดว่าจะเห็น 1 ใน 3? คอลัมน์ 10 ใน 2? คอลัมน์
และ 100 ใน 1? คอลัมน์.
ตัวเลือก:
-s ใช้คุณภาพการทำแผนที่ด้านเดียวเป็นคุณภาพการทำแผนที่ขั้นสุดท้าย
-m INT จำนวน mismatahces สูงสุดที่อนุญาตให้นับการอ่าน [4]
-q INT คุณภาพการแมปขั้นต่ำที่อนุญาตให้นับการอ่าน [30]
กระเจิดกระเจิง MAQ กระเจิดกระเจิง [-เอสพีวีพี] [-m แม็กมิส] [-Q แม็กซ์] [-q นาทีQ] [-l ไฟล์ไซต์] in.ref.bfa
ใน.aln.map > out.pilup
แสดงการจัดตำแหน่งในรูปแบบข้อความ "ซ้อน" แต่ละบรรทัดประกอบด้วย
โครโมโซม ตำแหน่ง ฐานอ้างอิง ความลึก และฐานที่อ่านจากปก
ตำแหน่งนี้. ถ้า -v ถูกเพิ่มในบรรทัดคำสั่ง คุณสมบัติพื้นฐาน และการทำแผนที่
คุณสมบัติจะถูกนำเสนอในคอลัมน์ที่หกและเจ็ดตามลำดับ
คอลัมน์ที่ห้าเริ่มต้นด้วย `@' เสมอ ในคอลัมน์นี้ อ่านฐานว่าเหมือนกัน
การอ้างอิงจะแสดงด้วยเครื่องหมายจุลภาค `,' หรือจุด `.' และอ่านฐานที่แตกต่างกัน
จากการอ้างอิงในจดหมาย เครื่องหมายจุลภาคหรือตัวพิมพ์ใหญ่แสดงว่าฐาน
มาจากการอ่านที่อยู่ในแนวหน้าในขณะที่จุดหรือตัวพิมพ์เล็กบน
สาระย้อนกลับ
คำสั่งนี้มีไว้สำหรับผู้ใช้ที่ต้องการพัฒนาผู้โทร SNP ของตนเอง
ตัวเลือก:
-s ใช้คุณภาพการทำแผนที่ด้านเดียวเป็นคุณภาพการทำแผนที่ขั้นสุดท้าย
-p ละทิ้งการอ่านสิ้นสุดที่จับคู่ที่ไม่ได้แมปเป็นคู่ที่ถูกต้อง
-v ส่งออกข้อมูลอย่างละเอียดรวมถึงคุณภาพฐานและการทำแผนที่
คุณภาพ
-m INT จำนวนไม่ตรงกันสูงสุดที่อนุญาตให้ใช้การอ่าน [7]
-Q INT จำนวนค่าคุณภาพที่ไม่ตรงกันสูงสุดที่อนุญาต [60]
-q INT คุณภาพการแมปขั้นต่ำที่อนุญาตให้ใช้การอ่าน [0]
-l ไฟล์ ไฟล์ที่มีไซต์ที่จะพิมพ์ไพล์อัพ ในเรื่องนี้
file คอลัมน์แรกให้ชื่อของการอ้างอิงและวินาที
พิกัด. คอลัมน์เพิ่มเติมจะถูกละเว้น [โมฆะ]
-P ยังส่งออกตำแหน่งฐานในการอ่าน
cns2fq MAQ cns2fq [-Q minMapQ] [-n มินเน่คิว] [-d นาทีความลึก] [-D ความลึกสูงสุด] in.cns >
out.cns.fastq
แยกลำดับฉันทามติในรูปแบบ FASTQ ในบรรทัดลำดับ ฐาน
ตัวพิมพ์เล็กมักจะซ้ำกันหรือไม่มีการครอบคลุมเพียงพอ ฐาน
ตัวพิมพ์ใหญ่ระบุภูมิภาคที่สามารถเรียก SNP ได้อย่างน่าเชื่อถือ ใน
เส้นคุณภาพ ASCII ของอักขระลบ 33 ให้คุณภาพ PHRED
ตัวเลือก:
-Q INT คุณภาพการทำแผนที่ขั้นต่ำ [40]
-d INT ความลึกในการอ่านขั้นต่ำ [3]
-n INT คุณภาพเพื่อนบ้านขั้นต่ำ (20)
-D INT ระยะการอ่านสูงสุด >=255 ไม่จำกัดจำนวน [255]
ซีเอ็นเอสทูเอสเอ็นพี MAQ ซีเอ็นเอสทูเอสเอ็นพี in.cns > ออก.snp
แยกไซต์ SNP แต่ละเส้นประกอบด้วยโครโมโซม ตำแหน่ง ฐานอ้างอิง
ฐานฉันทามติ คุณภาพฉันทามติเหมือน Phred ความลึกในการอ่าน จํานวนเฉลี่ย
จำนวนการอ่านที่ครอบคลุมตำแหน่งนี้ คุณภาพการทำแผนที่สูงสุดของการอ่าน
ครอบคลุมตำแหน่งคุณภาพฉันทามติขั้นต่ำในการขนาบข้าง 3bp
ภูมิภาคที่แต่ละด้านของไซต์ (ทั้งหมด 6bp) การโทรที่ดีที่สุดอันดับสอง log
อัตราส่วนความน่าจะเป็นที่ดีที่สุดอันดับสองและการโทรที่ดีที่สุดอันดับสามและอันดับสามที่ดีที่สุด
โทร.
คอลัมน์ที่ 5 เป็นเกณฑ์สำคัญเมื่อคุณตัดสินความน่าเชื่อถือของ SNP
อย่างไรก็ตาม เนื่องจากคุณภาพนี้คำนวณโดยสมมติความเป็นอิสระของไซต์ คุณ
ควรพิจารณาคอลัมน์อื่นด้วยเพื่อให้ได้รับการเรียก SNP ที่แม่นยำยิ่งขึ้น สคริปต์
คำสั่ง `maq.pl ตัวกรอง SNP' ออกแบบมาเพื่อสิ่งนี้ (ดูด้านล่าง)
คอลัมน์ที่ 7 บ่งบอกว่าไซต์อยู่ในพื้นที่ที่ซ้ำกันหรือไม่ ถ้าไม่
อ่านครอบคลุมเว็บไซต์สามารถแมปด้วยคุณภาพการทำแผนที่สูงขนาบข้าง
ภูมิภาคอาจซ้ำซากหรือขาดการอ่านที่ดี SNP ที่ไซต์ดังกล่าว
มักจะไม่น่าเชื่อถือ
คอลัมน์ที่ 8 ให้หมายเลขสำเนาของบริเวณขนาบใน
จีโนมอ้างอิง ในกรณีส่วนใหญ่ ตัวเลขนี้เข้าใกล้ 1.00 ซึ่งหมายถึง
ภูมิภาคมีความเป็นเอกลักษณ์ บางครั้งคุณอาจเห็นความลึกในการอ่านที่ไม่เป็นศูนย์ แต่ 0.00 ที่
คอลัมน์ที่ 7 นี่แสดงว่าการอ่านทั้งหมดที่ครอบคลุมตำแหน่งมีที่
ไม่ตรงกันอย่างน้อยสองครั้ง Maq จะนับเฉพาะจำนวนการตี 0 และ 1 ที่ไม่ตรงกันถึง
ข้อมูลอ้างอิง เนื่องจากปัญหาทางเทคนิคที่ซับซ้อน
คอลัมน์ที่ 9 ให้คุณภาพใกล้เคียง การกรองคอลัมน์นี้ก็เช่นกัน
จำเป็นต้องได้รับ SNP ที่เชื่อถือได้ แนวคิดนี้ได้รับแรงบันดาลใจจาก NQS แม้ว่า NQS จะเป็น
แรกเริ่มออกแบบมาสำหรับการอ่านเพียงครั้งเดียวแทนที่จะเป็นฉันทามติ
cns2view MAQ cns2view in.cns > ออก.ดู
แสดงข้อมูลโดยละเอียดที่ไซต์ทั้งหมด รูปแบบเอาต์พุตเหมือนกับ
ซีเอ็นเอสทูเอสเอ็นพี แจ้ง
cns2อ้างอิง MAQ cns2อ้างอิง in.cns > out.ref.fasta
แยกลำดับการอ้างอิง
ซีเอ็นเอสทูวิน MAQ ซีเอ็นเอสทูวิน [-w ชนะขนาด] [-c chr] [-b เริ่ม] [-e ปลาย] [-q นาทีQ] in.cns >
ออก. ชนะ
ดึงข้อมูลโดยเฉลี่ยในหน้าต่างการไถพรวน เอาต์พุตเป็นตัวคั่น TAB
ซึ่งประกอบด้วยชื่ออ้างอิง พิกัดหารด้วย 1,000,000 อัตรา SNP
อัตรา het, ความลึกในการอ่านดิบ, ความลึกในการอ่านในภูมิภาคที่ไม่ซ้ำกันโดยประมาณ, the
จำนวนการอ่านเฉลี่ยในหน้าต่างและเปอร์เซ็นต์ GC
ตัวเลือก:
-w INT ขนาดของหน้าต่าง [1000]
-c STR ลำดับการอ้างอิงปลายทาง มิฉะนั้นจะถูกนำมาใช้อ้างอิงทั้งหมด
[โมฆะ]
-b INT ตำแหน่งเริ่มต้น 0 โดยไม่มีข้อจำกัด [0]
-e INT ตำแหน่งสิ้นสุด 0 โดยไม่มีข้อจำกัด [0]
-q INT คุณภาพฉันทามติขั้นต่ำของไซต์ที่จะใช้ [0]
การจำลอง ที่เกี่ยวข้อง
ของปลอม MAQ ของปลอม [-r กลายพันธุ์] [-R อินเดลแฟรค] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp
สุ่มแนะนำการแทนที่และอินเดลไปยังข้อมูลอ้างอิง การเปลี่ยนตัวและ
สามารถเพิ่มอินเดลคู่เบสได้
ตัวเลือก:
-r ลอย อัตราการกลายพันธุ์ [0.001]
-R ลอย เศษส่วนของการกลายพันธุ์ที่จะเป็นอินเดล [0.1]
ซิมูเทรน MAQ ซิมูเทรน out.simupars.dat ใน.read.fastq
ค่าประมาณ/พารามิเตอร์ฝึกสำหรับการจำลองการอ่าน
แกล้งทำ MAQ แกล้งทำ [-d ในขนาด] [-s ผู้พัฒนา] [-N nอ่าน] [-1 อ่านLen1] [-2 อ่านLen2] [-r
มิวเรท] [-R อินเดลแฟรค] [-h] ออก.read1.fastq ออก.read2.fastq in.ref.fasta
in.simupars.dat
จำลองการอ่านปลายคู่ ไฟล์ in.simupars.dat กำหนดความยาวในการอ่านและ
การกระจายคุณภาพ มันถูกสร้างขึ้นจาก ซิมูเทรน, หรือสามารถดาวน์โหลดได้จาก
เว็บไซต์แม็ก. ในไฟล์เอาต์พุตการอ่าน ชื่อที่อ่านประกอบด้วยการอ้างอิง
ชื่อลำดับและพิกัดภายนอกของคู่การอ่านจำลอง โดย
ค่าเริ่มต้น, แกล้งทำ ถือว่าการอ่านมาจากลำดับซ้ำซึ่งถูกสร้างขึ้น
โดยการเพิ่มการกลายพันธุ์ที่แตกต่างกันสองชุด รวมทั้งอินเดลคู่เบสหนึ่งชุด to
in.ref.fasta.
ตัวเลือก:
-d INT ค่าเฉลี่ยระยะนอกของขนาดเม็ดมีด [170]
-s INT ส่วนเบี่ยงเบนมาตรฐานของขนาดเม็ดมีด [20]
-N INT จำนวนคู่ของการอ่านที่จะสร้าง [1000000]
-1 INT ความยาวของการอ่านครั้งแรก [กำหนดโดย in.simupars.dat]
-2 INT ความยาวของการอ่านครั้งที่สอง [กำหนดโดย in.simupars.dat]
-r ลอย อัตราการกลายพันธุ์ [0.001]
-R ลอย เศษส่วนของอินเดล 1bp [0.1]
-h เพิ่มการกลายพันธุ์ทั้งหมดไปที่ in.ref.fasta และสร้างการอ่านจากซิงเกิ้ล
ลำดับการกลายพันธุ์ (โหมดเดี่ยว)
หมายเหตุ:
* การอ่านที่สร้างจากคำสั่งนี้เป็นอิสระ ซึ่งแตกต่างจาก
ความจริง. ในขณะที่การประเมินการจัดตำแหน่งได้รับผลกระทบน้อยกว่านี้ การประเมินบน
การโทร SNP ควรดำเนินการด้วยความระมัดระวัง การพึ่งพาข้อผิดพลาดอาจเป็นหนึ่งใน
สาเหตุหลักของการเรียก SNP ที่ไม่ถูกต้อง
simusat MAQ simusat in.simu-aln.map > out.simusat
ประเมินคุณภาพการทำแผนที่จากการอ่านจำลอง
แข็ง ที่เกี่ยวข้อง
fasta2csfa MAQ fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta
แปลงนิวคลีโอไทด์ FASTA เป็น FASTA ที่มีรหัสสี ธง -c ก็ควรจะทา
ไปยัง แผนที่ สั่งการ. ในผลลัพธ์ ตัวอักษร 'A' หมายถึงสี 0, 'C' แทน 1, 'G'
สำหรับ 2 และ 'T' สำหรับ 3 แต่ละลำดับในเอาต์พุตจะสั้นกว่าอินพุต 1bp
csmap2nt MAQ csmap2nt out.nt.แผนที่ in.ref.nt.bfa in.cs.แผนที่
เปลี่ยนการจัดตำแหน่งสีเป็นการจัดตำแหน่งนิวคลีโอไทด์ อินพุต in.ref.nt.bfa คือ
ไฟล์อ้างอิงไบนารีนิวคลีโอไทด์ FASTA ต้องสอดคล้องกับไฟล์ต้นฉบับ
ซึ่งการอ้างอิงสีจะถูกแปลง ฉันทามติของนิวคลีโอไทด์สามารถเรียกได้ว่า
จากการจัดตำแหน่งผลลัพธ์
เบ็ดเตล็ด/ขั้นสูง คำสั่ง
แผนที่ย่อย MAQ แผนที่ย่อย [-q minMapQ] [-Q maxSumErr] [-m สูงสุดMM] [-p] ออก.แผนที่ ในแผนที่
กรองการจัดตำแหน่งที่ไม่ถูกต้องใน ในแผนที่. ตัวเลือกบรรทัดคำสั่งมีอธิบายไว้ใน
`รวบรวม' สั่งการ.
อีแลนด์ทูแมค MAQ อีแลนด์ทูแมค [-q ผิดนัด] ออก.แผนที่ ใน.รายการ ใน.eland
แปลงการจัดตำแหน่ง eland เป็นรูปแบบ .map ของ maq ไฟล์ ใน.รายการ ประกอบด้วย
ชื่อลำดับที่ปรากฏที่คอลัมน์ที่เจ็ดของไฟล์การจัดตำแหน่งอีแลนด์
ใน.eland และชื่อที่คุณคาดว่าจะเห็นในการจัดตำแหน่ง maq ต่อไปนี้เป็น
ตัวอย่าง:
cX.ฟ้า chrX
c1.ฟ้า ch1
c2.ฟ้า ch2
หากคุณกำลังจัดแนวการอ่านหลายชุดโดยใช้ eland สิ่งสำคัญคือต้อง
ใช้เหมือนกัน ใน.รายการ สำหรับการแปลง นอกจากนี้ maq จะโหลดทั้งหมด
จัดตำแหน่งและจัดเรียงไว้ในหน่วยความจำ หากคุณมีการเชื่อมต่อหลาย eland
ออกเป็นไฟล์ขนาดใหญ่ไฟล์เดียว คุณควรแยกไฟล์ออกเป็นไฟล์ขนาดเล็กเป็น
ป้องกันไม่ให้ maq กินหน่วยความจำเครื่องทั้งหมดของคุณ
คำสั่งนี้มีจุดมุ่งหมายเพื่อแสดงการจัดตำแหน่ง Eland ใน Maqview ไม่มีคุณภาพ
มีข้อมูลให้ ไม่ควรใช้ไฟล์การจัดตำแหน่ง maq ที่เป็นผลลัพธ์
เพื่อเรียกจีโนไทป์ฉันทามติ
ส่งออก2maq MAQ ส่งออก2maq [-1 อ่าน1เลน] [-2 อ่าน2เลน] [-a สูงสุด] [-n] ออก.แผนที่ ใน.รายการ
ใน.ส่งออก
แปลงรูปแบบการส่งออกของ Illumina เป็น Maq's .แผนที่ รูปแบบ. รูปแบบการส่งออกเป็นรูปแบบใหม่
รูปแบบการจัดตำแหน่งตั้งแต่ SolexaPipeline-0.3.0 ซึ่งคำนวณการแมปด้วย
คุณสมบัติเช่น maq ไฟล์ผลลัพธ์สามารถใช้เรียกฉันทามติ genotypes
เนื่องจากข้อมูลที่จำเป็นส่วนใหญ่มีให้ maq ดำเนินการได้อย่างถูกต้อง
ตัวเลือก:
-1 INT ความยาวของการอ่านครั้งแรก [0]
-2 INT ความยาวของการอ่านครั้งที่สอง [0]
-a INT ระยะห่างภายนอกสูงสุดสำหรับคู่การอ่านที่ถูกต้อง [250]
-n เก็บกรองอ่าน
MAQ-PERL คำสั่ง
สาธิต maq.pl สาธิต [-h] [-s] [-N nคู่] [-d ออกDir] อิน.ฟาสต้า in.simudat
สาธิตการใช้ MAQ และสคริปต์ประกอบ คำสั่งนี้จะ
จำลองการอ่านจากไฟล์ FASTA อิน.ฟาสต้า. ความยาวและคุณภาพของลำดับ
ถูกกำหนดโดย in.simudat ซึ่งเกิดจาก MAQ ซิมูเทรน หรือสามารถ
ดาวน์โหลดจากเว็บไซต์ Maq การอ่านจำลองจะถูกจับคู่กับ
maq.pl วิ่งง่าย. ความแม่นยำในการจัดตำแหน่งถูกประเมินโดย MAQ simusatที่
ความถูกต้องฉันทามติโดย MAQ ซิมัสและความแม่นยำ SNP โดย maq_eval.pl.
โดยค่าเริ่มต้น การอ่านสิ้นสุดที่จับคู่จะถูกจำลองและลำดับซ้ำจะเป็น
สร้างจากอินพุตโดยเพิ่มการกลายพันธุ์เป็นประเภทเดี่ยว ตัวแทรก
ขนาดและอัตราการกลายพันธุ์ถูกควบคุมโดย MAQ แกล้งทำ.
ตัวเลือก:
-h จำลองลำดับเดี่ยวแทนลำดับซ้ำ
-s ใช้โหมดปลายเดียวเพื่อจัดแนวการอ่านแทนโหมดปลายคู่
-N INT จำนวนคู่ของการอ่านที่จะจำลอง [1000000]
-d DIR ไดเร็กทอรีเอาต์พุต [maqdemo]
หมายเหตุ:
* ไฟล์ที่ส่งออกจาก maq_eval.pl ไม่ได้จัดทำเป็นเอกสาร แต่ท่านอาจทำ
เดาได้ดีที่บางไฟล์เหล่านี้
* คำสั่งนี้เพียงสาธิตการใช้ชุด maq ความแม่นยำของจริง
ข้อมูลมักจะต่ำกว่าที่คุณเห็นจากการจำลองแบบล้วนๆ
วิ่งง่าย maq.pl วิ่งง่าย [-1 อ่าน1เลน] [-d ออก.ผบ] [-n nอ่าน] [-A 3อะแดปเตอร์] [-e นาทีDep]
[-q ขั้นต่ำ CnsQ] [-p] [-2 อ่าน2เลน] [-a สูงสุด] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]
วิเคราะห์ไปป์ไลน์สำหรับจีโนมขนาดเล็ก คำสั่ง Easyrun จะรันการวิเคราะห์ส่วนใหญ่
นำมาใช้ MAQ. โดยค่าเริ่มต้น, วิ่งง่าย ถือว่าอินพุตทั้งหมดอ่านลำดับ
ไฟล์เป็นแบบปลายเดียวและเป็นอิสระ เมื่อไร -p ถูกระบุ สองลำดับการอ่าน
ต้องมีไฟล์หนึ่งไฟล์สำหรับแต่ละปลาย
ไฟล์หลายไฟล์จะถูกสร้างขึ้นใน ออก.ผบซึ่งไฟล์ต่อไปนี้คือ
เอาท์พุทที่สำคัญ:
cns.final.snp การโทร SNP ขั้นสุดท้ายด้วยการโทรที่มีคุณภาพต่ำถูกกรองออก
cns.fq ลำดับและคุณภาพที่เป็นเอกฉันท์ในรูปแบบ FASTQ
ตัวเลือก:
-d DIR ไดเร็กทอรีเอาต์พุต [easyrun]
-n INT จำนวนการอ่าน/คู่ในหนึ่งชุดของการจัดตำแหน่ง [2000000]
-S ใช้การวิเคราะห์แบบแยกอ่านของอินเดลสั้น (อาจช้ามาก)
-N INT จำนวน haplotypes/สายพันธุ์ในสระ (>=2) [2]
-A ไฟล์ ไฟล์สำหรับ 3'-adapter ไฟล์ควรมีลำดับบรรทัดเดียว
[โมฆะ]
-1 INT ความยาวของการอ่านครั้งแรก 0 สำหรับอัตโนมัติ [0]
-e INT ความลึกในการอ่านขั้นต่ำที่จำเป็นในการเรียก SNP (สำหรับ SNPfilter) [3]
-q INT คุณภาพฉันทามติขั้นต่ำสำหรับ SNP ใน cns.final.snp [30]
-p เปลี่ยนเป็นโหมดการจัดตำแหน่งปลายที่จับคู่
-2 INT ความยาวของวินาทีอ่านเมื่อ -p ถูกนำไปใช้ [0]
-a INT ขนาดเม็ดมีดสูงสุดเมื่อ -p ถูกนำไปใช้ [250]
หมายเหตุ:
* สำหรับการเรียก SNP ในตัวอย่างแบบรวม ผู้ใช้ควรตั้งค่า ` . ที่ถูกต้อง-N' เช่นกัน
`-E 0'
* ไฟล์อินพุตสามารถเป็นรูปแบบไบนารีของ maq ได้ maq.pl จะตรวจจับโดยอัตโนมัติ
รูปแบบไฟล์
ตัวกรอง SNP maq.pl ตัวกรอง SNP [-d นาทีDep] [-D สูงสุด] [-Q maxMapQ] [-q ขั้นต่ำ CnsQ] [-w
indelWinSize] [-n มินเน่คิว] [-F อินเดลเป] [-f อินเดลโซ] [-s คะแนนขั้นต่ำ] [-m
สูงสุดข้าม] [-a] [-N maxWinSNP] [-W เดนส์วินไซส์] in.cns2snp.snp >
ออก.กรอง.snp
แยกแยะ SNPs ที่ครอบคลุมโดยการอ่านไม่กี่ครั้ง (ระบุโดย -d) โดยมากเกินไป
อ่าน (ระบุโดย -D) ใกล้ (ระบุโดย -w) สู่อินเดลที่อาจเกิดขึ้น
ในพื้นที่ที่เกิดซ้ำได้ (แสดงโดย -Q) หรือมีคุณภาพต่ำ
ฐานใกล้เคียง (ระบุโดย -n) ถ้า maxWinSNP หรือมากกว่า SNP ปรากฏในใดๆ
เดนส์วินไซส์ หน้าต่างก็จะถูกกรองออกไปพร้อมกันด้วย
ตัวเลือก:
-d INT ความลึกในการอ่านขั้นต่ำที่จำเป็นในการเรียก SNP [3]
-D INT ความลึกในการอ่านสูงสุดที่จำเป็นในการเรียก SNP (<255 มิฉะนั้นจะละเว้น)
[256]
-Q INT ต้องการคุณภาพการทำแผนที่สูงสุดของการอ่านที่ครอบคลุม SNP [40]
-q INT คุณภาพฉันทามติขั้นต่ำ (20)
-n INT คุณภาพฉันทามติที่อยู่ติดกันขั้นต่ำ (20)
-w INT ขนาดของหน้าต่างรอบๆ อินเดลที่มีศักยภาพ SNP ที่ใกล้เคียง
ให้อินเดลถูกระงับ [3]
-F ไฟล์ งานวิ่งการกุศล อินเดลเป เอาท์พุท [null]
-f ไฟล์ งานวิ่งการกุศล อินเดลโซ เอาท์พุท [null]
-s INT คะแนนขั้นต่ำสำหรับ soa-indel ที่จะพิจารณา [3]
-m INT จำนวนการอ่านสูงสุดที่สามารถแมปข้าม soa-indel [1]
-a ตัวกรองทางเลือกสำหรับการจัดตำแหน่งปลายด้านเดียว
อินเดลเป maq.pl อินเดลเป อินเดลเป > ออก indelpe
แก้ไขจำนวนการอ่านที่แมปโดยไม่มี indels สำหรับ homopolymer tracts นี้
คำสั่งแก้ไขคอลัมน์ที่ 4, 10 และสามคอลัมน์สุดท้ายของ อินเดลเป และ
ส่งออกผลลัพธ์ใน ออก indelpe. หลังจากแก้ไขดังนี้ awk
คำสั่งให้ indels homozygous สมมุติ:
awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'
และต่อไปนี้ให้ heterozygotes:
awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'
โปรดทราบว่านี้ อินเดลเป คำสั่งเพียงใช้กฎฮิวริสติกหลายข้อ
ไม่ถูกต้องสำหรับโฮโมพอลิเมอร์ที่ไม่บริสุทธิ์หรือได-นิวคลีโอไทด์/ทริปเล็ต
ซ้ำ ดังนั้น ทั้งสองคำสั่ง awk ให้เพียง hom/het . โดยประมาณเท่านั้น
อินเดล
ตัวอย่าง
·สคริปต์ Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq
· คีย์คำสั่งเบื้องหลัง easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
แผนที่ maq part1.map ref.bfa part1.bfq;
แผนที่ maq part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq ประกอบ cns.cns ref.bfa aln.map;
ใช้ maq ออนไลน์โดยใช้บริการ onworks.net