این دستور spidey است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
spidey - توالی های mRNA را با یک ژنوم تراز کنید
خلاصه
موج دار [-] [-F N] [-G] [-L N] [-M نام فایل] [-N نام فایل] [-R نام فایل] [-S بعد از ظهر] [-T N]
[-X] [-a نام فایل] [-c N] [-d] [-e X] [-f X] [-g X] -i نام فایل [-j] [-k نام فایل] [-l N]
-m نام فایل [-n N] [-o خ] [-p N] [-r c/d/m/p/v] [-s] [-t نام فایل] [-u] [-w]
شرح
موج دار ابزاری برای تراز کردن یک یا چند توالی mRNA با یک توالی ژنومی معین است.
موج دار با دو هدف اصلی در ذهن نوشته شده است: یافتن ترازهای خوب بدون توجه به اینترون
اندازه؛ و از گیج شدن توسط شبهزاها و پارالوگهای نزدیک خودداری کنید. به سمت اولی
هدف، موج دار از BLAST و Dot View (یکی دیگر از ابزارهای تراز محلی) برای یافتن آن استفاده می کند
ترازها از آنجایی که این هر دو ابزار تراز محلی هستند، موج دار ذاتا نیست
اینترون های کوتاهتر یا طولانی تر را ترجیح می دهند و حداکثر اندازه اینترون را ندارند. برای جلوگیری از اشتباه
از جمله اگزون های پارالوگ و شبه زا، موج دار ابتدا پنجره هایی را روی ژنومیک تعریف می کند
توالی و سپس تراز mRNA به ژنوم را به طور جداگانه در هر پنجره انجام می دهد.
به دلیل نحوه ساخت پنجره ها، پارالوگ ها یا شبه ژن های همسایه باید
در پنجره های جداگانه باشد و نباید در ترازبندی نهایی قرار گیرد.
اول ترازها و ساخت و ساز of ژنومی پنجره
موج دار یک توالی ژنومی منفرد و مجموعه ای از پیوست های mRNA یا FASTA را به عنوان ورودی می گیرد
دنباله ها تمام پردازش ها در یک زمان یک توالی mRNA انجام می شود. اولین قدم برای هر کدام
توالی mRNA یک BLAST با شدت بالا در برابر توالی ژنومی است. ضربه های حاصله
برای یافتن پنجره های ژنومی تجزیه و تحلیل می شوند.
ترازهای BLAST بر اساس امتیاز مرتب شده و سپس توسط یک بازگشتی به ویندوز اختصاص داده می شوند
تابعی که اولین تراز را می گیرد و سپس از لیست تراز پایین می رود تا همه را پیدا کند
ترازهایی که با اولین (رشته مشابه mRNA، هر دو mRNA و
مختصات ژنومی غیر همپوشانی و به طور خطی سازگار هستند). در پاس های بعدی،
ترازهای باقیمانده مورد بررسی قرار می گیرند و به صورت غیر همپوشانی خاص خود قرار می گیرند،
پنجره های ثابت، تا زمانی که هیچ تراز باقی نماند. بسته به اینکه چند مدل ژنی باشد
مورد نظر، بالا n پنجره ها برای رفتن به مرحله بعدی انتخاب می شوند و بقیه هستند
حذف شده.
تراز کردن in هر پنجره
هنگامی که پنجره های ژنومی ساخته شدند، ترازهای اولیه BLAST آزاد می شوند و
جستجوی BLAST دیگری انجام می شود، این بار با کل mRNA در برابر ژنومیک
منطقه تعریف شده توسط پنجره، و با سختی کمتر از جستجوی اولیه. موج دار
سپس از یک الگوریتم حریص برای ایجاد یک زیرمجموعه با امتیاز بالا و بدون همپوشانی از
ترازها از دومین جستجوی BLAST. این مجموعه سازگار با دقت مورد تجزیه و تحلیل قرار می گیرد
اطمینان حاصل کنید که کل توالی mRNA توسط ترازها پوشانده شده است. وقتی شکاف هایی پیدا می شود
بین ترازها، ناحیه مناسب توالی ژنومی در برابر آن جستجو می شود
mRNA از دست رفته، ابتدا از یک BLAST با شدت کم استفاده کنید و اگر BLAST نتواند یک
ضربه بزنید، با استفاده از توابع DotView برای تعیین محل تراز. وقتی شکاف هایی در انتهای آن یافت می شود
همترازیها، جستجوهای BLAST و DotView در واقع مجاز به گسترش بیش از حد هستند
مرزهای پنجره اگر انتهای 3' mRNA به طور کامل در یک راستا قرار نگیرد، همینطور است
ابتدا برای وجود دم پلی (A) مورد بررسی قرار گرفت. هیچ تلاشی برای تراز کردن صورت نمی گیرد
بخشی از mRNA که به نظر می رسد دم پلی (A) باشد. گاهی اوقات یک دم پلی (A) وجود دارد
که با توالی ژنومی همخوانی دارد، و اینها به این دلیل ذکر می شوند که نشان می دهند
احتمال وجود یک شبه ژن
اکنون که mRNA به طور کامل توسط مجموعه همترازی ها پوشانده شده است، مرزهای
ترازها (اکنون باید یک تراز در هر اگزون وجود داشته باشد) به گونه ای تنظیم می شوند که
ترازها دقیقاً به یکدیگر متصل می شوند و به گونه ای که در مجاورت اسپلایس دهنده خوب قرار دارند
و سایت های پذیرنده معمولاً، ترازهای دو اگزون مجاور به اندازه هم همپوشانی دارند
20 یا 30 جفت باز روی توالی mRNA. مرز اگزون واقعی ممکن است در هر جایی از آن باشد
این همپوشانی، یا (همانطور که به طور تجربی دیدیم) حتی چند جفت پایه خارج از همپوشانی.
برای قرار دادن مرزهای اگزون، همپوشانی به اضافه چند جفت باز در هر طرف است
با استفاده از توابعی که دارای ماتریسهای اسپلایس متفاوتی هستند، برای مکانهای اهداکننده اسپلایس بررسی شدند
بسته به ارگانیسم انتخاب شده چند سایت اهداکننده برتر (بر اساس امتیاز) هستند
ارزیابی شد که چقدر بر مرزهای تراز اصلی تأثیر می گذارد. سایتی که
کمترین مرزها را تحت تأثیر قرار می دهد، انتخاب می شود و به عنوان وجود یک ارزیابی می شود
سایت پذیرنده ترازها در صورت لزوم کوتاه یا گسترش می یابند تا آنها
در محل اهداکننده اسپلایس خاتمه می یابد و به طوری که همپوشانی ندارند.
نهایی نتیجه
پنجره ها به دقت بررسی می شوند تا درصد هویت در هر اگزون، تعداد آنها بدست آید
شکاف در هر اگزون، درصد هویت کلی، درصد پوشش mRNA، حضور
یک دم پلی (A) هم تراز یا غیر هم تراز، تعداد مکان های اهداکننده پیوند و وجود یا
عدم وجود مکانهای دهنده و پذیرنده پیوند برای هر اگزون و وقوع mRNA
که دارای انتهای 5' یا 3' (یا هر دو) است که با توالی ژنومی هماهنگ نیست. اگر
درصد هویت کلی و درصد پوشش طول بالاتر از برش های تعریف شده توسط کاربر است، a
گزارش خلاصه چاپ می شود، و در صورت درخواست، یک تراز متنی که هویت و
عدم تطابق نیز چاپ شده است.
بین گونه ها ترازها
موج دار قادر به انجام ترازهای بین گونه ای است. تفاوت عمده در
ترازهای بین گونه ای این است که هویت mRNA ژنومی نزدیک به 100٪ نخواهد بود.
در ترازهای درون گونه ای قرار دارد. همچنین ترازها دارای شکاف های متعدد و طولانی هستند. اگر
موج دار در حالت عادی خود برای انجام همترازی بین گونه ای استفاده می شود، مدل های ژنی را تولید می کند
با اگزون های بسیار بسیار کوتاه. وقتی پرچم بین گونه ها تنظیم شد، موج دار استفاده های مختلف
پارامترهای BLAST برای تشویق شکاف های طولانی تر و بیشتر و جریمه نکردن آنچنان سنگین
عدم تطابق به این ترتیب، هم ترازی برای اگزون ها بسیار طولانی تر و نزدیک تر است
ساختار واقعی ژن را تقریبی کنید.
استخراج CDS ترازها
چه زمانی موج دار در حالت آگاه از شبکه یا زمانی که فایل های ASN.1 برای mRNA استفاده می شود اجرا می شود
سوابق، می تواند یک تراز CDS را از یک ردیف mRNA استخراج و چاپ کند
اطلاعات CDS نیز. از آنجایی که هم ترازی CDS فقط زیر مجموعه ای از تراز mRNA است،
کوتاه کردن ترازهای اگزون در صورت لزوم و به نسبت ساده است
ایجاد یک تراز CDS. علاوه بر این، اکنون مناطق ترجمه نشده تعریف شده اند، بنابراین
درصد هویت برای مناطق ترجمه نشده 5' و 3' نیز محاسبه شده است.
OPTIONS
خلاصه ای از گزینه ها در زیر آمده است.
- پیام مصرف چاپ
-F N شروع فاصله ژنومی مورد نظر (از؛ بر اساس 0).
-G فایل ورودی یک لیست GI است.
-L N اندازه اینترون بسیار بزرگ برای استفاده (پیشفرض = 220000).
-M نام فایل
فایل با ماتریس پیوند دهنده.
-N نام فایل
فایل با ماتریس اتصال پذیرنده.
-R نام فایل
فایل (از جمله مسیر) برای تکرار پایگاه داده انفجار برای فیلتر کردن.
-S بعد از ظهر محدود به رشته های مثبت (p) یا منهای (m) توالی ژنومی.
-T N توقف فاصله ژنومی مورد نظر (تا؛ بر اساس 0).
-X از اندازه های اینترون بسیار بزرگ استفاده کنید (محدودیت اینترون های اولیه و پایانی را افزایش می دهد
از 100 کیلو بایت تا 240 کیلوبایت و برای بقیه از 35 کیلوبایت تا 120 کیلوبایت)؛ ممکن است منجر شود
زمان های محاسبه به طور قابل توجهی طولانی تر
-a نام فایل
فایل خروجی برای ترازها هنگامی که به یک فایل جداگانه هدایت می شود -p 3 (پیش فرض =
spidey.aln).
-c N قطع هویت، بر حسب درصد، برای اهداف کنترل کیفیت.
-d همچنین سعی کنید دنباله های کد کننده مربوط به رکوردهای mRNA داده شده را تراز کنید (ممکن است
نیاز به دسترسی به شبکه).
-e X ارزش الکترونیکی گذر اول (پیشفرض = 1.0e-10). مقادیر بالاتر باعث افزایش سرعت در هزینه می شود
از حساسیت
-f X ارزش الکترونیکی گذر دوم (پیشفرض = 0.001).
-g X ارزش الکترونیکی گذر سوم (پیشفرض = 10).
-i نام فایل
فایل ورودی حاوی توالی ژنومی با فرمت ASN.1 یا FASTA. اگر شما
کامپیوتر در شبکه ای اجرا می شود که می تواند به GenBank دسترسی داشته باشد، می توانید آن را جایگزین کنید
شماره دسترسی مورد نظر برای نام فایل
-j چاپ تراز ASN.1؟
-k نام فایل
فایل برای خروجی ASN.1 با -k (پیش فرض = spidey.asn).
-l N قطع پوشش طول، بر حسب درصد.
-m نام فایل
فایل ورودی حاوی توالی(های) mRNA در قالب ASN.1 یا FASTA، یا لیستی از
الحاقات آنها (با -G). اگر رایانه شما روی شبکه ای کار می کند که می تواند
با دسترسی به GenBank، می توانید یک شماره دسترسی واحد را برای نام فایل جایگزین کنید.
-n N تعداد مدلهای ژنی برای بازگشت در هر mRNA ورودی (پیشفرض = 1).
-o خ فایل خروجی اصلی (پیشفرض = stdout؛ محتویات کنترل شده توسط -p).
-p N تراز چاپی؟
0 خلاصه و ترازها با هم (پیشفرض)
1 فقط خلاصه
2 فقط ترازها
3 خلاصه و تراز در فایل های مختلف
-r c/d/m/p/v
ارگانیسم توالی ژنومی، برای تعیین ماتریس های اسپلایس استفاده می شود.
c C. elegans
d Drosophila
m Dictyostelium discoideum
p گیاه
v مهره داران (پیش فرض)
-s برای ترازهای بین گونه ای تنظیم کنید.
-t نام فایل
فایل با جدول ویژگی، در 4 ستون جدا شده با برگه:
seqid (به عنوان مثال، NM_04377.1)
نام (فقط منطقه_تکراری در حال حاضر پشتیبانی می شود)
شروع (بر اساس 0)
متوقف کردن (بر اساس 0)
-u یک تراز چندگانه از همه mRNA های ورودی (که باید روی ژنومیک همپوشانی داشته باشند) ایجاد کنید
توالی).
-w کاراکترهای کوچک را در دنباله های ورودی FASTA در نظر بگیرید تا ماسک شوند.
با استفاده از خدمات onworks.net از spidey آنلاین استفاده کنید