این دستور pymvpa2-crossval است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
pymvpa2-crossval - اعتبارسنجی متقابل عملکرد یادگیرنده
خلاصه
pymvpa2 متقاطع [- نسخه] [-h] -i DATASET [DATASET ...] -- یادگیرنده یادگیرنده [--یادگیرنده-
فضا LEARNER_SPACE] -- پارتیشن کننده پارتیشن ساز [--errorfx ERRORFX] [--avg-datafold-
نتایج] [-- آموزش تعادل BALANCE_TRAINING] [--نمونه گیری-تکرار
SAMPLING_REPETITIONS] [-- جایگشت ها جایگشت] [--prob-tail {چپ راست}] -o OUTPUT
[--hdf5-فشرده سازی TYPE]
شرح
اعتبارسنجی متقابل عملکرد یادگیرنده
یک یادگیرنده به طور مکرر بر روی پارتیشن های یک مجموعه داده ورودی که هستند آموزش دیده و آزمایش می شود
تولید شده توسط یک طرح پارتیشن بندی قابل تنظیم. پارتیشن معمولاً آموزش را تشکیل می دهد
و بخش های تست یادگیرنده در مورد بخش آموزشی از مجموعه داده آموزش می بیند و سپس
تعمیم یادگیرنده با مقایسه پیشبینیهای آن در بخش آزمون آزمایش میشود.
خلاصه ای از عملکرد یادگیرنده در STDOUT نوشته می شود. بسته به تنظیمات خاص
از تجزیه و تحلیل اعتبار متقابل، یا پیشبینیهای خام یادگیرنده یا خلاصه
آمار در یک مجموعه داده خروجی برگردانده می شود.
اگر تست جایگشت مونت کارلو فعال باشد (نگاه کنید به -- جایگشت ها) مجموعه داده خروجی دوم
با مقادیر p مربوطه نیز ذخیره می شود (پسوند نام فایل '_nullprob').
OPTIONS
- نسخه
نمایش اطلاعات نسخه و مجوز برنامه و خروج
-h, --کمک, --help-np
این پیام راهنما را نشان داده و خارج شوید. --help-np استفاده از پیجر را به زور غیرفعال می کند
برای نمایش راهنما
-i DATASET [DATASET ...]، -- ورودی DATASET [DATASET ...]
مسیر(های) یک یا چند فایل مجموعه داده PyMVPA. همه مجموعه داده ها در یک ادغام خواهند شد
مجموعه داده واحد (vstack'ed) به ترتیب مشخصات. در برخی موارد این گزینه ممکن است
اگر مجموعه داده های ورودی چندگانه، اما مجزا هستند، باید بیش از یک بار مشخص شوند
مورد نیاز است.
گزینه برای اعتبار سنجی متقابل راه اندازی:
-- یادگیرنده یادگیرنده
یک یادگیرنده (گره قابل آموزش) را از طریق توضیحات آن در انبار یادگیرنده انتخاب کنید (نگاه کنید به
دستور 'info' برای یک فهرست)، فهرستی از قابلیتها با دو نقطه جدا شده یا توسط یک فایل
مسیری به یک اسکریپت پایتون که یک نمونه طبقه بندی کننده (پیشرفته) ایجاد می کند.
--فضای یادگیرنده LEARNER_SPACE
نام یک ویژگی نمونه که مدلی را که باید یادگیرنده یاد بگیرد را تعریف می کند. توسط
به طور پیش فرض این یک ویژگی به نام "targets" است.
-- پارتیشن کننده پارتیشن ساز
یک طرح تاشو داده را انتخاب کنید. آرگومان های پشتیبانی شده عبارتند از: 'نیمی' برای تقسیم-نیمه
پارتیشن بندی، "oddeven" برای پارتیشن بندی به تکه های فرد و زوج، "گروه-X" که در آن
X می تواند هر عدد صحیح مثبتی برای پارتیشن بندی در گروه های X باشد، "nX" جایی که X می تواند باشد
هر عدد صحیح مثبت برای پارتیشن بندی ترک-X-تکه ها خارج می شود. به صورت پیش فرض پارتیشن
بر روی تکههای مجموعه دادهای که با یک ویژگی نمونه «تکهها» تعریف میشوند، کار میکنند. نام
ویژگی "chunking" را می توان با اضافه کردن یک دو نقطه و نام آن تغییر داد
ویژگی (به عنوان مثال 'oddeven:run'). به صورت اختیاری یک آرگومان برای این گزینه نیز می تواند باشد
یک مسیر فایل به یک اسکریپت پایتون که یک نمونه پارتیشن سفارشی ایجاد می کند
(پیشرفته).
--errorfx ERRORFX
تابع خطا برای اهداف و پیش بینی های هر کدام اعمال شود
فولد داده اعتبارسنجی متقابل این می تواند نام هر تابع خطایی در آن باشد
ماژول mvpa2.misc.errorfx PyMVPA، یا یک مسیر فایل به یک اسکریپت پایتون که ایجاد می کند
یک تابع خطای سفارشی (پیشرفته).
--avg-datafold-results
میانگین مقادیر نتیجه در میان تاهای داده تولید شده توسط پارتیشنکننده. مثلا
برای محاسبه میانگین خطای پیشبینی در تمام مراحل یک روش اعتبارسنجی متقابل.
-- آموزش تعادل BALANCE_TRAINING
اگر فعال باشد، نمونه های آموزشی در هر فولد داده متعادل می شوند. اگر کلمه کلیدی
'برابر' به عنوان آرگومان تعداد مساوی از نمونه های تصادفی برای هر منحصر به فرد داده می شود
مقدار هدف انتخاب شده است. تعداد نمونه ها در هر دسته بر اساس تعیین می شود
دسته با کمترین تعداد نمونه در مجموعه آموزشی مربوطه. یک
آرگومان عدد صحیح باعث می شود تعداد نمونه های مربوطه در هر دسته به آن برسد
به صورت تصادفی انتخاب شود آرگومان عدد ممیز شناور (فاصله [0,1،XNUMX]) نشان می دهد
چه کسری از نمونه های موجود باید انتخاب شود.
--نمونه گیری-تکرار SAMPLING_REPETITIONS
اگر تعادل مجموعه آموزشی فعال باشد، انتخاب نمونه تصادفی باید چند بار انجام شود
برای هر فولد داده انجام می شود. پیش فرض: 1
-- جایگشت ها جایگشت
تعداد جایگشت های مونت کارلو که باید برای تخمین H0 محاسبه شوند
توزیع برای همه نتایج اعتبار متقابل فعال کردن این گزینه باعث می شود
گزارشهایی از مقادیر p مربوطه موجود در خلاصه نتیجه و خروجی.
--prob-tail {چپ راست}
کدام دنباله از توزیع احتمال برای گزارش مقادیر p در هنگام ارزیابی
نتایج تست جایگشت برای مثال، پیشبینی میانگین محاسباتی اعتبار متقابل
خطا می تواند مقدار p دم چپ را برای یک تست یک طرفه گزارش کند.
تولید گزینه ها:
-o خروجی، -- خروجی OUTPUT
نام فایل خروجی (پسوند '.hdf5' به طور خودکار در صورت لزوم اضافه می شود). توجه داشته باشید که
فرمت خروجی برای تبادل داده بین دستورات PyMVPA مناسب است، اما اینطور نیست
برای ذخیره یا تبادل طولانی مدت توصیه می شود زیرا محتوای خاص آن ممکن است متفاوت باشد
بسته به محیط واقعی نرم افزار. برای ذخیره سازی طولانی مدت در نظر بگیرید
تبدیل به سایر فرمت های داده (به دستور 'dump' مراجعه کنید).
--hdf5-فشرده سازی TYPE
نوع فشرده سازی برای ذخیره سازی HDF5. مقادیر موجود به HDF5 خاص بستگی دارد
نصب و راه اندازی. مقادیر معمولی عبارتند از: 'gzip'، 'lzf'، 'szip' یا اعداد صحیح از 1 تا 9
سطوح فشرده سازی gzip را نشان می دهد.
از pymvpa2-crossval به صورت آنلاین با استفاده از خدمات onworks.net استفاده کنید