Ini adalah perintah pymvpa2-crossval yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa stasiun kerja online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
pymvpa2-crossval - validasi silang kinerja pelajar
RINGKASAN
pymvpa2 lintas katup [--Versi: kapan] [-h] -i HIMPUNAN DATA [HIMPUNAN DATA ...] --pelajar PELAJAR [--pelajar-
ruang LEARNER_SPACE] --pemisah PEMERINTAH [--kesalahanfx ERORFX] [--rata-rata-datafold-
hasil] [--keseimbangan-pelatihan BALANCE_TRAINING] [--pengulangan-pengulangan-pengambilan sampel
SAMPLING_REPETISI] [--permutasi PERMUTASI] [--prob-ekor {kiri kanan}] -o KELUARAN
[--hdf5-kompresi JENIS]
DESKRIPSI
Validasi silang kinerja pelajar
Seorang pelajar berulang kali dilatih dan diuji pada partisi dari dataset input yang
dihasilkan oleh skema partisi yang dapat dikonfigurasi. Partisi biasanya merupakan pelatihan
dan bagian pengujian. Pelajar dilatih pada bagian pelatihan dari kumpulan data dan kemudian
Generalisasi pembelajar diuji dengan membandingkan prediksinya pada bagian pengujian.
Ringkasan kinerja pelajar ditulis ke STDOUT. Tergantung pada pengaturan tertentu
analisis validasi silang, baik prediksi mentah atau ringkasan pelajar
statistik dikembalikan dalam set data keluaran.
Jika pengujian permutasi Monte-Carlo diaktifkan (lihat --permutasi) kumpulan data keluaran kedua
dengan nilai-p yang sesuai disimpan juga (akhiran nama file '_nullprob').
PILIHAN
--Versi: kapan
tampilkan versi program dan informasi lisensi dan keluar
-h, --membantu, --bantu-np
tunjukkan pesan bantuan ini dan keluar. --bantu-np secara paksa menonaktifkan penggunaan pager
untuk menampilkan bantuan.
-i SET DATA [SET DATA ...], --memasukkan SET DATA [SET DATA ...]
path ke satu atau lebih file set data PyMVPA. Semua kumpulan data akan digabungkan menjadi
dataset tunggal (vstack'ed) dalam urutan spesifikasi. Dalam beberapa kasus, opsi ini mungkin
perlu ditentukan lebih dari sekali jika beberapa, tetapi terpisah, kumpulan data input adalah
diperlukan.
Opsi untuk validasi silang mempersiapkan:
--pelajar PELAJAR
pilih pelajar (simpul yang dapat dilatih) melalui deskripsinya di gudang pelajar (lihat
perintah 'info' untuk daftar), daftar kemampuan yang dipisahkan titik dua, atau dengan file
path ke skrip Python yang membuat instance classifier (lanjutan).
--belajar-ruang LEARNER_SPACE
nama atribut sampel yang mendefinisikan model yang akan dipelajari oleh pelajar. Oleh
default ini adalah atribut bernama 'target'.
--pemisah PEMERINTAH
pilih skema pelipatan data. Argumen yang didukung adalah: 'setengah' untuk split-half
partisi, 'ganjil' untuk mempartisi menjadi potongan ganjil dan genap, 'grup-X' di mana
X dapat berupa bilangan bulat positif apa pun untuk dipartisi dalam grup X, 'nX' di mana X dapat
bilangan bulat positif apa pun untuk partisi leave-X-chunks out. Dengan partisi default
beroperasi pada potongan dataset yang ditentukan oleh atribut sampel 'potongan'. Nama
dari atribut "chunking" dapat diubah dengan menambahkan titik dua dan nama
atribut (misalnya 'ganjil: jalankan'). opsional argumen untuk opsi ini juga bisa
jalur file ke skrip Python yang membuat instance partisi khusus
(canggih).
--kesalahanfx ERORFX
fungsi kesalahan untuk diterapkan pada target dan prediksi masing-masing
lipatan data validasi silang. Ini bisa berupa nama fungsi kesalahan apa pun di
Modul mvpa2.misc.errorfx PyMVPA, atau jalur file ke skrip Python yang membuat
fungsi kesalahan khusus (lanjutan).
--avg-datafold-hasil
nilai hasil rata-rata di seluruh lipatan data yang dihasilkan oleh pemartisi. Sebagai contoh
untuk menghitung kesalahan prediksi rata-rata di semua lipatan prosedur validasi silang.
--keseimbangan-pelatihan BALANCE_TRAINING
Jika diaktifkan, sampel pelatihan akan diseimbangkan dalam setiap lipatan data. Jika kata kunci
'sama' diberikan sebagai argumen jumlah sampel acak yang sama untuk setiap unik
nilai target dipilih. Jumlah sampel per kategori ditentukan oleh
kategori dengan jumlah sampel paling sedikit di set pelatihan masing-masing. NS
argumen integer akan menyebabkan jumlah sampel yang sesuai per kategori menjadi
dipilih secara acak. Argumen angka floating point (interval [0,1]) menunjukkan
berapa fraksi sampel yang tersedia yang harus dipilih.
--pengulangan-pengulangan-pengambilan sampel SAMPLING_REPETISI
Jika penyeimbangan set pelatihan diaktifkan, seberapa sering pemilihan sampel acak harus dilakukan?
dilakukan untuk setiap lipatan data. Standar: 1
--permutasi PERMUTASI
Jumlah permutasi Monte-Carlo yang akan dihitung untuk mengestimasi H0
distribusi untuk semua hasil validasi silang. Mengaktifkan opsi ini akan membuat
laporan nilai-p yang sesuai tersedia dalam ringkasan hasil dan output.
--prob-ekor {kiri kanan}
bagian mana dari distribusi probabilitas untuk melaporkan nilai-p saat mengevaluasi
hasil tes permutasi. Misalnya, prediksi rata-rata komputasi validasi silang
kesalahan dapat melaporkan nilai-p ekor kiri untuk pengujian satu sisi.
Keluaran pilihan:
-o KELUARAN, --keluaran KELUARAN
nama file keluaran (ekstensi '.hdf5' ditambahkan secara otomatis jika perlu). CATATAN:
format output cocok untuk pertukaran data antara perintah PyMVPA, tetapi tidak
direkomendasikan untuk penyimpanan atau pertukaran jangka panjang karena konten spesifiknya dapat bervariasi
tergantung pada lingkungan perangkat lunak yang sebenarnya. Untuk penyimpanan jangka panjang pertimbangkan
konversi ke format data lain (lihat perintah 'dump').
--hdf5-kompresi JENIS
jenis kompresi untuk penyimpanan HDF5. Nilai yang tersedia tergantung pada HDF5 . tertentu
instalasi. Nilai umum adalah: 'gzip', 'lzf', 'szip', atau bilangan bulat dari 1 hingga 9
menunjukkan tingkat kompresi gzip.
Gunakan pymvpa2-crossval online menggunakan layanan onworks.net