Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen timbl komutudur.
Program:
ADI
timbl - Tilburg Hafıza Tabanlı Öğrenci
SİNOPSİS
timbl [seçenekler]
timbl -f veri dosyası -t test dosyası
TANIM
TiMBL, çeşitli bellek tabanlı öğrenmeyi uygulayan açık kaynaklı bir yazılım paketidir
k-en yakın komşu sınıflandırmasının bir uygulaması olan IB1-IG'nin de aralarında bulunduğu algoritmalar
sembolik özellik alanlarına uygun özellik ağırlıklandırması ve bir karar ağacı olan IGTree ile
IB1-IG'nin yaklaşımı. Uygulanan tüm algoritmaların ortak noktası, bazılarını saklamalarıdır.
eğitim setinin bellekte açıkça temsil edilmesi. Testler sırasında yeni vakalar
en benzer saklanan vakalardan ekstrapolasyonla sınıflandırılır.
SEÇENEKLER
-a veya -a
sınıflandırma algoritmasını belirler.
Olası değerler şunlardır:
0 or IB
IB1 (k-NN) algoritması (varsayılan)
1 or IGTREE
IB1'in karar ağacı tabanlı yaklaşımı
2 or TRİBL
IB1 ve IGTREE'nin bir melezi
3 or IB2
IB1'in artımlı düzenleme sürümü
4 or TRIBL2
TRIBL'in parametrik olmayan bir versiyonu
-b n
önyükleme için kullanılan satır sayısı (yalnızca IB2)
-B n
sayısal özellik değerlerinin ayrıklaştırılması için kullanılan kutu sayısı
--Işın=
+v db çıktısını en yüksek oyu alan n sınıfla sınırla
--klonlar=
paralel test için kullanılacak f sayısı
-c n
MVDM matrislerini önceden saklamak için kırpma frekansı
+D
tüm düğümlerdeki dağıtımları depolayın (IGTree ile +v db kullanmak için gereklidir, ancak israflar
aksi takdirde hafıza)
--Çeşitlendirmek
ağırlığı yeniden ölçeklendirin (belgelere bakın)
-d val
Komşuları mesafelerine göre tartın:
Z : herkese eşit ağırlık (varsayılan)
ID : Ters Mesafe
IL : Ters Doğrusal
ED:a : a faktörlü Üstel Azalma (boşluk yok!)
ED:a:b : a ve b faktörlü Üstel Azalma (boşluk yok!)
-e n
n modelin test edilmesine kadar geçen süreyi tahmin edin
-f dosya
'dosya' veri dosyasından okuyun VEYA çapraz doğrulama testi için 'dosya'daki dosya adlarını kullanın
-F biçim
belirtilen giriş formatını varsayalım (Kompakt, C4.5, ARFF, Sütunlar, İkili, Seyrek)
-G normalleştirme
dağıtımları normalleştir (yalnızca +v db seçeneği)
Desteklenen normalleştirmeler şunlardır:
Olasılık or 0
0 ile 1 arasında normalleştirme
addFactor: veya 1:
tüm olası hedeflere f ekleyin, ardından 0 ile 1 arasında normalleştirin (varsayılan f=1.0).
logOlasılık or 2
Hedef Ağırlığa 1 ekleyin, 10Log'u alın ve ardından 0 ile 1 arasında normalleştirin
+H or -H
karma ağaçları yaz (varsayılan +H)
-i dosya
InstanceBase'i 'dosyadan' okuyun (aşama 1 ve 2'yi atlar)
-I dosya
InstanceBase'i 'dosyaya' boşaltın
-k n
'n' en yakın komşuları ara (varsayılan n = 1)
-L n
n düzeyinde MVDM'den Çakışmaya geri çekilmek için değer frekans eşiğini ayarlayın
-l n
sabit özellik değeri uzunluğu (yalnızca Kompakt format)
-m dizi
özellik metriklerini 'string'de belirtildiği şekilde kullanın:
Format şu şekildedir: GlobalMetric:MetricRange:MetricRange
örneğin: mO:N3:I2,5-7
C: kosinüs mesafesi. (Yalnızca küresel. sayısal özellikler ima edilir)
D: nokta çarpım. (Yalnızca küresel. sayısal özellikler ima edilir)
DC: Zar katsayısı
O: ağırlıklı örtüşme (varsayılan)
E: Öklid mesafesi
L: Levenstein mesafesi
M: değiştirilmiş değer farkı
J: Jeffrey farklılığı
S: Jensen-Shannon farklılığı
N: sayısal değerler
I: Adlandırılmış değerleri yoksay
--matrixin=dosya
'dosya' dosyasından Değer Farkı Matrislerini oku
--matrixout=dosya
ValueDifference Matrislerini 'dosyada' saklayın
-n dosya
C4.5 tarzı bir ad dosyası 'dosyası' oluşturun
-M n
MaxBests Dizisinin boyutu
-N n
özellik sayısı (varsayılan 2500)
-o s
çıktı dosya adı olarak s'yi kullan
-- oluşumlar=
Giriş dosyası oluşum sayımlarını içerir (son konumda) değer bir olabilir
edilmiştir: tren , test or her ikisi de
-O yol
çıktıyı 'yol' kullanarak kaydedin
-p n
ilerlemeyi her n satırda göster (varsayılan p = 100,000)
-P yol
'yol' kullanarak verileri oku
-q n
TRIBL eşiğini n seviyesine ayarla
-R n
bağları tohum n ile rastgele çöz
-s
giriş dosyasındaki örnek ağırlıkları kullanın
-s0
giriş dosyasındaki örnek ağırlıkları göz ardı edin
-T n
sınıf etiketi olarak n özelliğini kullanın. (varsayılan: son özellik)
-t dosya
'dosya'yı kullanarak test edin
-t Leave_one_out
birini dışarıda bırakma test rejimiyle test edin (yalnızca IB1). --sloppy'yi ekleyebilirsiniz
bir tanesini dışarıda bırakma testini hızlandırın (ancak belgelere bakın)
-t çapraz_validate
çapraz doğrulama testi gerçekleştirin (yalnızca IB1)
-t @dosya
'dosya'da açıklanan dosyaları ve seçenekleri kullanarak test edin Desteklenen seçenekler: de F kmopq
R tuvwx % -
--Ağaç Düzeni =değer n
Ağacın sıralaması:
Yapın: yok
GRO: GainRatio'yu kullanma
IGO: InformationGain'i kullanma
1/V: Değerlerin 1/#'sini kullanma
G/V: Kazanç Oranı/Değersiz Sayısı kullanılarak
I/V: InfoGain/Değersiz Sayısı kullanma
X2O: X-karesini kullanma
X/V: X-karesini/Değer Sayısını kullanma
SVO: Paylaşılan Varyansı kullanma
S/V: Paylaşılan Farkı/Değer Sayısını kullanma
GxE: GainRatio * SplitInfo'yu kullanma
IxE: InformationGain * SplitInfo'yu kullanma
1/S: 1/SplitInfo'yu kullanma
-u dosya
'dosyadan' değer sınıfı olasılıklarını okuyun
-U dosya
Değer sınıfı olasılıklarını 'dosya'ya kaydet
-V
SÜRÜMÜ Göster
+v seviye veya -v seviye
Ayrıntı düzeyini ayarlayın veya kaldırın; burada düzey:
s: sessizce çalış
o: ayarlanan tüm seçenekleri göster
b: düğüm/dal sayısını ve dallanma faktörünü göster
f: hesaplanan özellik ağırlıklarını göster (varsayılan)
p: değer farkı matrislerini göster
e: tam eşleşmeleri göster
şu şekilde: gelişmiş istatistikleri göster (bellek tüketir)
cm: karışıklık matrisini göster (+vas anlamına gelir)
cs: sınıf başına istatistikleri gösterir (+vas anlamına gelir)
cf: çıktı dosyasına güven ekleyin (-G gerektirir)
di: çıktı dosyasına mesafe ekle
db: çıktı dosyasına en iyi eşleşen dağıtımı ekle
md: çıktı dosyasına eşleşen derinliği ekleyin.
k: çıktı dosyasına tüm k komşular için bir özet ekleyin (setler -x)
n: çıktı dosyasına en yakın komşuları ekle (setler -x)
Seviyeleri '+' kullanarak birleştirebilirsiniz; örneğin +v p+db veya -v o+di
-w n
ağırlıklandırma
0 veya nw: ağırlıklandırma yok
1 veya gr: kazanç oranını kullanarak tartın (varsayılan)
2 veya ig: bilgi kazancını kullanarak tartın
3 veya x2: ki-kare istatistiğini kullanarak tartın
4 veya sv: paylaşılan varyans istatistiğini kullanarak tartın
5 veya sd: standart sapmayı kullanarak tartın. (tüm özellikler sayısal olmalıdır)
-w dosya
'dosyadan' ağırlıkları oku
-w dosya:n
'dosya'dan ağırlık n'yi oku
-W dosya
tüm ağırlıkları hesaplayın ve 'dosyaya' kaydedin
+% or -%
test sonucunu (%) dosyaya kaydedin veya kaydetmeyin
+x or -x
tam eşleme kısayolunu kullanın veya kullanmayın
(Yalnızca IB1 ve IB2, varsayılan -x'tir)
-X dosya
InstanceBase'i XML olarak 'dosyaya' boşaltın
Onworks.net hizmetlerini kullanarak timbl'i çevrimiçi kullanın