Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen dbacl komutudur.
Program:
ADI
dbacl - metin tanıma için sayısal bir Bayes sınıflandırıcısı.
SİNOPSİS
dbacl [-01dvnirmwMNDXW] [-T tip ] -l kategori [-H boyut] [-H gsize] [-X ondalık] [-Q
kalite] [-w maksimum_sipariş] [-e Deftok] [-Ö Online] [-L ölçmek] [-G regex] ...
[DOSYA]...
dbacl [-vnimNRX] [-h boyut] [-T tip] -c kategori [-C kategori]... [-F tutmak]... [DOSYA]...
dbacl -V
GENEL BAKIŞ
dbacl bir Bayes metin ve e-posta sınıflandırıcıdır. kullanırken -l geçiş, bir vücut öğrenir
metin ve adlı bir dosya üretin kategori hangi metni özetler. kullanırken -c
geçiş, bir giriş metin akışını herhangi bir sayıdaki ile karşılaştırır. kategori dosyalar ve çıktılar
en yakın eşleşmenin adı veya isteğe bağlı olarak aşağıda açıklanan çeşitli sayısal puanlar.
Bu kılavuz sayfasının bir referans olması amaçlandığından, birkaç öğretici ve
özel bilgi almak için okuyabileceğiniz belgeler. hakkında özel belgeler
tasarımı dbacl ve kullandığı istatistiksel modeller dbacl.ps içinde bulunabilir. için
kullanarak metin sınıflandırmasına genel bakış dbacl, öğretici.html'ye bakın. Yardımcı öğretici
email.html e-posta filtrelemeye yöneliktir. dbacl almakta sorun yaşıyorsanız
güvenilir bir şekilde sınıflandırın, is_it_working.html'yi okuyun. Bu kılavuz sayfasının KULLANIM bölümü de
bazı örnekleri var.
/usr/share/doc/dbacl/dbacl.ps
/usr/share/doc/dbacl/tutorial.html
/usr/share/doc/dbacl/email.html
/usr/share/doc/dbacl/is_it_working.html
dbacl göre oluşturulmuş bir maksimum entropi (minimum sapma) dil modeli kullanır
bir sayısal referans ölçüsüne (bilinmeyen belirteçler, digramlardan tahmin edilir, yani
Edebiyat). Pratik olarak, bu şu anlama gelir: kategori içindeki belirteçlerden inşa edilmiştir
eğitim seti, daha önce görülmeyen belirteçler otomatik olarak tahmin edilebilirken
Edebiyat. Buradaki simge, ya bir sözcük (parça) ya da sözcüklerin (parçaların) birleşimidir.
çeşitli anahtarlara göre seçilir. Öğrenme, belirteci değiştirerek kabaca çalışır
eğitim verileri en az şaşırtıcı olana kadar olasılıklar.
EXIT DURUMU
Normal kabuk çıkış kuralları takip edilmiyor (üzgünüz!). kullanırken -l komuta
biçim, dbacl başarı durumunda sıfır, bir hata oluşursa sıfırdan farklı olarak döner. kullanırken -c biçim,
dbacl karşılık gelen pozitif bir tamsayı döndürür kategori en yüksek arka ile
olasılık. Beraberlik durumunda, en olası ilk kategori seçilir. eğer bir hata
oluşur dbacl sıfır döndürür.
TANIM
Kullanıldığı zaman -l komut formu, dbacl bir veya daha fazla DOSYA adı verildiğinde bir kategori öğrenir,
hangi okunabilir ASCII metni içermelidir. DOSYA verilmezse, dbacl STDIN'den öğrenir. Eğer
DOSYA bir dizindir, açılır ve tüm dosyaları okunur, ancak alt dizinleri değil.
Sonuç, adlı ikili dosyaya kaydedilir. kategorive herhangi birinin yerini tamamen alır
önceki içerikler Kolaylık sağlamak için, DBACL_PATH ortam değişkeni bir
dizin, daha sonra bu, dosya yolunun başına eklenir, aksi takdirde kategori '/' veya a ile başlar
'.'.
Öğrenme için giriş metninin varsayılan olarak yapılandırılmamış düz metin olduğu varsayılır. Bu
e-postayı öğrenmek için uygun değildir, çünkü e-posta çeşitli taşıma kodlamaları içerir ve
sınıflandırma etkinliğini azaltabilecek biçimlendirme talimatları. kullanmalısın -T
bu durumda geçiş yap dbacl MIME'nin kodunu çözmesi ve filtrelemesi gerektiğini bilir
ve uygun şekilde HTML. RFC2822 e-posta girişi için uygun anahtar değerleri "-T email"dir,
HTML girişi için "-T html", genel XML stili girişi için "-T xml" ve "-T metni"
varsayılan düz metin biçimi. başka değerler de var -T aynı zamanda para cezasına da izin veren anahtar
kod çözme yeteneklerinin ayarlanması.
Kullanıldığı zaman -c komut formu, dbacl DOSYA'da bulunan metni sınıflandırmaya çalışır veya
DOSYA verilmemişse STDIN. her olası kategori ayrı ayrı verilmeli ve
önceden öğrenilmiş bir metin külliyatının dosya adı. Bir kolaylık olarak, eğer değişken
DBACL_PATH bir dizin içerir, başlamayan her dosya yolunun başına eklenir
'/' veya '.' ile. Sınıflandırmanın görünür çıktısı, kombinasyona bağlıdır
kullanılan ekstra anahtarların sayısı. Anahtar kullanılmazsa, STDOUT'ta çıkış gösterilmez. Ancak,
dbacl her zaman test edilebilecek bir çıkış kodu üretir.
Bir sınıflandırma çıktısını görmek için aşağıdakilerden en az birini kullanmanız gerekir. -v,-U,-n,-N,-D,-d
anahtarlar. Bazen, doğal bir varyasyon üretmek için kombinasyon halinde kullanılabilirler.
onların bireysel çıktıları. Ara sıra, dbacl ayrıca varsa STDERR üzerinde uyarılar üretir.
The -v switch, verilen tüm seçenekler arasından en iyi kategorinin adını verir.
The -U switch, en iyi kategorinin adını ve ardından bir güven yüzdesini verir.
Normalde, kullanmak istediğiniz anahtar budur. %100'lük bir yüzde şu anlama gelir: dbacl
seçiminden emindir, %0'lık bir yüzde ise başka bir kategorinin eşit olduğu anlamına gelir.
büyük ihtimalle. Bu model olasılığı değildir, ancak sınıflandırmanın ne kadar açık olduğunu ölçer.
emin olmayan sınıflandırmaları etiketlemek için kullanılabilir (örneğin, güven %25 veya daha azsa).
The -N switch, her kategori adını ve ardından ifade edilen (arka) olasılığını yazdırır
yüzde olarak. Yüzdeler her zaman %100'e ulaşır. Bu sezgiseldir, ancak yalnızca değerlidir
sınıflandırılan belge bir avuç jeton içeriyorsa (on veya daha az). ortak
çok daha fazla jetonun olduğu durumda, olasılıklar her zaman %100 ve %0'a son derece yakındır.
The -n switch, her kategori adını ve ardından onun negatif logaritmasını yazdırır.
olasılık. Bu, aşağıdakileri kullanmaya eşdeğerdir: -N geçiş, ancak çok daha kullanışlı. En küçük
sayı en iyi kategoriyi verir. Daha uygun bir form, her ikisini de kullanmaktır. -n ve -v hangi
her bir kategori adını ve ardından çapraz entropiyi ve analiz edilen belirteçlerin sayısını yazdırır.
Çapraz entropi, elde edilebilecek ortalama sıkıştırma oranını (bit olarak) ölçer.
verilen kategori modeli altında, giriş metninin belirteci başına. Üçünü de kullanırsanız -n,-v,-X
daha sonra her kategori için bir tür p-değerini temsil eden ekstra bir değer verilir.
kategori puanı. Bu, puanın eğitimle karşılaştırıldığında ne kadar tipik olduğunu gösterir.
belgeler, ancak yalnızca aşağıdaki durumlarda çalışır: -X anahtarı öğrenme sırasında kullanıldı ve yalnızca bazıları için
model türleri (örn. e-posta). Bu p-değerleri düzgün dağılmış ve bağımsızdır.
(eğer kategoriler bağımsız ise), bu nedenle Fisher'in ki kare testi kullanılarak birleştirilebilir.
kategori grupları için bileşik p değerleri elde edin.
The -v ve -X anahtarlar birlikte her kategori adını yazdırır ve ardından ayrıntılı bir
kategori puanının ayrıştırılması, çarpanlara ayrılmış ( sapma oranı + shannon entropisi
oran )* jeton sayısı @ p-değeri. Yine, bu yalnızca bazı model türlerinde çalışır.
The -v ve -U anahtarlar, her kategori adını yazdırır ve ardından
kategori puanı ( sapma oranı + shannon entropi oranı # puan farkı )* belirteci
sayın.
The -D switch, giriş metnini dahili olarak değiştirildiği şekilde yazdırır. dbacl önce
simgeleştirme. Örneğin, MIME kodlu bir e-posta belgesi sınıflandırılmışsa, bu
gerçekten belirtilecek ve sınıflandırılacak kodu çözülmüş metni yazdırır. Bu anahtar
çoğunlukla hata ayıklama için kullanışlıdır.
The -d anahtar dökümleri jetonları ve puanları okunurken. için yararlıdır
hata ayıklama veya sınıflandırmanın grafiksel temsillerini oluşturmak istiyorsanız. A
çıktının ayrıntılı açıklaması bu kılavuz sayfasının kapsamı dışındadır, ancak
dbacl.ps okuduysanız basit. Olası varyasyonlar şunları içerir: -d Birlikte -n
or -N.
Sınıflandırma prensip olarak bir veya birkaç kategori ile yapılabilir. iki veya daha fazla olduğunda
kategoriler kullanılırsa, giriş metni verildiğinde Bayes sonsal olasılığı kullanılır,
kategoriler üzerinde tek tip bir ön dağılım ile. Diğer önceki seçenekler için bkz.
yardımcı yardımcı program bayesol(1). Tek bir kategori kullanıldığında sınıflandırma yapılabilir.
puanı bir eşik ile karşılaştırarak. Ancak pratikte çok daha iyi sonuçlar
birkaç kategori ile elde edilmiştir.
Öğrenme ve sınıflandırma aynı komut çağrısında karıştırılamaz, ancak
kilitleme sorunu yok ve ayrı dbacl süreçler aynı anda çalışabilir
çünkü dosya işlemleri atomik olacak şekilde tasarlanmıştır.
Son olarak, şunu unutmayın dbacl belge topluluğunuzu veya bilgisayarlarınızı yönetmez
kategoriler ve özellikle mevcut bir kategori dosyasını genişletmenize izin vermez
yeni belgelerle Bu, yeni şeyler öğrenebilen çeşitli mevcut spam filtrelerinden farklıdır.
e-postalar kademeli olarak Bu sınırlama dbacl kısmen doğrusal olmayan prosedürden kaynaklanmaktadır.
öğrenme algoritmasında kullanılır ve kısmen artan esneklik arzusu.
Eğitim belgelerinizi aşağıdakilere kaydederek aşamalı öğrenmenin etkisini simüle edebilirsiniz.
arşivler ve zaman içinde bu arşivlere ekleme, periyodik olarak sıfırdan yeniden öğrenme.
Bu arşivler anında sıkıştırılır ve sıkıştırılırsa, öğrenme aslında daha hızlıdır
ihtiyaç duyulduğunda. Arşivlerinizin kontrolünü elinizde tutarak, arşivdeki bilgileri asla kaybetmezsiniz.
kategorileriniz ve farklı anahtarlar veya belirteçler ile kolayca deney yapabilir veya
İsterseniz eğitim belgeleri setleri.
İKİNCİL ANAHTARLAR
Varsayılan olarak, dbacl girdi metnini bir bütün olarak sınıflandırır. Ancak, kullanırken -f seçeneği
dbacl her bir giriş satırını ayrı ayrı filtrelemek için kullanılabilir, yalnızca şu satırları yazdırır:
tarafından tanımlanan bir veya daha fazla modeli eşleştirin tutmak (bir kategoriye atıfta bulunmak için kategori adını veya numarasını kullanın)
kategori). Bu, bazı satırları filtrelemek istiyorsanız kullanışlıdır, ancak satırlar
kısa ise hata oranı yüksek olabilir.
The -e,-w,-g,-j anahtarlar, uygun bir belirteç şeması seçmek için kullanılır. A
belirteç, bir kelime veya kelime parçası veya kelimelerin veya parçaların birleşimidir. belirteçlerin şekli
tarafından kullanılan dil modellerinin temelini oluşturduğu için önemlidir. dbacl. -e
switch, hızlı ancak sınırlı olan önceden tanımlanmış bir simgeleştirme şeması seçer. NS -w
anahtarından türetilen bileşik belirteçleri belirtir. -e değiştirmek. Örneğin, "-e alnum -w 2"
belirteçlerin örtüşen çiftler halinde birleştirilmiş alfasayısal kelime parçaları olması gerektiği anlamına gelir
(bigramlar). Ne zaman -j anahtarı kullanıldığında, tüm belirteçler küçük harfe dönüştürülür;
olası belirteçlerin sayısını ve dolayısıyla bellek tüketimini azaltır.
Eğer -g anahtarı kullanıldığında, belirteçlerin nasıl görüneceğini tamamen belirleyebilirsiniz.
düzenli bir ifade kullanarak. Birçok -g anahtarlar karmaşık oluşturmak için kullanılabilir
tokenizasyon şemaları ve her ifadenin içindeki parantezler seçmek için kullanılabilir
parçalar ve bunları n-gramlar halinde birleştirir. Böyle bir esnekliğin maliyeti azalır
sınıflandırma ve öğrenme hızı. Belirteçleştirme şemalarını denerken, kullanmayı deneyin
the -d or -D jetonları yazdıracakları için öğrenirken veya sınıflandırırken geçiş yapar
Böylece hangi metin parçalarının alındığını veya kaçırıldığını görebilirsiniz. düzenli
ifade sözdizimi, bkz. regex(7).
The -h ve -H anahtarlar ne kadar bellek düzenler dbacl öğrenmek için kullanabilir. Metin
sınıflandırma çok fazla bellek kullanabilir ve varsayılan olarak dbacl hatta kendini sınırlar
öğrenme doğruluğu masrafı. Çoğu durumda, bir sınıra ulaşılırsa, bir uyarı mesajı görüntülenir.
bazı tavsiyelerle STDERR'de basılabilir.
Aynı kategoriyi birkaç kez yeniden öğrenirken, önemli bir hızlanma elde edilebilir.
ile -1 geçiş yapın, çünkü bu önceden öğrenilmiş olasılıkların okunmasına izin verir.
kategori ve yeniden kullanılır.
Sınıflandırma doğruluğunun her şeyden önce miktarına ve kalitesine bağlı olduğunu unutmayın.
eğitim örnekleri ve daha sonra yalnızca ince ayar miktarı.
EXIT DURUMU
Kullanıldığı zaman -l komut formu, dbacl Başarıda sıfır döndürür. kullanırken -c biçim,
dbacl karşılık gelen pozitif bir tamsayı (1,2,3...) döndürür kategori en yüksek ile
arka olasılık. Beraberlik durumunda, en olası ilk kategori seçilir. eğer bir
Hata oluştu, dbacl sıfır döndürür.
SEÇENEKLER
-0 Öğrenirken ağırlık yüklenmesini engeller. Normalde, dbacl kategorinin olup olmadığını kontrol eder
dosya zaten var ve eğer öyleyse, başlangıç olarak mevcut ağırlıkları kullanmaya çalışır.
puan. Bu, öğrenmeyi önemli ölçüde hızlandırabilir. Eğer -0 (sıfır) anahtarı ayarlı,
sonra dbacl kategori dosyası yokmuş gibi davranır. Bu esas olarak aşağıdakiler için yararlıdır:
test yapmak. Bu anahtar, ağırlık kaymasına karşı koruma sağlamak için artık varsayılan olarak etkinleştirilmiştir.
bu, birçok öğrenme yinelemesinde doğruluğu azaltabilir. Kullanmak -1 zorlamak
ön yükleme.
-1 Kategori dosyası zaten mevcutsa, ağırlık ön yüklemesini zorlayın. tartışmasına bakın
-0 geçiş.
-a Puanları ekleyin. Her giriş satırı STDOUT'a yazılır ve dbacl puanları
eklendi. Bu, aşağıdakilerle son işleme için kullanışlıdır: bayesol(1). kolaylığı için
işleme, her orijinal giriş satırı tek bir boşlukla girintilenir (ayırt etmek için
ekli puanlardan) ve puanların bulunduğu satır (eğer -n kullanılır)
"puan" dizesiyle önek. ikinci bir kopyası ise dbacl bunu okuması gerekiyor
çıktı daha sonra, ile çağrılmalıdır -A geçiş.
-d Model parametrelerini STDOUT'a boşaltın. Ile bağlantılı olarak -l seçenek, bu
maksimum entropi modelinin insan tarafından okunabilir bir özetini üretir. İle birlikte
the -c seçeneği, her jetonun nihai puana katkısını görüntüler.
Diğer tüm normal çıktıları bastırır.
-e Varsayılan (regex tabanlı değil) simgeleştirme için karakter sınıfını seçin. Varsayılan olarak,
belirteçler yalnızca alfabetik dizelerdir. Bu, şu duruma karşılık gelir: Deftok is
"alfa". için olası değerler Deftok "alfa", "alnum", "grafik", "char", "cef"
ve "adp". Son ikisi, e-posta mesajları için tasarlanmış özel belirteçlerdir. Görmek
Ayrıca isalfa(3). "char" belirteci, yazdırılabilir tek karakterleri alır.
daha büyük belirteçlerden daha fazladır ve yalnızca test amaçlıdır.
-f Her giriş satırını ayrı ayrı filtreleyin, yalnızca STDOUT'a eşleşen satırları iletin.
kategori olarak tanımlandı tutmak. Bu seçenek her biri için tekrar tekrar kullanılmalıdır.
kategori hangi tutulması gerekir. tutmak ya olabilir kategori dosya adı veya bir
gerekli olanı temsil eden pozitif tam sayı kategori üzerinde göründüğü sırayla
komut satırı.
Çıktı satırları yazıldığı anda temizlenir. Giriş dosyası bir boru ise
veya karakter aygıtı, daha sonra satır arabelleğe alma modunu kullanma girişiminde bulunulur, aksi takdirde
daha verimli blok arabelleğe alma kullanılır.
-g Yalnızca genişletilmiş normal ifadeyle açıklanan özellikleri öğrenin regex. Bu
varsayılan özellik seçim yöntemini geçersiz kılar (bkz. -w seçeneği) ve her biri için öğrenir
girdi satırı, yalnızca dizelerin birleştirilmesinden oluşturulan belirteçler
sağlanan içindeki etiketli alt ifadeleri eşleştirin regex. Tüm alt dizeler
maç regex her giriş satırının bir son eki içinde, özellik olarak kabul edilir, hatta
giriş satırında üst üste gelirler.
Opsiyonel kolaylık olarak, regex son eki içerebilir ||xyz bu gösterir
hangi parantez içindeki alt ifadeler etiketlenmelidir. Bu durumda, xyz meli
münhasıran 1'den 9'a kadar olan rakamlardan oluşur ve tam olarak bu alt ifadeleri numaralandırır.
etiketlenmelidir. Alternatif olarak, içinde parantez yoksa regex, sonra öyle
tüm ifadenin yakalanması gerektiği varsayılır.
-h Hash tablosunun boyutunu 2^ olarak ayarlayınboyut elementler. kullanırken -l seçenek, bu
olan maksimum entropi modelinde izin verilen toplam özellik sayısını ifade eder.
öğrendi. kullanırken -c seçeneği ile birlikte -M anahtar ve çok terimli tip
kategoriler, bu, sırasında dikkate alınan maksimum özellik sayısını ifade eder.
sınıflandırma. olmadan -M değiştirin, bu seçeneğin hiçbir etkisi yoktur.
-i Tamamen uluslararasılaştırılmış mod. Dahili olarak geniş karakterlerin kullanımını zorlar;
bazı yerel ayarlarda gereklidir. Bu, gözle görülür bir performans cezasına neden olur.
-j Özellikleri büyük/küçük harfe duyarlı hale getirin. Normalde, tüm özellikler küçük harfe dönüştürülür
işleme sırasında, depolama gereksinimlerini azaltan ve istatistiksel olarak iyileştiren
Küçük veri kümeleri için tahminler. Bu seçenekle orijinal büyük harf kullanılır
her özellik için. Bu, sınıflandırma doğruluğunu artırabilir.
-m Kategorileri agresif bir şekilde belleğe eşler ve bunları önlemek için RAM'e kilitler.
mümkünse takas. Bu, hızın çok önemli olduğu ve hafızanın önemli olduğu durumlarda kullanışlıdır.
bol, örneğin sınıflandırıcıyı büyük veri kümelerinde test ederken.
Kilitleme, aşağıdakilerle rahatlatıcı kullanıcı sınırlarını gerektirebilir: ulimit(1). sisteminize sorun
yönetici. kullanırken dikkatli olun -m ile birlikte geçiş yapın -o anahtarı, sadece
dosya bozulmasını önlemek için bir dbacl işlemi bir seferde öğrenmeli veya sınıflandırmalıdır. Eğer
hiçbir öğrenme gerçekleşmez, o zaman -m sınıflandırma anahtarının kullanımı her zaman güvenlidir.
Ayrıca tartışma için bkz. -o geçiş.
-n Her biri için puanları yazdır kategori. Her puan iki sayının çarpımıdır,
çapraz entropi ve her modelin altındaki girdi metninin karmaşıklığı. çarpılmış
birlikte, girdinin modele benzediği günlük olasılığını temsil ederler. İle
bu numaraları ayrı ayrı görün, ayrıca -v seçenek. Ile bağlantılı olarak -f
seçeneği, filtrelemeyi durdurur ancak her giriş satırını bir puan listesiyle birlikte yazdırır
o hat için.
-q Seç kalite öğrenme, nerede kalite 1,2,3,4 olabilir. Daha yüksek değerler daha uzun sürer
öğrenmek ve biraz daha doğru olmalıdır. Varsayılan kalite 1 ise
kategori dosyası mevcut değil veya ağırlıklar önceden yüklenemiyor ve aksi takdirde 2.
-o Öğrenirken, yeniden kullanılabilecekleri şekilde kısmi belirteç sayılarını okur/yazar. Normalde,
kategori dosyaları tam olarak verilen giriş verilerinden öğrenilir ve şunları içermez:
yabancı bilgi. Bu seçenek etkin olduğunda, bazı ek bilgiler
dosyaya kaydedildi Online, tüm girdiler okunduktan sonra. Bu bilgi tekrar okunabilir
öğrenmenin bir sonraki gerçekleştiğinde, önceki veri kümesinin kaldığı yerden devam etmek için
kapalı. Eğer Online yoktur, yaratılmıştır. Eğer Online var, daha önce okundu
öğrenilir ve daha sonra güncellenir. Dosya yaklaşık 3 kat daha büyüktür (
en az) öğrenilenden kategori.
In dbacl, dosya güncellemeleri atomiktir, ancak -o anahtarı, iki veya daha fazla
Süreçler aynı anda öğrenmemelidir, çünkü sadece bir süreç kalıcı bir sonuç yazacaktır.
kategori ve bellek dökümü. NS -m switch çevrimiçi öğrenmeyi de hızlandırabilir, ancak
olası yolsuzluklara karşı dikkatli olun. Yalnızca bir işlem bir dosyayı okumalı veya yazmalıdır. Bu
seçenek öncelikle kontrollü test çalıştırmaları için tasarlanmıştır.
-r Yalnızca sayısal referans modelini öğrenin. içindeki ekstra özelliklerin öğrenilmesini atlar.
metin korpusu.
-v Ayrıntılı mod. Öğrenirken, hesaplamanın ayrıntılarını yazdırın, ne zaman
sınıflandırma, en olası olanın adını yazdırın kategori. İle birlikte
the -n seçeneği, puanları çapraz entropinin açık bir ürünü olarak yazdırır ve
karmaşıklık.
-w n-gram'a kadar varsayılan özellikleri seçin maksimum_sipariş. Bu uyumsuz
the -g her zaman öncelikli olan seçenek. Eğer hayırsa -w or -g seçenekler sunulur,
dbacl varsayar -w 1. 1'den büyük n için n-gramların çizgiyi aşmadığına dikkat edin.
varsayılan olarak kırılır. NS -S anahtarı, hat ayırmayı sağlar.
-x Kırılma olasılığını 1 - 2^(-decim). Bellek gereksinimlerini azaltmak için
öğrenme, bazı girdiler rastgele atlanır ve modele yalnızca birkaçı eklenir.
Kesin davranış, geçerli olana bağlıdır -T seçenek (varsayılan -T "Metin"). Ne zaman
tür "e-posta" (örneğin "metin") değil, daha sonra bireysel giriş özellikleri ile eklenir
olasılık 2^(-decim). Tür "e-posta" olduğunda, tam giriş mesajları
2^( olasılıkla eklendi-decim). Bu tür her bir mesajın içinde, tüm özellikler
Kullanılmış.
-A Girintili girdi ve puanlar bekleyin. Bu anahtarla, dbacl giriş satırlarının olmasını bekler
tek bir boşluk karakteriyle girintilenir (daha sonra atlanır). ile başlayan satırlar
diğer karakterler yoksayılır. Bu muadili -a yukarı geçiş yapın.
ile birlikte kullanıldığında -a değiştirmek, dbacl atlanan satırları olduğu gibi verir,
ve işlenen her giriş satırının önündeki boşluğu yeniden yerleştirir.
-D Hata ayıklama çıktısını yazdırın. Normal olarak kullanmayın, ancak ekranı görüntülemek için çok yararlı olabilir.
Öğrenirken alınan özellikleri listeleyin.
-H Hash tablosunun maksimum 2^'ye kadar büyümesine izin vergsize Öğrenme sırasındaki unsurlar.
İlk boyut tarafından verilir -h seçeneği.
-L Karakter geçişleri için sayısal referans ölçüsünü seçin. NS ölçmek olabilir
"üniforma", "dirichlet" veya "maxent" ten biri. Varsayılan "üniforma"dır.
-M Kuvvet çok terimli hesaplamalar. Öğrenirken, model özelliklerini olmaya zorlar.
multinomal olarak tedavi edilir. Sınıflandırırken, yansıtmak için entropi puanlarını düzeltir
çok terimli olasılıklar (varsa, yalnızca çok terimli tip modellere uygulanabilir).
Özelliklerin sırası kaybolduğu için puanlar her zaman daha düşük olacaktır.
-N Her biri için arka olasılıkları yazdır kategori. Bu, sağlanan
kategoriler kapsamlı bir olasılıklar listesi oluşturur. Ile bağlantılı olarak -f
seçeneği, filtrelemeyi durdurur ancak her giriş satırını,
bu çizgi için arka dağılım.
-R Tamamen rastgele metin için ekstra bir kategori ekleyin. Kategoriye "rastgele" denir.
Sadece kullanıldığında anlamlıdır. -c seçeneği.
-S Hat ayırmayı etkinleştir. Bu, aşağıdakilerle birlikte kullanışlıdır: -w n-gram'a izin verme seçeneği
n > 1 için satır sonlarını yok saymak için, böylece karmaşık bir belirteç, sonuna kadar devam edebilir
çizgi. Bu, e-posta için önerilmez.
-T Standart olmayan metin biçimini belirtin. Varsayılan olarak, dbacl giriş metninin bir olduğunu varsayar
tamamen ASCII metin dosyası. Bu, şu duruma karşılık gelir: tip "metin" dir.
Giriş metnini temizlemek için kullanılabilecek birkaç tür ve alt tür vardır.
gerçek öğrenme veya sınıflandırma gerçekleşmeden önce yabancı belirteçler. Her (alt) tür
kullanmak istediğiniz ayrı bir işaret ile belirtilmelidir. -T komut satırındaki seçenek,
ve otomatik olarak karşılık gelen türü ifade eder.
"Metin" türü, yapılandırılmamış düz metin içindir. Herhangi bir temizleme işlemi yapılmamaktadır. Bu
komut satırında hiçbir tür belirtilmemişse varsayılan.
"E-posta" türü, mbox biçimindeki giriş dosyaları veya tekli RFC822 e-postaları içindir. Başlıklar
tanınır ve çoğu atlanır. Ekstra RFC822 standart başlıklarını dahil etmek için
(izleme üstbilgileri hariç), "e-posta:başlıklar" alt türünü kullanın. İzlemeyi dahil etmek için
üstbilgiler için "email:theaders" alt türünü kullanın. E-postaya tüm başlıkları dahil etmek için şunu kullanın:
"email:xheaders" alt türü. Konu dışındaki tüm başlıkları atlamak için şunu kullanın:
"e-posta: başlıksız". Dizeler için ikili ekleri taramak için "email:atts" kullanın
alt tip.
"E-posta" türü etkin olduğunda, HTML işaretlemesi metinden otomatik olarak kaldırılır
metin/düz ekler hariç ekler. Ayrıca düzden HTML işaretlemesini kaldırmak için
metin ekleri için "email:noplain" kullanın. Tüm metinlerde HTML işaretlemesinin kaldırılmasını önlemek için
ekler, "e-posta:düz" kullanın.
"html" türü, HTML işaretlemesini kaldırmak içindir (arasında ve etiketleri) ve
çevreleyen metin. "E-posta" türü etkinleştirilirse, "html"nin
yalnızca uyumlu mesaj ekleri için otomatik olarak etkinleştirilir.
"xml" türü "html" gibidir, ancak onurlandırmaz ve , ve yapmaz
etiketleri yorumlayın (bu nedenle bu, daha doğru bir şekilde "açı işaretlemesi" kaldırma olarak adlandırılmalıdır ve
gerçek XML anlambilimiyle ilgisi yoktur).
"html" etkinleştirildiğinde, çoğu işaretleme özniteliği kaybolur ("en" yakın değerleri için
herkese'). "html:links" alt türü, bağlantı url'lerini ayrıştırılmaya ve öğrenilmeye zorlar,
aksi takdirde göz ardı edilecekti. "html:alt" alt türü,
ALT özniteliklerinde ve diğer çeşitli etiketlerde alternatif metin. "html:komut dosyaları"
alt tür, komut dosyalarının ayrıştırılmasını zorlar, "html:styles", stillerin ayrıştırılmasını zorlar,
"html:forms", form değerlerinin ayrıştırılmasını zorlarken "html:comments", form değerlerinin ayrıştırılmasını zorlar.
HTML yorumları.
-U Yazdır (U) belirsizliği. ile birlikte kullanıldığında -v geçiş yap, puanları yazdır
ampirik standart sapmaları takip eder. Tek başına kullanıldığında en iyi sonucu verir
kategori, ardından bu kategori seçiminin tahmini bir olasılığı
açık. Daha doğrusu, olasılık, CLT'nin çakışma eksikliğini ölçer.
Her kategori puanı için güven aralıkları (Örtüşme varsa,
belirsizlik).
Bu tahmini olasılık, "emin değilim" işareti olarak kullanılabilir, örn.
olasılık %50'den düşük. Resmi olarak, %0 puan, başka bir kategorinin olduğu anlamına gelir.
girdiye uygulanma olasılığı eşittir ve %100 puan başka kategori olmadığı anlamına gelir
girdi için geçerli olması muhtemeldir. Bu tür bir güvenin aşağıdakilerle ilgisi olmadığına dikkat edin:
the -X değiştirmek. Ayrıca, belge şu şekildeyse, olasılık tahmini genellikle düşüktür.
kısa veya mesaj daha önce hiç görülmemiş birçok belirteç içeriyorsa
(yalnızca tek biçimli sayısal ölçü için geçerlidir).
-V Program sürüm numarasını yazdırın ve çıkın.
-W -w gibi, ancak özelliklerin yeni satırları aşmasını önler. açıklamasına bakın -w.
-X Her biri için hesaplanan puandaki güveni yazdırın kategori, birlikte kullanıldığında
ile -n or -N değiştirmek. ile kullanıldığında, modeli güven puanları için hazırlar.
the -l değiştirmek. Güven, puanın tipikliğinin bir tahminidir,
verilen kategorinin doğru olduğu sıfır hipotezinin varsayılması. ile kullanıldığında
-v tek başına geçiş, puanı ampirik sapma artı shannon olarak çarpanlara ayırır
entropi, bu sırayla karmaşıklıkla çarpılır. NS -X anahtarı desteklenmiyor
tüm olası modeller ve hesaplanamazsa "0.0" yüzdesini görüntüler.
Bilinmeyen belgeler için, aşağıdakilere yakın bir güvene sahip olmanın oldukça yaygın olduğunu unutmayın.
sıfır.
KULLANIM
adlı iki ASCII metin dosyasından geçerli dizinde iki kategori dosyası oluşturmak için
Mark_Twain.txt ve William_Shakespeare.txt sırasıyla şunu yazın:
% dbacl -l ikiz Mark_Twain.txt
% dbacl -l William_Shakespeare.txt'i salla
Artık giriş metnini sınıflandırabilirsiniz, örneğin:
% yankı "naber" | dbacl -v -c twain -c sallama
iki parça
% echo "olmak ya da olmamak" | dbacl -v -c twain -c sallama
sallamak
Unutmayın -v seçenek en azından gereklidir, aksi takdirde dbacl hiçbir şey yazdırmaz.
Dönüş değeri ilk durumda 1, ikinci durumda 2'dir.
% echo "olmak ya da olmamak" | dbacl -v -N -c twain -c sallama
twain %22.63 sallama %77.37
% echo "olmak ya da olmamak" | dbacl -v -n -c twain -c sallama
twain 7.04 * 6.0 sallamak 6.74 * 6.0
Bu çağrılar eşdeğerdir. 6.74 ve 7.04 sayıları,
ortalama jeton her kategoriye aittir ve 6.0, gözlemlenen jeton sayısıdır. Eğer istersen
en iyi kategoriyle birlikte basit bir güven değeri yazdırmak için -v ile -U.
% echo "olmak ya da olmamak" | dbacl -U -c twain -c sallama
%34 salla
Kategorinin gerçek olasılığının sallamak kategoriye karşı iki parça %77.37'dir, ancak
hesaplama biraz belirsizdir ve %34, %100'ün güvenirliğidir.
hesaplama niteliksel olarak doğrudur.
Bir belge.txt dosyasının gürültü çizgileriyle serpiştirilmiş İngilizce metin satırları içerdiğini varsayalım. NS
mevcut bir kategoriniz olduğunu varsayarak İngilizce satırlardaki gürültü satırlarını filtreleyin
salla, söyle, yaz:
% dbacl -c sallama -f sallama -R belge.txt > belge.txt_eng
% dbacl -c sallamak -f rastgele -R belge.txt > belge.txt_rnd
Sonuçların kalitesinin kategorilerin ne kadar iyi sallandığına bağlı olarak değişeceğini unutmayın.
ve rastgele, her giriş satırını temsil eder. Bazen arkayı görmek yararlıdır.
filtreleme olmadan her satır için olasılıklar:
% dbacl -c sallama -f sallama -RN belge.txt > belge.txt_probs
Artık her metin satırı için sonsal olasılıkları başka bir metin satırıyla sonradan işleyebilirsiniz.
komut dosyası, seçtiğiniz keyfi bir Bayes karar kuralını çoğaltmak için.
Tam olarak iki kategorinin özel durumunda, optimal Bayes karar prosedürü
belgeler için aşağıdaki gibi uygulanmalıdır: p1 girdinin önceki olasılığı olsun
metin olarak sınıflandırılır Kategori 1. Sonuç olarak, olarak sınıflandırmanın önceki olasılığı
Kategori 2 1 - p1. let u12 yanlış sınıflandırmanın maliyeti olmak Kategori 1 metin olarak gir
ait Kategori 2 ve bunun tersi için u21. Sınıflandırmanın hiçbir maliyeti olmadığını varsayıyoruz.
doğru şekilde. Ardından, aşağıdaki komut en uygun Bayes kararını uygular:
% dbacl -n -c Kategori 1 -c Kategori 2 | awk '{ if(2$ * p1 * u12 > 4 $ * (1 - p1) * u21) {
1$ yazdır; } başka { 3$ yazdır; } }'
dbacl ile birlikte de kullanılabilir Procmail'in(1) basit bir Bayesian uygulamak için
e-posta sınıflandırma sistemi. Gelen postanın otomatik olarak teslim edilmesi gerektiğini varsayalım
$MAILDIR içinde bulunan ve adlandırılmış üç posta klasöründen birine iş, kişisel, ve Spam.
Başlangıçta bunlar oluşturulmalı ve uygun örnek e-postalarla doldurulmalıdır. A crontab(1)
dosyası günde bir kez üç kategoriyi öğrenmek için kullanılabilir, örn.
KEDİLER=$HOME/.dbacl
5 0 * * * dbacl -T e-posta -l $CATS/iş $MAILDIR/iş
10 0 * * * dbacl -T email -l $CATS/kişisel $MAILDIR/kişisel
15 0 * * * dbacl -T e-posta -l $CATS/spam $MAILDIR/spam
Gelen her e-postayı otomatik olarak uygun klasöre teslim etmek için aşağıdakiler
procmailrc(5) tarif parçası kullanılabilir:
KEDİLER=$HOME/.dbacl
# spam sınıflandırıcıyı çalıştır
:0 c
YAY=| dbacl -vT e-posta -c $KEDİLER/iş -c $KEDİLER/kişisel -c $KEDİLER/spam
# uygun posta kutusuna gönder
: 0:
* ? test -n "$YAY"
$MAILDIR/$YAY
: 0:
$VARSAYILAN
Ara sıra, dbacl e-postayı yanlış posta kutusuna gönderir. Bu durumda, yanlış sınıflandırılmış
mesaj yanlış hedefinden kaldırılmalı ve doğru posta kutusuna yerleştirilmelidir.
Mesajlarınız bir sonraki öğrenildiğinde hata düzeltilecektir. içinde bırakılırsa
yanlış kategori, dbacl yanlış korpus istatistiklerini öğrenecektir.
Tarafından okunan varsayılan metin özellikleri (belirteçler) dbacl tamamen alfabetik dizelerdir,
bellek gereksinimlerini en aza indirir ancak bazı durumlarda gerçekçi olmayabilir. Modeller oluşturmak için
alfasayısal belirteçlere dayalı olarak, -e değiştirmek. Aşağıdaki örnek ayrıca isteğe bağlı
-D belgede bulunan gerçek belirteçlerin bir listesini yazdıran anahtarı:
% dbacl -e alnum -D -l twain Mark_Twain.txt | az
Öğrenmek için kullanılan varsayılan özellik seçim yöntemini geçersiz kılmak da mümkündür.
düzenli ifadeler aracılığıyla kategori modeli. Örneğin, aşağıdaki kopyalar
C yerel ayarında varsayılan özellik seçim yöntemi, çok daha yavaş olmakla birlikte:
% dbacl -l twain -g '^([[:alpha:]]+)' -g '[^[:alpha:]]([[:alpha:]]+)' Mark_Twain.txt
Elde edilen iki kategori, metindeki sadece tek alfabetik kelimelere bağlıdır.
Mark_Twain.txt dosyası (ve tahmin için hesaplanan diyagram istatistikleri). bir saniye
örneğin, aşağıdaki komut, düzgünleştirilmiş bir Markovian (kelime bigram) modeli oluşturur.
her satırdaki ardışık kelime çiftlerine bağlıdır (ancak çiftler bir satırı geçemez
kırmak):
% dbacl -l twain2 -g '(^|[^[:alpha:]])([[:alpha:]]+)||2' -g
'(^|[^[:alpha:]])([[:alpha:]]+)[^[:alpha:]]+([[:alpha:]]+)||23' Mark_Twain.txt
Tüm siparişlerin (7'ye kadar) daha genel, çizgi tabanlı, n-gram modelleri benzer bir şekilde oluşturulabilir.
yol. Paragraf tabanlı modeller oluşturmak için girdi derlemlerini şu şekilde yeniden biçimlendirmeniz gerekir:
awk(1) veya susuzluk(1) satır başına bir paragraf elde etmek. Satır boyutu kullanılabilir ile sınırlıdır
bellek, ancak normal ifade performansının uzun satırlar için hızla düşeceğini unutmayın.
PERFORMANS
İstatistiksel öğrenmenin altında yatan varsayım, nispeten az sayıda
eğitim belgeleri, çok daha büyük bir girdi belgeleri kümesini temsil edebilir. Böylece uzun süre
çalıştırıldığında, öğrenme, sınıflandırma doğruluğu üzerinde ciddi bir etki olmaksızın durma noktasına gelebilir. Süre
gerçekte doğru değil, bu varsayım, e-posta gibi sorunlar için şaşırtıcı derecede doğrudur.
filtreleme. Uygulamada bu, on bin mertebesinde iyi seçilmiş bir külliyatın olduğu anlamına gelir.
belgeler yıllarca yüksek doğrulukta sonuçlar için yeterlidir. sonra sürekli öğrenme
böyle kritik bir kütle azalan getirilerle sonuçlanır. Tabii ki, gerçek dünya girdisi olduğunda
belge kalıpları önemli ölçüde değişirse, modellerin tahmin gücü kaybolabilir. saat
diğer uçta, birkaç yüz belge zaten çoğu durumda kabul edilebilir sonuçlar veriyor.
dbacl sık sınıflandırmalar için yoğun şekilde optimize edilmiştir, ancak seyrek toplu
öğrenme. Bu, yukarıda açıklanan uzun vadeli optimumdur. İdeal koşullar altında, dbacl yapabilmek
düşük uç donanımda (500Mhz Pentium III) saniyede yüz e-postayı sınıflandırın. Öğrenme
hız çok daha yavaş değildir, ancak büyük belgeler için etkili bir şekilde çok daha uzun sürer
çeşitli nedenlerle koleksiyon kullanırken -m geçiş, veri yapıları
mümkünse agresif bir şekilde belleğe eşlenir, hem G/Ç hem de bellek için genel giderleri azaltır
tahsisler.
dbacl girdisini mümkün olan en kısa sürede atar ve girdi belgesinde herhangi bir sınırlama yoktur
boy. Hem sınıflandırma hem de öğrenme hızı, öğrenci sayısı ile doğru orantılıdır.
girişteki belirteçler, ancak öğrenmenin aynı zamanda doğrusal olmayan bir optimizasyon adımına ihtiyacı vardır.
keşfedilen benzersiz belirteçlerin sayısıyla orantılı zaman. Yazarken, dbacl is
optimum kullanım senaryosu göz önüne alındığında en hızlı açık kaynaklı posta filtrelerinden biri, ancak
öğrenme için diğer filtrelerden daha fazla bellek.
BİRDEN İŞLEMLER VE VERİ RÜŞVET
Kategori dosyalarını kaydederken, dbacl önce aynı konuma geçici bir dosya yazar,
ve daha sonra yeniden adlandırır. Öğrenme sırasında bir sorun veya çökme meydana gelirse, eski kategori
bu nedenle dosyaya dokunulmaz. Bu, kategorilerin asla bozulmamasını sağlar, hayır
Aynı anda kaç süreç öğrenmeye veya sınıflandırmaya çalışırsa çalışsın ve bunun geçerli olduğu anlamına gelir.
kategoriler herhangi bir zamanda sınıflandırma için kullanılabilir.
Kullanıldığı zaman -m geçiş, dosya içeriği hızlı okuma ve yazma için bellek eşlenir.
ile birlikte bu -o anahtarı, onlarca olduğunda, esas olarak test amaçlıdır.
ölçmek için bir laboratuvarda binlerce mesaj öğrenilmeli ve puanlanmalıdır. dbacl's
kesinlik. Performans nedenleriyle hiçbir dosya kilitleme girişiminde bulunulmadığından, bozulmalar
mümkün, yalnızca bir tane olduğundan emin olmadıkça dbacl süreç herhangi bir zamanda herhangi bir dosyayı okur veya yazar
verilen zaman. Yolsuzluğun mümkün olduğu tek durum (-m ve -o birlikte) budur.
BELLEK KULLANIMI
Bir belgeyi sınıflandırırken, dbacl belirtilen tüm kategorileri RAM'e yükler, böylece toplam
gereken bellek, yaklaşık olarak kategori dosya boyutlarının toplamı artı sabit bir küçük
havai. Girdi belgesi okunurken tüketilir, bu nedenle boyutu önemli değildir,
ancak çok uzun satırlar yer kaplayabilir. kullanırken -m geçiş yapın, kategoriler okunur
kullanma mmap(2) mevcut olarak.
Öğrenirken, dbacl birçok nesneyi içeren büyük bir yapıyı bellekte tutar.
çıktı kategorisine kaydedilmez. Bu yapının büyüklüğü ile orantılıdır.
okunan benzersiz belirteçlerin sayısı, ancak girdi belgelerinin boyutu değil, çünkü bunlar
okunurken atılır. Kaba bir kılavuz olarak, bu yapı, yapının 4x-5x boyutundadır.
üretilen son kategori dosyası.
Denetlenmeyen bellek büyümesini önlemek için, dbacl varsayılan olarak sabit bir küçük miktar tahsis eder
belirteçler için bellek. Bu alan dolduğunda, daha fazla jeton atılır.
öğrenilen kategoriyi çarpıtmanın etkisi, daha fazla jeton düştükçe onu daha az kullanılabilir hale getirir. A
böyle bir durumda uyarı STDERR'de yazdırılır.
The -h anahtarı, belirteç alanının başlangıç boyutunu 2'nin güçleriyle, yani "-h 17" olarak sabitlemenizi sağlar
2^17 = 131072 olası belirteç anlamına gelir. "dbacl -V" yazarsanız, sayısını görebilirsiniz.
Öğrenirken veya sınıflandırırken her belirteç için gereken bayt sayısı. Bu sayı ile çarpın
öğrenme için gereken hafızayı tahmin etmek için mümkün olan maksimum jeton sayısı. bu -H
geçiş sağlar dbacl tablolarını gerektiğinde ve gerektiğinde maksimuma kadar otomatik olarak büyütün
belirtildi. Bu nedenle, "-H 21" yazarsanız, başlangıç boyutu aşağıdaki durumlarda tekrar tekrar ikiye katlanır:
gerekli, yaklaşık iki milyona kadar benzersiz jeton.
ile öğrenirken -X geçiş, bir avuç giriş belgesi de RAM'de tutulur
boyunca.
ÇEVRE
DBACL_PATH
Bu değişken ayarlandığında, değeri her değişkenin başına eklenir. kategori dosya adı hangisi
'/' veya '.' ile başlamıyor.
SİNYALLER
INT Bu sinyal yakalanırsa, dbacl herhangi bir temizleme veya başka bir işlem yapmadan basitçe çıkar
operasyonlar. Bu sinyal genellikle klavyede Ctrl-C tuşlarına basılarak gönderilebilir. Görmek
arpacık(1).
HUP, ÇIKIŞ, DÖNEM
Bu sinyallerden biri yakalanırsa, dbacl girdiyi okumayı durdurur ve devam eder
daha fazla giriş yokmuş gibi işlem. Bu zarif bir şekilde bırakmanın bir yolu,
ancak öğrenme modunda, kategori dosyasına dayalı olarak bir kategori dosyası yazılacağını unutmayın.
eksik girdi ÇIKIŞ sinyali genellikle Ctrl- tuşuna basılarak gönderilebilir.
tuş takımı. Görmek arpacık(1).
USR1 Bu sinyal yakalanırsa, dbacl mevcut kategorileri en erken yeniden yükler
uygulanabilir fırsat. Bu normalde hiç kullanışlı değildir, ancak özel olarak olabilir.
gibi durumlarda, -f anahtar, uzun süredir devam eden bir girdiyle birlikte çağrılır
boru.
NOTLAR
dbacl oluşturulan kategori dosyaları ikili biçimdedir ve taşınabilir olabilir veya olmayabilir
farklı bir bayt sırası mimarisi kullanan sistemler (bu, dbacl oldu
derlenmiş). bu -V switch, kategorilerin taşınabilir olup olmadığını yazdırır, yoksa
Deney.
dbacl işlevsel olarak eşdeğer düzenli ifadeleri tanımıyor ve bu durumda
yinelenen özellikler birkaç kez sayılacaktır.
Öğrenilen her kategoride, kullanılan komut satırı seçenekleri kaydedilir. Ne zaman
sınıflandırma, ilgili her kategorinin aynı set ile öğrenildiğinden emin olun.
seçenekler (regex'lerin farklı olmasına izin verilir), aksi takdirde davranış tanımsızdır. yok
sınıflandırma yaparken tüm anahtarları tekrarlamanız gerekir.
Çok sayıda sayısallaştırma uyarısı alıyorsanız tek seferde çok fazla veri öğrenmeye çalışıyorsunuz demektir.
veya modeliniz çok karmaşık. dbacl finali sayısallaştırarak bellekten tasarruf etmek için derlenir
ancak dbacl.h dosyasını düzenleyerek ve yeniden derleyerek sayısallaştırmayı devre dışı bırakabilirsiniz.
dbacl birkaç yerleşik belirteç sunar (bkz. -e geçiş) gelecekte daha fazlası ile
sürümleri, yazarın icat ettiği gibi. Varsayılan belirteç gelişebilirken, hayır
tokenizer hiç kaldırılmalıdır, böylece her zaman öncekini simüle edebilirsiniz dbacl davranış
hata düzeltmelerine ve mimari değişikliklere tabidir.
yoluyla elde edilen güven tahminleri -X anahtar hafife alınır, yani daha fazladır
olması gerekenden daha muhafazakar.
onworks.net hizmetlerini kullanarak çevrimiçi dbacl kullanın