ນີ້ແມ່ນຄໍາສັ່ງ ifile ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
ifile - core executable for the ifile mail filtering system
ສະຫຼຸບສັງລວມ
ifile [-b ເອກະສານ] [-q|-Q] [-g] [-k] [-o] [-v num] [lexing ທາງເລືອກໃນການ] ເອກະສານ ...
ifile -c -q|-Q [-T threshold] [-b ເອກະສານ] [-g] [-k] [-o] [lexing ທາງເລືອກໃນການ] ເອກະສານ ...
ifile [-b ເອກະສານ] [-d ໂຟນເດີ] [-i ໂຟນເດີ|-u ໂຟນເດີ] [-g] [-k] [-o] [-v num] [lexing ທາງເລືອກໃນການ]
ເອກະສານ ...
ifile -r [-b ເອກະສານ]
ລາຍລະອຽດ
ifile ແມ່ນຕົວກອງເມລທີ່ໃຊ້ການຮຽນຮູ້ເຄື່ອງຈັກເພື່ອຈັດປະເພດອີເມລເປັນ
ໂຟນເດີ/ກ່ອງຈົດໝາຍ. ສູດການຄິດໄລ່ທີ່ມັນໃຊ້ເອີ້ນວ່າ Naive Bayes. ໂດຍພື້ນຖານແລ້ວ, naive
bayes ພິຈາລະນາແຕ່ລະເອກະສານເປັນການລວບລວມຄໍາສັບທີ່ບໍ່ມີຄໍາສັ່ງແລະຈັດປະເພດໂດຍການຈັບຄູ່
ການແຈກຢາຍເອກະສານທີ່ມີການແຈກຢາຍໂຟນເດີ/ກ່ອງຈົດໝາຍທີ່ກົງກັນທີ່ສຸດ.
OPTIONS
-b, --db-file=ເອກະສານ
ສະຖານທີ່ເພື່ອອ່ານ/ເກັບຮັກສາຖານຂໍ້ມູນ ifile. ຄ່າເລີ່ມຕົ້ນແມ່ນ ~/.idata
-c, -- ຫຍໍ້
ທຽບເທົ່າກັບ "ifile -v 0 | ຫົວ -1 | ຕັດ -f1 -d". ຕ້ອງໃຊ້ກັບ -q or -Q.
-d, --ລຶບ=ໂຟນເດີ
ລົບສະຖິຕິສໍາລັບແຕ່ລະຄົນ ໄຟ ຈາກປະເພດ ໂຟນເດີ
-f, --folder-calcs=ໂຟນເດີ
ສະແດງໃຫ້ເຫັນຄໍານວນຄວາມເປັນໄປໄດ້ຂອງຄໍານວນສໍາລັບການ ໂຟນເດີ
-g, --log-file
ສ້າງແລະເກັບຮັກສາຂໍ້ມູນ debugging ໃນ ~/.ifile.log
-i, --ໃສ່=ໂຟນເດີ
ເພີ່ມສະຖິຕິສໍາລັບແຕ່ລະໄຟລ໌ໄປຫາຫມວດຫມູ່ ໂຟນເດີ
-k, -- ຮັກສາບໍ່ເລື້ອຍໆ
ອອກຈາກຖານຂໍ້ມູນທີ່ເກີດຂື້ນເລື້ອຍໆ (ປົກກະຕິແລ້ວມັນຖືກໂຍນອອກ)
-l, --query-loocv=ໂຟນເດີ
ສໍາລັບແຕ່ລະໄຟລ໌, ຊົ່ວຄາວເອົາໄຟລ໌ອອກຈາກ ໂຟນເດີ, ດໍາເນີນການສອບຖາມແລະ
ຫຼັງຈາກນັ້ນ, reinserts ໄຟລ໌ໃນ ໂຟນເດີ. ຖານຂໍ້ມູນບໍ່ໄດ້ຖືກດັດແກ້.
-o, -- ເກີດຂຶ້ນ
ໃຊ້ການເປັນຕົວແທນຂອງ bit-vector. ນັບແຕ່ລະຄໍາຫນຶ່ງຄັ້ງຕໍ່ເອກະສານ.
-q, --ສອບຖາມ
ຜົນຜະລິດຄະແນນຄະແນນສໍາລັບແຕ່ລະໄຟລ໌
-Q, --query-insert
ສໍາລັບແຕ່ລະໄຟລ໌, ຜົນຜະລິດຄະແນນຄະແນນແລະເພີ່ມສະຖິຕິສໍາລັບໂຟນເດີທີ່ມີ
ຄະແນນສູງສຸດ
-T, -- ເກນ=threshold
ເມື່ອໃຊ້ກັບທັງສອງ -c ແລະ -q, ຜົນຜະລິດສອງປະເພດການຈັດອັນດັບທີ່ສູງທີ່ສຸດຖ້າພວກເຂົາ
ຄະແນນແຕກຕ່າງກັນໂດຍຫຼາຍທີ່ສຸດ threshold / 1000, ເຊິ່ງສາມາດຖືກນໍາໃຊ້ເພື່ອກວດຫາຊາຍແດນ
ກໍລະນີ. ເມື່ອໃຊ້ກັບ -q ເທົ່ານັ້ນ ແລະອັນໃດ threshold > 0, ຜົນໄດ້ຮັບຄວາມແຕກຕ່າງຂອງຄະແນນ
ເປີເຊັນ. ຍົກຕົວຢ່າງ,
ifile -T1 -q foo.txt
ອາດຈະສົ່ງຜົນໃຫ້
ຂີ້ເຫຍື້ອ -15570.48640776
ທີ່ບໍ່ແມ່ນ spam -18728.00272369
diff[spam,non-spam](%) 9.21
ຖ້າເປັນດັ່ງນັ້ນ, ແລ້ວ
ifile -T93 -q -c foo.txt
ຈະມີຜົນໃນ
foo.txt spam, ບໍ່ແມ່ນ spam
ໃນຂະນະທີ່
ifile -T92 -q -c foo.txt
ຈະມີຜົນໃນ
foo.txt spam
-r, --reset-data
ລຶບຂໍ້ມູນທັງໝົດທີ່ເກັບໄວ້ໃນຂະນະນີ້
-u, --ອັບເດດ=ໂຟນເດີ
ຄືກັນກັບ 'ແຊກ' ຍົກເວັ້ນພຽງແຕ່ເພີ່ມສະຖິຕິຖ້າ ໂຟນເດີ ມີຢູ່ແລ້ວ
-v, --ຄຳເວົ້າ=num
ປະລິມານຜົນຜະລິດໃນຂະນະທີ່ແລ່ນ: 0=silent, 1=quiet, 2=progress, 3=verbose, 4=debug
ທາງເລືອກ Lexing:
-a, --alpha-lexer
ຄໍາ Lex ເປັນລໍາດັບຂອງຕົວອັກສອນ (ຄ່າເລີ່ມຕົ້ນ)
-A, --alpha-only-lexer
ສະເພາະລຳດັບຕົວອັກສອນທີ່ແຍກອອກຈາກຊ່ອງຫວ່າງ lex ເຊິ່ງປະກອບດ້ວຍທັງໝົດ
ຕົວອັກສອນຕົວອັກສອນ
-h, --strrip-header
ຂ້າມເສັ້ນຫົວຂໍ້ທັງໝົດ ຍົກເວັ້ນຫົວຂໍ້:, ຈາກ: ແລະ ເຖິງ:
-m, --ຄວາມຍາວສູງສຸດ=char
ບໍ່ສົນໃຈບາງສ່ວນຂອງຂໍ້ຄວາມຫຼັງຈາກທໍາອິດ char ຕົວລະຄອນ. ໃຊ້ຂໍ້ຄວາມທັງຫມົດຖ້າ char
ຕັ້ງເປັນ 0. ຄ່າເລີ່ມຕົ້ນແມ່ນ 50,000.
-p, --print-tokens
ພຽງແຕ່ tokenize ແລະພິມ, ບໍ່ດໍາເນີນການໃດໆ. ເອກະສານຖືກສົ່ງຄືນເປັນ
ບັນຊີລາຍຊື່ຂອງຄໍາ, ຄູ່ຄວາມຖີ່.
-s, -- ບໍ່ຢຸດ
ຢ່າຖິ້ມຄໍາທີ່ໃຊ້ເລື້ອຍໆ (stoplist) ເກີນໄປໃນເວລາທີ່ lexing
-S, -- ລໍາຕົ້ນ
ໃຊ້ 'Porter' stemming algorithm ໃນເວລາທີ່ lexing ເອກະສານ
-w, --white-lexer
ຄໍາ Lex ເປັນລໍາດັບຂອງຕົວອັກສອນທີ່ແຍກອອກຈາກຊ່ອງ
ຖ້າບໍ່ມີໄຟລ໌ໃດຖືກລະບຸໄວ້ໃນເສັ້ນຄໍາສັ່ງ, ifile ຈະໃຊ້ວັດສະດຸປ້ອນມາດຕະຖານເປັນຂອງມັນ
ຂໍ້ຄວາມທີ່ຈະປຸງແຕ່ງ.
-?, - ຊ່ວຍ
ໃຫ້ບັນຊີລາຍຊື່ການຊ່ວຍເຫຼືອນີ້
-- ການນໍາໃຊ້
ໃຫ້ຂໍ້ຄວາມການນໍາໃຊ້ສັ້ນ
-V, - ການປ່ຽນແປງ
ສະບັບຂອງໂຄງການພິມ
ການໂຕ້ຖຽງບັງຄັບຫຼືທາງເລືອກຕໍ່ທາງເລືອກຍາວແມ່ນຍັງບັງຄັບຫຼືທາງເລືອກສໍາລັບການໃດໆ
ທາງເລືອກສັ້ນທີ່ສອດຄ້ອງກັນ.
ໃຊ້ ifile ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net