این دستور bmf است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
bmf - فیلتر ایمیل بیزی کارآمد
خلاصه
bmf [-t] [-n] [-s] [-N] [-S] [-f fmt] [-d db] [-i فایل] [-kn] [-m نوع] [-p]
[-v] [-V] [-h]
شرح
bmf یک فیلتر ایمیل بیزی است. در حالت عادی کارکرد، یک پیام ایمیل می گیرد
یا متن دیگری در ورودی استاندارد، یک بررسی آماری در برابر لیست های "خوب" و
کلمات "هرزنامه"، داده های جدید را ثبت می کند و یک کد وضعیت نشان می دهد که آیا یا نه
پیام اسپم است BMF با الگوریتم های سریع و بدون کپی نوشته شده است که مستقیماً به زبان C کدگذاری شده است.
و برای سرعت تنظیم شده است. هدف آن این است که سریعتر، کوچکتر و تطبیق پذیرتر از مشابه باشد
برنامه های کاربردی.
bmf از هر دو فرمت ذخیره سازی ایمیل mbox و maildir پشتیبانی می کند. به طور خودکار پردازش خواهد شد
چندین پیام در یک فایل mbox به طور جداگانه.
OPTIONS
بدون گزینه های خط فرمان، bmf ورودی را پردازش می کند، آن را به عنوان "خوب" یا ثبت می کند
"اسپم"، و کد خطای مناسب را برمی گرداند. فهرست فهرست کلمات و وجود ندارد
فایل های word در صورت عدم وجود ایجاد می شوند.
-t تست کنید تا ببینید ورودی اسپم است یا خیر. لیست کلمات به روز نمی شود. گزارشی نوشته می شود
به stdout که امتیاز نهایی را نشان می دهد و نشانه هایی با بالاترین انحراف یک میانگین را تشکیل می دهند
0.5.
-n ورودی را به عنوان غیر هرزنامه ثبت کنید.
-s ورودی را به عنوان هرزنامه ثبت کنید.
-N ورودی را به عنوان غیر هرزنامه ثبت کنید و ثبت قبلی را به عنوان هرزنامه لغو کنید.
-S ورودی را به عنوان هرزنامه ثبت کنید و ثبت قبلی را به عنوان غیر هرزنامه لغو کنید.
-f fmt فرمت پایگاه داده را مشخص کنید. فرمت های معتبر متن، db و mysql هستند. متن همیشه هست
معتبر. اگر گزینه مربوطه در آن فعال نباشد، ممکن است بقیه در دسترس نباشند
زمان کامپایل پیشفرض در صورت موجود بودن db، متن دیگر است.
-d db پایگاه داده یا دایرکتوری را برای بارگیری و ذخیره لیست کلمات مشخص کنید. پیش فرض است
~/.bmf در حالت متن
-i پرونده به جای stdin از فایل برای ورودی استفاده کنید.
-k n تعداد اکسترم ها (حافظان) مورد استفاده در محاسبه Bayes را مشخص کنید. پیشفرض
15 است
-m fmt فرمت ذخیره ایمیل را مشخص کنید. فرمت های معتبر mbox و maildir هستند. پیش فرض به است
به طور خودکار فرمت ذخیره ایمیل را شناسایی کند. این گزینه منسوخ شده است.
-p ورودی را در خروجی کپی کنید (عبور) و هدرهای هرزنامه را به سبک درج کنید
SpamAssassin. هدر X-Spam-Status همیشه با جزئیات پردازش درج می شود. در
محتوای این هدر همیشه با "بله" یا "خیر" شروع می شود. اگر ورودی به قضاوت شود
هرزنامه باشد، هدر "X-Spam-Flag: YES" نیز درج شده است.
-v پرحرف تر باش این گزینه هنوز به خوبی پشتیبانی نمی شود.
-V نمایش اطلاعات نسخه
-h نمایش اطلاعات استفاده
تئوری OF عمل
bmf ورودی خود را به عنوان یک کیسه توکن در نظر می گیرد. هر نشانه با "خوب" و "بد" بررسی می شود
فهرستهای کلمه، که تعداد دفعاتی را که در موارد غیر هرزنامه رخ داده است را حفظ میکند
نامه های اسپم این اعداد برای محاسبه احتمال اینکه یک نامه در آن است استفاده می شود
نشانه رخ می دهد هرزنامه است. پس از محاسبه احتمالات برای همه نشانه های ورودی، یک مشکل ثابت شد
تعداد احتمالاتی که بیشترین انحراف را از میانگین دارند با استفاده از بیز ترکیب می شوند
قضیه احتمالات مشروط
در حالی که این روش در مقایسه با رویکرد تطبیق الگوی معمولی خام به نظر می رسد
معلوم می شود که بسیار موثر است. مقاله پل گراهام طرحی برای هرزنامه:
http://www.paulgraham.com/spam.html خواندن توصیه می شود
bmf با انجام تحلیل واژگانی هوشمندانه تر، پیشنهاد پل را بهبود می بخشد. به خصوص،
نام هاست و آدرس های IP حذف نمی شوند و انواع خاصی از اطلاعات MTA حذف می شوند
دور انداخته شده (مانند شناسه پیام و تاریخ).
MIME و سایر پیوستها رمزگشایی نمیشوند. تجربه تماشای جریان های رمزی
نشان می دهد که هرزنامه با محفظه ها همیشه خود را از طریق نشانه های موجود در آن از بین می برد
هدرها و قطعات غیر محصور. با این وجود، من می خواهم قابلیت رمزگشایی را اضافه کنم
کدهای قابل چاپ نقل قول و شاید base64 برای پیوست های متنی.
ادغام با OTHER ابزارها
لطفاً برای نمونه ها و پیشنهادات به /usr/share/doc/bmf/README.gz مراجعه کنید.
برگشت ارزش
در حالت عبور: صفر برای موفقیت، غیر صفر برای شکست.
در حالت غیر عبور: 0 برای هرزنامه. 1 برای غیر هرزنامه؛ 2 برای I/O یا خطاهای دیگر.
با استفاده از خدمات onworks.net از bmf آنلاین استفاده کنید