Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാവുന്ന കമാൻഡ് സ്പാമോറാക്കിൾ ആണിത്.
പട്ടിക:
NAME
സ്പാമോറാക്കിൾ - ഒരു സ്പാം വർഗ്ഗീകരണ ഉപകരണം
സിനോപ്സിസ്
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] അടയാളം [ മെയിൽബോക്സ് ... ]
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] ചേർക്കുക [-v] -സ്പാം സ്പാംബോക്സ് ... -നല്ലത് ഗുഡ്ബോക്സ് ...
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] പരിശോധന [-മിനിറ്റ് പ്രോബ്] [-പരമാവധി പ്രോബ്] [ മെയിൽബോക്സ് ... ]
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] അറിഞ്ഞുകൂടാത്തപിശകുനിലസ്റ്റാറ്റ് [ മെയിൽബോക്സ് ... ]
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] പട്ടിക regexp ...
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] ബാക്കപ്പ് > ബാക്കപ്പ് ഫയൽ
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] വീണ്ടെടുക്കുക < ബാക്കപ്പ് ഫയൽ
സ്പാമോറാക്കിൾ [-കോൺഫിഗ് conf] [-f ഡാറ്റാബേസ്] വാക്കുകൾ [ മെയിൽബോക്സ് ... ]
വിവരണം
"സ്പാം" കണ്ടെത്താനും ഫിൽട്ടർ ചെയ്യാനും സഹായിക്കുന്ന ഒരു ഉപകരണമാണ് SpamOracle (ആവശ്യപ്പെടാത്ത വാണിജ്യ ഇ-
മെയിൽ). ഇ-മെയിലിൽ ദൃശ്യമാകുന്ന വാക്കുകളുടെ സ്റ്റാറ്റിസ്റ്റിക്കൽ വിശകലനത്തിലൂടെയാണ് ഇത് മുന്നോട്ട് പോകുന്നത്,
പദങ്ങളുടെ ആവൃത്തിയെ ഉപയോക്താക്കൾ നൽകിയ കോർപ്പസിൽ കാണുന്നവയുമായി താരതമ്യം ചെയ്യുന്നു
സ്പാമും അറിയപ്പെടുന്ന നിയമാനുസൃത ഇ-മെയിലും. വർഗ്ഗീകരണ അൽഗോരിതം ബേയ്സിനെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്
സൂത്രവാക്യം, പോൾ ഗ്രഹാമിന്റെ പേപ്പറിൽ വിവരിച്ചിരിക്കുന്നു, A പദ്ധതി വേണ്ടി സ്പാം,
http://www.paulgraham.com/spam.html.
എന്നിവയുമായി ചേർന്ന് പ്രവർത്തിക്കുന്നതിനാണ് ഈ പ്രോഗ്രാം രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത് പ്രോക്മെയിൽ(1). യുടെ ഫലം
വിശകലനം ഒരു അധിക സന്ദേശ തലക്കെട്ടായി ഔട്ട്പുട്ട് ആണ് എക്സ്-സ്പാം: പിന്തുടരുന്നു അതെ, ഇല്ല or അജ്ഞാതമാണ്,
കൂടാതെ അധിക വിശദാംശങ്ങൾ. ഒരു പ്രോക്മെയിൽ നിയമത്തിന് ഇത് പരീക്ഷിക്കാൻ കഴിയും എക്സ്-സ്പാം: തലക്കെട്ടും ഡെലിവറും
ഉചിതമായ മെയിൽബോക്സിലേക്കുള്ള ഇമെയിൽ.
കൂടാതെ, സ്പാം ഒറാക്കിൾ MIME അറ്റാച്ച്മെന്റുകൾ വിശകലനം ചെയ്യുകയും പ്രസക്തമായ വിവരങ്ങൾ വേർതിരിച്ചെടുക്കുകയും ചെയ്യുന്നു
MIME തരം, പ്രതീക എൻകോഡിംഗും അറ്റാച്ച് ചെയ്ത ഫയലിന്റെ പേരും പോലുള്ളവ, അവയെ a-ൽ സംഗ്രഹിക്കുക
അധികമായി എക്സ്-അറ്റാച്ചുമെന്റുകൾ: തലക്കെട്ട്. ഇ-മെയിലുകൾ എളുപ്പത്തിൽ നിരസിക്കാൻ പ്രോക്മെയിലിനെ ഇത് അനുവദിക്കുന്നു
സംശയാസ്പദമായ അറ്റാച്ച്മെന്റുകൾ അടങ്ങിയിരിക്കുന്നു, ഉദാ: പലപ്പോഴും വൈറസിനെ സൂചിപ്പിക്കുന്ന വിൻഡോസ് എക്സിക്യൂട്ടബിളുകൾ.
ആവശ്യകതകൾ ഒപ്പം പരിമിതികൾ
SpamOracle ഉപയോഗിക്കുന്നതിന്, നിങ്ങൾക്ക് ഷെൽ ഉള്ള ഒരു Unix മെഷീനിലേക്ക് നിങ്ങളുടെ മെയിൽ ഡെലിവർ ചെയ്യണം
അക്കൗണ്ട്. ഈ യന്ത്രം ഉണ്ടായിരിക്കണം പ്രോക്മെയിൽ(1) (കാണുക http://www.procmail.org/) ഇൻസ്റ്റാൾ ചെയ്തു.
നിങ്ങളുടെ ~/.മുന്നോട്ട് എല്ലാ ഇൻകമിംഗ് ഇ-മെയിലുകളും പ്രവർത്തിപ്പിക്കുന്നതിന് ഫയൽ സജ്ജീകരിച്ചിരിക്കണം പ്രോക്മെയിൽ(1). എങ്കിൽ
നിങ്ങളുടെ മെയിൽ സെർവർ POP അല്ലെങ്കിൽ IMAP പ്രോട്ടോക്കോളുകളെ പിന്തുണയ്ക്കുന്നു, നിങ്ങൾക്ക് ഉപയോഗിക്കാനും കഴിയും കൊണ്ടുവരിക(1) മുതൽ
സെർവറിൽ നിന്ന് നിങ്ങളുടെ മെയിൽ എടുത്ത് അത് നിങ്ങളുടെ പ്രാദേശിക മെഷീനിൽ എത്തിക്കുക.
SpamOracle "പഠിക്കുന്ന" സന്ദേശങ്ങളുടെ കോർപ്പസ് നൽകാൻ, ഏകദേശം 1000 ആർക്കൈവ്
നിങ്ങളുടെ ഇ-മെയിലുകൾ ആവശ്യമാണ്. ആർക്കൈവ് സ്വമേധയാ അല്ലെങ്കിൽ സെമി-ഓട്ടോമാറ്റിക്കായി വിഭജിച്ചിരിക്കണം
അറിയപ്പെടുന്ന സ്പാമുകളും അറിയപ്പെടുന്ന നല്ല സന്ദേശങ്ങളും. കോർപ്പസിൽ തെറ്റായി തരംതിരിച്ച സന്ദേശങ്ങൾ (ഉദാ. സ്പാമുകൾ
നല്ല സന്ദേശങ്ങൾക്കിടയിൽ തെറ്റായി സംഭരിച്ചിരിക്കുന്നത്) കാര്യക്ഷമത കുറയ്ക്കും
വർഗ്ഗീകരണം. ആർക്കൈവ് Unix മെയിൽബോക്സ് ഫോർമാറ്റിലോ "ഓരോ ഫയലിനും ഒരു സന്ദേശം" എന്നതിലോ ആയിരിക്കണം
ഫോർമാറ്റ് (a la MH). Emacs' Babyl പോലുള്ള മറ്റ് ഫോർമാറ്റുകൾ പിന്തുണയ്ക്കുന്നില്ല.
SpamOracle ഉപയോഗിക്കുന്ന "വാക്ക്" എന്ന ആശയം പടിഞ്ഞാറൻ യൂറോപ്യൻ ഭാഷകളിലേക്ക് ചരിഞ്ഞതാണ്,
അതായത് ഐഎസ്ഒ ലാറ്റിൻ-1, ലാറ്റിൻ-9 പ്രതീക സെറ്റുകൾ. JIS-എൻകോഡുള്ള പ്രാഥമിക പിന്തുണ
കംപൈൽ സമയത്ത് ജാപ്പനീസ് തിരഞ്ഞെടുക്കാം. നിങ്ങൾക്ക് ലഭിക്കുകയാണെങ്കിൽ SpamOracle നന്നായി പ്രവർത്തിക്കില്ല
ചൈനീസ് അല്ലെങ്കിൽ കൊറിയൻ സെറ്റുകൾ പോലെയുള്ള മറ്റ് അക്ഷര സെറ്റുകളിൽ എഴുതിയ നിരവധി നിയമാനുസൃത ഇ-മെയിലുകൾ.
സമാരംഭിക്കൽ
കോർപ്പസിൽ നിന്ന് വേഡ് ഫ്രീക്വൻസികളുടെ ഡാറ്റാബേസ് നിർമ്മിക്കുന്നതിന്, ചെയ്യുക:
rm ~/.spamoracle.db
സ്പാമോറാക്കിൾ ചേർക്കുക -v -നല്ലത് ഗുഡ്മെയിലുകൾ -സ്പാം സ്പാംമെയിലുകൾ
സ്ഥിരസ്ഥിതിയായി, ഡാറ്റാബേസ് ഫയലിൽ സംഭരിച്ചിരിക്കുന്നു .spamoracle.db നിങ്ങളുടെ ഹോം ഡയറക്ടറിയിൽ.
ഇത് ഉപയോഗിച്ച് അസാധുവാക്കാം -f ഓപ്ഷൻ: സ്പാമോറാക്കിൾ -f mydatabase ചേർക്കുക ... ദി -v ഓപ്ഷൻ
കോർപ്പസിന്റെ പ്രോസസ്സിംഗ് സമയത്ത് പുരോഗതി വിവരങ്ങൾ പ്രിന്റ് ചെയ്യുന്നു.
കോർപ്പസിൽ നിന്നുള്ള നല്ലതും സ്പാം അല്ലാത്തതുമായ സന്ദേശങ്ങൾ ഫയലിൽ സംഭരിച്ചിട്ടുണ്ടെന്ന് ഇത് അനുമാനിക്കുന്നു
ഗുഡ്മെയിലുകൾ, കൂടാതെ ഫയലിലെ അറിയപ്പെടുന്ന സ്പാം സന്ദേശങ്ങളും സ്പാംമെയിലുകൾ. നിങ്ങൾക്ക് കോർപ്പസ് എടുക്കാനും കഴിയും
നിരവധി ഫയലുകളിൽ നിന്നുള്ള സന്ദേശങ്ങൾ, കൂടാതെ/അല്ലെങ്കിൽ SpamOracle-ന്റെ നിരവധി ഇൻവോക്കേഷനുകളിലൂടെ അവ പ്രോസസ്സ് ചെയ്യുക:
സ്പാമോറാക്കിൾ ചേർക്കുക -നല്ലത് ഗുഡ്മെയിലുകൾ1 ... ഗുഡ്മെയിലുകൾN
സ്പാമോറാക്കിൾ ചേർക്കുക -സ്പാം സ്പാമെയ്ലുകൾ1 ... സ്പാമെയ്ൽസ്പി
ടെസ്റ്റിംഗ് ദി ഡാറ്റബേസ്
ഡാറ്റാബേസ് ശരിയായി നിർമ്മിച്ചതാണോയെന്ന് പരിശോധിക്കുന്നതിനും നിങ്ങളെ പരിചയപ്പെടുന്നതിനും
SpamOracle നടത്തിയ സ്റ്റാറ്റിസ്റ്റിക്കൽ വിശകലനം, മെയിൽബോക്സുകളിൽ "ടെസ്റ്റ്" മോഡ് പ്രയോഗിക്കുക
കോർപ്പസ് നിർമ്മിക്കാൻ നിങ്ങൾ ഇപ്പോൾ ഉപയോഗിച്ചു:
സ്പാമോറാക്കിൾ പരിശോധന ഗുഡ്മെയിലുകൾ | കൂടുതൽ
സ്പാമോറാക്കിൾ പരിശോധന സ്പാംമെയിലുകൾ | കൂടുതൽ
നൽകിയിരിക്കുന്ന മെയിൽബോക്സുകളിലെ ഓരോ സന്ദേശത്തിനും, ഇതുപോലുള്ള ഒരു സംഗ്രഹം നിങ്ങൾ കാണും:
നിന്ന്: bbo <midhack@ureach.com>
വിഷയം: പരിശോധിക്കുക ഈ പുറത്ത്
സ്കോർ: 1.00 -- 15
വിശദാംശങ്ങൾ: refid:98 $$$$:98 സർഫിംഗ്:98 asp:95 ക്ലിക്ക്:93 കേബിൾ:92
തൽക്ഷണം:90 https:88 ഇന്റർനെറ്റ്:87 www:86 U4:85 അല്ല:14 മാസം: 81
com:75 സർഫ്:75
അറ്റാച്മെന്റ്: cset="GB2312" ടൈപ്പ്="അപ്ലിക്കേഷൻ/ഒക്ടറ്റ്-സ്ട്രീം"
പേര്="Guangwen4.zip"
പ്രമാണം: ഇൻബോക്സ്/314
ആദ്യത്തെ രണ്ട് വരികൾ മാത്രമാണ് നിന്ന്: ഒപ്പം വിഷയം: യഥാർത്ഥ സന്ദേശത്തിന്റെ ഫീൽഡുകൾ.
ദി സ്കോർ: ലൈൻ വിശകലനത്തിന്റെ ഫലം സംഗ്രഹിക്കുന്നു. ആദ്യ സംഖ്യ (0.0-നും
1.0) സന്ദേശം യഥാർത്ഥത്തിൽ സ്പാം ആയിരിക്കാനുള്ള സാധ്യതയാണ് --- അല്ലെങ്കിൽ, തത്തുല്യമായി, ബിരുദം
കോർപ്പസിലെ സ്പാം സന്ദേശങ്ങളുമായി സന്ദേശത്തിന്റെ സാമ്യം. രണ്ടാമത്തെ നമ്പർ (an
0 നും 15 നും ഇടയിലുള്ള പൂർണ്ണസംഖ്യ) സന്ദേശത്തിൽ കാണുന്ന "രസകരമായ" പദങ്ങളുടെ എണ്ണമാണ്.
"രസകരമായ" വാക്കുകൾ കോർപ്പസിൽ 5 തവണയെങ്കിലും സംഭവിക്കുന്നവയാണ്. ഉദാഹരണത്തിൽ,
ഞങ്ങൾക്ക് 15 രസകരമായ വാക്കുകളും (പരമാവധി) 1.00 സ്കോറും ഉണ്ട്, ഇത് സ്പാമിനെ സൂചിപ്പിക്കുന്നു.
ഉയർന്ന ഉറപ്പ്.
ദി വിശദാംശങ്ങൾ: ലൈൻ സ്കോറിന്റെ വിശദീകരണം നൽകുന്നു. അതിൽ ഏറ്റവും രസകരമായ 15 എണ്ണം പട്ടികപ്പെടുത്തുന്നു
സന്ദേശത്തിൽ കാണപ്പെടുന്ന വാക്കുകൾ, അതായത്, സാധ്യതയുള്ള 15 രസകരമായ വാക്കുകൾ
ഒരു സ്പാം സൂചിപ്പിക്കുന്നത് ന്യൂട്രൽ 0.5 ൽ നിന്ന് വളരെ അകലെയാണ്. ഓരോ വാക്കും അതിന്റെ കൂടെ നൽകിയിരിക്കുന്നു
വ്യക്തിഗത സ്കോർ, ഒരു പ്രോബബിലിറ്റി എന്നതിലുപരി ഒരു ശതമാനമായി (01 നും 99 നും ഇടയിൽ) എഴുതിയിരിക്കുന്നു
അങ്ങനെ സ്ഥലം ലാഭിക്കാൻ. ഇവിടെ, പോലുള്ള വളരെ "സ്പാമിഷ്" വാക്കുകൾ ഞങ്ങൾ കാണുന്നു $$$$ or
ക്ലിക്കിൽ, യഥാക്രമം 0.98 ഉം 0.93 ഉം പ്രോബബിലിറ്റിയും കൂടാതെ കുറച്ച് "നിഷ്കളങ്കമായ" വാക്കുകളും
അല്ല (സംഭാവ്യത 0.14). ദി U4 0.85 പ്രോബബിലിറ്റി ഉള്ള വാക്ക് യഥാർത്ഥത്തിൽ ഒരു കപട പദമാണ്
4-അക്ഷരമുള്ള പദത്തെ എല്ലാം വലിയക്ഷരത്തിൽ പ്രതിനിധീകരിക്കുന്നു -- സ്പാമർമാർ ഇഷ്ടപ്പെടുന്ന ഒന്ന്.
ദി അറ്റാച്മെന്റ്: ഈ സന്ദേശത്തിനായുള്ള MIME അറ്റാച്ച്മെന്റുകളെക്കുറിച്ചുള്ള ചില വിവരങ്ങൾ ലൈൻ സംഗ്രഹിക്കുന്നു.
ഇവിടെ, ഞങ്ങൾക്ക് തരത്തിലുള്ള ഒരു അറ്റാച്ച്മെന്റ് ഉണ്ട് ആപ്ലിക്കേഷൻ/ഒക്ടക്റ്റ്-സ്ട്രീം, ഫയലിന്റെ പേര് Guangwen4.zip,
സ്വഭാവഗുണവും GB2312 (ചൈനീസിനുള്ള ഒരു എൻകോഡിംഗ്).
ദി പ്രമാണം: പരീക്ഷിക്കുന്ന ഫയൽ ലൈൻ കാണിക്കുന്നു.
സാധാരണയായി, ഓടുമ്പോൾ സ്പാമോറാക്കിൾ പരിശോധന ഗുഡ്മെയിലുകൾ, മിക്ക സന്ദേശങ്ങളും കുറഞ്ഞതായിരിക്കണം
സ്കോർ (0.2 അല്ലെങ്കിൽ അതിൽ കുറവ്), ഒപ്പം ഓടുമ്പോൾ സ്പാമോറാക്കിൾ പരിശോധന സ്പാംമെയിലുകൾ, മിക്ക സന്ദേശങ്ങളും വരണം
ഉയർന്ന സ്കോർ (0.8 അല്ലെങ്കിൽ അതിൽ കൂടുതൽ) ഉപയോഗിച്ച് പുറത്ത്. ഇല്ലെങ്കിൽ, നിങ്ങളുടെ കോർപ്പസ് വളരെ നല്ലതല്ല, അല്ലെങ്കിൽ നല്ലതല്ല
സ്പാം, നോൺ-സ്പാം എന്നിങ്ങനെ തരംതിരിച്ചിരിക്കുന്നു. ഔട്ട്ലറുകൾ വേഗത്തിൽ കാണുന്നതിന്, നിങ്ങൾക്ക് കുറയ്ക്കാം
സന്ദേശ സംഗ്രഹങ്ങൾ പ്രദർശിപ്പിക്കുന്ന സ്കോറുകളുടെ ഇടവേള ഇനിപ്പറയുന്ന രീതിയിൽ:
സ്പാമോറാക്കിൾ പരിശോധന -മിനിറ്റ് 0.2 ഗുഡ്മെയിലുകൾ | കൂടുതൽ
# ഷോകൾ മാത്രം നല്ല മെയിലുകൾ കൂടെ സ്കോർ >= 0.2
സ്പാമോറാക്കിൾ പരിശോധന -പരമാവധി 0.8 സ്പാംമെയിലുകൾ | കൂടുതൽ
# ഷോകൾ മാത്രം സ്പാം മെയിലുകൾ കൂടെ സ്കോർ <= 0.8
ഇപ്പോൾ, കൂടുതൽ വെല്ലുവിളി നിറഞ്ഞ ഒരു പരിശോധനയ്ക്കായി, ഫിൽട്ടർ ചെയ്യാത്ത ഇ-മെയിലുകൾ അടങ്ങുന്ന ഒരു മെയിൽബോക്സ് എടുക്കുക, അതായത് ഒരു
സ്പാമിന്റെയും നിയമാനുസൃതമായ ഇ-മെയിലുകളുടെയും മിശ്രിതം, സ്പാം ഒറാക്കിൾ വഴി പ്രവർത്തിപ്പിക്കുക:
സ്പാമോറാക്കിൾ പരിശോധന mymailbox | കുറവ്
ബാക്കിയുള്ളവയിൽ നിന്ന് ഒറാക്കിൾ എത്ര നന്നായി സ്പാം തിരിച്ചറിയുന്നു എന്നതിൽ ആശ്ചര്യപ്പെടുക! ഫലം അങ്ങനെയല്ലെങ്കിൽ
നിങ്ങൾക്ക് അത്ഭുതകരമാണ്, ചില സ്പാമുകൾ തിരിച്ചറിയാൻ കഴിയാത്തത്ര ചെറുതാണെന്ന് ഓർമ്മിക്കുക (അല്ല
മതിയായ പ്രാധാന്യമുള്ള വാക്കുകൾ). കൂടാതെ, ഒരുപക്ഷേ നിങ്ങളുടെ കോർപ്പസ് വളരെ ചെറുതായിരിക്കാം, അല്ലെങ്കിൽ നല്ലതല്ല
വർഗ്ഗീകരിച്ച...
മാർക്കറ്റിംഗ് ഒപ്പം ഫിൽട്ടറിംഗ് വരാനിരിക്കുന്ന ഇ-മെയിൽ
ഡാറ്റാബേസ് നിർമ്മിച്ചുകഴിഞ്ഞാൽ, SpamOracle വഴി ഇൻകമിംഗ് ഇ-മെയിലുകൾ പ്രവർത്തിപ്പിക്കാൻ നിങ്ങൾ തയ്യാറാണ്. ദി
കമാൻഡ് സ്പാമോറാക്കിൾ അടയാളം സ്റ്റാൻഡേർഡ് ഇൻപുട്ടിൽ നിന്ന് ഒരു ഇമെയിൽ വായിക്കുകയും അത് സ്റ്റാൻഡേർഡിലേക്ക് പകർത്തുകയും ചെയ്യുന്നു
ഔട്ട്പുട്ട്, രണ്ട് തലക്കെട്ടുകൾ ചേർത്തു: എക്സ്-സ്പാം: ഒപ്പം എക്സ്-അറ്റാച്ചുമെന്റുകൾ:. ദി എക്സ്-സ്പാം: തലക്കെട്ടിന് ഒന്ന് ഉണ്ട്
ഇനിപ്പറയുന്ന ഫോർമാറ്റുകൾ:
എക്സ്-സ്പാം: അതെ; സ്കോർ; വിശദാംശങ്ങൾ
or
എക്സ്-സ്പാം: ഇല്ല; സ്കോർ; വിശദാംശങ്ങൾ
or
എക്സ്-സ്പാം: അജ്ഞാതൻ; സ്കോർ; വിശദാംശങ്ങൾ
ദി സ്കോർ ഒപ്പം വിശദാംശങ്ങൾ വിവരിച്ചിരിക്കുന്നത് പോലെയാണ് സ്പാമോറാക്കിൾ പരിശോധന.
ദി അതെ/ഇല്ല/അജ്ഞാതമാണ് ടാഗ് വിശകലനത്തിന്റെ ഫലങ്ങൾ സമന്വയിപ്പിക്കുന്നു: അതെ സ്കോർ എന്നാണ് അർത്ഥമാക്കുന്നത്
ആണ് >= 0.8 കൂടാതെ കുറഞ്ഞത് 5 രസകരമായ വാക്കുകളെങ്കിലും കണ്ടെത്തി; ഇല്ല സ്കോർ <= 0.2 എന്നാണ് അർത്ഥമാക്കുന്നത്
കൂടാതെ കുറഞ്ഞത് 5 രസകരമായ വാക്കുകളെങ്കിലും കണ്ടെത്തി; അജ്ഞാതമാണ് അല്ലാത്ത വിധത്തിൽ തിരിച്ചയക്കുന്നു. ദി അജ്ഞാതമാണ്
വേണ്ടത്ര രസകരമായ വാക്കുകൾ ഇല്ലാത്ത വളരെ ചെറിയ സന്ദേശങ്ങൾക്കാണ് സാധാരണയായി കേസ് സംഭവിക്കുന്നത്
കണ്ടെത്തി.
ദി എക്സ്-അറ്റാച്ചുമെന്റുകൾ: തലക്കെട്ടിൽ അതേ വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്നു അറ്റാച്മെന്റ്: ട്ട്പുട്ട്
സ്പാമോറാക്കിൾ പരിശോധന, അതായത്, സന്ദേശ അറ്റാച്ച്മെന്റുകളുടെ ഒരു സംഗ്രഹം.
SpamOracle വഴി നിങ്ങളുടെ ഇൻകമിംഗ് ഇ-മെയിൽ സ്വയമേവ പ്രോസസ്സ് ചെയ്യുന്നതിനും ഫലങ്ങളിൽ പ്രവർത്തിക്കുന്നതിനും
വിശകലനത്തിന്റെ, ഫയലിൽ ഇനിപ്പറയുന്ന "പാചകക്കുറിപ്പുകൾ" ചേർക്കുക ~/.procmailrc:
:0fw
| /usr/local/bin/spamoracle അടയാളം
:0
* ^എക്സ്-സ്പാം: അതെ;
സ്പാംബോക്സ്
ഈ നിഗൂഢ കമാൻഡുകൾ എന്താണ് അർത്ഥമാക്കുന്നത്:
- വഴി എല്ലാ മെയിലുകളും പ്രവർത്തിപ്പിക്കുക സ്പാമോറാക്കിൾ അടയാളം കമാൻഡ്. (സ്പാമോറാക്കിൾ ഇൻസ്റ്റാൾ ചെയ്തിട്ടില്ലെങ്കിൽ
/ usr / local / bin, ആവശ്യമായ പാത ക്രമീകരിക്കുക.) ഇത് സന്ദേശത്തിലേക്ക് രണ്ട് തലക്കെട്ടുകൾ ചേർക്കുന്നു: X-
സ്പാം: ഒപ്പം എക്സ്-അറ്റാച്ചുമെന്റുകൾ:, സ്പാം വിശകലനത്തിന്റെയും അറ്റാച്ച്മെന്റിന്റെയും ഫലങ്ങൾ വിവരിക്കുന്നു
വിശകലനം.
- ഞങ്ങൾക്ക് ഒരു ഉണ്ടെങ്കിൽ എക്സ്-സ്പാം: അതെ തലക്കെട്ട്, ഫയലിലേക്ക് സന്ദേശം കൈമാറുക സ്പാംബോക്സ് എന്നതിലുപരി
നിങ്ങളുടെ സാധാരണ മെയിൽബോക്സ്. ഒരുപക്ഷേ, നിങ്ങൾ വായിക്കും സ്പാംബോക്സ് ഇടയ്ക്കിടെ, എന്നാൽ കുറച്ച് തവണ
നിങ്ങളുടെ സാധാരണ മെയിൽബോക്സിനേക്കാൾ. ധൈര്യമുള്ള ഉപയോക്താക്കൾക്ക് ഇടാം / dev / null ഇതിനുപകരമായി സ്പാംബോക്സ് നീതിക്ക്
സന്ദേശം വലിച്ചെറിയുക, എന്നാൽ നിങ്ങൾ കുറച്ച് സമയത്തേക്ക് SpamOracle ഉപയോഗിക്കുന്നതുവരെ ദയവായി അത് ചെയ്യരുത്
ഫലങ്ങളിൽ സന്തുഷ്ടരാണ്. SpamOracle-ന്റെ തെറ്റായ പോസിറ്റീവ് നിരക്ക് (അതായത് നിയമാനുസൃത മെയിലുകൾ
സ്പാം ആയി തരംതിരിച്ചിരിക്കുന്നു) കുറവാണ് (0.1%) എന്നാൽ അസാധുവല്ല. അതിനാൽ, അനുമാനിക്കുന്ന സ്പാമുകൾ സംരക്ഷിക്കുന്നതാണ് നല്ലത്
എവിടെയെങ്കിലും, കാലാകാലങ്ങളിൽ അവ വേഗത്തിൽ സ്കാൻ ചെയ്യുക.
അറ്റാച്ച്മെന്റ് അധിഷ്ഠിത ഫിൽട്ടറിംഗ് ആസ്വദിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ചില പ്രോക്മെയിൽ നിയമങ്ങൾ ഇതാ
അതിനു വേണ്ടി:
:0
* ^X-അറ്റാച്ചുമെന്റുകൾ:.*name=".*\.(pif|scr|exe|bat|com)"
സ്പാംബോക്സ്
:0
* ^X-അറ്റാച്ച്മെന്റുകൾ:.*തരം="ഓഡിയോ/(x-wav|x-midi)
സ്പാംബോക്സ്
:0
* ^(ഉള്ളടക്ക-തരം:.*|X-അറ്റാച്ചുമെന്റുകൾ:.*cset="|^വിഷയം:.*=\?)(ks_c|gb2312|iso-2|euc-|big5|windows-1251)
സ്പാംബോക്സ്
വിൻഡോസ് എക്സിക്യൂട്ടബിൾ അറ്റാച്ച്മെന്റായി ഉള്ള എല്ലാ മെയിലുകളും ആദ്യ നിയമം സ്പാം ആയി കണക്കാക്കുന്നു.
ഈ മെയിലുകൾ സാധാരണയായി വൈറസുകൾ വഴിയാണ് അയയ്ക്കുന്നത്. രണ്ടാമത്തെ നിയമം അറ്റാച്ചുമെന്റുകൾക്കും സമാനമാണ്
x-wav അല്ലെങ്കിൽ x-midi തരം. എനിക്ക് സാധാരണയായി ഇ-മെയിൽ വഴി സംഗീതം ലഭിക്കില്ല, എന്നിരുന്നാലും ചില ജനപ്രിയത
ഇ-മെയിൽ വൈറസുകൾ ഈ അറ്റാച്ച്മെന്റ് തരങ്ങളെ ഇഷ്ടപ്പെടുന്നതായി തോന്നുന്നു. മൂന്നാമത്തെ നിയമം സ്പാം ആയി കണക്കാക്കുന്നു
കൊറിയൻ, ചൈനീസ്, ജാപ്പനീസ്, കൂടാതെ പ്രതീക എൻകോഡിംഗുകൾ ഉപയോഗിക്കുന്ന മെയിൽ
സിറിലിക്.
അപ്ഡേറ്റ് ചെയ്യുന്നു ദി ഡാറ്റബേസ്
ഏത് സമയത്തും, നിങ്ങൾക്ക് കൂടുതൽ അറിയപ്പെടുന്ന സ്പാമുകളോ അറിയപ്പെടുന്ന നിയമാനുസൃത സന്ദേശങ്ങളോ ഡാറ്റാബേസിലേക്ക് ചേർക്കാൻ കഴിയും
ഉപയോഗിച്ച് സ്പാമോറാക്കിൾ ചേർക്കുക കമാൻഡ്.
ഉദാഹരണത്തിന്, തരംതിരിച്ചിട്ടില്ലാത്ത ഒരു സ്പാം സന്ദേശം നിങ്ങൾ കണ്ടെത്തുകയാണെങ്കിൽ, അത് പ്രവർത്തിപ്പിക്കുക
സ്പാമോറാക്കിൾ ചേർക്കുക -സ്പാം, അങ്ങനെ SpamOracle അതിന്റെ തെറ്റിൽ നിന്ന് പഠിക്കാൻ കഴിയും. (അധികം ഇല്ലാതെ
ആർഗ്യുമെന്റുകൾ, ഈ കമാൻഡ് സ്റ്റാൻഡേർഡ് ഇൻപുട്ടിൽ നിന്നുള്ള ഒരൊറ്റ സന്ദേശം വായിക്കുകയും അത് രേഖപ്പെടുത്തുകയും ചെയ്യും
സ്പാം.) താഴെ മൃഗം(1) ഉദാഹരണത്തിന്, സ്പാം സന്ദേശം ഹൈലൈറ്റ് ചെയ്ത് ടൈപ്പ് ചെയ്യുക
|സ്പാമോറാക്കിൾ ചേർക്കുക -സ്പാം
അതുപോലെ, നിങ്ങളുടെ സ്പാം ബോക്സ് പരിശോധിക്കുമ്പോൾ നിയമാനുസൃതമായ ഒരു സന്ദേശം കണ്ടെത്തുകയാണെങ്കിൽ, അതിലൂടെ പ്രവർത്തിപ്പിക്കുക
സ്പാമോറാക്കിൾ ചേർക്കുക -നല്ലത്.
മെയിൽബോക്സിലേക്ക് കൂടുതൽ അറിയപ്പെടുന്ന സ്പാമുകളോ അറിയപ്പെടുന്ന കൂടുതൽ നല്ല സന്ദേശങ്ങളോ ശേഖരിക്കുക എന്നതാണ് മറ്റൊരു ഓപ്ഷൻ
ഫയലുകൾ, ഒരിക്കൽ ചെയ്യുക സ്പാമോറാക്കിൾ ചേർക്കുക -നല്ലത് പുതിയ_നല്ല_മെയിലുകൾ or സ്പാമോറാക്കിൾ ചേർക്കുക -സ്പാം
new_spam_mails.
ചോദ്യം ചെയ്യുന്നു ദി ഡാറ്റബേസ്
നിങ്ങളുടെ പരിഷ്ക്കരണത്തിനും വിനോദത്തിനും വേണ്ടി, ഡാറ്റാബേസിന്റെ ഉള്ളടക്കം അന്വേഷിക്കാവുന്നതാണ്
പതിവ് ഭാവങ്ങൾ. ദി സ്പാമോറാക്കിൾ പട്ടിക regexp ഡാറ്റാബേസിലെ എല്ലാ വാക്കുകളും കമാൻഡ് ലിസ്റ്റുചെയ്യുന്നു
ആ പൊരുത്തം regexp (ഒരു ഇമാക്സ്-സ്റ്റൈൽ റെഗുലർ എക്സ്പ്രഷൻ), അവയുടെ എണ്ണം സഹിതം
സ്പാം മെയിലിലും നല്ല മെയിലിലുമുള്ള സംഭവങ്ങൾ. ഉദാഹരണത്തിന്:
സ്പാമോറാക്കിൾ പട്ടിക '.*' # കാണിക്കുക എല്ലാം വാക്കുകൾ -- വലിയ ലിസ്റ്റ്!
സ്പാമോറാക്കിൾ പട്ടിക 'സെക്സ്.*'
സ്പാമോറാക്കിൾ പട്ടിക 'linux.*'
ഡാറ്റബേസ് ബാക്കപ്പുകൾ
SpamOracle ഉപയോഗിക്കുന്ന ഡാറ്റാബേസ്, മനുഷ്യത്വമില്ലാത്ത ഒരു കോംപാക്റ്റ്, ബൈനറി ഫോർമാറ്റിലാണ് സംഭരിച്ചിരിക്കുന്നത്
വായിക്കാവുന്നത്. മാത്രമല്ല, SpamOracle-ന്റെ പിന്നീടുള്ള പതിപ്പുകളിൽ ഈ ഫോർമാറ്റ് മാറ്റത്തിന് വിധേയമാണ്. ലേക്ക്
ബാക്കപ്പുകളും അപ്ഗ്രേഡുകളും സുഗമമാക്കുക, ഡാറ്റാബേസ് ഉള്ളടക്കങ്ങൾ കൈകാര്യം ചെയ്യാനും കഴിയും a
പോർട്ടബിൾ, ടെക്സ്റ്റ് ഫോർമാറ്റ്.
ദി സ്പാമോറാക്കിൾ ബാക്കപ്പ് കമാൻഡ് ഡാറ്റാബേസിന്റെ ഉള്ളടക്കത്തെ സ്റ്റാൻഡേർഡ് ഔട്ട്പുട്ടിലേക്ക് ഡംപ് ചെയ്യുന്നു, a ൽ
ടെക്സ്റ്റ്, പോർട്ടബിൾ ഫോർമാറ്റ്.
ദി സ്പാമോറാക്കിൾ വീണ്ടെടുക്കുക കമാൻഡ് സ്റ്റാൻഡേർഡ് ഇൻപുട്ടിൽ നിന്ന് അത്തരമൊരു ഡംപ് വായിക്കുകയും പുനർനിർമ്മിക്കുകയും ചെയ്യുന്നു
ഈ ഡാറ്റയുള്ള ഡാറ്റാബേസ്.
SpamOracle-ന്റെ പുതിയ പതിപ്പിലേക്ക് അപ്ഗ്രേഡ് ചെയ്യുന്നതിനുള്ള ശുപാർശിത നടപടിക്രമം ഇതാണ്:
# മുമ്പ് The നവീകരിക്കുക:
സ്പാമോറാക്കിൾ ബാക്കപ്പ് > ബാക്കപ്പ് ഫയൽ
# നവീകരണം സ്പാംഒറാക്കിൾ
# പുനഃസ്ഥാപിക്കുക The ഡാറ്റാബേസ്
സ്പാമോറാക്കിൾ വീണ്ടെടുക്കുക < ബാക്കപ്പ് ഫയൽ
കോൺഫിഗർ ചെയ്യുന്നു ഫിൽട്ടറിംഗ് പാരാമീറ്ററുകൾ
സന്ദേശ വർഗ്ഗീകരണത്തെ നിയന്ത്രിക്കുന്ന പല പരാമീറ്ററുകളും a വഴി കോൺഫിഗർ ചെയ്യാവുന്നതാണ്
കോൺഫിഗറേഷൻ ഫയൽ. സ്ഥിരസ്ഥിതിയായി, കോൺഫിഗറേഷൻ ഫയലിൽ നിന്ന് വായിക്കുന്നു .spamoracle.conf
ഉപയോക്താവിന്റെ ഹോം ഡയറക്ടറിയിൽ. മറ്റൊരു കോൺഫിഗറേഷൻ ഫയൽ ഇതിൽ വ്യക്തമാക്കാം
കമാൻഡ് ലൈൻ ഉപയോഗിച്ച് -കോൺഫിഗ് ഓപ്ഷൻ: സ്പാമോറാക്കിൾ -കോൺഫിഗ് myconfigfile ...
ക്രമീകരിക്കാവുന്ന പരാമീറ്ററുകളുടെ പട്ടികയും കോൺഫിഗറേഷൻ ഫയലിന്റെ ഫോർമാറ്റും വിവരിച്ചിരിക്കുന്നു
in സ്പമോറക്കിൾ.conf(5).
എല്ലാ പാരാമീറ്ററുകൾക്കും ന്യായമായ ഡിഫോൾട്ടുകൾ ഉണ്ട്, എന്നാൽ നിങ്ങൾക്ക് ഗുണനിലവാരം മെച്ചപ്പെടുത്താൻ ശ്രമിക്കാവുന്നതാണ്
അവയെ ട്വീക്ക് ചെയ്തുകൊണ്ട് കൂടുതൽ വർഗ്ഗീകരണം. നിങ്ങളുടെ മാറ്റങ്ങളുടെ സ്വാധീനം നിർണ്ണയിക്കാൻ, ഉപയോഗിക്കുക
ഒന്നുകിൽ പരിശോധന or അറിഞ്ഞുകൂടാത്തപിശകുനിലസ്റ്റാറ്റ് ആജ്ഞാപിക്കുന്നു സ്പാമോറാക്കിൾ. ദി സ്പാമോറാക്കിൾ അറിഞ്ഞുകൂടാത്തപിശകുനിലസ്റ്റാറ്റ് കമാൻഡ് ഒന്ന് പ്രിന്റ് ചെയ്യുന്നു-
മെയിൽബോക്സുകളിൽ എത്ര സ്പാം, നോൺ-സ്പാം, അജ്ഞാത സന്ദേശങ്ങൾ കണ്ടെത്തി എന്നതിന്റെ ലൈൻ സംഗ്രഹം
വാദങ്ങളായി നൽകിയിരിക്കുന്നു.
സാങ്കേതികമായ വിശദാംശങ്ങൾ
SpamOracle ന്റെ "പദം" എന്ന ആശയം ഇനിപ്പറയുന്ന പ്രതീകങ്ങളിൽ 3 മുതൽ 12 വരെയുള്ള ഏതെങ്കിലും ഓട്ടമാണ്: അക്ഷരങ്ങൾ,
ഒറ്റ ഉദ്ധരണികളും ഡാഷുകളും (-). ഇംഗ്ലീഷ് ഇതര യൂറോപ്യൻ ഭാഷകൾക്കുള്ള പിന്തുണ സമാഹരിച്ചിട്ടുണ്ടെങ്കിൽ
in, പദ പ്രതീകങ്ങളിൽ ഭാഷകൾക്കുള്ള പ്രസക്തമായ ഉച്ചാരണ അക്ഷരങ്ങളും ഉൾപ്പെടുന്നു
ചോദ്യം. എല്ലാ വാക്കുകളും ചെറിയക്ഷരത്തിലേക്ക് മാപ്പ് ചെയ്തിരിക്കുന്നു, കൂടാതെ ഉച്ചാരണമുള്ള അക്ഷരങ്ങൾ എന്നതിലേക്ക് മാപ്പ് ചെയ്തിരിക്കുന്നു
പ്രസക്തമായ ഉച്ചാരണമില്ലാത്ത അക്ഷരങ്ങൾ.
ഇനിപ്പറയുന്ന പ്രതീകങ്ങളിൽ 3 മുതൽ 12 വരെ ഒരു ഓട്ടവും ഒരു വാക്ക് ഉൾക്കൊള്ളുന്നു: അക്കങ്ങൾ, ഡോട്ടുകൾ,
കോമകളും ഡോളർ, യൂറോ, ശതമാനം അടയാളങ്ങളും.
കൂടാതെ, മൂന്നോ അതിലധികമോ വലിയക്ഷരങ്ങളുടെ ഒരു ഓട്ടം ഒരു കപട വാക്ക് സൃഷ്ടിക്കുന്നു Un എവിടെ n
ആണ് ഓട്ടത്തിന്റെ ദൈർഘ്യം. അതുപോലെ, മൂന്നോ അതിലധികമോ നോൺ ASCII പ്രതീകങ്ങളുടെ ഒരു റൺ (കോഡ് >=
128) ഒരു കപട വാക്ക് സൃഷ്ടിക്കുന്നു Wn എവിടെ n ആണ് ഓട്ടത്തിന്റെ ദൈർഘ്യം.
ഉദാഹരണത്തിന്, ഇനിപ്പറയുന്ന വാചകം:
SUMMER in ഇംഗ്ലീഷ് is എഴുതപ്പെട്ടിരിക്കുന്നു "എതെ" in ഫ്രഞ്ച്
കംപൈലിൽ ഫ്രഞ്ച് പിന്തുണ തിരഞ്ഞെടുത്തുവെന്ന് അനുമാനിച്ച് ഇനിപ്പറയുന്ന വാക്കുകളിലേക്ക് പ്രോസസ്സ് ചെയ്യുന്നു-
സമയം:
U5 വേനൽ ഇംഗ്ലീഷ് എഴുതപ്പെട്ടിരിക്കുന്നു വേനൽക്കാലം ഫ്രഞ്ച് W3
ഫ്രഞ്ച് പിന്തുണ തിരഞ്ഞെടുത്തിട്ടില്ലെങ്കിൽ:
U5 വേനൽ ഇംഗ്ലീഷ് എഴുതപ്പെട്ടിരിക്കുന്നു ഫ്രഞ്ച് W3
ഒരു സന്ദേശത്തിൽ നിന്ന് എക്സ്ട്രാക്റ്റുചെയ്ത വാക്കുകൾ കാണുന്നതിന്, പുറപ്പെടുവിക്കുക സ്പാമോറാക്കിൾ വാക്കുകൾ കമാൻഡ്.
ഇത് സ്റ്റാൻഡേർഡ് ഇൻപുട്ടിൽ നിന്നുള്ള ഒരൊറ്റ സന്ദേശം അല്ലെങ്കിൽ മെയിൽബോക്സിൽ നിന്നുള്ള എല്ലാ സന്ദേശങ്ങളും വായിക്കുന്നു
ഫയലുകൾ ആർഗ്യുമെന്റുകളായി നൽകിയിരിക്കുന്നു, സന്ദേശങ്ങളെ വാക്കുകളാക്കി വിഘടിപ്പിക്കുകയും വാക്കുകൾ അച്ചടിക്കുകയും ചെയ്യുന്നു.
RANDOM കുറിപ്പുകൾ
ഡാറ്റാബേസ് ഫയൽ കംപ്രസ് ചെയ്യാൻ കഴിയും gzip(1) ഡിസ്ക് സ്ഥലം ലാഭിക്കാൻ, ചെലവിൽ
പതുക്കെ പോകൂ സ്പാമോറാക്കിൾ പ്രവർത്തനങ്ങൾ. ഡാറ്റാബേസ് ഫയൽ വ്യക്തമാക്കിയിട്ടുണ്ടെങ്കിൽ -f ഓപ്ഷൻ ഉണ്ട്
വിപുലീകരണം .gz, സ്പാമോറാക്കിൾ സ്റ്റാർട്ടപ്പിൽ ഇത് യാന്ത്രികമായി അൺകംപ്രസ്സ് ചെയ്യുകയും വീണ്ടും കംപ്രസ് ചെയ്യുകയും ചെയ്യും
അപ്ഡേറ്റുകൾക്ക് ശേഷം.
നിങ്ങളുടെ മെയിൽ MH ഫോർമാറ്റിലാണ് സൂക്ഷിച്ചിരിക്കുന്നതെങ്കിൽ, നിങ്ങൾക്ക് "കമാൻഡ് ലൈൻ വളരെ ദൈർഘ്യമേറിയ" പിശകുകൾ ഉണ്ടാകാം.
ഉപയോഗിച്ച് ധാരാളം ചെറിയ ഫയലുകൾ പ്രോസസ്സ് ചെയ്യാൻ ശ്രമിക്കുന്നു സ്പാമോറാക്കിൾ ചേർക്കുക കമാൻഡ്, ഉദാ ചെയ്യുമ്പോൾ
സ്പാമോറാക്കിൾ ചേർക്കുക -നല്ലത് ആർക്കൈവുകൾ/*/* -സ്പാം സ്പാം/*
പകരം, ഇതുപോലുള്ള എന്തെങ്കിലും ചെയ്യുക:
കണ്ടെത്തുക ആർക്കൈവുകൾ -തരം f - അച്ചടിക്കുക | xargs സ്പാമോറാക്കിൾ ചേർക്കുക -നല്ലത്
കണ്ടെത്തുക സ്പാം -തരം f - അച്ചടിക്കുക | xargs സ്പാമോറാക്കിൾ ചേർക്കുക -സ്പാം
onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് സ്പാമോറാക്കിൾ ഓൺലൈനായി ഉപയോഗിക്കുക