InglesPransesEspanyol

OnWorks favicon

simhash - Online sa Cloud

Patakbuhin ang simhash sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command simhash na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


simhash - tool ng hash ng pagkakatulad ng file

SINOPSIS


simhash [ -s nshingles ] [ -f mga tampok ] [ file ]
simhash [ -s nshingles ] [ -f mga tampok ] -w file ...
simhash [ -s nshingles ] [ -f mga tampok ] -m file ...
simhash -c hashfile hashfile

DESCRIPTION


Ang program na ito ay ginagamit upang kalkulahin at paghambingin ang pagkakatulad ng mga hash ng mga file. Isang pagkakatulad na hash
ay isang tipak ng data na may katangian na ang ilang sukatan ng distansya sa pagitan ng mga file ay
proporsyonal sa ilang sukatan ng distansya sa pagitan ng mga hash. Karaniwan ang pagkakatulad na hash
ay magiging mas maliit kaysa sa file mismo.

Ang algorithm na ginamit ng simhash ay ang algorithm ng "shingleprinting" ni Manassas (tingnan ang BIBLIOGRAPHY
sa ibaba): kumuha ng hash ng bawat m-byte na kasunod ng file, at panatilihin ang n ng mga ito
mga hash na pinakamaliit sa bilang. Ang laki ng intersection ng hash sets ng
dalawang file ay nagbibigay ng istatistikal na mahusay na pagtatantya ng pagkakapareho ng mga file sa kabuuan.

Sa default mode nito, simhash ay kalkulahin ang pagkakatulad na hash ng file argument nito (o
stdin) at isulat ang hash na ito sa karaniwang output nito. Kapag tinawag kasama ang -w argumento (tingnan
sa ibaba), simhash ay kalkulahin ang pagkakatulad na mga hash ng lahat ng mga argumento ng file nito sa "batch
mode". Kapag tinawag kasama ang -m argumento (tingnan sa ibaba), simhash ihahambing ang lahat ng ibinigay
mga file na gumagamit ng mga hash ng pagkakatulad sa "match mode". Sa wakas, kapag tinawag kasama ang -c argumento
(tingnan sa ibaba), simhash ay mag-uulat ng antas ng pagkakatulad sa pagitan ng dalawang hash.

Opsyon


-f tampok-bilang
Kapag nag-compute ng hash ng pagkakatulad, panatilihin ang pinakamarami tampok-bilang makabuluhang hash
mula sa target na file. Ang default ay 128 na mga tampok. Ang mas malaking bilang ng tampok ay gagawin
magbigay ng mas mataas na resolution sa mga pagkakaiba sa pagitan ng mga file, ay tataas ang laki ng
pagkakatulad hash nang proporsyonal sa bilang ng tampok, at tataas ang pagkakatulad
bahagyang oras ng pag-compute ng hash.

-s laki ng shingle
Kapag nag-compute ng pagkakatulad na hash, gumamit ng mga hash ng mga sample na binubuo ng laki ng shingle
magkakasunod na byte na nakuha mula sa target na file. Ang default ay 8 bytes, ang pinakamababa
ay 4 bytes. Ang mas malalaking sukat ng shingle ay higit na magbibigay-diin sa mga pagkakaiba sa pagitan ng mga file
at magpapabagal sa pagkakapareho ng hash computation nang proporsyonal sa laki ng shingle.

-c hashfile1 hashfile2
Ipakita ang distansya (na-normalize sa hanay na 0..1) sa pagitan ng hash ng pagkakatulad
nakalagay sa hashfile1 at ang pagkakatulad na hash na nakaimbak sa hashfile2.

-w file ...
Isulat ang pagkakatulad hash ng bawat isa sa file mga argumento sa file.sim.

-m file ...
Kalkulahin ang pagkakatulad hash ng bawat isa sa file argumento, at maglabas ng pagkakatulad
matrix para sa mga file na iyon.

Gumamit ng simhash online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad