InglésFrancésEspañol

icono de página de OnWorks

simhash - Online en la nube

Ejecute simhash en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando simhash que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


simhash - herramienta hash de similitud de archivos

SINOPSIS


Simhash [ -s culebrilla ] [ -f características ] [ presentar ]
Simhash [ -s culebrilla ] [ -f características ] -w presentar ...
Simhash [ -s culebrilla ] [ -f características ] -m presentar ...
Simhash -c archivo hash archivo hash

DESCRIPCIÓN


Este programa se utiliza para calcular y comparar hashes de similitud de archivos. Un hash de similitud
es un fragmento de datos que tiene la propiedad de que alguna métrica de distancia entre archivos es
proporcional a alguna métrica de distancia entre los hashes. Normalmente, el hash de similitud
será mucho más pequeño que el archivo en sí.

El algoritmo utilizado por Simhash es el algoritmo de "impresión de tejas" de Manassas (ver BIBLIOGRAFÍA
a continuación): tome un hash de cada m-byte subsecuencia del archivo, y conserva el n de estos
hashes numéricamente más pequeños. El tamaño de la intersección de los conjuntos hash de
dos archivos da una estimación estadísticamente buena de la similitud de los archivos en su conjunto.

En su modo predeterminado, Simhash calculará el hash de similitud de su argumento de archivo (o
stdin) y escriba este hash en su salida estándar. Cuando se invoca con el -w argumento (ver
abajo), Simhash calculará hashes de similitud de todos sus argumentos de archivo en "lote
mode ". Cuando se invoca con el -m argumento (ver más abajo), Simhash comparará todo lo dado
archivos que utilizan hashes de similitud en "modo de coincidencia". Finalmente, cuando se invoca con el -c argumento
(vea abajo), Simhash informará el grado de similitud entre dos hashes.

OPCIONES


-f recuento de características
Al calcular un hash de similitud, retenga como máximo recuento de características hashes significativos
desde el archivo de destino. El valor predeterminado es 128 funciones. Los recuentos de funciones más grandes
dar mayor resolución en las diferencias entre archivos, aumentará el tamaño de la
hash de similitud proporcionalmente al recuento de características, y aumentará la similitud
tiempo de cálculo de hash ligeramente.

-s del tamaño de una teja
Al calcular un hash de similitud, use hash de muestras que constan de del tamaño de una teja
bytes consecutivos extraídos del archivo de destino. El valor predeterminado es 8 bytes, el mínimo
es de 4 bytes. Los tamaños de tejas más grandes enfatizarán más las diferencias entre los archivos.
y ralentizará el cálculo del hash de similitud proporcionalmente al tamaño de la teja.

-c archivo hash1 archivo hash2
Muestra la distancia (normalizada al rango 0..1) entre el hash de similitud
guardado en archivo hash1 y el hash de similitud almacenado en archivo hash2.

-w presentar ...
Escribe el hash de similitud de cada uno de los presentar argumentos a archivo.sim.

-m presentar ...
Calcule el hash de similitud de cada uno de los presentar argumentos y generar una similitud
matriz para esos archivos.

Use simhash en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad