Это команда bup-margin, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
bup-margin - определите свой запас безопасности при дедупликации
СИНТАКСИС
маржа bup [варианты ...]
ОПИСАНИЕ
bup margin перебирает все объекты в вашем репозитории bup, вычисляя наибольший
количество битов префикса, совместно используемых любыми двумя записями. Это число n определяет
самое длинное подмножество SHA-1, которое вы могли бы использовать, но все еще сталкиваетесь с конфликтом между вашим объектом
идентификаторы.
Например, одна из протестированных систем имела набор из 11 миллионов объектов (70 ГБ),
и маржа bup вернула 45. Это означает, что 46-битного хеша будет достаточно, чтобы избежать всех
столкновения среди этого набора объектов; каждый объект в этом репозитории может быть уникальным
идентифицируется его первыми 46 битами.
Количество необходимых битов, кажется, увеличивается примерно на 1-2 при каждом удвоении
количество объектов. Поскольку хэши SHA-1 имеют 160 бит, остается 115 битов запаса. Из
конечно, поскольку хэши SHA-1 по сути случайны, теоретически можно использовать
гораздо больше бит с гораздо меньшим количеством объектов.
Если вы не уверены в возможности коллизий SHA-1, вы можете следить за своим
репозиторий, время от времени запуская bup margin, чтобы увидеть, не приближаетесь ли вы к опасной близости
до 160 бит.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
--предсказывать
Угадайте смещение в каждом индексном файле, где появится конкретный объект, и
сообщить о максимальном отклонении правильного ответа от предположения. Это
потенциально полезно для настройки алгоритма поиска с интерполяцией.
--игнорировать-мидкс
не используйте файлы .midx, используйте только файлы .idx. Это действительно полезно только при использовании
с --predict.
ПРИМЕРЫ
маржа в долларах
Индексы чтения: 100.00% (1612581/1612581), выполнено.
40
40 совпадающих битов префикса
1.94 бита на удвоение
Осталось 120 бит (61.86 удвоения)
4.19338e + можно в 18 раз больше
Каждый на Земле может иметь 625878182 набора данных
как и ваш, все в одном репозитории, и мы бы
ожидать столкновения 1 объекта.
маржа в долларах - прогноз
PackIdxList: с использованием 1 индекса.
Индексы чтения: 100.00% (1612581/1612581), выполнено.
915 из 1612581 (0.057%)
Используйте bup-margin онлайн с помощью сервисов onworks.net