Это команда recollindex, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
recollindex - команда индексации для системы полнотекстового поиска Recoll
СИНТАКСИС
повторный индекс -h
повторный индекс [ -c ] [ -z | -Z ] [ -k ]
повторный индекс [ -c ] -m [ -w ] [ -D ] [ -x ] [ -C ] [ -n | -k ]
повторный индекс [ -c ] -i [ -Z ] [ -k ] [ -f ] [ ]
повторный индекс [ -c ] -r [ -Z ] [ -K ] [ -e ] [ -f ] [ -p шаблон ]
повторный индекс [ -c ] -e [ ]
повторный индекс [ -c ] -l
повторный индекс [ -c ] -s
повторный индекс [ -c ] -S
повторный индекс [ -c ] -E
ОПИСАНИЕ
Команда повторный индекс Утилита позволяет выполнять операции индексации текста Recoll
поисковая система.
Поскольку индексирование иногда может занимать много времени, команду можно прервать, отправив
сигнал прерывания (Ctrl-C, SIGINT) или завершения (SIGTERM). Может пройти некоторое время, прежде чем
процесс завершается, потому что ему необходимо правильно очистить и закрыть индекс. Это также может быть
выполняется из графического интерфейса recoll (пункт меню: File / Stop_Indexing). После такого перерыва
index будет несколько непоследовательным, потому что некоторые операции, которые обычно выполняются
в конце прохода индексации будут пропущены (например, стемминг и
орфографические базы данных будут несуществующими или устаревшими). Вам просто нужно перезапустить индексацию
в более позднее время, чтобы восстановить последовательность. Индексация возобновится после прерывания.
точка (будет пройдено все дерево файлов, но файлы, которые были проиндексированы до
прерывание и для которого индекс все еще актуален, переиндексировать не нужно).
Команда -c опция указывает имя каталога конфигурации, отменяя значение по умолчанию или
$ RECOLL_CONFDIR.
Есть несколько режимов работы.
В обычном режиме будет проиндексирован набор файлов, описанных в файле конфигурации.
recoll.conf. Это будет постепенно обновлять базу данных файлами, которые были изменены с момента
последний пробег. Если вариант -z дана, база данных будет стерта перед запуском. Если
вариант -Z задано, база данных не будет сброшена, но все файлы будут считаться
требуется переиндексация (на месте сброса).
Начиная с версии 1.21, повторный индекс обычно не обрабатывает повторно файлы, которые ранее
не удалось проиндексировать (например, из-за отсутствия вспомогательной программы). Если вариант -k дано,
повторный индекс попытается еще раз обработать все файлы с ошибкой. Обратите внимание, что повторный индекс май
также решите повторить попытку неудачных файлов, если вспомогательный сценарий проверки, определенный
Переменная конфигурации checkneedretryindexscript указывает, что это должно произойти.
Если вариант -m задано, recollindex запускается для мониторинга в реальном времени с использованием файла
пакет системного мониторинга, для которого он был настроен (fam, gamin или inotify). Этот режим
должен быть явно настроен при сборке пакета, он недоступен для
дефолт. Программа обычно отсоединяется от управляющего терминала и становится
демон. Если вариант -D дан, он останется на переднем плане. Вариант -w может быть
используется для указания, что программа должна находиться в спящем режиме в течение указанного времени перед индексированием
начинается. Значение по умолчанию - 60. Демон обычно отслеживает сеанс X11 и завершает работу.
когда он сброшен. Вариант -x отключает этот мониторинг сеанса X11 (демон останется в живых
даже если он не может подключиться к серверу X11). Вам также нужно использовать это, если вы используете
демон без контекста X11. Вы можете использовать опцию -n чтобы пропустить начальный проход приращения
который обычно выполняется до начала мониторинга. После запуска мониторинга
демон обычно следит за конфигурацией и перезапускается с нуля в случае внесения изменений.
Вы можете отключить это с помощью опции -C
повторный индекс -i индексирует отдельные файлы в базе данных. Расширение стебля и
базы aspell обновляться не будут. Конфигурация skippedPaths и skippedNames
будут использоваться переменные, поэтому некоторые файлы могут быть пропущены. Вы можете сообщить recollindex
игнорировать skippedPaths и skippedNames, установив -f вариант. Это позволяет полностью настраивать
выбор файла для данного поддерева, для которого вы должны добавить верхний каталог в
skippedPaths и используйте любой настраиваемый инструмент для создания списка файлов (например, инструмент из источника
кодовая система управления).
повторный индекс -e удалит данные для отдельных файлов из базы данных. Расширение стебля
базы не будут обновляться.
Опции -i и -e можно комбинировать. Это сначала выполнит очистку, а затем индексацию.
С опциями -i or -e , если в командной строке не указаны имена файлов, они будут прочитаны
из стандартного ввода, чтобы вы могли, например, запустить:
найти / путь / к / директории -print | recollindex -e -i
для принудительной переиндексации дерева каталогов (которое должно существовать внутри файловой системы
область, определенная Topdirs в recoll.conf). В основном вы могли бы сделать то же самое с
найти / путь / к / директории -print | recollindex -Z -i
Однако последний будет выполнять менее тщательную работу по удалению устаревших суб-документов.
повторный индекс -r в основном работает как -i , но параметр - это единственный каталог, который будет
рекурсивно обновляться. В основном это не более чем найдите Topdir | повторный индекс -i
но может быть удобнее использовать при запуске из другой программы. Это повторяет
сбойные файлы по умолчанию, используйте опцию -K изменить. Один или несколько -p варианты могут быть использованы
для установки шаблонов выбора типа оболочки (например: * .pdf).
повторный индекс -l перечислит имена доступных стеммеров языка.
повторный индекс -s создаст базу данных расширения основы для данного языка, которая может или
может не входить в список в файле конфигурации. Если язык не входит в
конфигурации, база данных расширения ствола будет удалена в конце следующего обычного
индексирование прогона. Вы можете получить список имен стеммеров из повторный индекс -l команда. Примечание
что это в основном для экспериментального использования, нормальный способ добавить основополагающий язык - это
установите его в конфигурации, отредактировав "recoll.conf" или используя индексацию графического интерфейса.
диалоговое окно конфигурации.
На момент написания этой статьи признаны следующие языки (из Xapian's
STEM.H):
· Датский
· Голландский
· Английская версия своего стеммера Мартина Портера 2002 г.
· English_lovins Стеммер Ловина
· English_porter Стеммер Портера, описанный в его статье 1980 г.
· Финский
· французкий язык
· Немецкий
· Итальянский
· Норвежский
· Португальский
· русский
· испанский
· Шведский
повторный индекс -S восстановит фонетический / орфографический указатель. Эта функция использует заклинание
пакет, который необходимо установить в системе.
повторный индекс -E проверит файл конфигурации на наличие topdirs и других соответствующих путей
существование (чтобы помочь отловить опечатки).
Используйте recollindex онлайн с помощью сервисов onworks.net