indexeur - En ligne dans le Cloud

Exécutez l'indexeur dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de l'indexeur de commandes qui peut être exécuté dans le fournisseur d'hébergement gratuit OnWorks à l'aide de l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.

Exécuter sous Ubuntu Courir dans Fedora Exécuter dans Windows Sim Exécuter dans MACOS Sim

PROGRAMME:

Nom

indexeur - Générateur d'index de texte intégral Sphinxsearch

SYNOPSIS

indexeur [--config FICHIER DE CONFIGURATION] [--rotation] [--noprogress | --silencieux] [--all | INDEX | ]

indexeur --arrêts de construction FICHIER DE SORTIE COUNT [--config FICHIER DE CONFIGURATION] [--pas de progrès | --calmer]
[--tout | INDEX | ]

indexeur --fusionner MAIN_INDEX DELTA_INDEX [--config FICHIER DE CONFIGURATION] [--rotation] [--noprogress |
--calmer]

DESCRIPTION

Sphinx est une collection de programmes qui visent à fournir une recherche plein texte de haute qualité.

indexeur est le premier des deux principaux outils faisant partie de Sphinx. Invoqué soit depuis le
ligne de commande directement, ou dans le cadre d'un script plus large, indexeur est seul responsable de
rassembler les données qui seront consultables.

La syntaxe d'appel de l'indexeur est la suivante :

$ indexeur [OPTIONS] [indexname1 [indexname2 [...]]]

Essentiellement, vous listeriez les différents index possibles (que vous feriez plus tard
disponible pour la recherche) dans sphinx.conf, donc lors de l'appel indexeur, vous devez au minimum être
lui dire quel index (ou index) vous voulez indexer.

Si sphinx.conf contenait des détails sur 2 index, mongrandindex et monpetit index, vous pourriez faire
ce qui suit:

$ indexeur mybigindex
$ indexeur mysmallindex mybigindex

Dans le fichier de configuration, sphinx.conf, vous spécifiez un ou plusieurs index pour votre
Les données. Vous pourriez appeler indexeur pour réindexer l'un d'entre eux, ad-hoc, ou vous pouvez lui dire de traiter
tous les index - vous n'êtes pas limité à appeler un seul, ou tous à la fois, vous pouvez toujours choisir
une combinaison des index disponibles.

OPTIONS

La majorité des options de indexeur sont donnés dans le fichier de configuration, cependant il
sont des options que vous devrez peut-être également spécifier sur la ligne de commande, car elles peuvent affecter
comment l'opération d'indexation est effectuée. Ces options sont :

--tout
Dit indexeur pour mettre à jour chaque index répertorié dans sphinx.conf, au lieu de lister
index individuels. Cela serait utile dans les petites configurations, ou de type cron ou
travaux de maintenance où l'ensemble de l'index sera reconstruit chaque jour, ou semaine, ou
quelle que soit la période qui convient le mieux.

Exemple d'utilisation:

$ indexeur --config /home/monutilisateur/sphinx.conf --all

--arrêts de construction fichier de sortie.txt NUM
Examine la source de l'index, comme s'il indexait les données, et produit une liste des
termes qui sont indexés. En d'autres termes, il produit une liste de tous les
termes qui font désormais partie de l'index. Noter; il ne met pas à jour l'index dans
question, il traite simplement les données "comme si" il était indexé, y compris en exécutant
requêtes définies avec sql_query_pre or sql_query_post. outputfile.txt contiendra le
liste de mots, un par ligne, triés par fréquence avec le plus fréquent en premier, et NUM
spécifie le nombre maximum de mots qui seront répertoriés ; s'il est suffisamment grand pour
englobent tous les mots de l'index, seul ce nombre de mots sera renvoyé. Tel que
la liste des dictionnaires peut être utilisée pour les fonctionnalités de l'application client autour de "Voulez-vous dire..."
fonctionnalité, généralement en conjonction avec --buildfreqs, Ci-dessous.

Mise en situation :

$ indexeur myindex --buildstops word_freq.txt 1000

Cela produirait un document dans le répertoire actuel, word_freq.txt avec les 1,000
mots les plus courants dans 'myindex', classés par les plus courants en premier. Notez que le fichier sera
se rapportent au dernier index indexé lorsqu'il est spécifié avec plusieurs index ou --tout (c'est à dire
le dernier répertorié dans le fichier de configuration)

--buildfreqs
Utilisé en paire avec --arrêts de construction (et est ignoré si --arrêts de construction n'est pas précisé). Comme
--arrêts de construction fournit la liste des mots utilisés dans l'index, --buildfreqs ajoute le
quantité présente dans l'indice, ce qui serait utile pour établir si certaines
les mots doivent être considérés comme des mots vides s'ils sont trop répandus. Cela aidera également à
développer des fonctionnalités "Voulez-vous dire..." où vous pouvez savoir à quel point un mot donné est plus courant
par rapport à un autre, similaire.

Mise en situation :

$ indexeur myindex --buildstops word_freq.txt 1000 --buildfreqs

Cela produirait le word_freq.txt comme ci-dessus, cependant après chaque mot serait le
nombre de fois qu'il s'est produit dans l'indice en question.

--config CONFIGRILER, -c FICHIER DE CONFIGURATION
Utilisez le fichier donné comme configuration. Normalement, il recherchera sphinx.conf dans le
répertoire d'installation (par exemple/usr/local/sphinx/etc/sphinx.conf s'il est installé dans
/usr/local/sphinx), suivi du répertoire actuel dans lequel vous vous trouvez lors de l'appel de l'indexeur
de la coquille. Ceci est surtout utilisé dans les environnements partagés où les fichiers binaires sont
installé quelque part comme /usr/local/sphinx/ mais vous voulez fournir aux utilisateurs le
possibilité de créer leurs propres configurations Sphinx personnalisées, ou si vous souhaitez exécuter plusieurs
instances sur un seul serveur. Dans des cas comme ceux-là, vous pourriez leur permettre de créer leur
propres fichiers sphinx.conf et les transmettre à indexeur avec cette option.

Par exemple :

$ indexer --config /home/monutilisateur/sphinx.conf monindex

--dump-lignes DOSSIER
Vide les lignes récupérées par la ou les sources SQL dans le fichier spécifié, dans un support compatible avec MySQL
syntaxe. Les vidages résultants sont la représentation exacte des données reçues par l'indexeur
et aider à répéter les problèmes de temps d'indexation.

--fusionner INDICE DST INDICE SRC
Fusionner physiquement deux index. Par exemple, si vous avez un schéma main+delta,
où l'index principal change rarement, mais l'index delta est reconstruit fréquemment, et
--fusionner serait utilisé pour combiner les deux. L'opération se déplace de droite à gauche - le
contenu de INDICE SRC être examiné et physiquement combiné avec le contenu de
INDICE DST et le résultat est laissé dans INDICE DST. En pseudo-code, il peut s'exprimer
comme: INDICE DST += INDICE SRC

Un exemple:

indexeur $ --merge main delta --rotate

Dans l'exemple ci-dessus, où le principal est le maître, l'index rarement modifié et le delta
est la moins fréquemment modifiée, vous pouvez utiliser ce qui précède pour appeler indexeur à
combiner le contenu du delta dans l'index principal et faire pivoter les index.

--merge-dst-range ATTR MIN MAX
Exécutez la plage de filtres donnée lors de la fusion. Plus précisément, comme la fusion est appliquée au
index de destination (dans le cadre de --fusionner, et est ignoré si --fusionner n'est pas précisé),
indexeur filtrera également les documents finissant dans l'index de destination, et seulement
les documents passeront par le filtre donné se retrouveront dans l'index final. Cette
pourrait être utilisé par exemple, dans un index où il y a un attribut 'supprimé', où 0
signifie « non supprimé ». Un tel index pourrait être fusionné avec :

$ indexer --merge main delta --merge-dst-range supprimé 0 0

Tous les documents marqués comme supprimés (valeur 1) seront supprimés du nouveau
indice de destination. Il peut être ajouté plusieurs fois à la ligne de commande, pour ajouter
filtres successifs à la fusion, qui doivent tous être satisfaits pour qu'un document
faire partie de l'indice final.

--merge-killlists, --merge-klists
Utilisé en paire avec --fusionner. Généralement lors de la fusion indexeur utilise la kill-list de l'index source
(c'est-à-dire celui qui est fusionné) comme filtre pour effacer les documents correspondants de
l'indice de destination. En même temps, la kill-list de la destination elle-même n'est pas
touché du tout. Lors de l'utilisation --merge-killlists, (ou sa forme plus courte --merge-klists) la
indexeur ne filtrera pas les documents dst-index avec killlist src-index, mais il fusionnera
leurs kill-lists ensemble, donc l'index de résultat final aura la kill-list
contenant les kill-lists des sources fusionnées.

--pas de progrès
N'affichez pas les détails de la progression au fur et à mesure qu'ils surviennent ; à la place, les détails du statut final (tels que
comme les documents indexés, la vitesse d'indexation et ainsi de suite ne sont signalés qu'à la fin de
indexage. Dans les cas où le script n'est pas exécuté sur une console (ou 'tty'), cela
sera activé par défaut.

Exemple d'utilisation:

indexeur $ --rotate --all --noprogress

--print-requêtes
Imprime les requêtes SQL que l'indexeur envoie à la base de données, ainsi que la connexion SQL
et les événements de déconnexion. C'est utile pour diagnostiquer et résoudre les problèmes avec SQL
sources.

--silencieux
Dit indexeur de ne rien sortir, sauf en cas d'erreur. Encore une fois, le plus utilisé pour
cron-type, ou d'autres travaux de script où la sortie n'est pas pertinente ou inutile, sauf
en cas d'erreur.

Exemple d'utilisation:

indexeur $ --rotate --all --quiet

--tourner
Utilisé pour les index tournants. Sauf si vous avez la situation où vous pouvez effectuer la recherche
fonctionner hors ligne sans déranger les utilisateurs, vous aurez presque certainement besoin de garder
recherche en cours lors de l'indexation de nouveaux documents. --tourner crée un deuxième index,
parallèlement au premier (au même endroit, en incluant simplement .new dans les noms de fichiers).
Une fois terminé, indexeur travaillant XNUMX h sur XNUMX, recherché en envoyant le VUE D'ENSEMBLE signal, et recherché
tentera de renommer les index (en renommant les index existants pour inclure .old et
renommer le .new pour les remplacer), puis commencez à servir à partir des fichiers les plus récents.
Selon le réglage de sans couture_rotation, il peut y avoir un léger retard pour pouvoir
pour rechercher les index les plus récents.

Exemple d'utilisation:

indexeur $ --rotate --all

--sighup-chacun
est utile lorsque vous reconstruisez de nombreux index volumineux et que vous souhaitez que chacun soit tourné en
recherché dès que possible. Avec --sighup-chacun, indexeur enverra un VUE D'ENSEMBLE signal à
recherché après avoir terminé avec succès le travail sur chaque index. (Le comportement par défaut est
envoyer un seul VUE D'ENSEMBLE après que tous les index aient été construits.)

--verbeux
Garantit que chaque ligne qui a causé des problèmes d'indexation (en double, zéro ou manquant
pièce d'identité ; ou classer les problèmes d'E/S sur le terrain ; etc) sera signalé. Par défaut, cette option
est désactivé et des résumés de problèmes peuvent être signalés à la place.

Utiliser l'indexeur en ligne à l'aide des services onworks.net