mu-index - En ligne dans le Cloud

Il s'agit de la commande mu-index qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


mu_index - indexe les messages électroniques stockés dans Maildirs

SYNOPSIS


mu indice [choix]

DESCRIPTION


mu indice est le mu commande pour analyser le contenu des répertoires Maildir et stocker
les résultats dans une base de données Xapian. Les données peuvent ensuite être interrogées en utilisant mu-trouver(1)

indice comprend Maildirs tel que défini par Daniel Bernstein pour qmail(7). De plus, il
comprend les Maildirs récursifs (Maildirs au sein de Maildirs), Maildir++. Il peut également traiter
avec des Maildirs basés sur VFAT qui utilisent '!' comme séparateurs au lieu de ':' comme utilisé par
Petitmail/Modeste et d'autres programmes de messagerie électronique.

E-mails qui ne sont pas stockés dans quelque chose ressemblant à un répertoire feuille maildir (actu
et nouvelle) sont ignorés, de même que les répertoires de cache pour pas beaucoup et dégoûter.

Les liens symboliques ne sont pas suivis.

S'il existe un fichier appelé .noindex dans un répertoire, le contenu de ce répertoire et tous
de ses sous-répertoires seront ignorés. Cela peut être utile pour exclure certains répertoires
du processus d'indexation, par exemple des répertoires contenant des messages de spam.

S'il existe un fichier appelé .Pas de mise à jour dans un répertoire, le contenu de ce répertoire et tous
de ses sous-répertoires seront ignorés, à moins que nous ne procédions à une reconstruction complète (avec --reconstruire). Ce
peut être utile pour accélérer les choses que vous avez certains maildirs qui ne changent jamais. Notez que vous
peut toujours rechercher ces messages, cela n'affecte que la mise à jour de la base de données.

La première série de mu indice peut prendre quelques minutes si vous avez beaucoup de courrier (des dizaines de
des milliers de messages). Heureusement, une telle analyse complète ne doit être effectuée qu'une seule fois ; après
qu'il suffit d'indexer les modifications, ce qui va beaucoup plus vite. Voir la 'Remarque sur
performances' ci-dessous pour plus d'informations.

La « deuxième phase » facultative du processus d'indexation est la suppression des messages du
base de données pour laquelle il n'y a plus de fichier correspondant dans le Maildir. Si tu ne le fais pas
voulez ça, vous pouvez utiliser -n, --pas de nettoyage.

Quand mu indice capte l'un des signaux SIGINT, VUE D'ENSEMBLE or SIGTERME (par exemple, lorsque vous appuyez sur
Ctrl-C pendant le processus d'indexation), il essaie de s'arrêter normalement ; il essaie de sauver et
valider les données et fermer la base de données, etc. Si elle reçoit un autre signal (par exemple, lorsque
en appuyant à nouveau sur Ctrl-C), mu indice prendra fin immédiatement.

OPTIONS


Notez que certaines des options générales sont décrites dans le mu(1) page de manuel et pas ici, comme
elles s'appliquent à plusieurs commandes mu.

-m, --maildir=
commence à chercher à . Par défaut, mu utilise quel que soit le MAILDIR sûr, heureux et sain
la variable est définie sur ; s'il n'est pas défini, il essaie ~/Répertoire de messagerie. Voir la note sur le mixage
sous-maildirs ci-dessous.

--mon adresse=

spécifie qu'une adresse e-mail est 'mon-adresse' (--mon adresse peut être utilisé
plusieurs fois). Ceci est utilisé par mu trouver -- toute adresse e-mail trouvée dans le
champs d'adresse d'un message qui a également dans une de ses adresses
champs est considéré comme un personnel adresse e-mail. Cela vous permet, par exemple, de
filtrer (mu trouver --personnel) adresses qui ont été simplement vues dans la liste de diffusion
des messages.

--pas de nettoyage
désactive le nettoyage de la base de données qui mu fait par défaut après l'indexation.

--reconstruire
effacer tous les messages de la base de données avant l'indexation. --reconstruire garantit que
une fois l'indexation terminée, il n'y a plus d'"anciens" messages dans la base de données
plus, ce qui n'est pas vrai avec --réindexer lors de l'indexation d'une partie seulement des messages
(À L'Aide De --maildir). Pour cette raison, il est nécessaire d'exécuter mu indice --reconstruire quand
il y a une mise à niveau dans le format de la base de données. mu indice émettra un avertissement concernant
ce.

--mise à niveau automatique
utiliser automatiquement -y, --vide quand mu remarque que la version de la base de données n'est pas à jour-
à ce jour. Cette option est à utiliser dans les scripts cron et autres, ils n'auront donc pas besoin
toute interaction avec l'utilisateur, même lorsque mu introduit une nouvelle version de la base de données.

--xbatchsize=<lot taille>
définir le nombre maximum de messages à traiter dans une seule transaction Xapian. Dans
pratique, cette option n'est utile que si vous trouvez que mu manque de mémoire
lors de l'indexation ; dans ce cas, vous pouvez définir la taille du lot sur (par exemple) 1000,
ce qui réduira la consommation de mémoire, mais aussi réduira considérablement l'indexation
la performance.

--max-taille-msg=<maximum msg taille>
définir la taille maximale (en octets) des messages. Le maximum par défaut (actuellement à
50 Mo) devrait suffire dans la plupart des cas, mais si vous rencontrez des avertissements de mu à propos
en ignorant les messages parce qu'ils sont trop gros, vous voudrez peut-être augmenter cela. Noter
que la raison d'avoir une taille maximale est que les gros messages nécessitent une grande mémoire
allocations, ce qui peut entraîner des problèmes.

NOTE: Il n'est pas recommandé de mélanger maildirs et sub-maildirs au sein de la hiérarchie
dans la même base de données ; par exemple, il vaut mieux ne pas indexer les deux avec
--maildir=~/MonrépertoireMail et --maildir=~/MonrépMail/foo, car cela peut conduire à des
résultats lors de la recherche avec le paramètre de recherche 'maildir:' (voir ci-dessous).

A noter on performant (I)
A titre de référence non scientifique, un simple test sur la machine de l'auteur (un Thinkpad X61s
ordinateur portable utilisant Linux 2.6.35 et un système de fichiers ext3) sans base de données existante, et un
maildir avec 27273 messages :

$ sudo sh -c 'sync && echo 3 > /proc/sys/vm/drop_caches'
$ heure mu index --quiet
66,65s utilisateur 6,05s système 27% cpu 4:24,20 total
(environ 103 messages par seconde)

Une deuxième exécution, qui est le cas d'utilisation le plus typique lorsqu'il existe déjà une base de données, va
Plus vite:

$ sudo sh -c 'sync && echo 3 > /proc/sys/vm/drop_caches'
$ heure mu index --quiet
0,48s utilisateur 0,76s système 10% cpu 11,796 total
(plus de 56818 messages par seconde)

Notez que chaque test vide les caches en premier ; un cas d'utilisation plus courant pourrait être d'exécuter mu
indice lorsqu'un nouveau courrier est arrivé ; le cache peut rester assez « chaud » dans ce cas :

$ heure mu index --quiet
0,33s utilisateur 0,40s système 80% cpu 0,905 total
ce qui représente plus de 30000 messages par seconde.

A noter on performant (Ii)
En juin 2012, nous avons fait le même benchmark non scientifique, cette fois avec un Intel)
CPU i5-2500 @ 3.30GHz, un système de fichiers ext4 et un maildir avec 22589 messages.

$ sudo sh -c 'sync && echo 3 > /proc/sys/vm/drop_caches'
$ heure mu index --quiet
27,79s utilisateur 2,17s système 48% cpu 1:01,47 total
(environ 813 messages par seconde)

Une deuxième exécution, qui est le cas d'utilisation le plus typique lorsqu'il existe déjà une base de données, va
Plus vite:

$ sudo sh -c 'sync && echo 3 > /proc/sys/vm/drop_caches'
$ heure mu index --quiet
0,13s utilisateur 0,30s système 19% cpu 2,162 total
(plus de 173000 messages par seconde)

En général, mu est devenu plus rapide à chaque version, même avec des
nouvelles fonctionnalités telles que la normalisation du texte (pour la correspondance insensible à la casse/insensible aux accents).
Les profils sont désormais dominés par les opérations de la base de données Xapian.

Utiliser mu-index en ligne à l'aide des services onworks.net



Derniers programmes en ligne Linux et Windows