Questo è il comando langidentp che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
langident - identifica i file di lingua in cui sono scritti
SINOSSI
langident [OPZIONI] file1 [file2 ...]
DESCRIZIONE
Identifica i file di lingua in cui sono scritti utilizzando il modulo Perl Lingua::Identify.
VERSIONI
-a
Mostra tutti i risultati (non solo la lingua più probabile).
-c
Mostra il livello di confidenza per la lingua più probabile (sarà il primo valore subito dopo
la lingua più probabile).
-d
Debug (solo sviluppo).
-E CODIFICA
Seleziona una codifica di input. Il valore predefinito è UTF-8.
# usa ISO-8859-1 (latino1)
file langident -E ISO-8859-1
-e METODI
Seleziona i metodi da utilizzare. Ci sono tre modi per farlo:
# semplicemente usando un metodo
file langident -e ngrams3
# utilizzando diversi metodi (separali con una virgola)
langident -e prefissi3, suffissi3
# utilizzare diversi metodi e assegnare pesi diversi a ciascuno di essi
langident -e smallwords=2,prefixes=1,ngrams3=1.3
Le modalità disponibili sono le seguenti: piccole parole, prefissi1, prefissi2, prefissi3,
prefissi4, suffissi1, suffissi2, suffissi3, suffissi4, ngrammi1, ngrammi2, ngrammi3 e
ngrammi4.
-h
Visualizza il messaggio di aiuto ed esci.
-l
Elenca tutte le lingue disponibili ed esci.
-m NUMERO
Imposta il numero massimo di risultati (lingue) da visualizzare (mostra le N lingue più probabili,
per ordine di probabilità decrescente).
Sostituisce l'opzione -a.
-o LE LINGUE
Funziona solo con le lingue specificate.
# identifica solo tra portoghese e inglese
langident -o pt,en *
-p
Mostra anche le percentuali.
-s TAGLIA
Dimensione massima da esaminare.
-v
Mostra la versione ed esci.
ESEMPI
Usa i metodi ngrams2 e ngrams1, assegnando il doppio di importanza a ngrams2 (-e
interruttore); l'output includerà le tre lingue più probabili (interruttore -m) con il suo
percentuali (-p switch) e anche il livello di confidenza (-c switch) del primo risultato.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 LEGGIMI
LEGGIMI:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
A DO
· Aggiungi un interruttore per ignorare i tag HTML (e forse anche altri formati)
Usa langidentp online utilizzando i servizi onworks.net