Il s'agit de la commande sim4db qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
sim4db - alignement épissé par lots de séquences d'ADNc sur un génome cible
SYNOPSIS
Une simple invocation en ligne de commande :
sim4db -génomique g.fasta -cdna c.fasta -scr script -sortie o.sim4db
où:
- 'c.fasta' et 'g.fasta' sont les fichiers de séquence d'ADNc et de génome multi-fasta
- 'script' est un fichier de script indiquant les alignements individuels à calculer
- la sortie au format sim4db sera envoyée dans le fichier 'o.sim4db' ('-' pour la sortie standard)
Une invocation plus complexe :
sim4db -genomic g.fasta -cdna c.fasta -output o.sim4db [options]
DESCRIPTION
sim4db effectue un alignement rapide par lots de grands ensembles de séquences d'ADNc (EST, ARNm) sur un ensemble de
régions génomiques eucaryotes. Il utilise les algorithmes sim4 et sim4cc pour déterminer le
alignements, mais intègre un mécanisme d'indexation et de récupération de séquence rapide, mis en œuvre
dans le paquet soeur feuille(1), pour traiter rapidement de gros volumes de séquences.
Tandis que sim4db produit des alignements de la même manière que sim4 ou sim4cc, il a des
fonctionnalités pour le rendre plus facile à utiliser avec les pipelines d'annotation du génome entier. Un scénario
peut être utilisé pour regrouper des appariements entre des ADNc et leurs régions génomiques correspondantes,
à aligner en un seul passage et en utilisant le même ensemble de paramètres. Sim4db également en option
rapporte plus d'un alignement pour le même ADNc dans une région génomique, tant qu'ils
répondre à des critères définis par l'utilisateur tels que la longueur minimale, le pourcentage d'identité de séquence ou
couverture. Cette caractéristique est essentielle pour trouver tous les alignements d'une famille de gènes à un
lieu. Enfin, la sortie est présentée soit sous forme d'alignements sim4db personnalisés, soit sous forme de gène GFF3
caractéristiques.
OPTIONS
Options saillantes :
-cdna utilise ces séquences d'ADNc (fichier multi-fasta)
-génomique utiliser ces séquences génomiques (fichier multi-fasta)
-script utilise ce fichier de script
-aligner séquentiellement des paires de séquences par paires
Si aucune des options '-script' et '-pairwise'
est spécifié, sim4db effectue tout contre tout
des alignements entre des paires d'ADNc et des séquences génomiques.
-output écrire la sortie dans ce fichier
-Gff3 sortie du rapport au format GFF3
-interspecies utilise sim4cc pour les alignements inter-espèces (par défaut sim4)
Options de filtre:
-mincoverage recherche itérativement tous les modèles d'exon avec le
POURCENTAGE DE COUVERTURE minimum
-minidentity recherche itérativement tous les modèles d'exon avec le
POURCENTAGE D'IDENTITÉ D'EXON minimum
-minlength recherche itérativement tous les modèles d'exon avec le
COUVERTURE ABSOLUE minimale (nombre de pb appariés)
(0 par défaut)
-toujours rapport toujours rapport modèles d'exons, même s'ils
sont en dessous des seuils de qualité
Si aucun mincoverage, minidentity ou minlength n'est indiqué, seulement
le meilleur modèle d'exon est renvoyé. Il s'agit de l'opération PAR DÉFAUT.
Vous voudrez probablement spécifier TOUS LES TROIS de couverture minimale,
minidentity et minlength! Ne supposez pas les valeurs par défaut
êtes ce que vous voulez !
Vous voudrez DÉFINITIVEMENT spécifier au moins un de mincoverage,
minidentity et minlength avec alwaysreport ! Si vous ne le faites pas,
mincoverage sera défini sur 90 et minidentity sur 95 -- pour réduire
le nombre de fausses correspondances lorsqu'une bonne correspondance est trouvée.
Options auxiliaires :
-nodeflines n'inclut pas le defline dans la sortie sim4db
-alignements imprimer les alignements
-les queues poly ne masquent pas les queues poly-A et poly-T
-couper les exons marginaux si A/T % > x (queues poly-AT)
-non canonique ne force pas les sites d'épissage canoniques
-splicemodel utilise le modèle d'épissure suivant : 0 - original sim4 ;
1 - GeneSplicer ; 2 - Lueur ; les options 1 et 2 sont
uniquement disponible avec '-interspecies'.
La valeur par défaut pour sim4 est 0 et pour sim4cc est 1.
-forcestrand Forcer la prédiction de brin à toujours être
l'un de 'en avant' ou 'en arrière'
Options d'exécution :
-threads Utilise n threads.
-touch crée ce fichier lorsque le programme termine l'exécution
Options de débogage :
-v affiche l'état sur stderr pendant l'exécution
-V imprime les lignes de script (stderr) au fur et à mesure de leur traitement
Options de développeur:
-Z définit le motif de graines espacées
-H définit le facteur de poids de relink (H=1000 recommandé pour les ARNm)
-K définit le premier seuil MSP
-C définir le deuxième seuil MSP
-Ma fixer la limite du nombre de MSP autorisés
-Mp même, en pourcentage de bases dans l'ADNc
REMARQUE : si utilisé, -Ma et -Mp doivent être spécifiés !
Utilisez sim4db en ligne en utilisant les services onworks.net