Jest to polecenie bp_load_gffp, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
bp_load_gff.pl - Załaduj bazę danych Bio::DB::GFF z plików GFF.
STRESZCZENIE
% bp_load_gff.pl -d testdb -u użytkownik -p pw
--dsn 'dbi:mysql:database=dmel_r5_1;host=mójhost;port=mójport'
dna1.fa cechy dna2.fa1.gff cechy2.gff ...
OPIS
Ten skrypt ładuje bazę danych Bio::DB::GFF z funkcjami zawartymi na liście GFF
pliki i/lub pliki sekwencji FASTA. Musisz użyć dokładnego wariantu GFF opisanego w
Biografia::DB::GFF. Różne opcje wiersza poleceń pozwalają kontrolować, która baza danych ma zostać załadowana
i czy zezwolić na nadpisanie istniejącej bazy danych.
Skrypt ten wykorzystuje interfejs Bio::DB::GFF i dlatego działa ze wszystkimi adapterami baz danych
obecnie obsługiwany przez ten moduł (wkrótce MySQL, Oracle, PostgreSQL). Jednak jest powolny.
Aby przyspieszyć ładowanie, zobacz specyficzne dla MySQL bp_bulk_load_gff.pl i bp_fast_load_gff.pl
skrypty.
UWAGI
Jeśli nazwa pliku zostanie podana jako „-”, wówczas dane wejściowe zostaną pobrane ze standardowego wejścia. Sprężony
pliki (.gz, .Z, .bz2) są automatycznie dekompresowane.
Pliki w formacie FASTA różnią się od plików GFF rozszerzeniami nazw plików. Akta
kończące się na .fa, .fasta, .fast, .seq, .dna i ich wielkie warianty są traktowane jako FASTA
akta. Cała reszta jest traktowana jako plik GFF. Jeśli chcesz załadować pliki -fasta z
STDIN, następnie użyj przełącznika wiersza poleceń -f z argumentem „-”, jak w
gunzip moje_dane.fa.gz | bp_fast_load_gff.pl -d test -f -
Przy pierwszym ładowaniu bazy danych zobaczysz szereg błędów „nieznanej tabeli”. To jest
Normal.
Informacje o maksymalnej funkcji: wartość domyślna to 100,000,000 XNUMX XNUMX zasad. Jeśli masz takie funkcje
o długości bliskiej lub większej niż 100 Mb, wówczas należy zwiększyć wartość maxfeature
do 1,000,000,000 10 XNUMX XNUMX lub innej potęgi liczby XNUMX.
WIERSZ POLECEŃ OPCJE
Opcje wiersza polecenia mogą być skrócone do opcji jednoliterowych. np. -d zamiast
--Baza danych.
--dsn Źródło danych (domyślnie dbi:mysql:test)
--adapter Adapter schematu (domyślny dbi::mysqlopt)
--użytkownik Nazwa użytkownika do uwierzytelniania mysql
--przechodzić Hasło do uwierzytelniania mysql
--szybko Plik Fasta lub katalog zawierający pliki Fasta dla DNA
--create Wymuś tworzenie i inicjalizację bazy danych
--maxfeature Ustawia wartość maksymalnego rozmiaru funkcji (domyślnie 100 Mb; musi być potęgą liczby 10)
--group Lista jednej lub więcej nazw znaczników (oddzielonych przecinkami lub spacjami)
do wykorzystania przy grupowaniu w 9. kolumnie.
--upgrade Aktualizuje istniejącą bazę danych do bieżącego schematu
--gff3_munge Aktywuj zmianę nazwy GFF3 (zobacz Bio::DB::GFF)
--quiet Brak raportów o postępie
--summary Generuje statystyki podsumowujące do rysowania histogramów pokrycia.
Można to uruchomić na wcześniej załadowanej bazie danych lub w trakcie
ładunek.
Użyj bp_load_gffp online, korzystając z usług onworks.net