Це команда gmt-music-clinical-correlationp, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
gmt music клінічна кореляція - співвіднести фенотипові ознаки з мутованими генами, або
проти окремих варіантів
Версія
Цей документ описує клініко-кореляційну версію gmt Music 0.04 (2016-01-01 на
23:10:19)
СИНТАКСИС
gmt музика клінічна кореляція --bam-list=? --output-file=? [--maf-file=?]
[--glm-clinical-data-file=?] [--use-maf-in-glm] [--skip-non-coding] [--skip-silent]
[--clinical-correlation-matrix-file=?] [--input-clinical-correlation-matrix-file=?]
[--genetic-data-type=?] [--numeric-clinical-data-file=?] [--numerical-data-test-method=?]
[--categorical-clinical-data-file=?] [--glm-model-file=?]
... музика клініко-кореляційна
--bam-list /path/myBamList.tsv
--maf-файл /path/myMAF.tsv
--numeric-clinical-data-file /path/myNumericData.tsv
--genetic-data-type 'ген'
--файл-виведення /шлях/файл_виведення
... музика клініко-кореляційна
--maf-файл /path/myMAF.tsv
--bam-list /path/myBamList.tsv
--numeric-clinical-data-file /path/myNumericData.tsv
--categorical-clinical-data-file /path/myClassData.tsv
--genetic-data-type 'ген'
--файл-виведення /шлях/файл_виведення
... музика клініко-кореляційна
--maf-файл /path/myMAF.tsv
--bam-list /path/myBamList.tsv
--файл-виведення /шлях/файл_виведення
--glm-model-file /шлях/model.tsv
--glm-clinical-data-file /path/glm_clinical_data.tsv
--use-maf-in-glm
ВИМАГАЄТЬСЯ АРГУМЕНТИ
бац-список текст
Список файлів BAM з роздільниками табуляторами [назва зразка, normal_bam, tumor_bam] (див. опис)
вихідний файл текст
Результати клініко-кореляційного інструменту. Буде додано суфікс для типу даних
ДОДАТКОВО АРГУМЕНТИ
maf-файл текст
Список мутацій з використанням специфікації TCGA MAF v2.3
glm-clinical-data-file текст
Клінічні ознаки, мутаційні профілі, інші змішані клінічні дані (Див. ОПИС)
use-maf-in-glm Boolean
Створіть матрицю варіантів із файлу MAF як варіант вхідних даних для аналізу GLM.
Значення за замовчуванням 'false' (--nouse-maf-in-glm), якщо не вказано
nouse-maf-in-glm Boolean
Зробити use-maf-in-glm 'false'
пропускати без кодування Boolean
Пропустити некодуючі мутації з наданого файлу MAF
Значення за замовчуванням "true", якщо не вказано
noskip-без кодування Boolean
Зробити skip-non-coding "false"
пропускати-беззвучно Boolean
Пропустити тихі мутації з наданого файлу MAF
Значення за замовчуванням "true", якщо не вказано
noskip-мовчазний Boolean
Зробити skip-silent 'false'
клінічний-кореляційний-матричний файл текст
Вкажіть файл для зберігання матриці зразка проти гена, створеної під час обчислень
вхідний-клінічний-кореляційний-матричний файл текст
Замість того, щоб створювати це з MAF, введіть матрицю зразка проти гена для
розрахунки
генетичний тип даних текст
Співвіднести клінічні дані з даними рівня «ген» або «варіант».
Значення за замовчуванням «ген», якщо не вказано
числовий-клінічний-файл-даних текст
Таблиця зразків (y) проти числової категорії клінічних даних (x)
метод чисельного тесту даних текст
Або "cor" для кореляції Пірсона, або "wilcox" для тесту суми рангу Вілкоксона для
чисельні клінічні дані
Значення за замовчуванням 'cor', якщо не вказано
категорійний-клінічний-файл-даних текст
Таблиця зразків (y) проти категорійних клінічних даних категорії (x)
glm-модель-файл текст
Файл із зазначенням типу моделі, змінної відповіді, коваріантів тощо для GLM
аналіз. (Див. ОПИС)
ОПИС
Ця команда пов’язує клінічні ознаки та мутаційні дані. Виконати може будь-який
кореляційний аналіз між мутаціями, зареєстрованими в MAF, і певним фенотипом
ознак, записаних у файлах клінічних даних для тих самих зразків, або можна запустити узагальнену
аналіз лінійної моделі (GLM) на тих же типах даних.
Файли клінічних даних для кореляції повинні бути розділені між числовими та категоріальними
дані та повинні дотримуватися таких умов:
· Заголовки обов'язкові
· Кожен файл повинен містити принаймні 1 стовпець sample_id і 1 стовпець атрибута з
формат: [ідентифікатор зразка клінічних_даних_атрибутів_1 клінічних_даних_атрибутів_2 ...]
· Ідентифікатор зразка повинен відповідати ідентифікатору зразка, зазначеному в MAF у розділі "Tumor_Sample_Barcode"
для зв’язку мутацій цього зразка.
Зверніть увагу на важливість заголовків: заголовок для кожного клінічного_даного_атрибуту буде
відображаються у вихідному файлі для позначення зв’язків із даними мутації з MAF.
Внутрішньо вхідні дані подаються в сценарій R, який обчислює значення P
ймовірність того, що кореляція спостерігається між мутаціями в кожному гені (або варіанті)
і кожна ознака фенотипу є випадковою. Нижчі P-значення вказують на меншу випадковість або ймовірність
справжні кореляції.
Результати зберігаються в назві вихідного файлу з додаванням суфікса; ".numeric.csv"
буде додано для результатів, отриманих на основі числових клінічних даних, і ".categorical.csv"
буде додано для результатів, отриманих на основі категоричних клінічних даних. Також ".glm.csv" буде
бути доданий до назви вихідного файлу для результатів GLM.
Аналіз GLM приймає змішані числові та категорійні файли клінічних даних, які вводяться за допомогою
параметр --glm-clinical-data-file. Клінічні дані GLM повинні відповідати описаним форматам
вище для файлів клінічних даних кореляції. GLM також вимагає від користувача введення a
--glm-модель-файл. Цей файл вимагає певних заголовків і визначає аналіз
виконано досить точно. Ось угоди, необхідні для цього файлу:
· Стовпчики повинні бути впорядковані таким чином:
· [пам’ятка про варіації назви_гена, тип клінічних_даних_назви_назви]
· Стовпець 'analysis_type' повинен містити або "Q", що вказує на кількісний показник, або
"B", що вказує на бінарну ознаку, буде досліджено.
· «clinical_data_trait_name» — це назва ознаки клінічних даних, яка визначається як
заголовок у файлі --glm-clinical-data.
· 'variant/gene_name' може бути ім'ям одного або кількох стовпців із
--glm-clinical-data-file, або назва одного чи кількох мутованих назв генів із MAF,
розділені символом «|». Якщо цей стовпець залишено порожнім або замість нього містить "NA", то кожен
стовпець із матриці варіантів мутації (--use-maf-in-glm) або з
--glm-clinical-data-file використовується послідовно як варіант стовпця в незалежному
аналізів.
· "коваріати" - це назви одного або кількох стовпців із файлу --glm-clinical-data,
розділені знаком «+».
· «нагадування» — це будь-яка нотатка, яка вважається корисною для користувача. Він буде надрукований у вихідних даних
файл для довідки.
Аналіз GLM можна виконувати, використовуючи виключно дані, введені в --glm-clinical-data-file,
як описано вище, або альтернативно, мутаційні дані з MAF можуть бути включені як
варіанти в аналізі GLM, як також описано вище. Використовуйте прапор --use-maf-in-glm для
включають матрицю мутацій, отриману з maf, як варіантні дані.
Зауважте, що всі вхідні файли як для кореляції, так і для аналізу GLM мають бути розділені табуляторами.
АРГУМЕНТИ
--бам-список
Надайте файл, що містить назви зразків та розташування нормальних/пухлинних BAM для кожного. Використовуйте
формат із роздільниками табуляції [назва_зразка normal_bam tumor_bam] на рядок. Тільки цей інструмент
потребує імені_зразка, тому всі інші стовпці можна пропустити. Ім'я зразка має бути
такі ж, як імена зразків пухлин, які використовуються у файлі MAF (16-й стовпець із заголовком
Пухлина_зразок_штрих-код).
Використовуйте gmt-music-clinical-correlationp онлайн за допомогою служб onworks.net