Це команда, яку можна запустити в постачальнику безкоштовного хостингу OnWorks, використовуючи одну з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
SoX - Sound eXchange, швейцарський армійський ніж аудіоманіпуляції
СИНТАКСИС
соску [глобальні варіанти] [параметри формату] infile1
[[параметри формату] infile2] ... [параметри формату] вихідний файл
[ефект [ефект-варіанти]] ...
грати [глобальні варіанти] [параметри формату] infile1
[[параметри формату] infile2] ... [параметри формату]
[ефект [ефект-варіанти]] ...
запис [глобальні варіанти] [параметри формату] вихідний файл
[ефект [ефект-варіанти]] ...
ОПИС
Вступ
SoX читає та записує аудіофайли в найбільш популярних форматах і може за бажанням застосовувати ефекти
їм. Він може поєднувати декілька джерел вхідного сигналу, синтезувати аудіо та, на багатьох системах,
діяти як аудіоплеєр загального призначення або багатодорожековий аудіо рекордер. Він також обмежений
можливість розділити вхідні дані на кілька вихідних файлів.
Уся функціональність SoX доступна лише за допомогою соску команда. Щоб спростити гру і
запис аудіо, якщо SoX викликається як грати, вихідний файл автоматично встановлюється як
звуковий пристрій за замовчуванням, а якщо він викликається як запис, як вхід використовується звуковий пристрій за замовчуванням
джерело. Крім того, soxiКоманда (1) забезпечує зручний спосіб просто запитувати аудіо
інформація заголовка файлу.
Серцем SoX є бібліотека під назвою libSoX. Ті, хто зацікавлений у розширенні або використанні SoX
в інших програмах слід звертатися до сторінки посібника libSoX: libsox(3).
SoX — це інструмент для обробки звуку командного рядка, який особливо підходить для швидкого та простого створення
редагування та пакетної обробки. Якщо вам потрібен інтерактивний графічний аудіоредактор, скористайтеся
зухвалість(1).
* * *
Загальний ланцюжок обробки SoX можна підсумувати таким чином:
Вхід(и) → Комбінатор → Ефекти → Вихід(и)
Зауважте, однак, що в командному рядку SoX позиції виходу(ів) та ефектів
міняються місцями на щойно показаний логічний потік. Зауважте також, що в той час як варіанти, що належать
до файлів розміщуються перед відповідними іменами файлів, для ефектів все навпаки.
Щоб показати, як це працює на практиці, ось добірка прикладів того, яким може бути SoX
використаний. Найпростіший
sox recital.au recital.wav
переводить аудіофайл у форматі Sun AU у файл Microsoft WAV, при цьому
sox recital.au -b 16 recital.wav каналів 1 швидкість 16k fade 3 норма
виконує переклад такого ж формату, але також застосовує чотири ефекти (змішування до одного
канал, зміна частоти дискретизації, згасання, номалізація) і зберігає результат на бітовій глибині
16.
sox -r 16k -e з підписом -b 8 -c 1 voice-memo.raw voice-memo.wav
перетворює "сирий" (він же "беззаголовок") аудіо у формат файлу, що самоописує,
sox slow.aiff fixed.aiff швидкість 1.027
регулює швидкість звуку,
sox short.wav long.wav long.wav
об’єднує два аудіофайли, і
sox -m music.mp3 voice.wav mixed.flac
змішує два аудіофайли.
грати "The Moonbeams/Greatest/*.ogg" бас +3
відтворює колекцію аудіофайлів із застосуванням ефекту посилення басів,
play -n -c1 synth sin %-12 sin %-9 sin %-5 sin %-2 fade h 0.1 1 0.1
грає синтезований «мінорний септакорд» зі звуком органу,
rec -c 2 radio.aiff trim 0 30:00
записує півгодини стереоаудіо, і
play -q take1.aiff & rec -M take1.aiff take1-dub.aiff
(з оболонкою POSIX і де підтримується апаратним забезпеченням) записує нову доріжку в багатодоріжку
запис. нарешті,
rec -r 44100 -b 16 -s -p тиша 1 0.50 0.1% 1 10:00 0.1% | \
sox -p song.ogg тиша 1 0.50 0.1% 1 2.0 0.1% : \
newfile : перезавантажити
записує потік аудіо, наприклад LP/касету, і розбиває на кілька аудіофайлів на
точки з 2 секундами тиші. Крім того, він не починає запис, поки не виявить
аудіо відтворюється та зупиняється після 10 хвилин тиші.
NB Вище наведене лише огляд можливостей SoX; докладні пояснення, як
використання всі Параметри SoX, формати файлів та ефекти можна знайти нижче в цьому посібнику, в
soxformat(7) і в soxi(1).
Файл сформований типи
SoX може працювати з "самоописними" і "необробленими" аудіофайлами. "самоописувані" формати
(наприклад, WAV, FLAC, MP3) мають заголовок, який повністю описує сигнал і кодування
атрибути аудіоданих, наведених нижче. Формати `raw' або `headerless' не містять
цю інформацію, тому їх аудіохарактеристики повинні бути описані на SoX
командного рядка або на основі даних у вхідному файлі.
Наступні чотири характеристики використовуються для опису такого формату аудіоданих, що
його можна обробити за допомогою SoX:
частота вибірки
Частота дискретизації в вибірках за секунду ("герц" або "Гц"). Цифрова телефонія
традиційно використовує частоту дискретизації 8000 Гц (8 кГц), хоча в наші дні 16 і навіть
32 кГц стають все більш поширеними. Аудіо компакт-диски використовують 44100 Гц (44.1 кГц).
Цифровий аудіокасет і багато комп’ютерних систем використовують частоту 48 кГц. Професійні аудіосистеми
часто використовують 96 кГц.
обсяг вибірки
Кількість бітів, що використовуються для зберігання кожного зразка. Сьогодні зазвичай використовується 16-розрядний.
8-розрядний був популярний у перші дні комп’ютерного аудіо. 24-розрядний використовується в
професійна аудіо арена. Використовуються також інші розміри.
кодування даних
Спосіб представлення (або «кодування») кожного звукового зразка. Деякі кодування
мають варіанти з різним упорядкуванням байтів або бітів. Деякі стискають
аудіоданих, щоб збережені аудіодані займали менше місця (тобто місця на диску або
пропускна здатність передачі), ніж інші параметри формату та кількість вибірок
означало б. Зазвичай використовувані типи кодування включають з плаваючою комою, μ-закон, ADPCM,
ціле число зі знаком PCM, MP3 і FLAC.
канали
Кількість аудіоканалів, що містяться у файлі. Один ("моно") і два
(`стерео') широко використовуються. Звук «Об’ємний звук» зазвичай містить шість або більше
Канали
Термін "швидкість передачі даних" - це міра обсягу пам'яті, зайнятого закодованим аудіо
сигнал за одиницю часу. Він може залежати від усього перерахованого вище і зазвичай позначається як
кількість кілобіт в секунду (кбіт/с). Сигнал телефонії A-law має бітрейт 64
кбіт/с. Стерео-музика, закодована у форматі MP3, зазвичай має бітрейт 128-196 кбіт/с. FLAC-кодування
стерео музика зазвичай має бітрейт 550-760 кбіт/с.
Більшість самоописуваних форматів також дозволяють вбудовувати текстові "коментарі" у файл, який
може використовуватися для опису аудіо певним чином, наприклад для музики, назви, автора тощо.
Одним з важливих варіантів використання коментарів до аудіофайлів є передача інформації про «Посилення відтворення». SoX
підтримує застосування інформації Replay Gain, але не генерує її. Зауважте, що за замовчуванням,
SoX копіює коментарі вхідного файлу у вихідні файли, які підтримують коментарі, тому вихідні файли можуть
містити інформацію про отримання повторного відтворення, якщо якась була присутня у вхідному файлі. У цьому випадку, якщо
було виконано будь-що інше, крім простого перетворення формату, після чого вихідний файл Replay
Імовірно, що отримана інформація буде неправильною, тому її слід перерахувати за допомогою інструменту, який
підтримує це (не SoX).
Команда soxi(1) команду можна використовувати для відображення інформації із заголовків аудіофайлів.
визначення & Установка Команда Файл сформований
Існує кілька механізмів, доступних для SoX для визначення або встановлення формату
характеристики аудіофайлу. Залежно від обставин, індивідуальний
характеристики можуть бути визначені або встановлені за допомогою різних механізмів.
Щоб визначити формат вхідного файлу, SoX буде використовувати в порядку пріоритету та як
надано або доступне:
1. Параметри формату командного рядка.
2. Вміст заголовка файлу.
3. Розширення імені файлу.
Щоб встановити формат вихідного файлу, SoX використовуватиме, у порядку пріоритету та відповідно до або
доступно:
1. Параметри формату командного рядка.
2. Розширення імені файлу.
3. Характеристики формату вхідного файлу, або найближчий, який підтримується вихідним
тип файлу.
Для всіх файлів SoX завершить роботу з помилкою, якщо не вдається визначити тип файлу. Команда-
Щоб вирішити проблему, можливо, потрібно буде додати або змінити параметри формату рядка.
Гра & запис аудіо
Команда грати та запис команди надаються так, щоб основні відтворення та запис були такими ж простими, як
відтворити існуючий файл.wav
та
rec новий файл.wav
Ці дві команди функціонально еквівалентні
sox існуючий-файл.wav -d
та
sox -d новий файл.wav
Звичайно, до команд можна додати додаткові параметри та ефекти (як описано нижче).
в будь-якій формі.
* * *
Деякі системи забезпечують більше ніж один тип (сумісного з SoX) аудіодрайвера, наприклад ALSA і OSS,
або SUNAU & AO. Системи також можуть мати більше одного аудіопристрою (він же «звукова карта»).
Якщо в SoX вбудовано більше одного аудіодрайвера, а SoX вибрано за замовчуванням
при записі або відтворенні не той, що хотілося, то той АУДИОДІВЕР навколишнє середовище
змінну можна використовувати для заміни значення за замовчуванням. Наприклад (у багатьох системах):
встановити AUDIODRIVER=oss
грати ...
Команда АУДІОДЄВ Змінна середовища може використовуватися для заміни аудіопристрою за замовчуванням, напр
встановити AUDIODEV=/dev/dsp2
грати ...
сокс ... -т осс
or
встановити AUDIODEV=hw:soundwave,1,2
грати ...
сокс ... -т альса
Зауважте, що спосіб встановлення змінних середовища різниться від системи до системи - для деяких
конкретні приклади, див. `SOX_OPTS' нижче.
Під час відтворення файлу з частотою дискретизації, яка не підтримується пристроєм виведення звуку,
SoX автоматично викличе файл швидкість ефект для виконання необхідної частоти дискретизації
перетворення. За замовчуванням для сумісності зі старим обладнанням швидкість встановлено рівень якості
`низький'. Це можна змінити, вказавши явно швидкість ефект з різним
рівень якості, напр
грати ... ставка -м
або за допомогою --play-rate-arg варіант (див. нижче).
* * *
На деяких системах SoX дозволяє регулювати гучність відтворення аудіо під час використання грати. Де
підтримується, це досягається натисканням клавіш `v' і `V' під час відтворення.
Щоб допомогти встановити відповідний рівень запису, SoX включає в себе вимірювач пікового рівня, який може
викликати (перед фактичним записом) наступним чином:
рек -н
Рівень запису слід відрегулювати (використовуючи програму мікшування, надану системою, а не SoX)
так що лічильник є at найбільш іноді повний масштаб, і ніколи не «в мінусі» (ан
відображається знак оклику). Дивись також -S нижче.
Точність
Багато форматів файлів, які стискають аудіо, відкидають деяку інформацію про звуковий сигнал
роблячи це. Перетворення в такий формат, а потім повторне перетворення не призведе до створення
точна копія оригінального аудіо. Це стосується багатьох форматів, що використовуються в телефонії
(наприклад, A-law, GSM), де низька пропускна здатність сигналу важливіша, ніж висока точність звуку,
і для багатьох форматів, що використовуються в портативних музичних програвачах (наприклад, MP3, Vorbis), якщо це достатньо
точність може бути збережена навіть з великими ступенями стиснення, які необхідні для створення
портативні плеєри практичні.
Формати, які відкидають інформацію про звуковий сигнал, називаються «з втратами». Формати, яких немає
називається "без втрат". Термін "якість" використовується як міра того, наскільки близький оригінал
аудіосигнал може бути відтворений при використанні формату з втратами.
Перетворення аудіофайлів за допомогою SoX відбувається без втрат, коли це можливо, тобто коли не використовується з втратами
стиснення, коли не зменшується частота дискретизації або кількість каналів, і коли
кількість бітів, використаних у форматі призначення, не менше, ніж у вихідному форматі. напр
перетворення з 8-розрядного формату PCM у 16-розрядний формат PCM відбувається без втрат, але перетворення з
8-розрядний формат PCM до (8-розрядного) A-закону не є.
NB SoX перетворює всі аудіофайли у внутрішній нестиснутий формат перед виконанням
будь-яка обробка звуку. Це означає, що маніпулювання файлом, який зберігається у форматі з втратами
може призвести до подальших втрат у точності звуку. Наприклад, з
sox long.mp3 short.mp3 обрізка 10
SoX спочатку розпаковує вхідний файл MP3, а потім застосовує файл оздоблення ефект, і нарешті
створює вихідний файл MP3 шляхом повторного стиснення аудіо - з можливим скороченням в
вірність вище тієї, яка мала місце під час створення вхідного файлу. Отже, якщо що є
в кінцевому рахунку бажаним є стиснутий з втратами звук, настійно рекомендується виконувати все
обробка аудіо з використанням форматів файлів без втрат, а потім перетворення у формат із втратами лише на
заключний етап.
NB Застосування кількох ефектів за допомогою одного виклику SoX, загалом, призведе
більш точні результати, ніж результати, отримані за допомогою кількох викликів SoX.
Дирінг
Звуження – це техніка, яка використовується для максимізації динамічного діапазону аудіо, що зберігається в a
конкретна бітова глибина. Будь-які спотворення, внесені квантуванням, декорелюються додаванням
невелика кількість білого шуму для сигналу. У більшості випадків SoX може визначити, чи є
вибрана обробка вимагає змішування та додасть його під час форматування виводу if
необхідності.
Зокрема, за замовчуванням SoX автоматично додає TPDF dither, коли вихідна бітова глибина дорівнює
менше 24 і будь-яке з наведеного нижче вірно:
· Скорочення бітової глибини вказано явно за допомогою параметра командного рядка
· формат вихідного файлу підтримує лише бітову глибину, меншу, ніж у вхідного файлу
формат
· ефект збільшив ефективну бітову глибину всередині внутрішнього ланцюга обробки
Наприклад, регулювання гучності за допомогою про 0.25 вимагає двох додаткових бітів
зберігати результати без втрат (оскільки 0.25 десяткового дорівнює 0.01 двійкового). Отже, якщо вхід
бітова глибина файлу дорівнює 16, тоді внутрішнє представлення SoX буде використовувати 18 біт після
обробка цієї зміни обсягу. Щоб зберегти вихід на тій самій глибині, що й
введення, дизерінг використовується для видалення додаткових бітів.
Використовувати -V можливість побачити, яку обробку SoX додав автоматично. The -D варіант може бути
надано для скасування автоматичного дизерінгу. Щоб викликати дизерінг вручну (наприклад, вибрати a
крива формування шуму), див трястися ефект
Відсікання
Відрізання – це спотворення, яке виникає, коли рівень аудіосигналу (або "гучність") перевищує значення
діапазон обраного представлення. У більшості випадків обрізання небажано, і це повинно бути
виправити шляхом регулювання рівня перед точкою (в ланцюжку обробки), на якій
це відбувається.
У SoX відсічення може відбуватися, як ви могли очікувати, під час використання про or коефіцієнт посилення ефекти до
збільшити гучність звуку. Відрізання також може відбуватися з багатьма іншими ефектами, коли
перетворення одного формату в інший, і навіть при простому відтворенні аудіо.
Відтворення аудіофайлу часто передбачає передсемплінг, а також обробку аналоговими компонентами
ввести невелике зміщення постійного струму та/або посилення, які можуть викликати спотворення
рівень звукового сигналу спочатку був занадто близьким до точки відсікання.
З цих причин зазвичай потрібно переконатися, що рівень сигналу аудіофайлу має певний рівень
`Headroom', тобто він не перевищує певний рівень нижче максимально можливого рівня
для даного представлення. Деякі стандарти рекомендують до 9 дБ запасу,
але в більшості випадків достатньо 3 дБ (≈ 70% лінійних). Зауважте, що ця мудрість, здається, була
втрачені в сучасному музичному виробництві; насправді багато компакт-дисків, MP3 тощо зараз освоюються на рівні
вище 0dBFS, тобто аудіо обрізається, як доставлено.
SoX stat та статистика ефекти можуть допомогти у визначенні рівня сигналу в аудіофайлі.
Команда коефіцієнт посилення or про ефект можна використовувати для запобігання відсіканню, напр
sox dull.wav bright.wav посилення -6 високих +6
гарантує, що підвищення високих частот не буде зрізано.
Якщо в будь-який момент обробки відбувається відсічення, SoX відобразить попереджувальне повідомлення
той ефект.
Дивіться також -G і коефіцієнт посилення та норма ефектів.
вхід Файл Об'єднання
Комбінатор вхідних даних SoX можна налаштувати (див. ПАРАЦІЇ нижче), щоб об’єднати декілька файлів за допомогою
будь-який з наступних методів: "конкатенація", "послідовність", "змішування", "мікс-потужність", "злиття" або
`множити'. Методом за замовчуванням є `sequence' для грати, і `об'єднати' для запис та соску.
Для всіх методів, крім "послідовності", декілька вхідних файлів повинні мати однакову вибірку
ставка. При необхідності можна використовувати окремі виклики SoX для коригування частоти дискретизації
перед поєднанням.
Якщо вибрано метод об’єднання "конкатенація" (зазвичай це буде за замовчуванням), тоді
вхідні файли також повинні мати однакову кількість каналів. Аудіо з кожного входу
будуть об’єднані в порядку, наведеному для формування вихідного файлу.
Метод об'єднання "послідовність" вибирається автоматично грати. Це схоже на
`конкатенація' в тому, що аудіо з кожного вхідного файлу послідовно надсилається у вихідний файл.
Однак тут вихідний файл може бути закритий і знову відкритий при відповідному переході
між вхідними файлами. Це може бути саме те, що потрібно під час надсилання різних типів аудіо
на пристрій виводу, але, як правило, не є корисним, якщо вихідним є звичайний файл.
Якщо вибрано метод комбінування `mix' або `mix-power', тоді два або більше вхідних даних
файли повинні бути надані, і вони будуть змішані разом, щоб утворити вихідний файл. Кількість
канали в кожному вхідному файлі не повинні бути однаковими, але SoX видасть попередження, якщо вони так
ні, і деякі канали у вихідному файлі не будуть містити аудіо з кожного вхідного файлу. А
змішаний аудіофайл не можна розмікшувати без посилання на вихідні вхідні файли.
Якщо вибрано метод об'єднання "злиття", то потрібно вказати два або більше вхідних файлів і
будуть об’єднані, щоб утворити вихідний файл. Кількість каналів на кожному вході
файл не повинен бути однаковим. Об’єднаний аудіофайл містить усі канали з усіх
вхідні файли. Роз'єднання можливе за допомогою кількох викликів SoX з ремікс
ефект. Наприклад, два монофайли можна об’єднати в один стереофайл. Перший
а другі монофайли стануть лівим і правим каналами стереофайлу.
Метод комбінування "множення" множить вибіркові значення відповідних каналів
(обробляються як числа в інтервалі від -1 до +1). Якщо кількість каналів на вході
файли не однакові, відсутні канали вважаються такими, що містять усі нулі.
При об’єднанні вхідних файлів SoX застосовує будь-які вказані ефекти (включаючи, наприклад,
про ефект регулювання гучності) після об’єднання звуку. Однак це часто буває
корисно, щоб мати можливість встановити гучність (тобто "баланс") вхідних даних окремо, раніше
відбувається комбінування.
Для всіх методів об’єднання можна налаштувати гучність вхідного файлу вручну за допомогою -v
параметр (нижче), який можна надати для одного або кількох вхідних файлів. Якщо це дається лише для
деякі вхідні файли, а інші не регулюють гучність. В деяких
обставини можуть застосовуватися автоматичне регулювання гучності (див. нижче).
Команда -V параметр (нижче) можна використовувати, щоб показати налаштування гучності вхідного файлу, які були
вибрано (вручну або автоматично).
Під час змішування вхідних файлів необхідно враховувати деякі особливі міркування:
На відміну від інших методів, комбінування "мікс" може викликати відсікання
суматор, якщо балансування не виконується. У цьому випадку, якщо ручного регулювання гучності немає
враховуючи, SoX намагатиметься гарантувати, що відсічення не відбувається, автоматично коригуючи
гучність (амплітуда) кожного вхідного сигналу з коефіцієнтом ¹/n, де n - кількість вхідних сигналів
файли. Якщо це призводить до надто тихого або незбалансованого звуку, тоді вхід
обсяги файлів можна налаштувати вручну, як описано вище. Використання норма вплив на суміш є
інша альтернатива.
Якщо змішане аудіо здається достатньо гучним в деяких моментах, але занадто тихим в інших, тоді динамічний діапазон
Щоб виправити це, слід застосувати стиснення - див компан ефект
При комбінованому методі «змішування-потужність» змішаний об’єм приблизно дорівнює об’єму
один із вхідних сигналів. Це досягається шляхом балансування з використанням коефіцієнта ¹/√n замість
№/п. Зауважте, що цей коефіцієнт балансу не гарантує, що відсічення не відбудеться, але
кількість кліпів, як правило, невелика, а результуюче спотворення, як правило, є
непомітний.
Вихід Файли
Поведінка SoX за замовчуванням полягає в тому, щоб брати один або кілька вхідних файлів і записувати їх в один
вихідний файл.
Цю поведінку можна змінити, вказавши псевдоефект `newfile' в ефектах
список. Потім SoX перейде в режим кількох виводів.
У режимі кількох виводів новий файл створюється, коли ефекти перед `новим файлом'
вказують, що вони виконані. Потім запускається ланцюжок ефектів, зазначений після `newfile' і
його вихідні дані зберігаються в новому файлі.
У режимі кількох виводів унікальний номер буде автоматично додано до кінця всіх
імена файлів. Якщо ім’я файлу має розширення, то число вставляється перед
розширення. Цю поведінку можна налаштувати, розмістивши %n будь-де в назві файлу
куди потрібно підставити число. Додаткове число можна розмістити після % до
вкажіть мінімальну фіксовану ширину для номера.
Режим кількох виводів не дуже корисний, якщо не буде ефект, який зупинить ланцюжок ефектів
рано вказується перед `новим файлом'. Якщо кінець файлу досягнуто до ефектів
ланцюг зупиняється, тоді новий файл не буде створено, оскільки він був би порожнім.
Нижче наведено приклад поділу перших 60 секунд вхідного файлу на два по 30
другі файли та ігноруючи решту.
sox song.wav рингтон%1n.wav trim 0 30 : newfile : trim 0 30
Зупинка SoX
Зазвичай SoX завершує обробку та автоматично вийде після того, як прочитає все
доступні аудіодані з вхідних файлів.
При бажанні його можна завершити раніше, відправивши в процес сигнал переривання
(зазвичай натисканням клавіші переривання на клавіатурі, яка зазвичай є Ctrl-C). Це
природна вимога за деяких обставин, наприклад, при використанні SoX для запису. Примітка
що під час використання SoX для відтворення кількох файлів Ctrl-C поводиться трохи інакше: натискання
це одного разу змушує SoX перейти до наступного файлу; натискання двічі поспіль викликає
SoX для виходу.
Інший варіант дострокового припинення обробки – використання ефекту, який має період часу або
підрахунок зразків для визначення точки зупинки. Прикладом цього є ефект обрізки. один раз
всі ланцюги ефектів зупинилися, тоді SoX також зупиниться.
ІМЕНИ ФАЙЛОВ
Імена файлів можуть бути простими іменами файлів, абсолютними або відносними іменами шляху або URL-адресами (вхідні файли
тільки). Зауважте, що це вимагає підтримки URL-адрес Wget(1) доступний.
Примітка: Надання SoX вхідного або вихідного імені файлу, яке буде таким же, як ім'я ефекту SoX
не працює, оскільки SoX розглядатиме це як специфікацію ефекту. Єдиний вихід із цього
уникати таких імен файлів. Це, як правило, нескладно, оскільки більшість аудіофайлів назви
мають `розширення' імені файлу, а назви ефектів - ні.
спеціальний Імена файлів
Наведені нижче спеціальні імена файлів можуть використовуватися за певних обставин замість звичайних
ім'я файлу в командному рядку:
- SoX можна використовувати в простих конвеєрних операціях за допомогою спеціального імені файлу `-'
який, якщо використовується як ім'я вхідного файлу, змусить SoX зчитувати аудіодані
"стандартний вхід" (stdin), і який, якщо використовується як вихідне ім'я файлу, спричинить SoX
надішле аудіодані на "стандартний вихід" (стандартний вихід). Зверніть увагу, що при використанні ц
параметр для вихідного файлу, а іноді при використанні його для вхідного файлу, файл
тип файлу (див -t нижче) також необхідно вказати.
"|програма [опції] ..."
Це можна використовувати замість імені вхідного файлу, щоб вказати дану програму
стандартний вихід (stdout) використовуватися як вхідний файл. На відміну від - (вище), це може бути
використовується для кількох входів до однієї команди SoX. Наприклад, якщо `genw' генерує моно
Відформатований WAV сигнали на свій стандартний вихід, тоді наступна команда робить a
стереофайл із двох згенерованих сигналів:
sox -M "|genw --imd -" "|genw --thd -" out.wav
Для аудіо без заголовків (необробленого) -t (і, можливо, інші варіанти формату) знадобиться
заданий перед командою введення.
"ім'я файлу підстановки"
Вказує, що SoX має виконувати `globbing' назви файлу (зіставлення підстановки).
замість оболонки. Це дозволяє застосувати до одного набору параметрів файлу
група файлів. Наприклад, якщо поточний каталог містить три `vox'
файли, file1.vox, file2.vox і file3.vox, потім
грати --rate 6k *.vox
буде розширено "оболонкою" (у більшості середовищ) до
відтворити --rate 6k файл1.vox файл2.vox файл3.vox
який розглядатиме лише перший файл vox як такий, що має частоту дискретизації 6k. З
play --rate 6k "*.vox"
даний параметр частоти дискретизації буде застосовано до всіх трьох файлів vox.
-p, --сокс-труба
Це можна використовувати замість назви вихідного файлу, щоб вказати команду SoX
слід використовувати як у вхідному каналі до іншої команди SoX. Наприклад, команда:
грати "|sox -n -p synth 2" "|sox -n -p synth 2 tremolo 10" stat
відтворює два "файли" поспіль, кожен з різними ефектами.
-p насправді є псевдонімом для `-t соску -'.
-d, --пристрій за замовчуванням
Це можна використовувати замість імені вхідного або вихідного файлу, щоб вказати, що
має використовуватися аудіопристрій за замовчуванням (якщо такий був вбудований у SoX). Це схоже
до виклику запис or грати (як описано вище).
-n, --нуль
Це можна використовувати замість імені вхідного або вихідного файлу, щоб вказати, що `null
file'. Зауважте, що тут "нульовий файл" відноситься до специфічного для SoX
механізм і не пов’язаний з жодним механізмом операційної системи з аналогічною назвою.
Використання нульового файлу для введення аудіо еквівалентно використанню звичайного аудіофайлу, який
містить нескінченну кількість мовчання, і, як такий, зазвичай не корисний, якщо
використовується з ефектом, який визначає кінцеву тривалість часу (наприклад оздоблення or синтезатор).
Використання нульового файлу для виведення аудіо означає відкидання аудіо і корисно
переважно з ефектами, які створюють інформацію про аудіо, а не впливають
це (наприклад шумопроф or stat).
Частота дискретизації, пов’язана з нульовим файлом, за замовчуванням становить 48 кГц, але, як і для a
звичайний файл, це можна замінити за бажанням за допомогою параметрів формату командного рядка
(Дивіться нижче).
Підтриманий Файл & аудіо Пристрій типи
Читати soxformat(7) для списку та опису підтримуваних форматів файлів та аудіопристроїв
водії.
ВАРІАНТИ
Глобальний Опції
Ці параметри можна вказати в командному рядку в будь-який момент перед першим ефектом
ім'я.
Команда SOX_OPTS Змінну середовища можна використовувати для надання альтернативних значень за замовчуванням для
Глобальні параметри SoX. Наприклад:
SOX_OPTS="--буфер 20000 --play-rate-arg -hs --temp /mnt/temp"
Зауважте, що налаштування SOX_OPTS потенційно може призвести до небажаних змін у поведінці
скрипти або інші програми, які викликають SoX. SOX_OPTS найкраще використовувати для речей (наприклад
як у наведеному прикладі), які відображають середовище, в якому виконується SoX. Увімкнення
такі варіанти, як --не-розбійника за замовчуванням може бути оброблено краще, використовуючи псевдонім оболонки, оскільки
псевдонім оболонки не вплине на роботу в скриптах тощо.
Один із способів гарантувати, що SOX_OPTS не може вплинути на сценарій, - це очистити SOX_OPTS на
початок сценарію, але це, звичайно, втрачає переваги SOX_OPTS, які несе деякі
загальносистемні параметри за замовчуванням. Альтернативний підхід — явний виклик SoX with
значення параметрів за замовчуванням, напр
SOX_OPTS="-V --no-clobber"
...
sox -V2 --clobber $вхід $вихід ...
Зверніть увагу, що спосіб встановлення змінних середовища відрізняється від системи до системи. Ось деякі з них
приклади:
Unix bash:
експорт SOX_OPTS="-V --no-clobber"
Unix csh:
setenv SOX_OPTS "-V --no-clobber"
MS-DOS/MS-Windows:
встановити SOX_OPTS=-V --no-clobber
Графічний інтерфейс MS-Windows: через Панель керування: Система: Додатково: Змінні середовища
Графічний інтерфейс Mac OS X: зверніться до документа Apple QA1067 з технічними питаннями і відповідями.
--буфер БАЙТИ, --вхідний буфер БАЙТИ
Встановити розмір буферів, що використовуються для обробки аудіо, в байтах (за замовчуванням 8192).
--буфер застосовується до обробки введення, ефектів та вихідних даних; --вхідний буфер застосовується
тільки для обробки введення (для якої він перевизначає --буфер якщо дано обидва).
Майте на увазі, що великі значення для --буфер Це призведе до того, що SoX повільно реагує
на запити на припинення або пропуск поточного вхідного файлу.
--лобник
Не запитуйте, перш ніж перезаписувати існуючий файл з таким же ім'ям, що надано
для вихідного файлу. Це поведінка за замовчуванням.
-- об'єднати з'єднати|злиття|змішувати|суміш-потужність|розмножуватися|послідовність
Виберіть спосіб об'єднання вхідних файлів; для деяких із них є короткі варіанти
доступно: -m вибирає "мікс", -M вибирає `об'єднати', і -T вибирає "множити".
Читати вхід Файл Об'єднання вище для опису різних комбінацій
методи
-D, --не-змішування
Вимкніть автоматичний дизеринг - див. "Дізеринг" вище. Приклад того, чому це може бути
іноді корисно, якщо файл був перетворений з 16 на 24 біт за допомогою
має намір виконати певну обробку на ньому, але насправді після цього обробка не потрібна
всі і оригінальний 16-розрядний файл було втрачено, то, строго кажучи, ніякого шуму
потрібен, якщо конвертувати файл назад у 16 біт. Дивіться також статистика ефект для того, як
щоб визначити фактичну бітову глибину аудіо у файлі.
--ефекти-файл ФІЛЕНАМ
Використовуйте FILENAME, щоб отримати всі ефекти та їх аргументи. Файл розбирається як би
значення були вказані в командному рядку. Замість цього можна використовувати новий рядок
особливий : маркер для розділення ланцюжків ефектів. Для зручності такі маркери на
кінець файлу зазвичай ігнорується; якщо ви хочете вказати порожній останній
ланцюг ефектів, використовуйте явний : в останньому рядку файлу. Це
Параметр спричиняє відкидання будь-яких ефектів, зазначених у командному рядку.
-G, -- охорона
Автоматично викликати коефіцієнт посилення ефект для захисту від відсікання. напр
sox -G infile -b 16 швидкість вихідного файлу 44100 dither -s
це скорочення для
sox infile -b 16 вихідний файл посилення -h швидкість 44100 посилення -rh dither -s
Дивіться також -V, --норма, і коефіцієнт посилення ефект
-h, --допомога
Показати номер версії та інформацію про використання.
--допомога-ефект ІМ'Я
Показати інформацію про використання зазначеного ефекту. Ім'я всі можна використовувати для показу
використання на всіх ефектах.
-- формат довідки ІМ'Я
Показати інформацію про вказаний формат файлу. Ім'я всі можна використовувати для показу
інформація про всі формати.
--і, --інформація
Тільки якщо вказано як перший параметр для соску, поводьтеся як soxi(1).
-m|-M Дорівнює -- об'єднати змішувати та -- об'єднати злиття, відповідно.
-- магія
Якщо SoX було створено з додатковою бібліотекою `libmagic', тоді ця опція може бути
надано, щоб уможливити його використання для виявлення типів аудіофайлів.
--багатопоточний | --однопотоковий
За замовчуванням SoX є "однопотоковим". Якщо --багатопоточний надається варіант
однак тоді SoX оброблятиме аудіоканали для більшості багатоканальних ефектів
паралельно на гіперпоточних/багатоядерних архітектурах. Це може зменшити обробку
час, хоча іноді може знадобитися використовувати цей параметр разом з a
більший розмір буфера, ніж за замовчуванням, щоб отримати будь-які переваги від багатопотокової роботи
обробка (наприклад, 131072; див --буфер вище).
--не-розбійника
Запропонуйте перед перезаписом існуючого файлу з таким же ім’ям, що надано для
вихідний файл.
NB Ненавмисно перезаписати файл легше, ніж ви думаєте
наприклад, якщо ви випадково ввійшли
sox файл1 файл2 ефект1 ефект2 ...
коли ви насправді мали на увазі
відтворити файл1 файл2 ефект1 ефект2 ...
тоді, без цієї опції, file2 буде перезаписано. Отже, використання цієї опції є
рекомендовано. SOX_OPTS (вище), псевдонім оболонки, сценарій або пакетний файл може бути
відповідний спосіб його постійної активації.
--норма[=рівень дБ]
Автоматично викликати коефіцієнт посилення ефект для захисту від обрізання та нормалізації
аудіо. напр
sox --norm infile -b 16 швидкість вихідного файлу 44100 dither -s
це скорочення для
sox infile -b 16 вихід файлу підсилення -h швидкість 44100 усилення -nh dither -s
За бажанням, звук можна нормалізувати до заданого рівня (зазвичай) нижче 0 dBFS:
sox --norm=-3 infile вихідний файл
Дивіться також -V, -G, і коефіцієнт посилення ефект
--play-rate-arg ARG
Вибирає параметр якості, який буде використовуватися, коли ефект `rate' автоматично викликається
під час відтворення аудіо. Цей параметр зазвичай встановлюється за допомогою SOX_OPTS навколишнє середовище
змінна (див. вище).
-- сюжет гнулот|октава|від
Якщо не встановлено від (за замовчуванням якщо -- сюжет не дається), запустити в режимі, який можна
використовується в поєднанні з програмою gnuplot або програмою GNU Octave, щоб допомогти
з вибором і конфігурацією багатьох з передатних функцій
ефектів. Для першого заданого ефекту, який підтримує вибрану програму побудови,
SoX виведе команди для побудови передатної функції ефекту, а потім вийде
без фактичної обробки звуку. напр
sox --plot октава input-file -n highpass 1320 > highpass.plt
октава highpass.plt
-q, --не-прогрес
Працюйте в тихому режимі, коли SoX інакше не робив би цього. Це протилежність
-S варіант.
-R Виконайте в режимі "повторюваного". Коли ця опція надається, де це можливо, SoX буде
вставити фіксовану позначку часу у вихідний файл (наприклад AIFF) і буде `посіяти' псевдо
генератори випадкових чисел (напр трястися) з фіксованим номером, таким чином забезпечуючи це
послідовні виклики SoX з тими самими входами та тими самими параметрами дають результат
той самий вихід.
--повторне посилення трек|альбом|від
Виберіть, чи застосовувати коригування підсилення відтворення до вхідних файлів. За замовчуванням
is від та цінності соску та запис, альбом та цінності грати де (принаймні) перші два вхідні файли
позначені однаковими іменами виконавця та альбому, і трек та цінності грати інакше.
-S, --показати прогрес
Відображати інформацію про формат вхідного файлу/заголовок та хід обробки як вхідні дані
файл(и) відсоток завершення, час, що минув, і час, що залишився (якщо відомо; показано в
дужки) та кількість зразків, записаних у вихідний файл. Також показано а
вимірювач пікового рівня та індикацію, чи відбулося відсікання. Вимірник пікового рівня
відображає до двох каналів і калібрується для цифрового звуку наступним чином (праворуч
показаний канал):
dB ФСД дисплей dB ФСД дисплей
-25 - -11 ====
-23 = -9 ====-
-21 =- -7 =====
-19 == -5 =====-
-17 ==- -3 ======
-15 === -1 =====!
-13 ===-
Трисекундне пікове значення запасу в дБ буде показано праворуч від
метр, якщо цей рівень нижче 6 дБ.
Цей параметр увімкнено за замовчуванням під час використання SoX для відтворення або запису аудіо.
-T Дорівнює -- об'єднати розмножуватися.
--темп ДОВІДНИК
Вкажіть, що будь-які тимчасові файли повинні бути створені в заданому ДОВІДНИК, це
може бути корисним, якщо є проблеми з дозволом або вільним простором за умовчанням
Розташування. У цьому випадку, використовуючи `--темп .' (для використання поточного каталогу) часто є a
гарне рішення.
-- версія
Покажіть номер версії SoX і вийдіть.
-V[рівень]
Встановити багатослівність. Це особливо корисно для перегляду будь-яких автоматичних ефектів
були викликані SoX.
SoX відображає повідомлення на консолі (stderr) відповідно до наведеної нижче докладності
рівні:
0 Повідомлення не відображаються взагалі; використовуйте статус виходу, щоб визначити, чи є помилка
сталося.
1 Відображаються лише повідомлення про помилки. Вони генеруються, якщо SoX не може завершитися
запитані команди.
2 Також відображаються попереджувальні повідомлення. Вони генеруються, якщо SoX може завершити
запитані команди, але не зовсім відповідно до запитаної команди
параметри, або якщо відбувається відсікання.
3 Також показані описи етапів обробки SoX. Корисно для перегляду
як саме SoX обробляє ваше аудіо.
4 і вище
Також відображаються повідомлення, які допоможуть налагодити SoX.
За замовчуванням рівень детальності встановлений на 2 (показує помилки та попередження). Кожен
виникнення -V Опція збільшує рівень детальності на 1. Як альтернатива,
рівень детальності можна встановити на абсолютне число, вказавши його відразу після
-V, напр -V0 встановлює значення 0.
вхід Файл Опції
Ці параметри застосовуються лише до вхідних файлів і можуть передувати лише іменам вхідних файлів на
command line.
--ignore-length
Замінити (неправильну) довжину аудіо, вказану в заголовку аудіофайлу. Якщо це
надається параметр, тоді SoX продовжуватиме читати аудіо, поки не досягне кінця
вхідний файл.
-v, --обсяг ФАКТОР
Цей параметр призначений для використання при об’єднанні кількох вхідних файлів
обсяг файлу, який слідує за ним у командному рядку, у коефіцієнт ФАКТОР, це
дозволяє його "збалансувати" щодо інших вхідних файлів. Це лінійна
(амплітуди), тож число менше 1 зменшує гучність і число
більше 1 збільшує його. Якщо дано від’ємне число, то на додаток до
регулювання гучності, звуковий сигнал буде інвертований.
Див. Також норма, про та коефіцієнт посилення ефектів і див вхід Файл Балансування вище.
вхід & Вихід Файл сформований Опції
Ці параметри застосовуються до вхідного або вихідного файлу, ім’я якого вони безпосередньо передують у файлі
командного рядка і використовуються в основному при роботі з форматами файлів без заголовків або коли
вказуючи формат вихідного файлу, який відрізняється від формату вхідного файлу.
-b BITS, --біти BITS
Кількість бітів (він же бітова глибина або іноді довжина слова) у кожному закодованому
зразок. Не застосовується до складних кодувань, таких як MP3 або GSM. Не Необхідно
з кодуваннями, які мають фіксовану кількість бітів, наприклад, A/μ-закон, ADPCM.
Для вхідного файлу цей параметр найчастіше використовується для інформування SoX
кількість бітів на вибірку в "сирому" ("беззаголовковому") аудіофайлі. Наприклад
sox -r 16k -e зі знаком -b 8 input.raw output.wav
перетворює конкретний `raw' файл у файл `WAV', що самоописує.
Для вихідного файлу можна використовувати цей параметр (можливо, разом з -e), щоб встановити
вихідний розмір кодування. За замовчуванням (тобто якщо ця опція не задана), вихід
буде встановлено розмір кодування (за умови, що він підтримується типом вихідного файлу).
вхідний розмір кодування. Наприклад
sox input.cdda -b 24 output.wav
перетворює необроблений цифровий аудіо компакт-диск (16-розрядне ціле зі знаком) у 24-бітове (ціле зі знаком)
файл `WAV'.
-1/-2/-3/-4/-8
Кількість байтів у кожному закодованому зразку. Застарілі псевдоніми для -b 8, -b 16, -b
24, -b 32, -b 64 відповідно.
-c КАНАЛИ, --канали КАНАЛИ
Кількість аудіоканалів у аудіофайлі. Це може бути будь-яке число більше ніж
нуль.
Для вхідного файлу цей параметр найчастіше використовується для інформування SoX
кількість каналів у "сирому" ("беззаголовку") аудіофайлі. Іноді це може бути
корисно використовувати цю опцію з файлом із заголовком, щоб замінити файл
(імовірно неправильне) значення в заголовку – зауважте, що це підтримується лише з
певні типи файлів. Приклади:
sox -r 48k -e float -b 32 -c 2 input.raw output.wav
перетворює конкретний `raw' файл у файл `WAV', що самоописує.
грати -c 1 music.wav
інтерпретує дані файлу як належність до одного каналу, незалежно від того, що є
вказано в заголовку файлу. Зауважте, що якщо файл насправді має два
каналів, це призведе до відтворення файлу на половинній швидкості.
Для вихідного файлу ця опція надає скорочення для визначення того, що
канали ефект слід викликати, щоб змінити (за потреби) кількість
каналів аудіосигналу до вказаного числа. Наприклад, наступні два
команди еквівалентні:
sox input.wav -c 1 вихід.wav bass -b 24
sox input.wav output.wav bass -b 24 канали 1
хоча друга форма є більш гнучкою, оскільки дозволяє впорядковувати ефекти
довільно.
-e КОДУВАННЯ, --кодування КОДУВАННЯ
Тип кодування звуку. Іноді потрібно з типами файлів, які підтримують більше ніж
один тип кодування. Наприклад, з raw, WAV або AU (але не, наприклад, with
MP3 або FLAC). Доступні такі типи кодування:
ціле число зі знаком
Дані PCM зберігаються як цілі числа зі знаком («доповнення до двох»). Зазвичай використовується з
16 або 24-бітний розмір кодування. Значення 0 представляє мінімальний сигнал
влада.
ціле число без знаку
Дані PCM зберігаються як цілі числа без знака. Зазвичай використовується з 8-бітним кодуванням
розмір. Значення 0 представляє максимальну потужність сигналу.
з плаваючою комою
Дані PCM зберігаються як IEEE 753 одинарної точності (32-біт) або подвійної точності
(64-розрядні) числа з плаваючою комою («дійсні»). Значення 0 означає мінімум
потужність сигналу.
а-закон Міжнародний стандарт телефонії для логарифмічного кодування до 8 біт на
зразок. Він має точність, еквівалентну приблизно 13-бітному PCM, і є
іноді кодується зі зворотним упорядкуванням бітів (див -X варіант).
U-закон, му-закон
Північноамериканський стандарт телефонії для логарифмічного кодування до 8 біт на
зразок. Він же μ-закон. Він має точність, еквівалентну приблизно 14-бітному PCM
і іноді кодується зі зворотним упорядкуванням бітів (див -X варіант).
oki-adpcm
OKI (він же VOX, Dialogic або Intel) 4-розрядний ADPCM; він має точність
еквівалентно приблизно 12-бітному PCM. ADPCM – це форма стиснення аудіо
має хороший компроміс між якістю звуку та швидкістю кодування/декодування.
ima-adpcm
IMA (він же DVI) 4-розрядний ADPCM; вона має точність, еквівалентну приблизно
13-розрядний PCM.
ms-adpcm
4-розрядний ADPCM Microsoft; він має точність, еквівалентну приблизно 14-бітному PCM.
gsm-повна швидкість
GSM в даний час використовується для переважної більшості цифрових бездротових мереж у світі
телефонні дзвінки. Він використовує кілька аудіоформатів з різними бітрейтами
і пов'язана якість мовлення. SoX підтримує оригінальні 13 кбіт/с GSM
Аудіоформат «Повна швидкість». Зазвичай для роботи з GSM потрібно багато процесора
аудіо.
Назви кодування можна скорочувати, якщо це не буде двозначним; наприклад
`unsigned-integer' може бути подано як `un', але не `u' (неоднозначно з `u-law').
Для вхідного файлу цей параметр найчастіше використовується для інформування SoX
кодування "сирого" ("беззаголовка") аудіофайлу (див. приклади в -b та -c
вище).
Для вихідного файлу можна використовувати цей параметр (можливо, разом з -b), щоб встановити
Тип кодування виведення Наприклад
sox input.cdda -e float output1.wav
sox input.cdda -b 64 -e float output2.wav
конвертувати необроблений цифровий аудіо компакт-диск (16-розрядне ціле зі знаком) у файли `WAV' з плаваючою комою
(одинарної та подвійної точності відповідно).
За замовчуванням (тобто, якщо цей параметр не вказано), тип кодування виведення буде
(за умови, що це підтримується типом вихідного файлу) бути встановлено на вхідне кодування
тип
-s/-u/-f/-A/-U/-o/-i/-a/-g
Застарілі псевдоніми для визначення типів кодування ціле число зі знаком, непідписаний-
ціле, з плаваючою комою, а-закон, му-закон, oki-adpcm, ima-adpcm, ms-adpcm, gsm-повний-
швидкість відповідно (див -e вище).
--ні-глоб
Вказує, що `globbing' (відповідність підстановки) імені файлу не має виконуватися
SoX на таку назву файлу. Наприклад, якщо поточний каталог містить файл
потім два файли `five-seconds.wav' і `five*.wav'
грати --no-glob "п'ять*.wav"
можна використовувати для відтворення лише одного файлу `five*.wav'.
-р, --ставка РЕЙТИНГ[k]
Надає частоту дискретизації в Гц (або кГц, якщо додається `k') файлу.
Для вхідного файлу цей параметр найчастіше використовується для інформування SoX
частота дискретизації аудіофайлу `raw' (`без заголовків') (див. приклади в -b та -c
вище). Іноді може бути корисно використовувати цю опцію з файлом із заголовком,
щоб замінити (імовірно неправильне) значення в заголовку - зверніть увагу на це
це підтримується лише для певних типів файлів. Наприклад, якщо було записане аудіо
з частотою дискретизації, скажімо, 48k від джерела, яке відтворюється трохи, скажімо 1.5%,
тоді надто повільно
sox -r 48720 input.wav output.wav
ефективно коригує швидкість, змінюючи лише заголовок файлу (але також див
швидкість ефект для більш звичайного вирішення цієї проблеми).
Для вихідного файлу ця опція надає скорочення для визначення того, що швидкість
ефект слід викликати, щоб змінити (якщо необхідно) частоту дискретизації
звуковий сигнал до заданого значення. Наприклад, наступні дві команди
еквівалент:
sox input.wav -r 48k output.wav bass -b 24
sox input.wav output.wav bass -b 24 rate 48k
хоча друга форма є більш гнучкою, наскільки це дозволяє швидкість варіанти, які потрібно надати, і
дозволяє ефектам упорядковуватися довільно.
-t, --тип ТИП ФАЙЛУ
Вказує тип аудіофайлу. Для вхідних і вихідних файлів цей параметр є
зазвичай використовується для інформування SoX про тип аудіофайлу "без заголовків" (наприклад, raw, mp3)
де фактичний/бажаний тип не може бути визначений із заданого розширення імені файлу.
Наприклад:
інша команда | sox -t mp3 - вихід.wav
sox input.wav -t необроблений вихід.bin
Його також можна використовувати для заміни типу, який передбачає розширення імені вхідного файлу,
але якщо перевизначити тип, який має заголовок, SoX вийде з відповідним
повідомлення про помилку, якщо такого заголовка насправді немає.
Читати soxformat(7) для списку підтримуваних типів файлів.
-L, -- endian трохи
-B, -- endian великий
-x, -- endian обмін
Ці параметри визначають, чи є порядок байтів аудіоданих відповідно
`little endian', `big endian' або навпаки системи, в якій SoX
використовується. Порядок порядків байдужості застосовується лише до даних, закодованих як з плаваючою комою або як
цілі числа зі знаком або без знака довжиною 16 або більше бітів. Часто доводиться уточнювати
один з цих параметрів для файлів без заголовків, а іноді необхідний для (інакше)
файли з самоописом. Даний параметр налаштування байдужого порядка може ігноруватися для входу
файл, заголовок якого містить певний ідентифікатор порядкового порядка, або для вихідного файлу
це насправді аудіопристрій.
NB На відміну від інших характеристик формату, порядність байтів (байт, відрізок і біт
впорядкування) вхідного файлу автоматично не використовується для вихідного файлу; так, для
наприклад, коли таке виконується в системі з маленьким порядком байтів:
sox -B audio.s16 trimmed.s16 trimmed 2
trimmed.s16 буде створено як little-endian;
sox -B audio.s16 -B trimmed.s16 trimmed 2
необхідно використовувати для збереження великого рядка у вихідному файлі.
Команда -V опцію можна використовувати для перевірки вибраних замовлень.
-N, --зворотні відрізи
Вказує, що порядок фрагментів (тобто 2 половини байта) зразків
слід перевернути; іноді корисно з форматами на основі ADPCM.
NB Дивіться також NB у розділі на -x вище.
-X, --зворотні біти
Вказує, що порядок бітів вибірок має бути зворотним; іноді корисно
з кількома (в основному без заголовків) форматами.
NB Дивіться також NB у розділі на -x вище.
Вихід Файл сформований Опції
Ці параметри застосовуються лише до вихідного файлу і можуть передувати лише назві вихідного файлу
командний рядок.
--додати-коментувати TEXT
Додайте коментар до заголовка вихідного файлу (де це можливо).
-- коментар TEXT
Укажіть текст коментаря для збереження в заголовку вихідного файлу (де це можливо).
SoX надасть коментар за замовчуванням, якщо цей параметр (або --файл коментарів) не надається.
Щоб указати, що коментарі не повинні зберігатися у вихідному файлі, використовуйте -- коментар "" .
--файл коментарів ФІЛЕНАМ
Укажіть файл, що містить текст коментаря, який потрібно зберегти в заголовку вихідного файлу
(де це застосовно).
-C, -- стиснення ФАКТОР
Коефіцієнт стиснення для змінного стиснення форматів вихідних файлів. Якщо це
не вказано, тоді буде застосовуватися коефіцієнт стиснення за замовчуванням. Стиснення
фактор інтерпретується по-різному для різних форматів стиснення файлів. Див
опис форматів файлів, які використовують цю опцію в soxformat(7) більше
інформація.
ЕФЕКТИ
На додаток до конвертації, відтворення та запису аудіофайлів, SoX можна використовувати для виклику a
кількість аудіо "ефектів". Можна застосувати кілька ефектів, вказавши їх один після
інший в кінці командного рядка SoX, утворюючи "ланцюжок ефектів". Зауважте, що
застосування кількох ефектів у режимі реального часу (тобто під час відтворення аудіо), ймовірно, вимагатиме a
високопродуктивний комп'ютер. Зупинка інших програм може полегшити проблеми з продуктивністю
якщо вони виникнуть.
Деякі з ефектів SoX в першу чергу призначені для застосування до одного інструменту або
`голос'. Щоб полегшити це, в ремікс ефект і глобальна опція SoX -M може бути використана для
ізолювати, а потім повторно об’єднувати треки з багатодоріжкового запису.
множинний Ефекти Ланцюги
Один ланцюжок ефектів складається з одного або кількох ефектів. Звук з входу запускається
через ланцюжок, поки не буде досягнуто кінця вхідного файлу або ефекту в
запити ланцюга на припинення ланцюга.
SoX підтримує запуск кількох ланцюжків ефектів на вхідному аудіо. У цьому випадку, коли один
ланцюг вказує, що обробка звуку завершена, аудіодані потім надсилаються через наступний
ланцюг ефектів. Це продовжується до тих пір, поки не більше не буде ланцюжків ефектів, або доки вхід не буде
досяг кінця файлу.
Ланцюжок ефектів завершується розміщенням a : (товста кишка) після ефекту. Будь-яке наступне
ефекти є частиною нового ланцюга ефектів.
Важливо розмістити ефект, який зупинить ланцюжок, як перший ефект у
ланцюг. Це пов’язано з тим, що будь-які зразки, які буферизовані ефектами зліва від
ефект припинення буде скасовано. Кількість відкинутих зразків пов'язана з
--буфер і його слід залишати невеликим відносно частоти дискретизації, якщо
припинення дії не може бути першим. Додаткову інформацію про ефект зупинки можна знайти
в Зупинка SoX .
Існує кілька псевдоефектів, які допомагають використовувати кілька ланцюжків ефектів. До них належать
новий файл який почне записувати в новий вихідний файл, перш ніж перейти до наступних ефектів
ланцюг і перезапуск який повернеться до першого ланцюга ефектів. Псевдоефекти повинні бути
вказано як перший ефект у ланцюжку та як єдиний ефект у ланцюжку (вони повинні мати
a : до і після їх уточнення).
Нижче наведено приклад кількох ланцюжків ефектів. Він розділить вхідний файл на
кілька файлів тривалістю 30 секунд. Кожна назва вихідного файлу матиме унікальний номер
його назва, як задокументовано в Вихід Файли .
sox infile.wav output.wav trim 0 30 : newfile : перезапуск
загальний нотація і параметри
У наступних описах дужки [ ] використовуються для позначення параметрів
необов'язкові, дужки { } для позначення необов'язкових і повторюваних, а також кутів
дужки < > для позначення тих, які повторюються, але не є необов’язковими. Де це застосовно,
значення за замовчуванням для необов’язкових параметрів показано в дужках ( ).
Наступні параметри використовуються з кількома ефектами та мають однакове значення для кількох ефектів:
центр[k]
Читати частота.
частота[k]
Частота в Гц або, якщо додається `k', кГц.
коефіцієнт посилення Підсилення потужності в дБ. Нуль не дає виграшу; менше нуля дає ослаблення.
ширина[h|k|o|q]
Використовується для визначення смуги пропускання фільтра. Кілька різних методів для
вкажіть доступну ширину (хоча не всі для кожного ефекту). Один з
показані символи можуть бути додані для вибору потрібного методу наступним чином:
Метод примітки
h Hz
k кГц
o Октави
q Q-фактор Див. [2]
Для кожного ефекту, який використовує цей параметр, метод за замовчуванням (тобто якщо немає символу
додається) – це той, який він зазначений першим у першому рядку ефекту
опису
Щоб перевірити, чи підтримує SoX додатковий ефект, введіть соску -h і шукайте його назву під
список: "ЕФЕКТИ".
Підтриманий Ефекти
Примітка: категоризований список ефектів можна знайти у супровідному файлі `README'.
allpass частота[k] ширина[h|k|o|q]
Застосуйте двополюсний всепропускний фільтр із центральною частотою (в Гц) частота та
фільтр-ширина ширина. Повнопрохідний фільтр змінює частоту звуку на фазу
співвідношення без зміни його частотного зв'язку на амплітуду. Фільтр
детально описано в [1].
Цей ефект підтримує -- сюжет глобальний варіант.
band [-n] центр[k] [ширина[h|k|o|q]]
Застосуйте смуговий фільтр. АЧХ логарифмічно падає навколо
центр частота. The ширина Параметр дає нахил перепаду. The
частоти на центр + ширина та центр - ширина буде наполовину оригіналу
амплітуди. band за замовчуванням встановлено режим, орієнтований на тональний звук, тобто голос,
спів або інструментальна музика. The -n Опція (для шуму) використовує альтернативний режим
для звуку без висоти (наприклад, перкусії). Увага! -n вводить посилення потужності
близько 11 дБ у фільтрі, тому остерігайтеся відсікання вихідного сигналу. band вносить шум
форма фільтра, тобто пік на центр частота і оселяння
його.
Цей ефект підтримує -- сюжет глобальний варіант.
Дивіться також синк для смугового фільтра з більш крутими плечима.
смуговий|bandreject [-c] частота[k] ширина[h|k|o|q]
Застосуйте двополюсний смуговий або смуговий фільтр Баттерворта з центральною частотою
частота, і (3 дБ-точки) смуги пропускання ширина, -c опція стосується лише
смуговий і вибирає постійне посилення спідниці (пікове посилення = Q) замість стандартного:
постійне пікове посилення 0 дБ. Фільтри спадають на рівні 6 дБ на октаву (20 дБ на декаду)
і детально описані в [1].
Ці ефекти підтримують -- сюжет глобальний варіант.
Дивіться також синк для смугового фільтра з більш крутими плечима.
bandreject частота[k] ширина[h|k|o|q]
Застосуйте фільтр відхилення смуги. Дивіться опис смуговий ефект для
подробиці
бас|потрійний коефіцієнт посилення [частота[k] [ширина[s|h|k|o|q]]]
Збільште або зменшіть низькі (нижні) або високі (верхні) частоти аудіо за допомогою
двополюсний стелажний фільтр з відгуком, подібним до стандартного Hi-Fi
регулятори тону. Це також відомо як вирівнювання полиць (EQ).
коефіцієнт посилення дає посилення при 0 Гц (для бас), або те, що є меншим із ~22 кГц і
частота Найквіста (для потрійний). Його корисний діапазон становить близько -20 (для великого
скорочення) до +20 (для великого підвищення). Остерігайтеся Відсікання при використанні позитиву коефіцієнт посилення.
При бажанні фільтр можна налаштувати за допомогою наступних додаткових параметрів:
частота встановлює центральну частоту фільтра і тому може використовуватися для розширення або
зменшити діапазон частот, який потрібно посилити або скоротити. Значенням за замовчуванням є 100 Гц (для
бас) або 3 кГц (для потрійний).
ширина визначає, наскільки крутим є перехід полиці фільтра. На додаток до
загальні методи специфікації ширини, описані вище, `slope' (за замовчуванням або якщо
додається `s') можна використовувати. Корисний діапазон "схилу" становить приблизно 0.3 для a
пологий схил, до 1 (максимальний), для крутого схилу; значення за замовчуванням 0.5.
Фільтри детально описані в [1].
Ці ефекти підтримують -- сюжет глобальний варіант.
Дивіться також еквалайзер для максимального ефекту вирівнювання.
згинатися [-f частота кадрів(25)] [-o надвибірка(16)] { затримка,центів,тривалість }
Змінює висоту звуку на певну величину в певний час. Кожна дана трійка:
затримка,центів,тривалість вказує один вигин. затримка це кількість часу після
початок аудіопотоку або кінець попереднього вигину, з якого слід почати
згинання кроку; центів це кількість центів (100 центів = 1 півтон), на яку
зігнути крок, і тривалість проміжок часу, протягом якого буде висота
є.
Алгоритм зміни висоти використовує дискретне перетворення Фур’є (DFT) на
конкретна частота кадрів і надлишкова дискретизація. The -f та -o можна використовувати параметри
регулювати ці параметри і таким чином контролювати плавність змін висоти.
Наприклад, генерується початковий тон, потім згинається три рази, виходить чотири
загалом різні нотатки:
play -n синтезатор 2.5 sin 667 посилення 1 \
bend .35,180,.25 .15,740,.53 0,-520,.3
Зауважте, що відсічення, створене в цьому прикладі, є навмисним; видалити
це, використовуйте коефіцієнт посилення -5 замість коефіцієнт посилення 1.
Дивіться також крок.
біквад b0 b1 b2 a0 a1 a2
Застосуйте двоквадратичний IIR-фільтр із заданими коефіцієнтами. Де b* і a* є
коефіцієнти чисельника та знаменника відповідно.
Читати http://en.wikipedia.org/wiki/Digital_biquad_filter (де a0 = 1).
Цей ефект підтримує -- сюжет глобальний варіант.
канали КАНАЛИ
Використовуйте простий алгоритм, щоб змінити кількість каналів у звуковому сигналі
дане число КАНАЛИ: змішування при зменшенні кількості каналів або
дублювання, якщо збільшити кількість каналів.
Команда канали ефект викликається автоматично, якщо SoX -c параметр визначає число
каналів, які відрізняються від вхідних файлів. Як варіант, якщо це
ефект дається явно, тоді SoX -c опцію надавати не потрібно. Наприклад,
наступні дві команди є еквівалентними:
sox input.wav -c 1 вихід.wav bass -b 24
sox input.wav output.wav bass -b 24 канали 1
хоча друга форма є більш гнучкою, оскільки дозволяє впорядковувати ефекти
довільно.
Дивіться також ремікс для ефекту, який дозволяє довільно змішувати/вибирати канали.
хор виграш виграш <затримка розпад швидкість глибина -s|-t>
Додайте ефект хору до аудіо. Це може створити один голосовий звук, як а
хору, але також може застосовуватися до інструментування.
Приспів нагадує ефект відлуння з короткою затримкою, але тоді як з ехо затримкою
є постійним, з хором, він варіюється за допомогою синусоїдальної або трикутної модуляції.
Глибина модуляції визначає діапазон, до якого відтворюється модульована затримка або
після затримки. Отже, звук із затримкою буде звучати повільніше або швидше, тобто
відкладений звук, налаштований на оригінальний, як у хорі, де є кілька вокалів
злегка вимкнений ключ. Дивіться [3], щоб дізнатися більше про ефект хору.
Кожен із чотирьох кортежних параметрів затримка/розпад/швидкість/глибина дає затримку в мілісекундах
і спад (відносно посилення) зі швидкістю модуляції в Гц з використанням глибини в
мілісекунд. Модуляція є або синусоїдною (-s) або трикутної (-t). Підвищення -
out — обсяг виходу.
Типова затримка становить від 40 мс до 60 мс; швидкість модуляції найкраща біля 0.25 Гц
і глибина модуляції близько 2 мс. Наприклад, одна затримка:
грати на гітарі1.wav приспів 0.7 0.9 55 0.4 0.25 2 -t
Дві затримки вихідних зразків:
грати на гітарі1.wav приспів 0.6 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 1.3 -с
Більш повний приспів (з трьома додатковими затримками):
грати на гітарі1.wav приспів 0.5 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 2.3 -t 40 0.3 0.3 1.3 -s
компан атака 1,розпад1{,атака 2,розпад2}
[м'яке коліно-дБ:]в дБ1[,вихід-дБ1]{,в дБ2,вихід-дБ2}
[коефіцієнт посилення [початкова гучність дБ [затримка]]]
Компонуйте (стискайте або розширюйте) динамічний діапазон аудіо.
Команда атака та розпад параметри (у секундах) визначають час, протягом якого
миттєвий рівень вхідного сигналу усереднюється для визначення його гучності;
атаки позначають збільшення обсягу, а розпади – зменшення. Для більшості
ситуацій, час атаки (реакція на гучнішу музику) має бути
коротше, ніж час розпаду, оскільки людське вухо більш чутливе до раптового гучного звуку
музика, ніж раптова тиха музика. Де більше однієї пари параметрів атаки/розпаду
вказано, кожен вхідний канал компонується окремо і кількість пар
має узгоджуватися з кількістю вхідних каналів. Типовими значеннями є 0.3,0.8 секунд.
Другим параметром є список точок передатної функції компандера
вказується в дБ відносно максимально можливої амплітуди сигналу. Вхідні дані
значення повинні бути в строго зростаючому порядку, але передатна функція ні
повинні монотонно зростати. Якщо пропущено, значення вихід-дБ1 за замовчуванням
таке ж значення, як в дБ1; рівні нижче в дБ1 не супроводжуються (але можуть мати посилення
застосовується до них). Точка 0,0 припускається, але може бути перевизначено (за допомогою 0,поза дБн).
Якщо списку передує а м'яке коліно-дБ значення, потім точки, у яких сусідні
відрізки лінії передатної функції зустрічаються будуть округлені на вказану суму.
Типовими значеннями для передатної функції є 6:-70,-60,-20.
Третій (необов’язковий) параметр – це додаткове посилення в дБ, яке взагалі має застосовуватися
точки передатної функції та дозволяє легко регулювати загальне посилення.
Четвертий (необов’язковий) параметр — це початковий рівень, який слід вважати для кожного каналу
коли починається компандування. Це дозволяє користувачеві спочатку ввести номінальний рівень,
так що, наприклад, дуже велике посилення не застосовується до початкових рівнів сигналу
перед тим, як почала діяти компандуюча дія: цілком імовірно, що в
подібна подія, вихід буде сильно обрізаний, а підсилення компандера
правильно налаштовується. Типове значення (для аудіо, яке спочатку тихе).
-90 дБ
П’ятий (необов’язковий) параметр — затримка в секундах. Аналізується вхідний сигнал
негайно керувати компандером, але він відкладається перед подачею до
регулятор гучності. Визначення затримки, приблизно дорівнює часу атаки/загасання
дозволяє компандеру ефективно працювати в «прогнозному», а не в а
реактивний режим. Типове значення 0.2 секунд.
* * *
Наступний приклад можна використати, щоб створити музичний твір із тихим і тихим звуком
гучні фрагменти, придатні для прослуховування в шумному оточенні, наприклад, у русі
транспортний засіб:
sox asz.wav asz-car.wav compand 0.3,1 6:-70,-60,-20 -5 -90 0.2
Функція передачі (`6:-70,...') говорить, що дуже тихі звуки (нижче -70 дБ) будуть
залишаються незмінними. Це зупинить компандер від збільшення гучності
«тихі» переходи, наприклад між рухами. Однак звуки в діапазоні -60 дБ до
0 дБ (максимальна гучність) буде збільшено, щоб динамічний діапазон 60 дБ вихідного
Музика буде стиснута 3 до 1 в діапазоні 20 дБ, що достатньо для задоволення
музика, але досить вузька, щоб обійти шум дороги. Параметр "6:" вибирає 6 дБ
м’який компандінг коліна. Вихідне посилення -5 (дБ) потрібне, щоб уникнути відсікання (
число є неточним і було отримано експериментальним шляхом). -90 (дБ) для
початкова гучність буде нормально працювати для кліпу, який починається майже без звуку, і
затримка 0.2 (секунди) змушує компандер реагувати трохи більше
швидко до різких змін гучності.
У наступному прикладі compand використовується як шумовий гейт, коли шум досягається
нижчий рівень, ніж сигнал:
відтворити infile compand .1,.2 -inf,-50.1,-inf,-50,-50 0 -90 .1
Ось ще один шумовий гейт, на цей раз для тих випадків, коли рівень шуму вищий ніж
сигнал (що робить його в чомусь схожим на шумоподавлення):
відтворити infile compand .1,.1 -45.1,-45,-inf,0,-inf 45 -90 .1
Цей ефект підтримує -- сюжет глобальна опція (для передатної функції).
Дивіться також mcompand для ефекту багатосмугового компандування.
контрастність [збільшення-сума(75)]
Порівняно зі стисненням, цей ефект змінює звуковий сигнал, щоб зробити його звучним
голосніше. збільшення-сума контролює величину покращення і є числом
в діапазоні 0-100. Зауважте, що збільшення-сума = 0 все ще дає значне значення
посилення контрасту.
Див. Також компан та mcompand ефектів.
dcshift зсув [обмежувач посилення]
Застосуйте зсув постійного струму до аудіо. Це може бути корисно для видалення зміщення постійного струму (спричиненого
можливо, через апаратну проблему в ланцюжку запису) з аудіо. Ефект
Зміщення постійного струму зменшує запас і, отже, обсяг. The stat or статистика ефект може
використовуватися, щоб визначити, чи має сигнал зсув постійного струму.
Дане dcshift значення – це число з плаваючою комою в діапазоні ±2, що
вказує величину зсуву звуку (що знаходиться в діапазоні ±1).
Необов’язковий обмежувач посилення також можна вказати. Він повинен мати набагато менше значення
ніж 1 (наприклад, 0.05 або 0.02) і використовується лише на піках для запобігання відсіканню.
* * *
Альтернативним підходом до видалення зсуву постійного струму (хоча і з короткою затримкою) є
використовувати високих частот ефект фільтра на частоті, скажімо, 10 Гц, як показано на рис
наступний приклад:
sox -n dc.wav synth 5 sin %0 50
sox dc.wav fixed.wav highpass 10
deemph Застосуйте компакт-диск (IEC 60908) для зняття акцентів (полицевий фільтр із загасанням високих частот).
Під час мастерингу деяких компакт-дисків, випущених на початку 1980-х років, застосовувався попередній наголос.
Серед них було багато альбомів класичної музики, а також популярні нині випуски
альбоми The Beatles, Pink Floyd та інших. Попередній наголос слід прибрати на
час відтворення за допомогою фільтра зняття акцентів у пристрої відтворення. Проте не всі
сучасні програвачі компакт-дисків мають цей фільтр, і дуже мало компакт-дисків для ПК мають його; грати перед-
підкреслений звук без правильного фільтра де-акцентування призводить до звуку, який
звучить жорстко і далеко від того, що задумали його творці.
З deemph ефект, можна застосувати необхідне деакцентування до аудіо
витягнутий із попередньо виділеного компакт-диска, а потім або записати де-
підкреслений звук на новий компакт-диск (який потім буде правильно відтворюватися на будь-якому програвачі компакт-дисків), або
просто відтворюйте на ПК аудіофайли, які правильно знижені. Наприклад:
sox track1.wav track1-deemph.wav deemph
а потім записати track1-deemph.wav на компакт-диск або
відтворити track1-deemph.wav
або просто
відтворити track1.wav deemph
Фільтр де-акцентування реалізований як біквад; його максимальне відхилення від
ідеальна реакція становить лише 0.06 дБ (до 20 кГц).
Цей ефект підтримує -- сюжет глобальний варіант.
Див. Також бас та потрійний ефект вирівнювання полиць.
затримка { }
Затримка одного або кількох аудіоканалів. можна вказати час або, якщо додається з
`s', ряд зразків. Не вказуйте як час, так і затримки зразків у
та сама команда. Наприклад, затримка 1.5 0 0.5 затримує перший канал на 1.5
секунд, третій канал на 0.5 секунди і залишає другий канал (і будь-який
інші канали, які можуть бути присутні) без затримки. Наступна (одна довга) команда
відтворює дзвінок:
play -n synth -j 3 sin %3 sin %-2 sin %-5 sin %-9 \
sin %-14 sin %-21 fade h .01 2 1.5 затримка \
1.3 1 .76 .54 .27 remix - fade h 0 2.7 2.5 норма -1
і це грає гітарний акорд:
play -n synth pl G2 pl B2 pl D3 pl G3 pl D4 pl G4 \
затримка 0 .05 .1 .15 .2 .25 remix - fade 0 4 .1 норма -1
трястися [-S|-s|-f фільтрувати] [-a] [-p точність]
Застосуйте дизерінг до аудіо. Дизеринг навмисно додає невелику кількість шуму
до сигналу, щоб замаскувати звукові ефекти квантування, які можуть виникнути, якщо
Розмір вихідної вибірки менше 24 біт. Якщо параметрів немає, цей ефект додасть
трикутний (TPDF) білий шум. Формування шуму (лише для певних частот дискретизації) може
бути обраним з -s, З -f варіант, можна вибрати певний
фільтр, що формує шум із наступного списку: lipshitz, f-weighted, modified-e-
зважений, покращений-е-зважений, gesemann, shibata, low-shibata, high-shibata. Примітка
що більшість типів фільтрів доступні лише з частотою дискретизації 44100 Гц. Фільтр
види розрізняють за такими властивостями: чутність шуму, рівень
(нерозбірливо, але в деяких випадках проблематично) високочастотної форми
шум і швидкість обробки.
Читати http://sox.sourceforge.net/SoX/NoiseShaping для графіків різного шуму-
формування кривих.
Команда -S Опція вибирає злегка «похилу» TPDF, зміщену в бік вищих частот.
Його можна використовувати з будь-якою частотою дискретизації, але нижче ≈22k, звичайний TPDF, ймовірно, краще,
і вище ≈ 37k, мабуть краще шумоподібна.
Команда -a Опція вмикає режим, у якому є дизеринг (і формування шуму, якщо є).
автоматично вмикається лише за потреби. Найімовірніше використання для цього - коли
застосування зникнення або зникнення до вже зміщеного файлу, щоб перезавантажити
стосується лише вицвілих частин. Однак, автоматичний дизерінг не є надійним
слід ретельно перевіряти фейди на наявність будь-якої модуляції шуму; якщо це станеться,
потім або повторно змішуйте весь файл, або використовуйте оздоблення, в'янути, і об’єднати.
Команда -p Опція дозволяє перевизначити цільову точність.
Якщо глобальна опція SoX -R варіант не дається, то псевдовипадкове число
генератор, який використовується для генерації білого шуму, буде `перезасіваний', тобто згенерований
шум буде відрізнятися між викликами.
Цей ефект не повинен супроводжуватися будь-яким іншим ефектом, який впливає на звук.
Дивіться також розділ «Дізеринг» вище.
зменшена вибірка [фактор(2)]
Зменшити дискретизацію сигналу на цілочисельний коефіцієнт: лише перший з кожного фактор
зразки зберігаються, інші викидаються.
Фільтр децимації не застосовується. Якщо вхід не обмежений належним чином
сигналу основної смуги, відбудеться накладення. Це може бути бажаним, наприклад, для частоти
переклад.
Загальний ефект передсемплінгу зі згладжуванням див швидкість, Див. Також підвищена вибірка.
вушка Покращує прослуховування аудіо в навушниках. Додає "підказки" до стереосистеми 44.1 кГц (тобто
формат аудіо CD) аудіо, щоб під час прослуховування в навушниках стереозображення було
переміщено зсередини голови (стандарт для навушників) назовні та перед
слухач (стандарт для ораторів).
нудьгувати виграш виграш <затримка розпад>
Додайте відлуння до аудіо. Ехо є відбитим звуком і може виникати природним чином
серед гір (а іноді і великих будівель) під час розмови чи крику; цифровий
Ехо-ефекти імітують цю поведінку і часто використовуються, щоб допомогти заповнити звук
одного інструменту або вокалу. Різниця в часі між вихідним сигналом
а відбиття - це "затримка" (час) і гучність відбитого сигналу
це "розпад". Кілька відлуння можуть мати різні затримки та загасання.
Кожен даний затримка розпад пара дає затримку в мілісекундах і розпад (відносний
щоб отримати в) цього відлуння. Коефіцієнт підсилення – це обсяг виходу. Наприклад: Це
змусить це звучати так, ніби інструментів вдвічі більше, ніж насправді
гра:
відтворити свинець.aiff echo 0.8 0.88 60 0.4
Якщо затримка дуже коротка, то це звучить як (металевий) робот, який грає музику:
відтворити свинець.aiff echo 0.8 0.88 6 0.4
Довша затримка звучатиме як концерт під відкритим небом у горах:
відтворити свинець.aiff echo 0.8 0.9 1000 0.3
Ще одна гора і:
play lead.aiff echo 0.8 0.9 1000 0.3 1800 0.25
відлуння виграш виграш <затримка розпад>
Додайте послідовність відлуння до аудіо. Кожен затримка розпад пара дає затримку в
мілісекунди та затухання (відносно посилення) цього відлуння. Виграш - це
обсяг випуску.
Як і ефект відлуння, луна означає 'ECHO in Sequel', тобто перше відлуння
приймає вхід, другий вхід і перший відлуння, третій вхід і
перше і друге відлуння, ... і так далі. Слід бути обережними, використовуючи багато
відлуння; одиничний відлуння має той самий ефект, що і одиничний відлуння.
Зразок буде відбити двічі симетричним відлунням:
відтворити lead.aiff echos 0.8 0.7 700 0.25 700 0.3
Зразок буде відбити двічі в асиметричному луні:
відтворити lead.aiff echos 0.8 0.7 700 0.25 900 0.3
Зразок буде звучати так, ніби відтворений у гаражі:
відтворити lead.aiff echos 0.8 0.7 40 0.25 63 0.3
еквалайзер частота[k] ширина[q|o|h|k] коефіцієнт посилення
Застосуйте двополюсний фільтр вирівнювання піків (EQ). За допомогою цього фільтра сигнал-
рівень на вибраній частоті та навколо неї можна збільшити або зменшити, водночас
(на відміну від смугових і смугових фільтрів), що на всіх інших частотах є
незмінний.
частота дає центральну частоту фільтра в Гц, ширина, пропускна здатність і
коефіцієнт посилення необхідне посилення або ослаблення в дБ. Остерігайтеся Відсікання при використанні а
позитивний коефіцієнт посилення.
Щоб створити складні вирівнювальні криві, цьому ефекту можна надати кілька
разів, кожен з різною центральною частотою.
Фільтр детально описано в [1].
Цей ефект підтримує -- сюжет глобальний варіант.
Дивіться також бас та потрійний для відкладення ефектів вирівнювання.
в'янути [тип] згасання в довжині [час зупинки [довжина згасання]]
Застосуйте ефект згасання до початку, кінця або обох аудіо.
Необов’язковий тип можна вказати, щоб вибрати форму кривої згасання: q та цінності
чверть синусоїди, h на половину синусоїди, t для лінійного ("трикутного") схилу,
l для логарифмічних і p для оберненої параболи. За замовчуванням – логарифмічний.
Згасання починається з першого зразка і підвищує рівень сигналу від 0 до повного
обсяг закінчився згасання в довжині секунд. Вкажіть 0 секунд, якщо не потрібно зникнення.
Для загасання звук буде обрізаний на час зупинки і рівень сигналу буде
бути зменшено з повної гучності до 0, починаючи з довжина згасання секунд до
час зупинки. Якщо довжина згасання не вказано, за замовчуванням має те саме значення, що й
згасання в довжині. Згасання не виконується, якщо час зупинки не вказано. Якщо
Довжина файлу може бути визначена з заголовка вхідного файлу та зміни довжини
то ефекти не діють 0 може бути зазначено для час зупинки щоб вказати
звичайний випадок загасання, яке закінчується в кінці вхідного звукового потоку.
Усі часи можна вказати або в періодах часу, або в кількості зразків. Щоб уточнити
періоди часу використовують формат hh:mm:ss.frac. Щоб указати, використовуючи кількість вибірок,
вкажіть кількість зразків і додайте букву `s' до кількості вибірок (для
приклад "8000").
Див. Також сплайсинг ефект
ялина [coefs-файл|коеф]
Використовуйте механізм згортки БПФ SoX із заданими коефіцієнтами FIR-фільтра. Якщо одиночний
дається аргумент, тоді це розглядається як ім’я файлу, що містить фільтр
коефіцієнти (відокремлені пробілами; можуть містити коментарі `#'). Якщо дане
ім'я файлу - `-', або якщо аргумент не вказано, то коефіцієнти читаються з
"стандартний вхід" (stdin); інакше за командою можуть бути задані коефіцієнти
лінія. Приклади:
sox infile outfile fir 0.0195 -0.082 0.234 0.891 -0.145 0.043
sox infile outfile fir coefs.txt
з файлом coefs.txt, що містить
# Фільтр HP
# частота = 10000
1.2311233052619888е-01
-4.4777096106211783e-01
5.1031563346705155е-01
-6.6502926320995331e-02
...
Цей ефект підтримує -- сюжет глобальний варіант.
флегер [затримка глибина кр ширина швидкість формувати фаза інтерп]
Застосуйте ефект фланга до аудіо. Див. [3] для детального опису
фланцевий.
Усі параметри є необов’язковими (справа наліво).
Діапазон дефолт Опис
затримка 0 - 30 0 Базова затримка в мілісекундах.
глибина 0 - 10 2 Додана затримка розгортання в мілісекундах.
кр -95 - 95 0 Відсоток регенерації (відкладено
сигнал зворотного зв'язку).
ширина 0 - 100 71 Відсоток змішаного сигналу із затримкою
з оригіналом.
швидкість 0.1 - 10 0.5 розгорток за секунду (Гц).
формувати sin Swept форма хвилі: синус|трикутник.
фаза 0 - 100 25 Зсув фаз у відсотках розгорнутої хвилі
для багатоканального (наприклад, стерео)
фланець; 0 = 100 = така ж фаза ввімкнена
кожного каналу.
інтерп lin Цифрова інтерполяція лінії затримки:
лінійний|квадратичний.
коефіцієнт посилення [-e|-B|-b|-r] [-n] [-l|-h] [посилення-дБ]
Застосуйте посилення або ослаблення звукового сигналу, або, в деяких випадках, до деяких
своїх каналів. Зверніть увагу, що використання будь-якого з -e, -B, -b, -rабо -n вимагає тимчасового
Файловий простір для зберігання аудіо, що підлягає обробці, тому може бути непридатним для використання
"потокове" аудіо.
Без інших варіантів, посилення-дБ використовується для регулювання рівня потужності сигналу
задана кількість дБ: позитивне посилює (остерігайтеся відсікання), негативне послаблює.
З іншими варіантами, посилення-дБ посилення або ослаблення (логічно) застосовується
після обробки завдяки цим параметрам.
З огляду на -e опції, рівні аудіоканалів багатоканального файлу
`equalised', тобто посилення застосовується до всіх каналів, крім каналу з найвищим
пікового рівня, так що всі канали досягають однакового пікового рівня (але також без
дає -n, звук не "нормалізований").
Команда -B (баланс) варіант схожий на -e, але з -Б, використовується рівень RMS
замість пікового рівня. -B може використовуватися для виправлення стереодисбалансу, викликаного
недосконалий картридж вертушки. Зауважте, що на відміну від -e, -B може викликати деякі
відсікання.
-b аналогічно -B але має захист від відсікання, тобто при необхідності запобігати
відрізання під час балансування, ослаблення застосовується до всіх каналів. Зауважте, однак,
що в поєднанні з -n, -B та -b є синонімами.
Команда -r Параметр використовується разом із попереднім викликом коефіцієнт посилення з -h
варіант - дивіться нижче для деталей.
Команда -n параметр нормалізує звук до 0dB FSD; його часто використовують у поєднанні з
негативний посилення-дБ для того, щоб звук нормалізувався до заданого рівня
нижче 0 дБ. Наприклад,
sox infile вихідний файл посилення -n
нормалізується до 0 дБ, і
sox infile вихідний файл посилення -n -3
нормалізується до -3 дБ.
Команда -l Параметр викликає простий обмежувач, напр
sox infile outfile посилення -l 6
застосовуватиме посилення 6 дБ, але ніколи не кліпує. Зверніть увагу, що обмеження більше ніж на кілька дБ більше
ніж іноді (у фрагменті аудіо) не рекомендується, оскільки це може викликати звук
спотворення. Див компан ефект для більш потужного обмежувача.
Команда -h Опція використовується для застосування коефіцієнта посилення, щоб забезпечити запас для подальшої обробки.
Наприклад, с
sox infile outfile посилення -h бас +6
Ослаблення 6 дБ буде застосовано до ефекту посилення низьких частот, що забезпечує таким чином
що він не обрізається. Звичайно, з басами очевидно, скільки буде простору
але з іншими ефектами (наприклад, швидкість, дизеринг) це не завжди так однозначно.
Ще одна перевага використання коефіцієнт посилення -h а не явне послаблення, це те, що якщо
запас не використовується для подальших ефектів, його можна повернути за допомогою коефіцієнт посилення -r,
Наприклад:
sox infile outfile посилення -h бас +6 швидкість 44100 посилення -r
Наведений вище ланцюжок ефектів гарантує, що ніколи не буде кліпуватися або посилюватися; воно послаблює, якщо
необхідно для запобігання відсіканню, але лише на стільки, скільки необхідно для цього.
Форматування виводу (змішування та зменшення бітової глибини) також вимагає запасу (що
не може бути "повернено"), напр
sox infile outfile посилення -h бас +6 швидкість 44100 посилення -rh дизер
Ось, другий коефіцієнт посилення invocation, відвойовує якомога більшу частину простору
попередні ефекти, але зберігає стільки запасу, скільки необхідно для наступних
обробка. Глобальна опція SoX -G можна надати для автоматичного виклику коефіцієнт посилення -h
та коефіцієнт посилення -r.
Див. Також норма та про ефектів.
високих частот|низький прохід [-1|-2] частота[k] [ширина[q|o|h|k]]
Застосуйте фільтр високих або нижніх частот з точкою 3 дБ частота. Фільтр може бути
або однополюсний (з -1), або двополюсний (за замовчуванням або з -2). ширина
стосується лише двополюсних фільтрів; за замовчуванням Q = 0.707 і дає a
Відповідь Баттерворта. Фільтри спадають на рівні 6 дБ на полюс на октаву (20 дБ на октаву).
полюса за десятиліття). Подвійні фільтри детально описані в [1].
Ці ефекти підтримують -- сюжет глобальний варіант.
Дивіться також синк для фільтрів з більш крутим спуском.
Хілберт [-n крани]
Застосуйте непарний фільтр перетворення Гільберта, зсуваючи сигнал по фазі на 90 градусів.
Це використовується в багатьох схемах матричного кодування та для генерації аналітичного сигналу. The
процес часто записується як множення на i (Або j), уявна одиниця.
Непарний фільтр перетворення Гільберта має смугову характеристику, яка послаблює
найнижча і найвища частоти. Його пропускною здатністю можна керувати кількістю
фільтраційні крани, які можна вказати с -n. За замовчуванням кількість натискань дорівнює
вибрано для частоти зрізу близько 75 Гц.
Цей ефект підтримує -- сюжет глобальний варіант.
ладспа Модулі [підключати] [аргумент...]
Застосуйте плагін LADSPA [5] (Linux Audio Developer's Simple Plugin API). Незважаючи на
Ім'я, LADSPA не є спеціальним для Linux, і доступний широкий спектр ефектів як
плагіни LADSPA, такі як cmt [6] (набір інструментів для комп’ютерної музики) і Steve Harris
колекція плагінів [7]. Перший аргумент - це модуль плагіна, другий - ім'я
плагіна (модуль може містити більше одного плагіна) та будь-які інші аргументи
призначені для контрольних портів плагіна. Відсутні аргументи надаються за замовчуванням
значення, якщо це можливо. Лише плагіни з щонайбільше одним аудіовходом та одним аудіовиходом
порт можна використовувати. Якщо знайдено, змінна середовища LADSPA_PATH буде використана як
шлях пошуку плагінів.
гучність [коефіцієнт посилення [посилання]]
Регулювання гучності - аналогічно коефіцієнт посилення ефект, але забезпечує вирівнювання для
слухова система людини. Побачити http://en.wikipedia.org/wiki/Loudness для детального
опис гучності. Підсилення регулюється заданим коефіцієнт посилення параметр (зазвичай
негативний) і сигнал вирівнюється відповідно до ISO 226 щодо еталонного рівня
65 дБ, хоча альтернатива посилання рівень може бути заданий, якщо вихідний звук має
вирівнюється для іншого оптимального рівня. Підсилення за замовчуванням -10 дБ використовується, якщо a
коефіцієнт посилення значення не надається.
Див. Також коефіцієнт посилення ефект
низький прохід [-1|-2] частота[k] [ширина[q|o|h|k]]
Застосуйте фільтр низьких частот. Дивіться опис високих частот ефект для деталей.
mcompand "атака 1,розпад1{,атака 2,розпад2}
[м'яке коліно-дБ:]в дБ1[,вихід-дБ1]{,в дБ2,вихід-дБ2}
[коефіцієнт посилення [початкова гучність дБ [затримка]]]" {частота кросовера[k] "атака1,..."}
Багатосмуговий компандер схожий на односмуговий компандер, але аудіо є
спочатку розділений на смуги за допомогою перехресних фільтрів Лінквіца-Райлі та окремо
визначений компандер запустити на кожному діапазоні. Див компан ефект для визначення
його параметрів. Параметри Compand вказуються між подвійними лапками та
Частота кросовера для цього діапазону визначається як частота кросовера; це можна повторити
для створення кількох груп.
Наприклад, наступна (одна довга) команда показує, як багатодіапазонне компандування
зазвичай використовується в FM-радіо:
відтворити track1.wav посилення -3 sinc 8000- 29 100 mcompand \
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100 \
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400 \
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600 \
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400 \
"0,0.025 -38,-31,-28,-28,-0,-25" \
посилення 15 highpass 22 highpass 22 sinc -n 255 -b 16 -17500 \
посилення 9 низьких частот -1 17801
Аудіофайл відтворюється із імітованим звуком FM-радіо (або сигналом мовлення
умова, якщо фільтр нижніх частот в кінці пропущено). Зверніть увагу, що трубопровід є
налаштований з попереднім упором 75us у американському стилі.
Дивіться також компан для ефекту односмугового компандування.
шумопроф [профіль-файл]
Обчисліть профіль звуку для використання в шумозаглушенні. Дивіться опис
в зашуміли ефект для деталей.
зашуміли [профіль-файл [кількість]]
Зменшіть шум в аудіосигналі шляхом профілювання та фільтрації. Цей ефект є
помірно ефективний для видалення постійного фонового шуму, такого як шипіння або гул.
Щоб скористатися ним, спочатку запустіть SoX з шумопроф вплив на частину аудіо
в ідеалі містив би тишу, але насправді містить шум - такі розділи є
зазвичай знаходиться на початку або в кінці запису. шумопроф will write
вивести профіль шуму профіль-файл, або до стандартного виведення, якщо ні профіль-файл або якщо `-' є
дано. напр
sox voice.wav -n trim 0 1.5 noiseprof voice.noise-profile
Щоб фактично видалити шум, запустіть SoX ще раз, цього разу за допомогою зашуміли ефект;
зашуміли зменшить шум відповідно до профілю шуму (який був створений
шумопроф), від профіль-файл, або зі стандартного входу, якщо ні профіль-файл або якщо вказано `-'.
Напр
sox language.wav cleaned.wav noisered voice.noise-profile 0.3
Скільки шуму потрібно видалити, вказується кількість-a число від 0 до 1
зі значенням за замовчуванням 0.5. Більш високі цифри знімуть більше шуму, але принесуть більше
ймовірність видалення бажаних компонентів аудіосигналу. Перед заміною an
оригінальний запис із шумозаглушеною версією, експериментуйте з різними кількість
значення, щоб знайти оптимальний для вашого звуку; використовуйте навушники, щоб переконатися, що ви
задоволений результатами, приділяючи особливу увагу тихим ділянкам
аудіо.
У більшості систем два етапи - профілювання та скорочення - можна об'єднати за допомогою a
труба, напр
sox noisy.wav -n trim 0 1 noiseprof | грати noisy.wav noisered
норма [рівень дБ]
Нормалізувати звук. норма є просто псевдонімом для коефіцієнт посилення -n; див коефіцієнт посилення ефект для
подробиці
ой Стерео ефект поза фазою. Змішує стерео в твін-моно, де кожен моно канал
містить різницю між лівим і правим стереоканалами. Це
іноді відомий як "ефект караоке", оскільки він часто видаляє більшість
або весь вокал із запису. Це еквівалентно ремікс 1,2 1,2.
погнати [коефіцієнт посилення(20) [колір(20)]]
Нелінійні спотворення. The колір Параметр контролює кількість парних гармонік
вміст у перезавантаженому виводі.
майданчик { [@положення]}
Доповнюйте аудіо тишею, на початку, в кінці або будь-якими вказаними пунктами
через аудіо. Обидва та положення можна вказати час або, якщо додано
з `s', кількість зразків. – кількість тиші для вставки та
положення положення у вхідному аудіопотоці, в яке його потрібно вставити. Будь-яке число
довжин і положень можна вказати за умови, що вказане положення є
не менше попереднього. положення є необов'язковим для першого та останнього
зазначені довжини та, якщо їх пропущено, відповідають початку та кінця
аудіо відповідно. Наприклад, майданчик 1.5 1.5 додає 1.5 секунди тиші
на кожному кінці аудіо, в той час як майданчик 4000s@3:00 вставляє 4000 зразків тиші 3
хвилин після аудіо. Якщо тиша потрібна лише в кінці аудіо, вкажіть
або кінцеву позицію, або вкажіть панель нульової довжини на початку.
Дивіться також затримка для ефекту, який може додати тишу на початку аудіо
поканал за каналом.
фазер виграш виграш затримка розпад швидкість [-s|-t]
Додайте ефект фазування до аудіо. Див. [3] для детального опису фазування.
затримка/розпад/швидкість дає затримку в мілісекундах і затухання (відносно посилення-
в) зі швидкістю модуляції в Гц. Модуляція є або синусоїдною (-s) -
краще для кількох інструментів, або трикутні (-t) - дає поодинокі інструменти
більш різкий ефект фази. Розпад має бути менше 0.5, щоб уникнути зворотного зв'язку, і
зазвичай не менше 0.1. Коефіцієнт підсилення – це обсяг виходу.
Наприклад:
грати в snare.flac phaser 0.8 0.74 3 0.4 0.5 -t
ніжніше:
грати в snare.flac phaser 0.9 0.85 4 0.23 1.3 -s
Популярний звук:
грати в snare.flac phaser 0.89 0.85 1 0.24 2 -t
Більш серйозні:
грати в snare.flac phaser 0.6 0.66 3 0.6 2 -t
крок [-q] зсув [сегмент [пошук [перекриття]]]
Змініть висоту звуку (але не темп).
зсув надає зсув висоти як додатні або негативні "центи" (тобто 100-х а
півтон). Див темп ефект для опису інших параметрів.
Див. Також згинатися, швидкість та темп ефектів.
швидкість [-q|-l|-m|-h|-v] [опції перевизначення] РЕЙТИНГ[k]
Змініть частоту дискретизації звуку (тобто повторіть вибірку аудіо) на будь-яку задану РЕЙТИНГ (навіть
неціле число, якщо це підтримується форматом вихідного файлу) з використанням рівня якості
визначається наступним чином:
Якість Смуга- Rej dB типовий Скористайтесь
ширина
-q швидко н/д ≈30 @ відтворення увімкнено
Fs/4 старовинне обладнання
-l низький 80% 100 відтворення на старій
апаратні засоби
-m середній 95% 100 відтворення аудіо
-h високий 95% 125 16-бітове мастеринг
(використовуйте з дитером)
-v дуже високий 95% 175 24-розрядне мастеринг
де Ширина смуги – відсоток збереженого діапазону звукових частот
та Rej dB це рівень шумозаглушення. Підвищення рівня повторної вибірки
якість забезпечується за рахунок збільшення часу на обробку аудіо. Якщо
не надано параметр якості, рівень якості використовується «високий» (але див. «Гра та
Запис аудіо» вище щодо відтворення).
Алгоритм "швидкого" використовує кубічну інтерполяцію; всі інші використовують обмежений діапазон
інтерполяція. За замовчуванням всі алгоритми мають "лінійну" фазову характеристику; для
«середній», «високий» і «дуже високий», фазова характеристика налаштовується (див. нижче).
Команда швидкість ефект викликається автоматично, якщо SoX -r параметр визначає ставку, яка
відрізняється від вхідних файлів. Як варіант, якщо цей ефект надається
явно, потім SoX -r опцію надавати не потрібно. Наприклад, наступні два
команди еквівалентні:
sox input.wav -r 48k output.wav bass -b 24
sox input.wav output.wav bass -b 24 rate 48k
хоча друга команда є більш гнучкою, наскільки це дозволяє швидкість можливі варіанти,
і дозволяє ефектам упорядковуватися довільно.
* * *
Попередження: технічно детальне обговорення нижче.
Простий вибір якості, описаний вище, забезпечує налаштування, які задовольняють
потреби переважної більшості завдань повторної вибірки. Однак іноді це може бути
бажано точно налаштувати відгук фільтра ресемплера; цього можна досягти за допомогою
перевизначення опції, як детально описано в наступній таблиці:
-М/-І/-Л Фазова характеристика = мінімальна/середня/лінійна
-s Крутий фільтр (ширина смуги = 99%)
-a Дозволити псевдонім/зображення над смугою пропускання
-b 74-99.7 Будь-яка пропускна здатність %
-p 0-100 Будь-яка фазова характеристика (0 = мінімум, 25 = проміжний,
50 = лінійний, 100 = максимум)
Зверніть увагу, що параметри Override не можна використовувати з алгоритмами «швидкого» або «низького» якості.
Усі ресемплери використовують фільтри, які іноді можуть створювати "відлуння" (він же "дзвінок")
артефакти з тимчасовими сигналами, як-от ті, що виникають при «клацанні пальцями» або
інші дуже ударні звуки. Такі артефакти набагато помітніше
людського вуха, якщо вони виникають до перехідного процесу («попереднього відлуння»), ніж якщо вони виникають після
це (`після ехо'). Зауважте, що частота будь-яких таких артефактів пов’язана з
менша від початкової та нової частоти вибірки, але це принаймні
44.1 кГц, то артефакти будуть лежати за межами діапазону людського слуху.
Налаштування фазової характеристики можна використовувати для керування розподілом будь-яких перехідних процесів
луна між `pre' та `post': з мінімальною фазою немає попереднього відлуння, крім
найдовший постехо; з лінійною фазою попередній і постехосигнал в рівних кількостях (в
терміни сигналу, але не терміни чутності); налаштування проміжної фази намагається
знайдіть найкращий компроміс, вибравши невелику довжину (і рівень) попереднього відлуння та a
середньої тривалості постехо.
Мінімальна, проміжна або лінійна фазова характеристика вибирається за допомогою -M, -Iабо -L
варіант; користувальницьку фазову відповідь можна створити за допомогою -p варіант. Зверніть увагу на цю фазу
відповіді між "лінійним" і "максимальним" (більше 50) рідко корисні.
Налаштування пропускної здатності ресемплера визначає, яка частина частотного вмісту
вихідний сигнал (що стосується початкової частоти дискретизації при підвищенні дискретизації, або нового
частота дискретизації при зменшенні дискретизації) зберігається під час перетворення. Термін `пройти-
band' використовується для позначення всіх частот до точки ширини смуги (наприклад, для
Частота дискретизації 44.1 кГц і ширина смуги повторної дискретизації 95%, смуга пропускання представляє
частоти від 0 Гц (DC) до приблизно 21 кГц). Збільшення пропускної здатності ресемплера
призводить до уповільнення перетворення і може збільшити тимчасові артефакти відлуння (і пороки
навпаки).
Команда -s Параметр «крутий фільтр» змінює ширину смуги повторної дискретизації з 95% за замовчуванням
(на основі точки 3 дБ) до 99%. The -b Опція дозволяє встановити пропускну здатність
будь-яке значення в діапазоні 74-99.7 %, але зверніть увагу, що значення пропускної здатності більше 99 %
не рекомендуються для нормального використання, оскільки вони можуть викликати надмірне перехідне ехо.
Якщо -a задано параметр, тоді дозволено псевдонім/зображення над смугою пропускання.
Наприклад, з частотою дискретизації 44.1 кГц і шириною смуги повторної дискретизації 95%, це
означає, що частотний вміст вище 21 кГц може бути спотворений; однак, оскільки це є
вище смуги пропускання (тобто вище найвищої частоти інтересу/чутності),
це може не бути проблемою. Переваги дозволу псевдонімів/зображень зменшуються
час обробки та зменшено (майже вдвічі) перехідні артефакти відлуння. Зауважте, що
якщо дана ця опція, то мінімальна допустима пропускна здатність с -b збільшується до
85%.
Приклади:
sox input.wav -b 16 output.wav rate -s -a 44100 dither -s
за замовчуванням (висока) якість повторної вибірки; перевизначає: крутий фільтр, дозволити псевдонім; до
частота дискретизації 44.1 кГц; шум у формі шуму до 16-бітного файлу WAV.
sox input.wav -b 24 output.aiff rate -v -I -b 90 48k
дуже якісна повторна вибірка; перевизначає: проміжна фаза, пропускна здатність 90%; до 48 тис
частота вибірки; зберегти вихід у 24-розрядний файл AIFF.
* * *
Команда крок та швидкість ефекти використовують швидкість ефект в їх основі.
ремікс [-a|-m|-p]поза спец>
поза спец = в спец{,в спец} | 0
в спец = [ін-чан][-[в-чан2]][том-спец]
том-спец = p|i|v[обсяг]
Виберіть та змішайте вхідні аудіоканали з вихідними аудіоканалами. Кожен вихід
канал задається, у свою чергу, заданим поза спец: список вкладених даних
канали та характеристики гучності.
Зауважте, що цей ефект діє на аудіо канали в рамках ефектів SoX
ланцюжок обробки; його не слід плутати з -m глобальний варіант (де
множинний файли змішуються перед входом в ланцюжок ефектів).
An поза спец містить розділені комами вхідні номери каналів і розділені дефісом
діапазони номерів каналів; як альтернатива, 0 можна надати для створення безшумного виходу
канал. Наприклад,
sox input.wav output.wav ремікс 6 7 8 0
створює вихідний файл із чотирма каналами, де канали 1, 2 і 3 є копіями
канали 6, 7 і 8 у вхідному файлі, а канал 4 беззвучний. Тоді як
sox input.wav output.wav ремікс 1-3,7 3
створює (дещо дивний) вихідний стереофайл, де лівий канал є мікс-
внизу вхідних каналів 1, 2, 3 і 7, а правий канал є копією входу
канал 3.
Якщо вказано діапазон каналів, номери каналів ліворуч і праворуч
дефіса є необов'язковими та за замовчуванням на 1 та кількість вхідних каналів
відповідно. Таким чином
sox input.wav output.wav ремікс -
виконує зведення всіх вхідних каналів в моно.
За замовчуванням, коли вихідний канал змішується з кількох (n) вхідних каналів, кожен
вхідний канал буде масштабуватися з коефіцієнтом ¹/n. Можна налаштувати індивідуальні об’єми змішування
слідуючи заданому вхідному каналу або діапазону вхідних каналів за допомогою a том-спец
(специфікація обсягу). Це один із листів p, iабо v, А потім
номер тому, значення якого залежить від заданої букви і визначається як
наступним чином:
лист Об'єм номер примітки
p регулювання потужності в дБ 0 = без змін
i регулюйте потужність в дБ Як `p', але інвертуйте значення
аудіо
v множник напруги 1 = без змін, 0.5 ≈ 6 дБ
загасання, 2 ≈ 6 дБ
посилення, -1 = інвертувати
Якщо поза спец включає принаймні один том-спец тоді за замовчуванням масштабування ¹/n не є
застосовується до будь-яких інших каналів у тій самій специфікації (хоча може бути в інших поза-
специфікації). Однак можна вказати параметр -a (автоматичний), щоб зберегти автоматичне
масштабування в цьому випадку. Наприклад,
sox input.wav output.wav remix 1,2 3,4v0.8
призводить до множників рівня каналу 0.5,0.5 1,0.8, тоді як
sox input.wav output.wav remix -a 1,2 3,4v0.8
призводить до множників рівня каналу 0.5,0.5 0.5,0.8.
Опція -m (ручна) вимикає всі автоматичні налаштування гучності, тому
sox input.wav output.wav remix -m 1,2 3,4v0.8
призводить до множників рівня каналу 1,1 1,0.8.
Номер тому необов'язковий, і його пропуск означає відсутність зміни гучності;
однак, єдиний випадок, у якому це корисно, - це поєднання з i. Форум
приклад, якщо input.wav то стерео
sox input.wav output.wav remix 1,2i
є моноеквівалентом ой ефект
Якщо -p задано параметр, тоді будь-яке автоматичне масштабування ¹/n замінюється на ¹/√n
(`потужність') масштабування; це дає більш гучний мікс, але такий, який іноді може зриватися.
* * *
Одне використання ремікс ефект полягає в тому, щоб розділити аудіофайл на набір файлів, кожен
містить один із складових каналів (для виконання наступних
обробка на окремих аудіоканалах). Де є більше ніж кілька каналів
залучений сценарій, наприклад наступний (сценарій оболонки Борна):
#!/ Бен / ш
chans=`soxi -c "$1"`
while [ $chans -ge 1 ]; робити
chans0=`printf %02i $chans` # 2 цифри, отже, до 99 каналів
out=`echo "$1"|sed "s/\(.*\)\.\(.*\)/\1-$chans0.\2/"`
sox "$1" "$out" ремікс $chans
chans=`вираз $chans - 1`
зроблений
Якщо файл input.wav містить шість аудіоканалів, сценарій би
створити шість вихідних файлів: вхід-01.wav, вхід-02.wav, ..., вхід-06.wav.
Див. Також обмін ефект
повторювати [вважати (1)]
Повторіть весь звук вважати разів, або один раз якщо вважати не дається. Вимагає
тимчасовий файловий простір для зберігання аудіо для повторення. Зверніть увагу, що повторюється один раз
дає дві копії: оригінальний аудіо та повторений аудіо.
реверберація [-w|--тільки вологий] [реверберація (50%) [ВЧ-загасання %)
[кімнатного масштабу (100%) [стерео-глибина %)
[попередня затримка (0 мс) [мокрий приріст (0 дБ)]]]]]]
Додайте реверберацію до аудіо за допомогою алгоритму `freeverb'. Реверберація
ефект іноді бажаний для концертних залів, які занадто малі або містять таке
багато людей, що природна реверберація залу зменшується. Застосування невеликого
кількість стерео реверберації до (сухого) моносигналу зазвичай робить його більш сильним
природний. Див. [3] для детального опису реверберації.
Зауважте, що цей ефект збільшує як гучність, так і тривалість аудіо
запобігання відсіканню в цих доменах, типовим викликом може бути:
грати dry.wav gain -3 pad 0 3 reverb
Команда -w можна дати можливість вибрати тільки «мокрий» сигнал, таким чином дозволяючи йому бути
обробляється далі, незалежно від «сухого» сигналу. напр
play -m voice.wav "|sox voice.wav -p reverse reverb -w reverse"
для ефекту зворотної реверберації.
зворотний
Повністю поверніть аудіо. Потрібен тимчасовий файловий простір для зберігання аудіо
бути зворотним.
riaa Застосуйте вирівнювання відтворення вінілу RIAA. Частота вибірки повинна бути однією з: 44.1,
48, 88.2, 96 кГц.
Цей ефект підтримує -- сюжет глобальний варіант.
мовчання [-l] понад періоди [тривалість поріг[d|%]
[нижчі періоди тривалість поріг[d|%]]
Усуває тишу на початку, середині або кінці аудіо. "Мовчання" - це
визначається визначеним порогом.
Команда понад періоди значення використовується, щоб вказати, чи потрібно обрізати звук на
початок аудіо. Значення, рівне нулю, означає, що тишу не потрібно обрізати
початок. При вказівці відмінного від нуля понад періоди, він обрізає звук до тих пір, поки
воно знаходить безмовчання. Зазвичай при обрізанні тиші від початку звуку
понад періоди буде 1, але його можна збільшити до вищих значень, щоб обрізати весь звук
до певної кількості періодів без тиші. Наприклад, якщо у вас був аудіо
файл із двома піснями, кожна з яких містила 2 секунди тиші перед піснею, you
міг би вказати понад період з 2, щоб видалити обидва періоди мовчання та перший
пісня.
Коли понад періоди не дорівнює нулю, ви також повинні вказати a тривалість та поріг.
Тривалість вказує проміжок часу, протягом якого перед цим має бути виявлено відсутність тиші
зупиняє обрізку звуку. Збільшуючи тривалість, сплеск шуму можна розглядати як
тиша і обрізана.
поріг використовується, щоб вказати, яке значення вибірки слід розглядати як мовчання. Для
цифрового аудіо, значення 0 може бути хорошим, але для аудіо, записаного з аналогового, можна
бажаєте збільшити значення для врахування фонового шуму.
Якщо за бажанням обрізати тишу з кінця аудіо, ви вказуєте a внизу-
періодів рахувати. В цьому випадку, нижче періоду означає видалити всі звуки після мовчання
виявляється. Зазвичай це буде значення 1, але його можна збільшити, щоб пропустити
протягом періодів мовчання, які потрібні. Наприклад, якщо у вас є пісня з 2
секунди тиші в середині і 2 секунди в кінці, ви можете встановити нижче-
з крапкою до значення 2, щоб пропустити тишу в середині аудіо.
для нижчі періоди, тривалість визначає період тиші, який повинен існувати раніше
аудіо більше не копіюється. Вказавши більшу тривалість, тобто тиша
шуканий можна залишити в аудіо. Наприклад, якщо у вас є пісня з очікуваним
1 секунда тиші в середині і 2 секунди тиші в кінці, тривалість
2 секунди можна використати, щоб пропустити середню тишу.
На жаль, ви повинні знати тривалість тиші в кінці вашого аудіо
файл, щоб надійно обрізати тишу. Обхідним є використання мовчання ефект в
поєднання з зворотний ефект. Спершу перевернувши аудіо, ви можете використовувати
понад періоди щоб надійно обрізати весь звук з того, що виглядає як передня частина
файл. Потім знову поверніть файл, щоб повернутися до нормального режиму.
Щоб видалити мовчання в середині файлу, вкажіть a нижчі періоди тобто
негативний. Це значення потім розглядається як позитивне значення і також використовується
вказує, що ефект має перезапустити обробку, як зазначено в понад періоди,
що робить його придатним для усунення періодів тиші в середині аудіо.
Опція -l вказує на це нижчі періоди тривалість довжину аудіо слід залишити
неушкодженим на початку кожного періоду тиші. Наприклад, якщо ви хочете
видаліть довгі паузи між словами, але не хочете повністю видаляти паузи.
Команда period підрахунок в одиницях зразків. Тривалість підрахунки можуть бути у форматі
hh:mm:ss.frac або точна кількість зразків. поріг цифри можуть мати суфікс
з d щоб вказати значення в децибелах, або % щоб вказати відсоток
максимальне значення вибіркового значення (0% визначає чисту цифрову тишу).
Наступний приклад показує, як цей ефект можна використовувати для початку запису
не містить затримки на початку, яка зазвичай виникає між натисканням кнопки
кнопка запису» і початок виступу:
запис параметри ім'я файлу інші ефекти тиша 1 5 2%
синк [-a att|-b бета] [-p фаза|-M|-I|-L] [-t відливати|-n крани] [freqHP][-freqLP [-t tbw|-n
крани]]
Застосувати фільтр низьких частот, високочастотних, смугових або смугових фільтрів із вікном Sinc Kaiser
на сигнал. The freqHP та freqLP параметри дають частоти 6 дБ
точки фільтра високих і нижніх частот, які можуть бути викликані окремо, або
разом. Якщо дано обидва, то freqHP менше freqLP створює смуговий пропуск
фільтр, freqHP більше freqLP створює смуговий фільтр відхилення. Наприклад,
виклики
від 3 тис
sinc -4к
від 3 до 4 тис
від 4 до 3 тис
створити фільтр високих, нижньочастотних, смугових і смугових фільтрів відповідно.
За замовчуванням можна змінити загасання смуги зупинки в 120 дБ -a;
як альтернатива, параметр `beta' вікна кайзера можна задати безпосередньо за допомогою -b.
Ширина смуги переходу за замовчуванням 5% від загальної смуги може бути змінена за допомогою -t
(І відливати в герцах); як альтернатива, кількість фільтруючих кранів можна вказати безпосередньо
з -n.
Якщо обоє freqHP та freqLP дано, то а -t or -n надано зліва від
частоти застосовуються до обох частот; один з цих варіантів надається
право на частоти стосується лише freqLP.
Команда -p, -M, -I та -L параметри керують фазовою характеристикою фільтра; див швидкість
ефект для деталей.
Цей ефект підтримує -- сюжет глобальний варіант.
спектрограма [опції]
Створити спектрограму аудіо; аудіо передається незміненим через SoX
ланцюг обробки. Цей ефект необов'язковий - тип соску --допомога і перевірте список
підтримувані ефекти, щоб перевірити, чи було воно включено.
Спектрограма відображається у файлі Portable Network Graphic (PNG) і відображається
час по осі X, частота по осі Y і величина звукового сигналу по Z-
вісь. Значення осі Z представлені кольором (або, за бажанням, інтенсивністю).
пікселів у площині XY. Якщо аудіосигнал містить кілька каналів, тоді
вони показані зверху вниз, починаючи з каналу 1 (який є лівим
канал для стереоаудіо).
Наприклад, якщо `my.wav' є стереофайлом, то with
sox my.wav -n спектрограма
спектрограма всього файлу буде створена у файлі `spectrogram.png'.
Однак частіше потрібен аналіз меншої частини аудіо; наприклад
з
sox my.wav -n remix 2 trim 20 30 спектрограма
спектрограма показує інформацію тільки з другого (правого) каналу, і з
тридцять секунд аудіо, починаючи з двадцяти секунд в. Для аналізу невеликого
частина частотної області, швидкість можна використовувати ефект, напр
sox my.wav -n rate 6k спектрограма
дозволяє детально аналізувати частоти до 3 кГц (половина частоти дискретизації), тобто
де слухова система людини найбільш чутлива. З
sox my.wav -n trim 0 10 спектрограма -x 600 -y 200 -z 100
наведені параметри контролюють розмір осей X, Y і Z спектрограми (у цьому
У випадку, область спектрограми створеного зображення буде мати розмір 600 на 200 пікселів
а діапазон осі Z становитиме 100 дБ). Зверніть увагу, що створене зображення містить осі
легенди тощо, і тому буде трохи більше, ніж зазначений розмір спектрограми.
У цьому прикладі:
sox -n -n синтезатор 6 tri 10k:14k спектрограма -z 100 -w kaiser
для найкращого відображення вибирається "вікно" аналізу з високим динамічним діапазоном
спектрограма розгорнутої трикутної хвилі. Для схожого прикладу додайте наступне
до команди `chime' в описі затримка ефект (вище):
швидкість 2k спектрограма -X 200 -Z -10 -w kaiser
Також доступні параметри для керування зовнішнім виглядом (набір кольорів, яскравість,
контраст тощо) та ім'я файлу спектрограми; наприклад з
sox my.wav -n спектрограма -m -l -o print.png
створюється спектрограма, придатна для друку на «чорно-білому» принтері.
варіанти:
-x Num Змініть (максимальну) ширину (вісь X) спектрограми зі стандартної
значення 800 пікселів до заданого числа від 100 до 200000. Див. також -X
та -d.
-X Num пікселів по осі X/секунду; за замовчуванням автоматично розраховується відповідно до заданого або
відома тривалість звуку до розміру осі X або 100 в іншому випадку. Якщо дати
поєднання з -d, цей параметр впливає на ширину спектрограми;
інакше це впливає на тривалість спектрограми. Num може бути від 1
(низька роздільна здатність за часом) до 5000 (висока роздільна здатність за часом) і не обов’язково має бути
ціле число. SoX може внести невелику корекцію до заданого числа для
обробка причин квантування; якщо так, SoX повідомить фактичну кількість
використовується (доступно для перегляду, коли параметр SoX global -V діє). Дивись також -x та
-d.
-y Num Встановлює розмір осі Y в пікселях (на канал); це кількість
частотні "біни", що використовуються в аналізі Фур'є, який створює спектрограму.
Примітка: створення спектрограми може бути повільним, якщо це число не одне
більше, ніж у степені двійки (наприклад, 129). За замовчуванням вибирається розмір осі Y
автоматично (залежно від кількості каналів). Побачити -Y для альтернативи
спосіб встановлення висоти спектрограми.
-Y Num Встановлює цільову загальну висоту спектрограми. Значення за замовчуванням
550 пікселів. Використовуючи цю опцію (і за замовчуванням), SoX вибере висоту
для окремих каналів спектрограми це на один більше, ніж ступінь двох, т
фактична загальна висота може бути меншою за вказане число. Однак там
також мінімальна висота на канал, тому якщо каналів багато,
кількість може бути перевищена. Побачити -y для альтернативного способу встановлення спектрограми
висота.
-z Num Діапазон (колір) осі Z в дБ, за замовчуванням 120. Це встановлює динамічний діапазон
спектрограма повинна бути -Num dBFS до 0 dBFS. В може коливатися від 20 до 180.
Зменшення динамічного діапазону ефективно збільшує "контрастність".
відображення спектрограми, і навпаки.
-Z Num Встановлює верхню межу осі Z в dBFS. Негативний Num фактично
збільшує «яскравість» відображення спектрограми, і навпаки.
-q Num Встановлює квантування по осі Z, тобто кількість різних кольорів (або
інтенсивності), у якому відображаються значення осі Z. Невелике число (наприклад, 4) буде
дають ефект, схожий на "плакат", що полегшує розпізнавання діапазонів величин
схожий рівень. Малі числа також зазвичай призводять до невеликих файлів PNG. The
дане число визначає кількість кольорів для використання всередині діапазону осі Z;
два кольори зарезервовано для представлення значень за межами діапазону.
-w ім'я
Вікно: Hann (за замовчуванням), Hamming, Bartlett, Rectangular або Kaiser. The
спектрограма створюється за допомогою дискретного перетворення Фур'є (DFT)
алгоритм. Важливим параметром цього алгоритму є вибір
`віконна функція'. За замовчуванням SoX використовує вікно Hann, яке має гарні всі-
круглі властивості частотної роздільної здатності та динамічного діапазону. На краще
роздільна здатність по частоті (але менший динамічний діапазон), виберіть вікно Хеммінга; для
вищий динамічний діапазон (але гірша роздільна здатність за частотою), виберіть Kaiser
вікно. Також доступні вікна Bartlett і прямокутні.
-W Num Параметр коригування вікна. Це можна використовувати для внесення невеликих коректив
Форма вікна Кайзера. Додатне число (до десяти) збільшує його
динамічний діапазон, від'ємне число зменшує його.
-s Дозволити м’яке перекриття вікон DFT. Це може в деяких випадках збільшитися
чіткість зображення та забезпечують кращу прихильність до -x значення, але на
за рахунок невеликих спектральних втрат.
-m Створює монохромну спектрограму (за замовчуванням – кольорова).
-h Вибирає палітру високих кольорів – менш приємну візуально, ніж стандартна
колірну палітру, але це може полегшити розрізнення різних рівнів.
Якщо цей параметр використовується разом із -m, в результаті вийде гібрид
монохромна / кольорова палітра.
-p Num Переставте кольори в кольорову або гібридну палітру. The Num параметр, від
1 (за замовчуванням) до 6, вибирає перестановку.
-l Створює «принтерну» спектрограму зі світлим фоном (
за замовчуванням має темний фон).
-a Придушити відображення осьових ліній. Це іноді корисно для допомоги
розпізнати артефакти на краях спектрограми.
-r Сирова спектрограма: придушення відображення осей і легенд.
-A Вибирає альтернативний, фіксований набір кольорів. Це передбачено лише для
сумісність зі спектрограмами, створеними іншим пакетом. Це не повинно
зазвичай використовується, оскільки у нього є деякі проблеми, не в останню чергу, відсутність
диференціювання на нижньому кінці, що призводить до маскування низького рівня
артефакти.
-t текст
Встановіть назву зображення - текст для відображення над спектрограмою.
-c текст
Встановіть (або очистіть) коментар до зображення – текст для відображення нижче та ліворуч
спектрограма.
-o текст
Назва вихідного PNG-файлу спектрограми, за замовчуванням `spectrogram.png'.
Розширений варіанти:
Щоб обробити меншу частину аудіо, не впливаючи на інші ефекти або
вихідний сигнал (на відміну від того, коли оздоблення використовується ефект), можливі наступні параметри
бути використаним.
-d тривалість
Цей параметр встановлює роздільну здатність осі X таким чином, щоб звук із заданим
тривалість ([[HH:]MM:]SS) відповідає вибраній (або за замовчуванням) ширині осі X. Для
наприклад,
sox input.mp3 output.wav -n спектрограма -d 1:00 stats
створює спектрограму, що показує першу хвилину аудіо, в той час як
статистика ефект застосовується до всього звукового сигналу.
Дивіться також -X для альтернативного способу встановлення роздільної здатності осі X.
-S час
Почніть спектрограму в заданій точці аудіопотоку. Наприклад
sox input.aiff output.wav спектрограма -S 1:00
створює спектрограму, яка показує всі звуки, крім першої хвилини (
вихідний файл, однак, отримує весь аудіопотік).
Про можливість виконання офлайн-обробки спектральних даних див stat
ефект
швидкість фактор[c]
Налаштуйте швидкість аудіо (висоту і темп разом). фактор є або співвідношенням
нова швидкість до старої: більше 1 прискорює, менше 1 сповільнює,
або, якщо додається літера `c', кількість центів (тобто 100
півтону), на який слід регулювати висоту звуку (і темп): більше 0
збільшується, менше 0 зменшується.
Технічно ефект швидкості змінює лише інформацію про частоту дискретизації, залишаючи значення
самі зразки недоторкані. The швидкість ефект викликається автоматично для повторного вибірки
до вихідної частоти дискретизації, використовуючи якість/швидкість за замовчуванням. Для більш високої якості або
вища швидкість передискретизації, на додаток до швидкість ефект, вкажіть швидкість ефект
з потрібним варіантом якості.
Див. Також згинатися, крок та темп ефектів.
сплайсинг [-h|-t|-q] { положення[,надлишок[,свобода дії]] }
З’єднайте аудіосекції. Цей ефект забезпечує дві речі над простим звуком
конкатенація: (зазвичай коротке) перехресне зникнення застосовується на з’єднанні та хвиля
Порівняння схожості зроблено, щоб допомогти визначити найкраще місце для створення
приєднуйтесь.
Один із варіантів -h, -tабо -q можна надати, щоб вибрати огинаючу згасання як половину
косинусна хвиля (за замовчуванням), трикутна (він же лінійна) або чверть-косинусальна хвиля
відповідно.
тип аудіо Вицвітати рівень Переходи
t корельований постійний посилення різко
h корельований постійний посилення плавний
q некорельована постійна потужність гладка
Щоб виконати зрощення, спочатку скористайтеся оздоблення ефект, щоб вибрати аудіо-секції
об'єдналися. Як і при виконанні стрічкового зрощення, кінець розрізу бути
зрощені на слід обрізати невеликою надлишок (за замовчуванням 0.005 секунди) аудіо
після ідеальної точки з'єднання. Початок аудіо-секції для з’єднання
слід обрізати тим же надлишок (перед ідеальною точкою з'єднання), плюс an
додатковий свобода дії (за замовчуванням 0.005 секунди). Тоді SoX слід викликати з двома
аудіо розділи як вхідні файли та сплайсинг ефект надається з позицією at
який потрібно виконати зрощення - це довжина першого аудіосекції (в т.ч
надлишок).
На наступній схемі використовується аналогія стрічки для ілюстрації операції зрощування.
Ефект імітує діагональні розрізи та з’єднує дві частини:
довжина1 надлишок
-----------><--->
_________ : : ________________
\ : : :\ `
\ : : : \ `
\: : : \ `
* : : * - - *
\ : : :\ `
\ : : : \ `
_______________\::: \_____`____
::::
<---> <----->
зайва свобода дій
де * позначає точки з'єднання.
Наприклад, довга пісня починається з двох куплетів, які починаються (як визначено, наприклад,
використання грати з командою оздоблення (старт) ефект) на часах 0:30.125 і
1:03.432. Наступні команди вирізають перший куплет:
sox too-long.wav part1.wav trim 0 30.130
(перевищення 5 мс, після початку першого куплета)
sox too-long.wav part2.wav trim 1:03.422
(5 мс перевищення плюс 5 мс свободи перед початком другого куплета)
sox part1.wav part2.wav just-right.wav splice 30.130
Для іншого прикладу, команда SoX
грати "|sox -n -p synth 1 sin %1" "|sox -n -p synth 1 sin %3"
генерує та відтворює дві ноти, але при переході відбувається неприємне клацання; в
клацання можна видалити шляхом зрощення замість об’єднання аудіо, тобто шляхом
додавання сплайсинг 1 до команди. (Натискання на початку та в кінці аудіо
можна видалити за допомогою попередній ефект зрощення с в'янути q . 01 2 . 01).
За умови, що ваша арифметика досить хороша, можна виконати кілька зрощень за допомогою a
один сплайсинг інвокація. Наприклад:
#!/ Бен / ш
# Скопіюйте аудіо та вставте
# acpo infile копіювати-почати копіювати-зупинити вставити-почати вихідний файл
# Усі часи виміряні у зразках.
rate=`soxi -r "$1"`
e=`expr $rate '*' 5 / 1000` # Використання перевищення за замовчуванням
l=$e # і свобода дії.
sox "$1" piece.wav trim `expr $2 - $e - $l`s \
`вираз $3 - $2 + $e + $l + $e`s
sox "$1" part1.wav обрізати 0 `expr $4 + $e`s
sox "$1" part2.wav trim `expr $4 + $3 - $2 - $e - $l`s
sox part1.wav piece.wav part2.wav "$5" зрощення \
`вираз $4 + $e`s \
`вираз $4 + $e + $3 - $2 + $e + $l + $e`s
У наведеному вище сценарії оболонки Борна два зрощення використовуються для «копіювання та вставки» аудіо.
* * *
Цей ефект також можна використовувати для виконання загальних перехресних затухань, наприклад для приєднання
дві пісні. В цьому випадку, надлишок зазвичай становить кількість секунд, -q
як правило, буде надано опцію (щоб вибрати перехресне загасання рівної потужності), і свобода дії
має бути нульовим (що є за замовчуванням if -q надається). Наприклад, якщо f1.wav і
f2.wav – це аудіофайли, які потрібно перехресно згасати
sox f1.wav f2.wav out.wav splice -q $(soxi -D f1.wav),3
перехресне згасання файлів, де точка рівної гучності знаходиться за 3 секунди до кінця
f1.wav, тобто загальна тривалість перехресного згасання становить 2 × 3 = 6 секунд (Примітка:
$(...) позначення – оболонка POSIX).
stat [-s масштаб] [-середньоквадратичне значення] [-частота] [-v] [-d]
Відображати статистичну інформацію про час і частоту про аудіо. Аудіо
передається незміненим через ланцюжок обробки SoX.
Інформація виводиться в потік "стандартних помилок" (stderr) і є
розраховано, де n це тривалість аудіо в семплях, c - це кількість
аудіо канали, r – частота дискретизації звуку, і xk представляє значення PCM (у
діапазон від -1 до +1 за замовчуванням) кожного наступного зразка в аудіо, як показано нижче:
зразки зчитування n×c
довжина (секунд) n÷r
Масштабований by Дивіться -s нижче.
Максимальний амплітуда макс(xk) Максимальне значення вибірки
в аудіо; зазвичай
це буде позитивом
номер.
мінімальний амплітуда хв(xk) Мінімальне значення вибірки
в аудіо; зазвичай
це буде негативом
номер.
Середня лінія амплітуда ½ хв (xk)+½макс(xk)
Середня норма ¹/nΣ│xk│ Середнє значення
абсолютне значення кожного
зразок в аудіо.
Середня амплітуда ¹/nΣxk Середнє значення кожного
зразок в аудіо. Якщо
ця цифра не дорівнює нулю,
тоді це вказує на
наявність DC
зміщення (що може бути
видалено за допомогою
dcshift ефект).
RMS амплітуда √(¹/nΣxk²) Рівень постійного струму
сигнал, що б
таку ж потужність, що і
середня потужність звуку.
Максимальний дельта макс(│xk-xk-1│)
мінімальний дельта хв (│xk-xk-1│)
Середня дельта ¹/n-1Σ│xk-xk-1│
RMS дельта √(¹/n-1Σ(xk-xk-1)²)
Грубий частота У Гц.
Об'єм Регулювання Параметр до про
ефект, який би зробив
звук настільки ж гучний, як
можна без
відсікання. Примітка: див
обговорення на Відсікання
вище з причин, чому це
рідко є хорошою ідеєю
насправді зробити це.
Зауважте, що дельта-виміри не застосовуються для багатоканального звуку.
Команда -s Опція може використовуватися для масштабування вхідних даних за заданим фактором. За замовчуванням
Значення масштаб дорівнює 2147483647 (тобто максимальне значення 32-розрядного цілого числа зі знаком).
Внутрішні ефекти завжди працюють із підписаними довгими даними PCM, тому значення має
стосуються цього факту.
Команда -середньоквадратичне значення Опція перетворює всі вихідні середні значення в `середньоквадратичний корінь'
Формат.
Команда -v Параметр відображає лише значення "Регулювання гучності".
Команда -частота Опція обчислює вхідний спектр потужності (4096 точок DFT) замість
статистику, наведену вище. Це слід використовувати лише з одноканальним звуком
файлу.
Команда -d Параметр відображає шістнадцятковий дамп 32-бітового підписаного аудіо даних PCM в SoX
внутрішній буфер. Це в основному використовується, щоб допомогти відстежити проблеми з порядком порядків
іноді зустрічаються в кросплатформних версіях SoX.
Див. Також статистика ефект
статистика [-b біти|-x біти|-s масштаб] [-w вікно-час]
Відображення статистичної інформації про аудіоканали в часовій області; аудіо є
проходив незміненим через ланцюг обробки SoX. Статистика розраховується і
відображається для кожного аудіоканалу, а також, якщо це можливо, загальна цифра
дано.
Наприклад, для типового добре освоєного стереомузичного файлу:
Загалом лівий правий
Зміщення постійного струму 0.000803 -0.000391 0.000803
Мінімальний рівень -0.750977 -0.750977 -0.653412
Максимальний рівень 0.708801 0.708801 0.653534
Pk лев дБ -2.49 -2.49 -3.69
RMS лев дБ -19.41 -19.13 -19.71
RMS Pk дБ -13.82 -13.82 -14.38
RMS Tr дБ -85.25 -85.25 -82.66
Крест-фактор - 6.79 6.32
Плоский коефіцієнт 0.00 0.00 0.00
Pk кількість 2 2 2
Розрядна глибина 16/16 16/16 16/16
Кількість зразків 7.72 млн
Довжина s 174.973
Масштаб не більше 1.000000
Вікно s 0.050
DC зсув, Мін рівень та Макс рівень за замовчуванням відображаються в діапазоні ±1. Якщо
-b (бітів), то ці три вимірювання будуть масштабовані до a
ціле число зі знаком із заданою кількістю бітів; наприклад, для 16 біт, масштаб
буде від -32768 до +32767. The -x опція поводиться так само, як -b крім того
цілі значення зі знаком відображаються в шістнадцятковому форматі. The -s параметр масштабує
три вимірювання за даним числом з плаваючою комою.
Pk лев dB та RMS лев dB є стандартним піковим і середньоквадратичним рівнем, виміряним у dBFS.
RMS Pk dB та RMS Tr dB – це пікові та мінімальні значення для середньоквадратичного рівня, виміряні протягом a
коротке вікно (за замовчуванням 50 мс).
гребінь фактор є стандартним відношенням піку до рівня RMS (примітка: не в дБ).
Flat фактор є мірою плоскості (тобто послідовні зразки з однаковими
значення) сигналу на його пікових рівнях (тобто або Мін рівеньабо Макс рівень).
Pk вважати – кількість випадків (а не кількість вибірок) сигналу
досягнуто або Мін рівеньабо Макс рівень.
Права рука Розрядна глибина цифра є стандартним визначенням бітової глибини, тобто бітів
менш значущі, ніж дане число, фіксуються на нулі. Лівостороння фігура
кількість найбільш значущих бітів, які фіксуються на нулі (або одиниці для негативних
чисел) віднімається від правої фігури (число, що віднімається, є прямим
відноситься до Pk лев dB).
Для багатоканального звуку загальний показник для кожного з вищенаведених вимірювань становить
дані та отримані з цифр каналу таким чином: DC зсув: максимум
величина; Макс рівень, Pk лев dB, RMS Pk dB, Розрядна глибина: максимум; Мін рівень,
RMS Tr dB: мінімум; RMS лев dB, Flat фактор, Pk вважати: середній; гребінь фактор: ні
застосовується.
довжина s – це тривалість аудіо в секундах і В зразки дорівнює
частота дискретизації, помножена на довжина. шкала Макс – це масштабування, застосоване до першого
три виміри; зокрема, це максимальне значення, до якого можна застосувати
Макс рівень. Window s – довжина вікна, що використовується для пікового та найнижчого RMS
виміру.
Див. Також stat ефект
обмін Поміняйте місцями стерео канали. Дивись також ремікс для ефекту, який дозволяє використовувати довільний канал
вибір і замовлення (і змішування).
розтягувати фактор [вікно в'янути зсув завмирання]
Змініть тривалість звуку (але не його висоту). Цей ефект в цілому еквівалентний
до темп ефект з (фактор перевернутий і) пошук встановлено на нуль, тому загалом,
його результати порівняно погані; він зберігається, оскільки іноді може перевершувати ефективність
темп для малого факторs.
фактор розтягування: >1 подовжити, <1 скоротити тривалість. вікно розмір в мс.
За замовчуванням – 20 мс. The в'янути опція, може бути `lin'. зсув співвідношення, в [0 1]. За замовчуванням
залежить від фактора розтягування. 1 для скорочення, 0.8 для подовження. The завмирання співвідношення, у [0
0.5]. Величина за замовчуванням завмирання залежить від фактор та зсув.
Див. Також темп ефект
синтезатор [-j KEY] [-n] [довжина [від [ph [p1 [p2 [p3]]]]]] {[тип] [об'єднувати]
[[%]частота[k][:|+|/|-[%]частота 2[k]]] [від [ph [p1 [p2 [p3]]]]]}
Цей ефект можна використовувати для створення звукових сигналів з фіксованою або розгорнутою частотою
різноманітних форм хвиль або для створення широкосмугового шуму різних «кольорів». Кілька
синтезаторні ефекти можна каскадувати для створення більш складних сигналів; на кожному етапі це
можна вибрати, чи буде згенерована форма сигналу змішана з, або
модулюється на вихід з попереднього етапу. Аудіо для кожного каналу в a
багатоканальний аудіофайл можна синтезувати незалежно.
Хоча цей ефект використовується для створення аудіо, вхідний файл все одно потрібно надати,
характеристики якого будуть використовуватися для встановлення довжини синтезованого аудіо
кількість каналів і частота дискретизації; однак, оскільки звук у вхідному файлі є
зазвичай не потрібен, `нульовий файл' (зі спеціальною назвою -n) часто дається
замість цього (і довжина, зазначена як параметр для синтезатор або іншим даним
ефект, який може мати відповідну довжину).
Наприклад, наступне створює аудіофайл тривалістю 3 секунди, 48 кГц, що містить a
синусоїдна розгортка від 300 до 3300 Гц:
sox -n output.wav synth 3 sine 300-3300
і це створює версію 8 кГц:
sox -r 8000 -n output.wav synth 3 sine 300-3300
Кілька каналів можна синтезувати, вказавши набір показаних параметрів
між брекетами кілька разів; наступне поміщає тон скачування ліворуч
канал і додає "коричневий" шум праворуч:
sox -n output.wav synth 3 sine 300-3300 brownnoise
У наведеному нижче прикладі показано, як можна об’єднати два синтезаторних ефекти, щоб створити більше
складна форма хвилі:
play -n синтезатор 0.5 синус 200-500 синтезатор 0.5 синус fmod 700-100
Частоти також можуть бути вказані у вигляді «наукових» записів або, додавши префікс «%».
символ, як кількість півтонів щодо "середньої А" (440 Гц). Наприклад,
наступне може бути використано, щоб допомогти налаштувати низьку струну "E" гітари:
play -n синтезатор 4 вищипувати %-29
або з петлею (оболонка Борна), вся гітара:
для n в E2 A2 D3 G3 B3 E4; робити
відтворити -n синтезатор 4 вирвати $n повторити 2; зроблено
Див затримка ефект (вгорі) і посилання на "Приклади сценаріїв SoX" (нижче)
більше синтезатор приклади
NB Цей ефект створює звук на максимальній гучності (0dBFS), що означає, що є
є висока ймовірність обрізання при подальшому використанні аудіо, тому в багатьох випадках
ви захочете стежити за цим ефектом за допомогою коефіцієнт посилення ефект, щоб запобігти цьому
відбувається. (Дивись також Відсікання вище.) Зверніть увагу, що за замовчуванням файл синтезатор ефект
включає в себе функціональність коефіцієнт посилення -h (Див коефіцієнт посилення ефект для деталей);
синтезатор's -n може бути надано можливість вимкнути цю поведінку.
Детальний опис кожного синтезатор наступний параметр:
довжина – це тривалість аудіо для синтезу, виражена як час або число
зразки; 0 = довжина введення, за замовчуванням = 0.
Формат для визначення довжин у часі: hh:mm:ss.frac. Формат для
зазначення кількості вибірок – це кількість зразків, до яких додається літера `s'
його.
тип є синусом, квадратом, трикутником, пилкою, трапецією, ехр, [білим]шумом,
tpdfnoise pinknoise, brownnoise, pluck; за замовчуванням = синус.
об'єднувати є одним із create, mix, amod (амплітудна модуляція), fmod (частота
модуляція); за замовчуванням = створити.
частота/частота 2 – частоти на початку/кінець синтезу в Гц або, якщо
перед `%', півтони відносно A (440 Гц); як альтернатива, "науковий"
Можна використовувати ноти (наприклад, E2). Частота за замовчуванням становить 440 Гц. За замовчуванням,
настроювання, що використовується з нотами, є «рівним темпераментом»; в -j KEY варіант
вибирає "просто інтонацію", де KEY це ціле число півтонів щодо
A (наприклад, -9 або 3 вибирає клавішу C), або нотатку в науковому позначенні.
If частота 2 дається, то довжина також має бути дано, і створений тон буде
переміщатися між заданими частотами. Дві задані частоти повинні бути
розділені одним із символів `:', `+', `/' або `-'. Цей символ використовується
щоб вказати функцію розгортки таким чином:
: Лінійний: тон буде змінюватися на фіксовану кількість герц за секунду.
+ Квадрат: функція другого порядку використовується для зміни тону.
/ Експоненційний: тон буде змінюватися на фіксовану кількість півтонів за секунду.
- Експоненція: як `/', але початкова фаза завжди дорівнює нулю і ступінчаста (менше
плавні) зміни частоти.
Не використовується для шуму.
від - зміщення (DC-offset) сигналу у відсотках; за замовчуванням=0.
ph – фазовий зсув у відсотках за 1 цикл; за замовчуванням=0. Не використовується для шуму.
p1 це відсоток кожного циклу, який "включено" (квадрат) або "зростає" (трикутник,
ехр, трапеція); за замовчуванням=50 (квадрат, трикутник, exp), за замовчуванням=10 (трапеція), або
підтримувати (вищипувати); за замовчуванням=40.
p2 (трапеція): відсоток у кожному циклі, з якого починається «падіння»;
за замовчуванням=50. exp: амплітуда, кратна 2 дБ; за замовчуванням=50, або тон-1 (вищипування);
за замовчуванням=20.
p3 (трапеція): відсоток у кожному циклі, на якому закінчується «падіння»;
за замовчуванням=60, або тон-2 (вищипування); за замовчуванням=90.
темп [-q] [-m|-s|-l] фактор [сегмент [пошук [перекриття]]]
Змініть швидкість відтворення аудіо, але не його висоту. Цей ефект використовує WSOLA
алгоритм. Аудіо розбивається на сегменти, які потім зміщуються в часі
домену та перекриваються (перехресні загасання) у точках, де їх форми хвилі найбільші
аналогічно визначеному вимірюванням «найменших квадратів».
За замовчуванням лінійний пошук використовується для пошуку найкращих точок накладання. Якщо
необов'язковий -q заданий параметр, замість нього використовується пошук по дереву. Це робить
ефект працює швидше, але результат може звучати не так добре. Однак, якщо ви
має покращити швидкість обробки, це, як правило, менше знижує якість звуку
ніж скорочення значень пошуку чи накладання.
Команда -m Опція використовується для оптимізації значень за замовчуванням для сегмента, пошуку та перекриття
обробка музики.
Команда -s Опція використовується для оптимізації значень за замовчуванням для сегмента, пошуку та перекриття
обробка мовлення.
Команда -l Опція використовується для оптимізації значень за замовчуванням для сегмента, пошуку та перекриття
"лінійна" обробка, яка, як правило, викликає більш помітні спотворення, але може бути
корисно, коли коефіцієнт близький до 1.
Якщо вказано -m, -s або -l, буде розраховано значення сегмента за замовчуванням
на основі коефіцієнта, тоді як значення пошуку за замовчуванням і перекриття базуються на сегменті. Будь-який
значення, які ви надаєте, все ще замінюють ці значення за замовчуванням.
фактор дає співвідношення нового темпу до старого, отже, наприклад, 1.1 прискорює
темп на 10%, а 0.9 сповільнює його на 10%.
The optional сегмент параметр вибирає розмір сегмента алгоритму в
мілісекунд. Якщо не вказано інші прапорці, значення за замовчуванням дорівнює 82 і є
зазвичай підходить для внесення невеликих змін у темп музики. Для більших змін
(наприклад, коефіцієнт 2), 41 мс може дати кращий результат. Прапори -m, -s та -l
призведе до автоматичного коригування сегмента за замовчуванням на основі фактора. Для
Приклад використання -s (для мовлення) з темпом 1.25 розраховує сегмент за замовчуванням
значення 32.
The optional пошук Параметр дає довжину звуку в мілісекундах, протягом якої
Алгоритм буде шукати точки перекриття. Якщо не вказано інших прапорів, то
значення за замовчуванням 14.68. Більші значення витрачають більше часу на обробку і можуть або не можуть
дають кращі результати. Практичний максимум дорівнює половині значення сегмента. Пошук
можна скоротити до скорочення часу обробки з ризиком погіршення якості продукції. The
Прапори -m, -s та -l призведуть до автоматичного налаштування пошуку за замовчуванням
на основі сегмента.
The optional перекриття Параметр дає довжину перекриття сегмента в мілісекундах.
Значення за замовчуванням — 12, але прапори -m, -s або -l автоматично коригують накладання на основі
розмір сегмента. Збільшення перекриття збільшує час обробки і може збільшитися
якість. Практичним максимумом для перекриття є значення пошуку з перекриттям
зазвичай (принаймні) трохи менше, ніж пошук.
Дивіться також швидкість для ефекту, який змінює темп і висоту звуку разом, крок та згинатися
для ефектів, які змінюють лише тон, і розтягувати для ефекту, який змінює темп
використовуючи інший алгоритм.
потрійний коефіцієнт посилення [частота[k] [ширина[s|h|k|o|q]]]
Застосуйте ефект контролю високих тонів. Дивіться опис бас ефект для
подробиці
тремоло швидкість [глибина]
Застосуйте ефект тремоло (низькочастотна амплітудна модуляція) до аудіо. The
Частота тремоло в Гц визначається як швидкість, а глибина у відсотках на глибина
(за замовчуванням 40).
оздоблення {[=|-]положення}
Вирізає частини аудіо. Будь-яка кількість положенняs може бути дано; аудіо немає
відправлено на вихід до першого положення досягнуто. Потім ефект змінюється
між копіюванням та відкиданням аудіо в кожному положення.
Якщо положення перед ним стоїть знак рівності або мінус, він інтерпретується відносно
початок або кінець аудіо відповідно. (Довжина аудіо має бути
відомі для роботи кінцевих відносних розташування.) В іншому випадку це вважається зміщенням
з останнього положення, або від початку аудіо для першого параметра. Використання
значення 0 для першого положення Параметр дозволяє копіювати з початку
аудіо.
Усі параметри можна вказати, використовуючи або кількість часу, або точну кількість
зразки. Формат для визначення довжин у часі: hh:mm:ss.frac. Значення
1:30.5 для першого параметра почнеться лише через 1 хвилину, тридцять і ½ секунди
в аудіо. Формат визначення кількості вибірок – це кількість зразків
з доданою буквою `s'. Значення 8000s для першого параметра буде
зачекайте, поки не буде прочитано 8000 семплів, перш ніж почати обробку аудіо.
Наприклад,
sox infile outfile trim 0 10
копіює перші десять секунд, while
відтворити обрізку файлу 12:34 =15:00 -2:00
відтворюватиметься від 12 хвилин 34 секунди в аудіо до 15 хвилин після аудіо
(тобто тривалістю 2 хвилини 26 секунд), потім відновіть гру за дві хвилини до
кінець аудіо.
підвищена вибірка [фактор]
Збільште вибірку сигналу на цілочисельний коефіцієнт: фактор-1 вставлено вибірки з нульовим значенням
між кожною парою вхідних вибірок. В результаті вихідний спектр є
реплікується в новий частотний простір (накладення) та ослаблено. Це
ослаблення можна компенсувати додаванням про фактор після будь-якого подальшого
обробка. Ефект підвищеної вибірки зазвичай використовується в поєднанні з фільтрацією
ефектів.
Загальний ефект передсемплінгу зі згладжуванням див швидкість, Див. Також зменшена вибірка.
як [опції]
Детектор голосової активності. Спроби обрізати тишу та тихі фонові звуки
кінці (досить високої роздільної здатності, тобто 16 біт, 44-48 кГц) записів мовлення.
Наразі алгоритм використовує просте вимірювання кепстральної потужності для виявлення голосу,
тому вас можуть обдурити інші речі, особливо музика. Ефект можна обрізати тільки від
передня частина аудіо, тому для того, щоб обрізати ззаду, в зворотний ефект повинен
також використовуватися. напр
грати мовлення.wav норма вад
обрізати спереду,
відтворити мовлення.wav norm reverse vad reverse
обрізати зі спини, і
грати мовлення.wav norm vad reverse vad reverse
обрізати з обох кінців. Використання норма ефект рекомендується, але пам'ятайте
що ні зворотний ні норма підходить для використання з потоковим аудіо.
варіанти:
Значення за замовчуванням показано в дужках.
-t Num (7)
Рівень вимірювання, який використовується для виявлення активності. Це може знадобитися
змінюватися в залежності від рівня шуму, рівня сигналу та іншого
характеристики вхідного звуку.
-T Num (0.25)
Постійна часу (у секундах), що використовується для ігнорування коротких спалахів звуку.
-s Num (1)
Кількість аудіо (у секундах) для пошуку тихих/коротших серій
аудіо для включення до виявленої точки тригера.
-g Num (0.25)
Дозволений інтервал (у секундах) між тихішими/коротшими серіями аудіо для включення
до виявленої тригерної точки.
-p Num (0)
Кількість аудіо (у секундах) для збереження перед тригерною точкою та
будь-які знайдені тихіші/коротші сплески.
Розширений варіанти:
Вони дозволяють точно налаштувати внутрішні параметри алгоритму.
-b Num Алгоритм (внутрішньо) використовує адаптивну оцінку/зменшення шуму по порядку
щоб визначити початок шуканого звуку. Цей параметр встановлює час для
початкова оцінка шуму.
-N Num Постійна часу, що використовується адаптивною оцінкою шуму для визначення рівня шуму
зростає.
-n Num Постійна часу, що використовується адаптивною оцінкою шуму для визначення рівня шуму
зменшується.
-r Num Величина шумозаглушення для використання в алгоритмі виявлення (наприклад, 0, 0.5,
...).
-f Num Частота обробки/вимірів алгоритмом.
-m Num Тривалість вимірювання; за замовчуванням подвійний період вимірювання; тобто з
перекриття.
-M Num Постійна часу, що використовується для згладжування спектральних вимірювань.
-h Num Частота 'цегляної стіни' фільтра високих частот, що застосовується на вході до
алгоритм детектора.
-l Num Частота фільтра нижніх частот, що застосовується на вході до
алгоритм детектора.
-H Num Частота «цегляної стіни» високочастотного підйомника, що використовується в алгоритмі детектора.
-L Num Частота «цегляної стіни» підйомника низьких частот, що використовується в алгоритмі детектора.
Див. Також мовчання ефект
про коефіцієнт посилення [тип [обмежувач посилення]]
Застосуйте посилення або ослаблення звукового сигналу. На відміну від -v варіант
(який використовується для балансування кількох вхідних файлів, коли вони входять до ефектів SoX
ланцюг обробки), про є ефектом, як і будь-яким іншим, тому його можна застосувати де завгодно, і
кілька разів, якщо необхідно, протягом ланцюга обробки.
Сума для зміни гучності задається на коефіцієнт посилення який тлумачиться, за
даного тип, наступним чином: якщо тип is амплітуда (або пропущено), то коефіцієнт посилення є
відношення амплітуди (тобто напруги або лінійного), якщо влада, потім потужність (тобто потужність або
відношення напруга-квадрат), а якщо dB, потім зміна потужності в дБ.
Коли тип is амплітуда or влада, то коефіцієнт посилення 1 залишає обсяг незмінним, менше ніж
1 зменшує його, а більше 1 збільшує; негативний коефіцієнт посилення інвертує звук
сигнал на додаток до регулювання його гучності.
Коли тип is dB, то коефіцієнт посилення 0 залишає обсяг незмінним, менше 0 зменшує його,
а більше 0 збільшує його.
Див. [4] для детального обговорення електричної (а отже, аудіосигналу) напруги
і коефіцієнти потужності.
Остерігайтеся Відсікання при збільшенні гучності.
Команда коефіцієнт посилення і тип параметри можна об’єднати за бажанням, напр про 10dB.
Необов’язковий обмежувач посилення значення можна вказати і має бути значенням, значно меншим за
1 (наприклад, 0.05 або 0.02) і використовується лише на піках для запобігання відсіканню. ні
зазначення цього параметра не призведе до використання обмежувача. У багатослівному режимі це
ефект відображатиме відсоток звуку, який потрібно було обмежити.
Дивіться також коефіцієнт посилення для ефекту зміни гучності з різними можливостями, і компан
для ефекту стиснення/розширення/обмеження динамічного діапазону.
Застаріле Ефекти
Наступні ефекти були перейменовані або їх функціональність включена в іншу
ефект; вони продовжують працювати в цій версії SoX, але можуть бути видалені в майбутньому.
змішувач [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n}]
Зменште кількість аудіоканалів шляхом змішування або вибору каналів, або збільште
кількість каналів шляхом дублювання каналів. Примітка: цей ефект діє на
аудіо канали в рамках ланцюга обробки ефектів SoX; це не слід плутати
з -m глобальний варіант (де декілька файли змішуються перед введенням
ланцюг ефектів).
При зменшенні кількості каналів можна використовувати -l, -r, -f, -b, -1,
-2, -3, -4, параметри, щоб вибрати лише лівий, правий, передній, задній канал(и) або
конкретний канал для виходу замість усереднення каналів. The -l та -r
Параметри виконуватимуть усереднення в чотириканальних файлах, тому виберіть точний канал для
запобігти цьому.
Команда змішувач ефект також може бути викликаний до 16 чисел, розділених комами,
які визначають частку (0 = 0% і 1 = 100%) кожного вхідного каналу, який
мікшуватися в кожен вихідний канал. У двоканальному режимі надається 4 числа: l →
l, l → r, r → l і r → r відповідно. У чотириканальному режимі перші 4
числа показують пропорції для лівого переднього вихідного каналу, а саме: lf →
lf, rf → lf, lb → lf і rb → rf. Наступні 4 дають правий передній вихід у
той же порядок, потім лівий і правий захисник.
Також можна використовувати 16 чисел для розширення або зменшення кількості каналів;
просто вкажіть 0 для невикористаних каналів.
Нарешті, певну зменшену комбінацію чисел можна точно вказати
комбінації вхідних/вихідних каналів.
In Ch З Ch В Відображення
2 1 2 l → l, r → l
2 2 1 налаштувати баланс
4 1 4 lf → l, rf → l, lb → l, rb → l
4 2 2 lf → l&rf → r, lb → l&rb → r
4 4 1 налаштувати баланс
4 4 2 передній баланс, задній баланс
Цей ефект був замінений на ремікс ефект, який обробляє будь-яку кількість
Канали
ДІАГНОСТИКА
Статус виходу дорівнює 0, якщо помилки немає, 1, якщо є проблема з параметрами командного рядка,
або 2, якщо під час обробки файлу сталася помилка.
Використовуйте гру онлайн за допомогою служб onworks.net