Музыкальная студия "La Bella Classic" композитора Алексея Паркова
ГЛАВА 2
Начальные сведения об оцифровке и синтезе
звука
Представление звука в цифровой форме
Необходимо сразу оговориться, что среди компьютерно-музыкальных технологий существуют две тесно связанные между собой, но совершенно различные технологии — цифровое аудио и MIDI. Различные варианты работы с цифровым аудио тоже можно условно разделить на два направления — запись/обработку готовых звуков и синтез звука с нуля, хотя оба они тесно связаны между собой.
В основном именно эти две технологии и будут рассматриваться в дальнейшем, поскольку они являются наиболее значимыми для использования музыкальных возможностей ПК.
Рассмотрим сначала теоретические основы этих двух технологий. Но прежде вспомним, что такое звук вообще и какие он имеет свойства.
Как известно, звук представляет собой колебания тела в упругой среде. Например, если какое-либо тело (классический пример — струна гитары) начинает колебаться, то вследствие упругости воздуха эти колебания начнут распространяться в виде волн (попеременного увеличения и уменьшения давления на окружающие предметы). Барабанная перепонка нашего уха под действием воздушных колебаний также начинает колебаться, а информация о характере этих колебаний передается в мозг, который воспринимает их в виде звука. Главное здесь то, что, распространяясь в воздухе, колебания должны достигнуть какого-либо приемника звука (например, нашего уха). Поскольку звуковые колебания распространяются не мгновенно, а с некоторой конечной скоростью, их распространение называют звуковой волной.
Звуковые колебания несут в себе информацию о таких свойствах звука, как высота, длительность и громкость. С некоторыми оговорками сюда можно отнести еще два свойства — тембр и пространственную локализацию.
Высота звука представляет собой восприятие мозгом частоты колебаний. Далеко не любые колебания будут восприняты нами как звук. Большинство людей способно воспринимать звуковые колебания с частотой от 20 до 18 000 раз в секунду (от 20 Гц до 18 кГц). Например, комар совершает в секунду от 300 до 500 полных взмахов крылышками, то есть совершает колебания с частотой 300-500 Гц, которые и воспринимаются нами в виде надоедливого писка. Чем чаще колебания, тем выше воспринимаемый звук.
Длительность звука представляет собой восприятие продолжительности колебаний. Это самый простой случай, не требующий дополнительных объяснений.
Громкость звука — восприятие амплитуды колебаний. Единицей измерения громкости является децибел, но это величина относительная. Удвоение амплитуды звуковых колебаний соответствует увеличению громкости на 6 децибел, и наоборот. Существуют две наиболее распространенные шкалы громкости. Согласно первой из них, абсолютной, за ноль децибел принимается уровень громкости, находящийся на пороге слышимости.
Однако мы будем пользоваться в основном другой шкалой, согласно которой ноль децибел — это максимальный уровень громкости, который данное звукозаписывающее устройство может отобразить без искажений. Таким образом, при записи звука в компьютер 0 дБ соответствует максимальному значению амплитуды, а все более тихие звуки имеют отрицательное значение амплитуды (например, уровень шума на компакт-кассете составляет приблизительно -60 дБ). Положительный входной уровень громкости является перегрузкой, то есть будет записан неправильно, и при его воспроизведении мы услышим характерные высокочастотные искажения. Особенно ярко это проявляется в цифровой записи, речь о которой пойдет в разделе Понятие оцифровки звукового сигнала.
Восприятие пространственной локализации звука возможно лишь при наличии как минимум двух приемников (например, человек, слыша звук двумя ушами, в большинстве случаев может определить, откуда этот звук исходит). При этом большую роль играет оценка временного промежутка между поступлением звука на первый и второй приемники. Если приемниками являются уши, в мозгу включаются подсознательные механизмы сравнительной оценки двух сигналов, поступивших на оба приемника. С помощью такой оценки мы и определяем направление на источник звука и расстояние до него.
Что же касается понятия тембра, то оно тесно связано опять же с высотой звука. Дело в том, что звуковые колебания обычно бывают сложными. К примеру, если мы взяли на скрипке ноту ля первой октавы (частота 440 Гц), то в колебаниях этой струны будут присутствовать также частоты 880, 1320, 1760, 2200 Гц и некоторые другие. При этом звук каждой частоты будет иметь определенную громкость, независимую от громкости звуков на других частотах. Амплитудно-частотное соотношение всех составных частей сложного колебания принято называть спектром звука, а звуки, соответствующие каждой присутствующей в сложном колебании частоте, — спектральными составляющими или компонентами. Именно набор спектральных составляющих определяет тембр звучания, а поскольку каждая спектральная составляющая — это уже звук определенной высоты, говорить о тембре как об отдельном свойстве звука нельзя.
Тем не менее, именно тембр звука (а точнее — спектр) обычно находится в центре внимания, когда речь идет о технологии цифрового аудио.
Звуковые колебания, в которых присутствует всего одна частота, называются синусоидальными. Дело в том, что если мы изобразим их графически в амплитудно-временной развертке (по горизонтальной оси откладывается время, а по вертикальной — значения амплитуды колеблющегося тела), то полученный график будет представлять собой синусоиду (рис. 2.1). Любое сложное колебание (например, изображенный графически на рис. 2.2 фрагмент записи песни А. Дольского) может быть представлено в виде суммы нескольких синусоидальных колебаний, имеющих различные частоты и амплитуды. Амплитудно-временную развертку звуковых колебаний принято называть волновой формой звука.
Рис. 2.1. Синусоидальный звуковой сигнал
Рис. 2.2. Сложный звуковой сигнал
На рис. 2.3 показана волновая форма одного из звуков электрооргана, которая может быть представлена в виде суммы четырех синусоид (рис. 2.4). Этот звук содержит четыре спектральные компоненты, амплитудно-частотное соотношение которых удобно изобразить графически (рис. 2.5). Именно в такой форме чаще всего и представляют спектр звука. Таким образом, любой постоянный (не изменяющийся во времени) тембр можно наглядно представить в виде двумерного графика, чем мы и будем пользоваться в дальнейшем.
Рис. 2.3. Звук электрооргана, состоящий и£ четырех синусоидальных составляющих
Рис. 2.4. Отдельные составляющие звука, представленного на рис. 2.3
Рис. 2.5. Спектр звука, представленного на рис. 2.3
Однако если тот или иной звуковой спектр изменяется во времени (как обычно и бывает), то на таком двумерном графике мы сможем наглядно изобразить лишь тембр очень короткого фрагмента данного звука, некий моментальный срез. Для графического представления сложных, изменяющихся во времени спектров можно использовать их трехмерную графическую развертку по трем осям, или же так называемую спектрограмму, в которой по двум осям отложены время и частота звуков, а амплитуда передается с помощью цвета или интенсивности (рис. 2.6).
Рис. 2.6. Спектрограмма
Для того чтобы тот или иной звук передать на большое расстояние, механические звуковые колебания преобразуются в электрические (например, периодическое изменение давления преобразуется в такое же изменение электрического напряжения). Используя свойства электромагнетизма, эти электрические колебания можно достаточно точно отобразить на магнитной ленте. В зависимости от напряжения, поступающего на записывающую головку магнитофона, разные участки магнитной ленты намагничиваются в различной степени (разное количество магнитных частичек переориентируется под действием магнитного поля).
В результате на магнитной ленте мы получим некий, образно говоря, магнитный график, являющийся точным аналогом первоначальных звуковых колебаний. Подобный метод записи принято называть аналоговым.
Аналоговая запись, ее недостатки и достоинства
Аналоговый метод звукозаписи достаточно точно передает первоначальную звуковую картину, однако он обладает рядом недостатков, причем основным недостатком является высокий уровень шумов и помех в записи. Шумы возникают из-за несовершенства материалов, из которых изготовлена лента, а также из-за постепенной дезориентации магнитных частичек в процессе хранения ленты и некоторых других факторов. Кроме того, во время воспроизведения и записи лента движется несколько неравномерно, что приводит к эффекту детонации, а также создает проблему синхронизации записей с нескольких пленок.
Шумы в аналоговой звукозаписи обычно довольно сильно мешают восприятию общего звучания. Даже на профессиональных магнитофонах уровень шума редко опускается ниже -72 децибел (без учета систем шумопонижения, таких как DBX или Dolby, однако их применение тоже не Может пройти полностью безболезненно для звука), а при использовании обычных кассетных магнитофонов мы вынуждены постоянно слушать шумы на уровне -60 дБ и выше. Это затрудняет прослушивание записей с большим динамическим диапазоном (например, записей симфонического оркестра), поскольку шумы оказываются громче, чем некоторые участки полезного сигнала. Причем, как правило, эти шумы имеют широкий спектр, и поэтому просто отфильтровать их на выходе не удается.
По этим и некоторым другим причинам предпочтительнее использовать метод цифровой записи, которая в большей степени свободна от шумов и помех, а также допускает очень гибкую обработку. А главное, цифровая запись звука может храниться и обрабатываться с помощью компьютера.
Понятие оцифровки звукового сигнала
Попробуем разобраться, как звуковые колебания можно представить в цифровом виде.
Как видно из амплитудно-временного графика звукового сигнала (волновой формы), в любой момент звучания амплитуда сигнала имеет конкретное значение, которое может быть измерено и выражено некоторым числом (рис. 2.7). Таким образом, если мы точно измерим амплитуду сигнала в каждый момент времени и выразим ее в числовом виде, полученный ряд чисел будет точной записью исходного звукового сигнала. Эта последовательность чисел может быть преобразована в двоичную форму и записана на любой носитель, в том числе в память компьютера.
Однако здесь мы сталкиваемся с большой проблемой, поскольку звуковой сигнал, вообще говоря, непрерывен, то есть количество точек на его графике бесконечно. Следовательно, для получения действительно точной цифровой записи звукового сигнала измерять его амплитуду нужно через бесконечно малые промежутки времени (и, следовательно, бесконечное количество раз, а полученный числовой массив будет бесконечно велик). Более того, на линейке шкалы измерения амплитуды должно быть бесконечное количество градаций, то есть весь динамический диапазон должен выражаться числами от -°° до +°° (или хотя бы от 0 до + =).
Естественно, в действительности мы можем провести измерения лишь конечное число раз, используя конечное количество амплитудных градаций (этот параметр называют амплитудным разрешением). Возникает вопрос: через какие промежутки времени и с каким амплитудным разрешением следует проводить измерения, чтобы звук на выходе не сильно отличался от исходного сигнала?
Рис. 2.7. Измерение амплитуды сигнала
На рисунке 2.8 показана волновая форма синусоидального сигнала с частотой 440 Гц (соответствующей ноте ля первой октавы), а на рисунках 2.9 и 2.10 — сигнал, полученный при измерении амплитуды соответственно 1000 и 5000 раз в секунду (как принято говорить, с частотой дискретизации 1000 и 5000 Гц). Как можно заметить, во втором случае форма выходного сигнала гораздо больше похожа на форму исходного сигнала. И вообще, чем больше частота дискретизации, тем точнее сигнал на выходе воспроизводит исходный.
Рис. 2.8. Синусоидальный сигнал 440 Гц
Согласно известной теореме Котельникова, для отображения сигнала некоторой частоты f необходима дискретизация с частотой не менее 2f. Поскольку человеческий слух может воспринимать звуковые колебания с частотой до 18 кГц, получается, что частота дискретизации любого звукового сигнала должна быть не менее 36 кГц. На практике обычно используются частоты дискретизации от 11 025 до 48 000 Гц (например, на звуковых компакт-дисках она составляет 44 100 Гц), а в последнее время стала использоваться частота 96 кГц (она определена как стандартная для DVD-дисков).
Рис. 2.9. Дискретизация сигнала 440 Гц с частотой 1000 Гц
Рис. 2.10. Дискретизация сигнала 440 Гц с частотой 5000 Гц
Что касается амплитудного разрешения, то можно заметить, что точность воспроизведения повышается с увеличением количества градаций амплитудной шкалы (рис. 2.11). В звуковых компакт-дисках используется 65 536 амплитудных градаций. Как известно, для представления чисел в диапазоне от 0 до 65 535 необходимо 16 бит информации, поэтому часто бывает удобнее говорить о 16-битном разрешении (а в просторечии — о 16-битном звуке). Ранее часто использовались 8-битное разрешение (256 градаций) и 12-битное (4096 градаций), звучащие с большими искажениями. На современном этапе звук обрабатывается, как правило, при 24-битном или 32-битном разрешении (16 777 216 или 4 294 967 296 амплитудных градаций).
Для того чтобы преобразовать звук в цифровую форму, используются специальные устройства — аналого-цифровые преобразователи (АЦП). От качества АЦП зависит качество полученного цифрового сигнала, и если преобразование произведено плохо, то впоследствии придется затратить массу сил и времени на то, чтобы исправить положение. Поэтому рекомендую пользоваться только качественными АЦП.
Рис. 2.11. Дискретизация с малым амплитудным разрешением искажает сигнал
Несмотря на все преимущества цифрового сигнала, его нельзя услышать напрямую. Для того чтобы его услышать, перед подачей на усилитель и колонки сигнал необходимо преобразовать в аналоговый, для чего используются цифро-аналоговые преобразователи (ЦАП). ЦАП должен быть также высокого качества, поскольку все достоинства цифрового сигнала и его гибкой компьютерной обработки могут превратиться в ничто, если звук будет воспроизведен через некачественный ЦАП.
Основными достоинствами цифровой записи звука являются ее чистота (низкий уровень шумов и устойчивость сигнала к помехам), а также возможность гибкой обработки. Иногда музыканты, впервые знакомящиеся с цифровыми методами записи и обработки, высказывают недоумение — почему записанный на магнитофонную кассету аналоговый сигнал начинает шуметь, а записанный почти на такую же по виду DAT-кассету цифровой сигнал — нет?
Причина становится понятной, если вспомнить, что помехи на магнитной ленте представляют собой незначительные отклонения записанного сигнала от исходного уровня. В аналоговой записи они влияют непосредственно на волновую форму звука, из-за чего мы и слышим помехи на выходе. В цифровой записи считывающее устройство знает, что возможны только два уровня сигнала, соответствующие 0 и 1, а все промежуточные являются следствием помех и должны быть скорректированы. Достаточно большая помеха, способная превратить 1 в 0 и наоборот, возникает крайне редко. Но и в этом случае, как правило, срабатывают различные механизмы пройерки, которые во многих случаях способны распознать и скорректировать неправильный бит. Это относится как к уже записанному на носитель цифровому сигналу, так и к передаваемому по проводам. Гибкость обработки цифрового звука открывает перед звукорежиссерами невиданные доселе возможности. Например, еще в 1994 году имел место такой случай. Запись симфонического произведения в конце радиопередачи должна была длиться 20 минут 23 секунды, а времени в передаче оставалось ровно 20 минут. Вместо того чтобы просто оборвать запись в конце (как, собственно, и делалось в прежние времена, хотя с музыкальной точки зрения это совершенно недопустимо), сделали цифровую обработку записи, сократившую время звучания за счет незаметного на слух микроскопического изменения темпа.
Другой яркий пример — цифровые фильтры. Если взять, к примеру, белый шум (сигнал, содержащий непрерывный ряд спектральных компонент одинаковой амплитуды по всему слышимому частотному диапазону), то с помощью цифрового фильтра можно выделить из него практически чистый синусоидальный сигнал на заданной частоте. С помощью аналоговых фильтров можно добиться выделения лишь довольно толстой спектральной полосы (рис. 2.12).
Рис. 2.12. Спектральная полоса, выделенная из белого шума с помощью аналогового фильтра
Дискретность цифрового сигнала и ее влияние на восприятие звука
Однако, как известно, нет в мире совершенства. И цифровой звук также не свободен от некоторых недостатков. Сразу замечу, что проблемы, связанные с оцифровкой и передачей цифровых сигналов, в последнее время находят все более успешные решения. Поэтому все сказанное в нескольких следующих абзацах не может служить аргументом против использования цифрового звука вообще, хотя о недостатках этой технологии упомянуть все же следует.
Во-первых, как уже было показано в разделе Понятие оцифровки звукового сигнала, цифровая запись воспроизводит форму исходного сигнала не точно, а с некоторым приближением. Далее, для более высоких частот эта форма все более искажается. При этом появляются дополнительные спектральные составляющие, а амплитуда высоких звуков также может быть отражена неправильно, вплоть до полного их исчезновения (рис. 2.13).
Рис. 2.13. Искажения высокочастотных составляющих спектра при дискретизации
Что еще менее приятно, так это тот факт, что некоторые высокочастотные составляющие и призвуки, лежащие в ультравысоком диапазоне (выше 18 кГц), на выходе после оцифровки превращаются в частоты звукового диапазона, причем гармоническая составляющая может при этом стать негармонической (о гармонических и негармонических составляющих см. в разделе Аддитивный и гармонический синтез).
Далее, при уменьшении амплитуды сигнала его волновая форма начинает приближаться к прямоугольнику, то есть спектр ее приобретает все больше изначально отсутствовавших высокочастотных составляющих, как показано на.рис. 2.14.
Рис. 2.14. Искажение очень тихого сигнала при дискретизации
Существует и еще целый букет проблем, связанных с аналогоцифровым и цифро-аналоговым преобразованием. Однако сейчас появляются все новые и новые методы их решения. О некоторых из них можно прочитать в журнале Компьютерра.
Итак, звук оцифрован и обработан с помощью компьютера. На какой носитель его можно перенести, чтобы взять с собой (например, из студии домой или из дома в издательскую фирму)?
Вообще говоря, если звук был оцифрован с помощью компьютера, то, скорее всего, он уже записан на один из возможных носителей — жесткий диск. Однако для того, чтобы взять с собой жесткий диск, нужно вынуть его из компьютера, что крайне неудобно (все отвинчивать, отсоединять, да и вообще он не рассчитан на то, чтобы его все время с собой таскали). Поэтому давайте рассмотрим другие варианты. Прежде всего, можно скопировать имеющийся у вас цифровой звук на какой-либо накопитель большого объема (Jaz, SparQ и т. п.). Недостаток этого способа в том, что аналогичное устройство должно найтись и в других местах, где вы собираетесь демонстрировать свою запись. Поскольку ни одно из подобных устройств (см. введение) сегодня не является общеупотребительным, могут возникнуть проблемы с совместимостью.
Другой способ — сделать запись на записываемом (CD-R) или перезаписываемом (CD-RW) компакт-диске с помощью соответствующего CD-дисковода. Используя CD-R и соответствующее программное обеспечение, можно даже записать диск в формате CD-audio, который затем будет легко прослушать на любом проигрывателе компакт-дисков. Этот способ явно предпочтительнее предыдущего, так как для демонстрации вашей записи уже не потребуется компьютер. Однако он имеет другой недостаток: для записи компакт-диска в аудиоформате нужно приложить дополнительные усилия, позаботиться о бесперебойном питании компьютера и (по крайней мере, при работе под управлением Windows) об отсутствии фоновых процессов для максимального использования ресурсов программой записи. Ведь если при записи CD-R произойдет сбой, то диск можно будет сразу выбрасывать, а если какой-либо фрагмент запишется неаккуратно, то при прослушивании диска наверняка возникнут проблемы (когда проигрыватель воспроизводит музыку, ему некогда перечитывать по нескольку раз одно и то же место). Кроме того, запись на CD-R — это запись навечно, а если вы хотите сохранить промежуточный результат работы или планируете последующую доработку, то лучше воспользоваться другими носителями.
Довольно распространенный способ сохранения цифрового аудио — запись на цифровую кассету DAT (Digital Audio Tape). Этот носитель цифрового аудио можно считать стандартным для профессиональных музыкантов во всем мире. Однако и он не лишен недостатков. Во-первых, магнитную ленту DAT надо хранить и использовать с большой аккуратностью, так как она больше, чем другие носители, боится внешних повреждений. Во-вторых, при записи с помощью цифровых интерфейсов (особенно S/PDIF) в цифровой сигнал могут быть внесены искажения (так называемый джиттер и пр.).
Сравнительно новый, но стремительно набирающий обороты стандарт цифровых носителей информации — это компактное магнитооптическое устройство MiniDisk (MD). Запись на MD аналогична записи на DAT, но пользоваться MD намного удобнее, и он менее подвержен внешним воздействиям (в частности, записанный MD, в отличие от DAT, можно смело подвергать воздействию магнитных полей — а их вокруг нас не так уж мало). Есть, правда и небольшой минус: при записи на MD звуковые данные сжимаются с использованием алгоритма ATRAC. При этом в сигнал не вносится почти никаких искажений — по результатам экспериментов, только в 0,9% случаев эксперты на слух правильно отличили запись одного и того же материала на DAT и на MiniDisk (результат анализа — 50,9 правильных ответов на 49,1 неправильных)- Однако факт использования алгоритма сжатия сам по себе часто отпугивает профессиональных музыкантов.
Итак, носителей цифрового аудио на сегодняшний день существует немало — есть из чего выбирать. Все они по-своему хороши, хотя у каждого есть и некоторые недостатки. Какой из них больше подойдет именно вам, лучше определить самостоятельно, по возможности попробовав хотя бы некоторые из них.
Электронная имитация акустических музыкальных инструментов
Стоит ли исполнять с помощью электронных музыкальных инструментов музыку, которая может быть исполнена и вживую? Имеет ли смысл электронная имитация акустических музыкальных инструментов? Эти и подобные вопросы уже перешли в категорию философско-риторических, и споры среди музыкантов на эту тему будут продолжаться, вероятно, не один год. Однако ясно одно: со времени появления первых электромузыкальных инструментов одной из задач их создателей всегда было создание звуков, похожих на звуки натуральных, акустических музыкальных инструментов.
Первоначально для этого использовался анализ спектров данных звуков и попытки воссоздания полученных спектров с помощью различных методов звукового синтеза (см. в разделах Аддитивный и гармонический синтез, Модуляция, Синтез методом частотной модуляции, Субтрактивный и фрактальный методы звукового синтеза). Впоследствии для этого была изобретена техника сэмплирования, которая используется в большинстве современных так называемых волнотаблич-ных синтезаторов, имеющихся на любой звуковой карте.
Помимо имитации живых инструментов техника сэмплирования может использоваться также для получения различных звуковых эффектов (например, звук летящего вертолета или аплодисментов в зале). Более того, с помощью сэмплирования музыканты иногда создают собственные, ни на что не похожие тембры. В этом случае за основу может быть взят какой-либо звук окружающего мира и путем цифровой обработки изменен до полной неузнаваемости. Сэмплирование позволяет открывать все новые возможности. Это замечали многие выдающиеся музыканты, такие как Джон Эпплтон, Эдуард Артемьев и другие.
Первоначальная идея, лежащая в основе техники сэмплирования, была крайне проста: для получения хорошей имитации акустического инструмента нужно просто записать один из звуков этого инструмента, а потом, проигрывая запись с разной скоростью, получать звуки различной высоты. Казалось бы, в этом случае имитация будет очень хорошей: ведь нажимая на разные клавиши электронного инструмента, мы в действительности будем слышать записанный звук инструмента акустического.
Однако не все оказалось так просто. Во-первых, акустические инструменты при громком и тихом исполнении производят немного разные по спектральному составу звуки, а простое уменьшение громкости звука, сыгранного на forte (или, наоборот, усиление изначально тихого звука), сразу приводило к неестественности звучания. Для решения этой проблемы требовалось либо записывать несколько звуков различной громкости, либо выстраивать систему специальных корректирующих фильтров.
Во-вторых, один и тот же звук на акустическом инструменте в зависимости от характера музыки может быть взят различными приемами игры, а также туше, что придает общему характеру звучания ту самую живость, которой иногда до сих пор не хватает компьютерному исполнению при имитации акустических инструментов.
И наконец, самое главное: при транспозиции записанного звука на другую высоту происходило искажение тембра за счет смещения формант. Форманты — это спектральные области, в которых независимо от высоты основного тона увеличивается амплитуда спектральных составляющих; они возникают за счет естественных резонаторов (например, вибрации деки и корпуса скрипки) и во многом определяют восприятие и узнавание нами того или иного тембра. А при простой транспозиции записанного звука вместе с основными составляющими транспонируются и формантные области, и тембр звука изменяется до неузнаваемости (если вы хоть раз включали двухкассетный магнитофон в режим ускоренной перезаписи, то хорошо понимаете, что имеется в виду).
У этой проблемы есть единственное решение: записывать не один звук акустического инструмента, а много, начиная от самого низкого и кончая самым высоким. Запись звуков почти всех акустических инструментов существенно изменяется в тембре уже при транспозиции на 1 -1,5 тона. Поэтому для получения хорошей имитации такого инструмента с помощью сэмплирования необходимо записать по 4-6 звуков на каждую октаву, а затем с помощью фильтров и других специальных средств сгладить переходы между ними.
Основные функции сэмплеров, звуковая петля
Само слово сэмшшрование (англ, sampling) происходит от слова sample, что означает образец. Электронный инструмент, имеющий функции сэмплирования, называется, соответственно, сэмплером (sampler или sampling synthesizer). Записанный в память сэмплера или компьютера образец звука называется сэмплом (wavesample). Часто сэмплеры бывают встроены в звуковые карты и/или интегрированы с волнотабличным синтезатором, как это, например, сделано на карте Tropez Plus от Turtle Beach. Так что в дальнейшем под словом сэмплер будем подразумевать не только отдельный модуль типа Ensoniq ASR10, но и встроенные сэмплерные модули звуковых карт.
Любой сэмплер может проигрывать записанный в память (засэмплированный) звук на различной высоте, а также с разной громкостью. Однако здесь возникает проблема с третьим параметром — продолжительностью. Ведь если записан звук длительностью, например, 3 секунды, то как выдержать его 4 секунды, если это потребуется в музыкальной пьесе?
Здесь на помощь приходит один из основных приемов в технике сэмплирования — создание звуковой петли. В простейшем случае звуковая петля предполагает, что засэмплированный звук проигрывается от начала до конца не один раз, а много, причем сразу после его окончания воспроизведение начинается сначала. Однако, как известно, самое начало звука (атака, attack) у большинства акустических инструментов и по громкости, и по тембру резко отличается от стабильного участка (sustain), на котором тембр и громкость звука остаются более или менее постоянными. Таким образом, каждый раз при возвращении к началу сэмпла мы будем слышать резкое изменение звучания, порой даже со щелчком, который возникает из-за резкого перепада уровня амплитуды (рис. 2.15).
Кроме того, в конце сэмпла зачастую происходит постепенное затухание (fade out). Тембр звука также обычно постепенно меняется: например, у многих акустических инструментов при затухании звука постепенно исчезают верхние спектральные составляющие. Все это делает применение простой звуковой петли (от начала до конца сэмпла) в большинстве случаев неприменимым.
Рис. 2.15. Перепад уровней громкости на стыке конца и начала простой петли
В связи с этим в большинстве сэмплеров применяется неполная петля, проиллюстрированная на рис. 2.16. При нажатии клавиши проигрывание звук начинает воспроизводиться с точки, обозначенной SS (sample start), доходит до точки LE (loop end), с нее возвращается сразу в точку LS (loop start), опять доходит до LE и возвращается к LS, и так до тех пор, пока клавиша не будет отпущена. Тогда, если в параметрах воспроизведения указано постепенное затухание после отпускания клавиши, воспроизведение звука идет через точку LE и доходит до SE (sample end). Участки сэмпла, находящиеся перед SS и после SE, никогда не воспроизводятся (обычно для экономии ОЗУ их можно обрезать с помощью стандартной для сэмплеров функции truncate).
Рис. 2.16. Обычная (неполная) петля
Некоторые сэмплеры способны воспроизводить так называемую сложную петлю (рис. 2.17). В этом случае через заданный промежуток времени воспроизведение звука проходит через точку LIE и добирается до точки L2E, после чего вторая петля L2S-L2E воспроизводится вплоть до отпускания клавиши.
Рис. 2.17. Сложная петля
Музыкант, создающий звук с помощью сэмплера, должен очень скрупулезно подбирать положения точек начала и конца петли (LS и LE). Они обе должны находится на стабильном участке звука, и при этом совпадать по амплитуде (в том числе в пиках), как показано на рис. 2.18. Если мы имеем дело с реально записанным звуком акустического инструмента, то подобрать такие точки бывает непросто. Кроме того, если звук на инструменте был исполнен с эффектом вибрато, придется позаботиться еще и о совпадении высоты звука в LS и LE. К счастью, большинство сэмплеров позволяет изменять петлю прямо в процессе прослушивания звука (не отпуская клавишу инструмента).
Рис. 2.18. Хорошо звучащая петля
Для тех особо сложных случаев, когда подобрать LS и LE чрезвычайно сложно, во многих сэмплерах предусмотрен режим двунаправленной петли. При этом воспроизведение из точки LE не перескакивает на LS, а, отразившись от LE, продолжается в обратном направлении до LS. Затем звук снова воспроизводится в обычном направлении до LS и т. д. Применение двунаправленной петли дает довольно специфический эффект, но иногда помогает решить проблему. Некоторые сэмплеры для получения хорошей ровной петли умеют немного корректировать волновую форму засэмплированного звука в соответствии с параметрами петли. Этот прием называется перекрестным слиянием (crossfade). Он заключается (в данном контексте!) в корректировке амплитуды и пиковой амплитуды сэмпла в областях, непосредственно прилегающих к точкам LS и LE. Это может быть сделано несколькими способами, и, как правило, музыкант подолгу прослушивает и сравнивает их, выбирая лучший вариант. Из этих способов наиболее интересные результаты обычно дает так называемое двунаправленное перекрестное слияние. В данном случае берется звуковой сигнал на участке между LS и LE в обычном виде и в ракоходе (то есть перевернутым по горизонтали), и эти два сигнала складываются. При этом часто получается довольно своеобразное звучание, но оно несколько отдаляет тембр полученного звука от исходного тембра.
Кроме всего перечисленного, часто сэмплеры и программы работы с сэмплами предлагают функцию автоматического подбора параметров звуковой петли (для особо ленивых). Однако в большинстве случаев результат получается довольно убогий, так что лучше на эту функцию не рассчитывать.
Техника звуковой петли позволяет использовать не очень длинные засэмплиро-ванные звуки для получения более продолжительных звуков на выходе, то есть экономить место в оперативной памяти сэмплера (звуковой карты), а также на внешних носителях, на которых будет храниться результат вашей работы. Кроме того, применение непродолжительных сэмплов существенно ускоряет процесс первоначальной загрузки звуков в сэмплер, что в некоторых случаях тоже бывает немаловажно.
Помимо звуковой петли в сэмплерах используется много других методов построения инструмента. О них будет рассказано ниже (см. раздел Что такое "инструмент").
Достоинства и недостатки техники сэмплирования
Техника сэмплирования, как показала практика, наилучшим образом подходит для имитации акустических инструментов. Основные приемы этой техники позволяют довольно точно имитировать акустические инструменты и создавать необычные звуки на основе засэмплированного участка звуковой волны. На технике сэмплирования основаны так называемые волнотабличные (wavetable, WT) синтезаторы, в которых вместо звуковых генераторов используются готовые сэмплы. По этому принципу были построены, например, знаменитые синтезаторы ProTeus компании E-mu. WT-синтезаторы обычно встраиваются в звуковые карты для компьютеров и часто расширяются до полнофункциональных сэмплеров. Недостатком техники сэмплирования является большая сложность поиска оптимальных параметров звуковой петли. Более того, некоторые специалисты утверждают, что легко могут определить на слух присутствие даже очень хорошей сэм-плерной петли. При ее наличии звук приобретает периодическое громкостное качание, придающее звуку некоторую неестественность. Такое качание легко услышать при прослушивании отдельного звука, однако оно совершенно незаметно в реальной музыкальной фактуре.
Аддитивный и гармонический синтез
Как известно, любое сколь угодно сложное звуковое колебание можно представить в виде суммы нескольких синусоидальных колебаний (чистых тонов), различных по частоте и амплитуде. Сам по себе чистый тон звучит блекло и практически непригоден для использования в музыке. Чем больше в звуке спектральных составляющих, тем интереснее и богаче его тембр.
Звуки акустических инструментов часто имеют так называемый гармонический спектр. Это означает, что частоты всех спектральных компонент звука кратны частоте основного тона (основным тоном обычно называют самую низкую составляющую). Спектральные составляющие, частоты которых кратны частоте основного тона, называются гармоническими составляющими, или гармониками. Все спектральные составляющие, лежащие выше основного тона, иногда называют обертонами.
Гармонические составляющие нумеруются в соответствии с отношением своей частоты к частоте основного тона. Так, если частота основного тона равна f, то составляющая на частоте 2f будет именоваться второй гармоникой, на частоте 3f — третьей и т. д.
На рис. 2.19 приведен пример гармонического спектра, ада рис. 2.20 — негармонического. Гармонические спектральные составляющие обычно сливаются для нашего слуха как бы в один звук, имеющий высоту основного тона спектра. Негармонические спектры звучат расплывчато, и определить на слух высоту их основного тона довольно трудно.
Рис. 2.19. Гармонический спектр
Рис. 2.20. Негармонический спектр
Звук содержащий непрерывный ряд спектральных компонент в какой-либо частотной области (рис. 2.212, имеет ярко выраженный шумовой призвук Если эта частотная область простирается на весь слышимый частотный диапазон а спектральные составляющие имеют одинаковую амплитуду, то такой звук называют белым шумом (рис. 2.23). Фрагмент волновой формы белого шума приведен на рис. 2.23
Рис. 2.21. Звук с шумовым призвуком
Рис. 2.22. Спектр белого шума
Рис. 2.23. Волновая форма белого шума
Звуковым синтезом называют процесс построения спектров при помощи генерации простых волновых форм и их последующей обработки. Большинство методов синтеза основано на оперировании чистыми тонами — синусоидальными волновыми формами, в спектре которых присутствует всего одна составляющая. Однако к простейшим волновым формам относят и некоторые другие периодические сигналы (прямоугольные, пилообразные, треугольные), а также шумы, то есть случайные сигналы (рис. 2.24-2.26).
Рис. 2.24. Прямоугольный сигнал
Рис. 2.25. Пилообразный сигнал
Рис. 2.26. Треугольный сигнал
Прямоугольная волновая форма дает звук, имеющий гармонический спектр, в котором присутствуют только нечетные гармоники. Амплитуда их уменьшается с увеличением номера гармоники, однако довольно медленно: неплохо слышна даже 17-я гармоника (рис. 2.27). Спектр звука треугольной формы также характеризуется наличием только нечетных гармоник, однако их здесь гораздо меньше — 7-я гармоника уже практически не слышна (рис. 2.28). В сигнале пилообразной формы присутствуют как нечетные, так и четные гармоники. И наконец, спектр случайного сигнала близок к белому шуму.
Рис. 2.27. Спектр прямоугольного сигнала
Рис. 2.28. Спектр треугольного сигнала
Аддитивный и гармонический синтез
Самый простой метод звукового синтеза заключается в следующем. Берем столько генераторов синусоидальных колебаний, сколько потребуется спектральных составляющих, настраиваем их на соответствующие частоты и просто складываем соответствующие сигналы. Этот метод хорош тем, что позволяет получить очень точный результат. Если ясно представлять себе требуемый спектр, то воспроизвести его не составит труда. Такой метод синтеза называется аддитивным (от англ, addition — сложение).
Сложность здесь заключается в том, что большинство богатых, красиво звучащих тембров могут состоять из очень большого количества спектральных компонент. Поскольку для каждой из них используется отдельный генератор, при создании тембра придется отдельно настраивать несколько десятков (а то и сотен) генераторов. Кроме того, в первые годы разработок в области звукового синтеза возникала еще одна проблема. Поскольку генераторы тогда не моделировались внутри компьютера, а представляли собой отдельные, довольно объемистые устройства, использование многих таких устройств потребовало бы наличия очень больших помещений.
Поэтому звуки, построенные при помощи аддитивного синтеза, обычно не отличаются богатством спектра: они состоят не более чем из десяти компонент и могут использоваться для имитации простых тембров типа флейты, некоторых органг ных регистров и т. п.
Если при аддитивном синтезе все спектральные составляющие звука складываются в гармонический звукоряд, такой метод называют гармоническим синтезом.
Попробуем прикинуть, сколько генераторов потребуется, чтобы получить хороший тембр струнного типа при помощи аддитивного синтеза. Волновая форма таких тембров близка к пилообразной, а значит, в спектре должны присутствовать все гармоники от 1-й и как минимум до 12-й. Кроме того, вокруг каждой гармоники необходимо построить небольшие области шумовых призвуков (рис. 2.29), иначе тембр будет звучать пусто. Для построения таких шумовых областей необходимо задействовать по крайней мере по 6 генераторов для каждой гармоники (меньшее их количество только загрязнит звук, не придав ему никакой живости). Таким образом, необходимо 12 генераторов для гармоник и еще 72 для шумовых областей — всего 84 генератора. В принципе, повозиться можно, но нелишне вспомнить, что с помощью частотно-модуляционного синтеза (о нем речь пойдет в разделе Синтез методом частотной модуляции) подобный звук можно легко получить, используя всего три генератора. ,
Рис. 2.29. Построение тембра методом аддитивного синтеза
Аналоговые системы синтеза (немного истории)
Аддитивный синтез широко применялся в первых аналоговых синтезаторах. Количество используемых генераторов, правда, обычно не превышало шести.
Генераторы с помощью кабелей коммутировались друг с другом (для различных модуляций, см. раздел Модуляция) и с другими устройствами — усилителями, фильтрами и пр. В одном из первых аналоговых синтезаторов Букла (рис. 2.2) входные и выходные разъемы всех устройств были выведены на одну коммутационную панель, расположенную вертикально, а сами эти устройства — скрыты за панелью. Чтобы облегчить работу музыканта, входные разъемы были выкрашены в один цвет, а выходные — в другой. Кроме разъемов на коммутационную панель были выведены потенциометры для регулировки параметров этих устройств (например, громкости усилителя). Коммутация осуществлялась с помощью специального набора кабелей.
Первоначально эти системы не имели устройств ввода типа фортепианной клавиатуры. Целесообразность использования таких устройств в системах синтеза вообще ставилась под сомнение. А частота генераторов регулировалась с помощью ручек или движков. Появлялись и довольно оригинальные устройства ввода, например набор из металлических пластинок, прикосновение к каждой из которых вызывало изменение частоты генератора. Силой давления руки на пластинку можно было контролировать какой-либо другой параметр.
При помощи современных компьютерных систем подобную систему аналогового синтеза легко смоделировать. Существуют специальные программы, пользовательский интерфейс которых напоминает старые аналоговые системы: отдельные виртуальные модули на экране компьютера коммутируются с помощью виртуальных проводов. В качестве примера упомяну программу Virtual Waves, которая будет рассмотрена в главе 10.
Модуляцией в системах звукового синтеза называется воздействие какого-либо устройства на входные параметры другого устройства. Не следует путать это понятие с более привычным для музыкантов — сменой тональности (и вообще, говоря о звуковом синтезе или сэмплировании, полезно сосредоточиться на звуке как таковом, на время забыв о компоновке различных звуков как методе музыкальной композиции).
Например, если мы возьмем генератор низкочастотных колебаний (low frequency oscillator — LFO), на выходе которого получим синусоидальный периодический сигнал частотой 6 Гц, и соединим его выход с амплитудным входом усилителя, то на выходе получим амплитудное вибрато, то есть громкость выходного сигнала будет изменяться с частотой 6 раз в секунду (рис. 2.30).
Аналогично, если выход LFO соединить со входом основного частотного генератора, то частота выходного сигнала будет попеременно увеличиваться и уменьшаться, то есть мы получим обычное вибрато.
Записав звуковой сигнал в сэмплер или получив его методами синтеза, мы обычно модулируем частоту от клавиатуры, а громкость — от силы удара по клавише (см. главу 3).
Рис. 2.30. Схема алгоритма получения амплитудного вибрато
Громкость выходного сигнала электронных инструментов также обычно модулируется of генераторов специальных непериодических сигналов — огибающих (см. раздел Огибающие).
Область применения модуляции для построения звуков (звукостроения) ограничена только вашей фантазией и возможностями аппаратных средств (ну и программных средств, в том случае, если вы не привыкли чуть что писать собственную программу). Применяется модуляция и для звукового синтеза (см. следующий раздел).
Применение модуляции для звукового синтеза
Основной недостаток аддитивного синтеза заключается в том, что при использовании п синусоидальных генераторов получается спектр не больше, чем из п составляющих. Применение модуляции для звукового синтеза позволяет получить в результирующем спектре значительно большее количество составляющих.
На рис. 2.31 изображена схема соединения устройств для синтеза звука методом амплитудной модуляции. Как видно из схемы, значение коэффициента амплитуды сигнала, поступающего с несущего генератора, здесь складывается со значением сигнала на выходе модулирующего генератора. В результате, если частота модулирующего генератора лежит ниже слышимого звукового диапазона (например, 6 Гц), то мы получим на выходе обычное амплитудное вибрато (хотя это, строго говоря, не совсем так, о чем будет сказано чуть ниже). Но если модулирующая частота лежит в звуковом диапазоне, то на выходе мы получим сигнал, в котором будут присутствовать частоты обоих генераторов, а также их сумма и разность. Например, если частота несущего генератора равна 100 Гц, а модулирующего — 300 Гц, то на выходе получится спектр, содержащий составляющие 100, 200, 300 и 400 Гц. Таким образом, из двух чистых тонов мы получим спектр из четырех составляющих!
Применяя амплитудную модуляцию, можно получить гармонический спектр из исходных тонов, находящихся в негармоническом соотношении. Например, если на входе мы имеем синусоидальные сигналы на частотах 100 и 150 Гц, то, как легко видеть, на выходе получим составляющие 50,100,150 и 250 Гц, а это уже гармонический спектр.
Интересный результат получится, когда несущая частота лежит ниже слышимого звукового диапазона. Если, например, несущий генератор дает сигнал частотой
1 Гц, а модулирующий 100 Гц, то на выходе будут присутствовать 1,99,100 и 101 Гц. Частота 1 Гц будет слышна как медленное амплитудное вибрато, а букет из 99, 100 и 101 Гц — как несколько утолщенный звук на частоте 100 Гц. Это придаст ему более естественную окраску.
Рис. 2.31. Схема алгоритма амплитудной модуляции
Умело используя метод амплитудной модуляции, можно, соединив генераторы цепочкой, получить довольно интересные спектры из небольшого количества генераторов.
Не путайте схему коммутации устройств для амплитудной модуляции со схемой, изображенной на рис. 2.32. Здесь выход модулирующего генератора непосредственно является амплитудным коэффициентом несущего. Данный метод модуляции принято называть кольцевой модуляцией (ring modulation). В отличие от предыдущего случая здесь мы не имеем на выходе исходных частот, а имеем только их сумму и разность. Таким образом, применение чистых тонов в качестве исходного материала не дает никакой выгоды. Однако если на вход кольцевой модуляции подать более сложные сигналы (например, 100 и 150 Гц в одном сигнале и 500 и 600 Гц в другом), то на выходе мы получим сигнал из большего количества составляющих (в нашем примере — 350,400,450,500,600,650,700 и 750 Гц). Звуки, полученные методом кольцевой модуляции, часто имеют ярко выраженный звенящий оттенок.
Рис. 2.32. Схема алгоритма кольцевой модуляции
При использовании кольцевой модуляции из двух звуков, имеющих гармонические спектры, на выходе часто получаются иегармонические спектры. Пример такого преображения приведен на рис. 2.33. На нем видно, как два довольно бедных гармонических спектра по три составляющих в каждом (100,200,300 Гц и 170, 340, 510 Гц) превращаются в этакого монстра из 18 негармонических составляющих (30,40, 70, 130,140, 210, 240, 270,310,370, 410, 440,470, 540, 610, 640, 710 и 810 Гц).
Рис. 2.33. Получение негармонического спектра из двух гармонических с помощью кольцевой модуляции
Несмотря на то что с помощью кольцевой модуляции можно получать весьма сложные спектры, их получением крайне трудно управлять и, кроме того, почти все они легко узнаются по неизменному зудяще-звенящему призвуку. Это сильно ограничивает область применения данного вида звукового синтеза.
Синтез методом частотной модуляции
Теоретические основы метода частотной модуляции
В 70-е годы в Стэнфорде был описан звуковой синтез методом частотной модуляции (frequency modulation — FM). Его придумал американец Джон Чоунинг и представил на суд университета в качестве своей дипломной работы. В общем потоке теоретических работ на эту как-то не обратили внимания, однако через несколько лет данным методом заинтересовалось руководство небезызвестной компании Yamaha. Подписав договор с Чоунингом, Yamaha взрастила с помощью этого метода целое поколение синтезаторов, к которому принадлежал знаменитый DX7. Да и по сей день звуковые карты компьютеров, как правило, помимо WT-синтеза-торов оснащаются синтезаторами, работающими методом частотной модуляции. Что же особенного в этом методе, что так привлекло производителей музыкального оборудования?
Во-первых, этот метод позволяет из минимального числа синусоидальных генераторов (в FM их принято называть операторами) получить сколь угодно сложные спектры, состоящие практически из любого количества компонент. А во-вторых, если хорошо понимать механизм возникновения нового тембра, то его параметрами очень легко управлять.
При звуковом синтезе методом частотной модуляции сигнал с выхода модулирующего оператора поступает на частотный вход несущего, складываясь с его собственной частотой. Понятно, что при этом выходная амплитуда модулирующего сигнала влияет на частотное отклонение несущего оператора. А величина частотного отклонения, как выясняется, непосредственно влияет на количество частотных компонент в полученном выходном спектре! Таким образом, уменьшать или увеличивать количество составляющих результирующего спектра можно, просто регулируя выходной уровень модулирующего оператора!
Для того чтобы облегчить понимание зависимости количества спектральных составляющих от частотного отклонения, удобно ввести понятие индекса модуляции, который определяется как отношение частотного отклонения к частоте модулирующего сигнала:
I=Df / fm
Рассмотрим, какой же спектр будет иметь наш выходной сигнал при простом частотно-модуляционном синтезе (простым называется тип FM-синтеза, при котором в синтезе участвуют всего два оператора и один из них модулирует другой, рис. 2.34). Можно показать, что результатом простого FM-синтеза будет спектр, состоящий из компонент, частоты которых являются суммой или разностью несущей частоты f. и модулирующей частоты fm, умноженной на коэффициент k, принимающий любые целые значения от нуля до величины индекса модуляции, увеличенного на 2. При этом амплитуда (а) является значением функции Бесселя, порядок которой равен данному значению коэффициента, а аргумент — индексу модуляции:
fr = fc + kfm ; k = 0, 1, 2 ... I + 2 при a = jk(I)
Рис. 2.34. Схема алгоритма простого частотно-модуляционного синтеза
Рассмотрим простой пример. Если частота несущего оператора равна 100 Гц, а модулирующего — 300 Гц при индексе модуляции, равном 3, то в результирующем спектре будут присутствовать составляющие на следующих частотах: 100, 100+300=400,100-300=-200,100+2*300=700,100-2*300—500, а также 1000,1300, 1600, -800, -1100 и -1400 Гц. Здесь отрицательные значения означают сигнал в противофазе. Таким образом, из двух исходных операторов мы получили сигнал, в спектре которого присутствует 11 гармонических составляющих (100, 200, 400,500,700,800,1000,1100,1300,1400 и 1600 Гц, см. рис. 2.35). Увеличив индекс модуляции до 4, мы можем добавить к спектру составляющие на 1700 и 1900 Гц, а уменьшив его до 1, сократить количество компонент до 7.
Рис. 2.35. Спектр сигнала, полученного при помощи двухоператорного FM-синтеза (fc=100 Гц, fm=300 Гц)
Еще большие возможности отрываются при использовании сложного частотно-модуляционного синтеза, с применением одновременно трех и более операторов (но обычно не больше шести). При этом возможно несколько вариантов.
Во-первых, возможна параллельная коммутация несущих операторов при независимых модуляторах (рис. 2.36, а). В этом самом простом случае на выходе мы получаем сумму двух или более FМ-спектров.
Рис. 2.36. Алгоритмы сложного частотно- модуляционного синтеза: а— параллельные несущие, независимые модуляторы; б— параллельные несущие, один модулятор; в— один несущий, несколько модуляторов; г— цепочка модуляторов; д— модуляция с обратной связью
Во-вторых, возможна параллельная коммутация несущих операторов при одном общем модуляторе (рис. 2.36, 6). Данный случай мало чем отличается от предыдущего — это все равно что иметь несколько модуляторов с одинаковыми параметрами. Далее, возможна одновременная модуляция несущего оператора несколькими независимыми модуляторами (рис. 2.36, в). В этом случае количество составляющих в результирующем спектре резко возрастает, так как положительные и отрицательные значения произведений модулирующих частот на их коэффициенты складываются с несущей частотой в произвольных комбинациях:
fr = fc+ k1fm1 + k2fm2; k1 = 0, 1, 2 ... I1 + 2 и k2 =0, 1, 2 ... I2 + 2 при а = Jk1 (I1) Jk2 (I2)
Наиболее интересных результатов такой способ частотной модуляции позволяет достичь в том случае, если один из модулирующих операторов имеет частоту, лежащую ниже звукового диапазона. При этом спектр получившегося звука получает характерное утолщение каждой гармонической составляющей, что придает звучанию характерный живой оттенок за счет биений, слышимых на каждой гармонической составляющей. В качестве упражнения читатель может по приведенной выше формуле самостоятельно вычислить спектр, возникающий при модуляции оператора частотой 500 Гц двумя параллельными операторами 100 Гц и 3 Гц при индексах модуляции, равных в обоих случаях 4.
Еще возможна так называемая цепная модуляция (рис. 2.36, г). При таком способе один или несколько операторов становятся одновременно и модулирующим, и модулируемым. Для трех операторов, показанных на рисунке, результирующий спектр будет содержать составляющие на тех же частотах, что и в предыдущем случае, но амплитудное соотношение их будет несколько иным:
fr = fc+ k1 fm1 + k2 fm2; k1 = 0, 1, 2 ... I1 + 2 и k2 =0, 1, 2 ... I2 + 2 при а = Jk1 (I1) Jk2 (I2)
Разумеется, в такую цепочку можно соединить не три, а четыре, пять и более операторов. Если обозначить частоту несущего оператора fc, первого модулирующего оператора — fml, а последнего — fmn, общей формулой результирующего спектра будет следующая:
fr = fc+ k1 fm1 + k2 fm2 + knfmn; k1 = 0, 1, 2 ... I1 + 2 и k2 =0, 1, 2 ... I2 + 2 и т. д. kn =0, 1, 2 ... In + 2 при а = Jk1 (I1) Jk2 (k1I2) Jk3(k1k2I2)...Jkn (k1k2k(n-1)In)
И наконец, не забывайте о возможности установки обратной связи на один или несколько операторов (рис. 2.36, д). Однако с точки зрения получаемого спектра этот случай аналогичен предыдущему. Изменяя уровень сигнала обратной связи, мы фактически как бы меняем количество модулирующих операторов, объединенных в цепочку.
Частотно-модуляционный синтез открывает перед музыкантом большие возможности. Конечно, если целью ставится имитация акустических инструментов, то предпочтительнее пользоваться волнотабличным методом. Однако методы FM-синтеза могут оказаться просто незаменимыми при решении различных нестандартных творческих задач.
Практическое применение метода частотной модуляции
На частотно-модуляционном синтезе были основаны многие модели различных синтезаторов. Этот вид синтеза позволяет быстро создавать необходимые звуки и гибко изменять их по мере необходимости. Несмотря на кажущуюся сложность приведенных выше формул, метод частотно-модуляционного синтеза очень легок в освоении. Немного поэскпериментировав с разными звуками, большинство музыкантов быстро начинают интуитивно чувствовать, каким образом повлияет на звук изменение того или иного параметра.
С помощью FM-синтеза очень удобно создавать изменяющиеся во времени спектры, а также звуки колокольного типа. Для имитации акустических инструментов сегодня имеются более подходящие средства, но в случае дефицита памяти можно применить следующий опыт производителей музыкального оборудования: в волновую таблицу записывается только атака звука (небольшой начальный фрагмент длительностью 0,2 с или менее), а далее к этому маленькому сэмплу приклеивается (встык или методом перекрестного слияния) синтезированное методом частотной модуляции продолжение. Поскольку для узнавания тембра особенно важен именно момент атаки, такая имитация на слух в большинстве случаев почти не отличается от имитации методом сэмплирования.
Субтрактивный и фрактальный методы звукового синтеза
Помимо описанных в предыдущих разделах существует множество других методов звукового синтеза. Приведу еще два небольших примера.
Одним из простейших звуковых сигналов является так называемый случайный сигнал, спектр которого близок к спектру белого шума. При помощи различных фильтров (см. раздел Фильтры) из этого спектра вырезаются все ненужные спектральные компоненты, после чего остаются только необходимые. Такой метод звукового синтеза называется субтрактивным (от англ, subtraction — вычитание).
Если в предыдущих методах синтеза одной из основных проблем было увеличение числа спектральных составляющих, то при использовании субтрактивного синтеза, как правило, возникает обратная проблема. Поскольку в исходном сигнале присутствует очень большое количество спектральных составляющих, очень сложно настроить фильтры так, чтобы срезать все ненужное. В результате у звуков, синтезированных методом субтрактивного синтеза, практически всегда есть лишние шумовые призвуки, и пользоваться им можно только для создания специфических звуков с шумовой окраской.
В качестве примера экзотического метода звукового синтеза рассмотрим так называемый фрактальный синтез, в основе которого лежит построение графических фракталов. Собственно говоря, при фрактальном синтезе самое интересное и заключается в их построении, а методы перевода полученного изображения в звук могут быть разные и, как правило, они не отличаются изобретательностью.
Наиболее традиционный способ такого преобразования — трактовка графического фрактала как спектрограммы с последующим ресинтезом звуковой волны. Такой метод фрактального синтеза реализован, например, в программе Avalon. В результате получаются довольно интересные звуковые пятна, стремительно изменяющиеся во времени. Они совершенно непригодны для построения аккордов или исполнения мелодических линий, а в большинстве случаев не могут быть и смешаны с какой бы то ни было музыкальной фактурой, однако интересны сами по себе. Такой звук может появиться не более, чем один-два раза за музыкальную пьесу, поскольку его сложный, меняющийся спектр больше напоминает короткий музыкальный фрагмент.
На этой не совсем обычной ноте пора завершить обзор методов звукового синтеза и перейти к дополнительным процессам и эффектам, которые могут быть применены и к сэмплированным, и к синтезированным звукам, и к цифровому аудио.
На рис. 2.37 изображена волновая форма звука фортепиано (самое начало, удар по клавише). Как легко заметить по размаху колебаний, громкость звука сначала возрастает, потом несколько уменьшается и затем остается в течение некоторого времени на одном уровне. Прочертив линию, проходящую сквозь амплитудные пики этого сигнала, мы получим как бы график изменения его громкости (рис. 2.8).
Рис. 2.37. Волновая форма начала звука фортепиано
Рис. 2.38. Огибающая звука на рис. 2.37Линия этого графика играет важную роль в технологиях сэмплирования и звукового синтеза. Она получила название огибающая (по-английски — envelope). В данном примере мы как бы выделили из волновой формы звука ее огибающую. Но обычно поступают наоборот — корректируют волновую форму звука в соответствии с той или иной огибающей.
Исследования показали, что огибающая играет даже большую роль в восприятии и, соответственно, узнавании того или иного тембра, чем собственно его спектральный состав. Например, если взять чистую синусоиду и наложить на нее огибающую от звука фортепиано, .то весь звук будет воспринят как звук фортепианного типа. Если же у засэмплированного реального звука фортепиано разгладить огибающую (или просто отрезать момент атаки), то в большинстве случаев этот звук не будет ассоциироваться с фортепианным, хотя его тембр при этом никак не изменяется.
Поэтому при звуковом синтезе и сэмплировании всегда следует уделить особое внимание огибающей.
Применение амплитудной огибающей к звуку проиллюстрировано на рис. 2.39 — 2.41. Вначале синтезируем звуковую волну (рис. 2.39), затем генерируем огибающую (рис. 2.40) и, наконец, подаем эту огибающую на амплитудный вход усилителя или звукового генератора (рис. 2.41).
Рис. 2.39. Ровная звуковая волна
Рис. 2.40. Огибающая для звука на рис. 2.39
Рис. 2.41. Управление амплитудой звука на рис. 2.39 с помощью огибающей на рис. 2.40
В качестве огибающей обычно выступает какой-либо непериодический сигнал. Если же в роли огибающей будет выступать звуковой сигнал, мы получим обычную кольцевую модуляцию.
В зависимости от творческой задачи можно построить, вообще говоря, какую угодно огибающую (рис. 2.42). Однако для большинства звуков характерны схожие их типы, поэтому в различных синтезаторах и сэмплерах часто используются некоторые стандартные виды огибающих (с возможностью настройки параметров).
Рис. 2.42. Различные виды огибающих
Наиболее распространенный вид огибающей — это так называемая огибающая ADSR, состоящая из четырех участков. Она может применяться и для протяженных звуков, и для коротких. Первый участок огибающей — первоначальное нарастание звука, так называемая атака (attack). Потом следует небольшое (обычно очень быстрое) затухание до основного уровня громкости звука (decay). Затем наступает так называемый стабильный участок звука, на котором уровень его остается постоянным (sustain). Если звук сэмплированный, то именно на этом участке обычно располагается звуковая петля. И наконец, последний участок огибающей — это концевое затухание (release, обычно включается после отпускания клавиши).
В большинстве устройств для определения огибающей ADSR необходимо указать следующие параметры: время атаки, время первичного затухания, уровень стабильного участка и время концевого затухания (рис. 2.43). Часто бывает целесообразно модулировать эти параметры от устройств ввода. Например, время атаки полезно сделать зависимым от силы удара по клавише (у акустических инструментов громкие звуки обычно имеют более резкую атаку).
С помощью огибающей ADSR можно довольно неплохо описать многие тембры, в том числе некоторых акустических инструментов (например, гобоя или кларнета). Однако в ряде случаев бывает целесообразно применять другие виды огибающих.
Рис. 2.43. Стандартная огибающая ADSR
Представим себе, что нам нужно сымитировать звук фортепиано, и мы уже синтезировали соответствующий спектр (даже если просто засэмплирован звук живого рояля и на нем сделана звуковая петля, это не меняет дела). Как известно, если долго держать нажатой клавишу фортепиано, звук очень медленно затухает. Поэтому огибающая ADSR в данном случае неприменима — ведь она предполагает постоянную громкость на стабильном участке.
Для подобных случаев часто применяется огибающая ADSDR, которая тоже состоит из четырех участков, однако имеет пять параметров настройки. Четыре из них совпадают с соответствующими параметрами огибающей ADSR, но есть и еще один — скорость затухания на стабильном участке (decay2, см. рис. 2.44). Этот параметр может задаваться по-разному, например с помощью указания времени полного затухания звука на стабильном участке.
Рис. 2.44. Огибающая ADSDR
Некоторые устройства позволяют использовать и более сложные огибающие. Например, первоначальная форма огибающей может быть вообще не определена, а пользователю предоставляется возможность определить уровни точек начала каждого участка, а также временные промежутки между ними. В этом случае музыкант может выстроить огибающую очень сложной формы, что часто бывает полезно в сочетании со сложными сэмплами, имеющими нестабильную амплитуду.
По аналогии с огибающими к выходной амплитуде звукового сигнала в некоторых устройствах есть возможность применять различные огибающие к другим звуковым параметрам. Например, для имитации детонации, эффекта портаменто и т. д. можно применить соответствующим образом выстроенную огибающую не к громкости, а к высоте звука. Такие высотные огибающие лучше всего звучат на синтезированных звуках, а применяя их к сэмплам, необходимо помнить о том, что их высота регулируется изменением скорости воспроизведения, что влечет за собой тембровые искажения (об этом см. в разделе Сэмплирование и таблицы волн). Кроме того, при изменении скорости воспроизведения меняется и продолжительность данных участков звука/Однако в случае незначительного изменения высоты (±40 центов) этими искажениями вполне можно пренебречь. Использование медленного периодического сигнала в каче стве высотной огибающей, к примеру, дает эффект вибрато.
Если спектр воспроизводимого звука достаточно богат составляющими, полезно бывает применить тембровую огибающую, влияющую на тембровую наполненность, яркость звука. Для этого в простейшем случае звуковой сигнал подается на низкочастотный фильтр (см. раздел Фильтры), а генератор огибающей регулирует частоту среза данного фильтра. Например, для имитации некоторых акустических инструментов целесообразно применить одну и ту же огибающую и к громкости, и к яркости звука, поскольку у акустических инструментов более тихий участок звука зачастую является и более тусклым по тембру.
Интересно также бывает применить различные огибающие к другим фильтрам, а также к различным параметрам звуковых эффектов.
Звуковым фильтром называют прибор, пропускающий через себя только часть спектра звукового сигнала. Например, запись на магнитофонной кассете, скопированная несколько раз, содержит довольно сильный шум в частотном диапазоне от 3 до 5 кГц. Пропустив звуковой сигнал, поступающий с этой кассеты, через соответствующий фильтр, мы получим на выходе ту же запись, в спектре которой не будет составляющих в этом частотном диапазоне, то есть шум в основном исчезнет (рис. 2.45).
Рис. 2.45. Фильтрация магнитофонного шума
Конечно, на самом деле не все так просто, поскольку в частотном диапазоне 3-5 кГц содержатся также частотные составляющие полезного сигнала, и после такой фильтрации тембр звучания потускнеет. Однако этот пример наглядно демонстрирует применение фильтров. Кроме того, первые системы динамического шумопонижения работали именно так.
Цифро-аналоговые и аналого-цифровые преобразователи также обязательно содержат фильтры. Например, частоты, лежащие выше половины частоты дискретизации, при оцифровке отобразятся неправильно и, скорее всего, будут восприниматься как помехи или искажения (см. раздел Представление звука в цифровой форме). Чтобы этого избежать, перед оцифровкой сигнала высокие частоты удаляются с помощью фильтра, и в результате оцифрованный сигнал оказывается свободным от данных искажений (рис. 2.46).
Рис. 2.46. Фильтрация высоких частот
В дальнейшем, при работе с программами звукового синтеза и обработки (главы 8 и 10), мы еще не раз столкнемся с применением звуковых фильтров различных типов.
Все звуковые фильтры можно разделить на четыре типа — низкочастотные (low-pass), высокочастотные (hi-pass), полосовые (band-pass) и режекторные (notch).
Низкочастотный фильтр пропускает через себя нижние частоты и подавляет верхние (рис. 2.47, а). Высокочастотный, наоборот, пропускает верхние частоты и подавляет нижние (рис. 2.47, 6). Параметр, называемый частотой среза, указывает, с какой частоты начинается подавление спектральных составляющих. Например, если частота среза низкочастотного фильтра равна 5 кГц, это означает, что все составляющие на частотах ниже 5 кГц беспрепятственно пройдут сквозь фильтр, а компоненты на частотах выше 5 кГц будут подавлены.
Рис. 2.47. Виды фильтров: а— низкочастотный; б— высокочастотный; в— полосовой; г— режекторный
Однако ни один аналоговый фильтр (да и большинство цифровых) не приспособлен к мгновенным перепадам, то есть невозможно, чтобы сигнал на частоте 4999 Гц прошел сквозь фильтр на 100% (уровень 0 дБ), а на частоте 5000 Гц был подавлен (например, -60 дБ). Обычно частотный перепад является не столь резким. Например, если при частоте среза 5 кГц уровень выходного сигнала на этой частоте (5 кГц) составляет 0 дБ, на частоте 10 кГц — минус 12 дБ, на частоте 20 кГц — минус 24 дБ и т. д., то говорят, что крутизна среза фильтра составляет 12 дБ на октаву (рис. 2.48).
Фильтры с крутизной среза 24 дБ на октаву считаются очень крутыми. А в некоторых случаях, наоборот, целесообразно использовать мягкие фильтры, имеющие крутизну среза 6 дБ на октаву и менее.
Рис. 2.48. Схема фильтра с крутизной среза 12 дБ на октаву
Полосовой фильтр пропускает только некоторую частотную полосу, подавляя компоненты на частотах, лежащих выше и ниже этой полосы. Режекторный фильтр, напротив, подавляет частотную полосу, пропуская все остальные частоты (рис. 2.47, в, г).
Частотой среза для этих двух типов фильтров называют центральную частоту пропускаемой/подавляемой полосы. Кроме того, у них существует еще один регулируемый параметр — ширина полосы (bandwidth).
Например, если указано, что частота среза полосового фильтра равна 500 Гц, а ширина полосы — 100 Гц, то это означает, что фильтр полностью пропустит составляющие на частотах от 450 до 550 Гц.
В первом рассмотренном здесь примере, с плохой магнитофонной записью, нужно использовать режекторный фильтр с частотой среза 4 кГц, шириной полосы около 1000 Гц и крутизной среза 8-12 дБ на октаву, а во втором (АЦП) — низкочастотный фильтр с частотой среза, равной половине частоты дискретизации и максимально возможной крутизной среза. На практике в АЦП частота среза низкочастотного фильтра обычно ставится несколько ниже половины частоты дискретизации, чтобы частоты, ненамного ее превышающие, были в достаточной степени подавлены. Действительно, если частота дискретизации равна 44 100 Гц, а частоту среза фильтра выбрать равной 22 050 Гц при крутизне 48 дБ на октаву, то сигнал на частоте 23 000 Гц будет ослаблен только на 3-4 дБ, что недостаточно. Если же использовать фильтр с частотой среза, допустим, 16 000 Гц, то 23 000-герцевый сигнал будет ослаблен почти на 24 дБ.
Если один и тот же звуковой сигнал параллельно подать на несколько полосовых фильтров, количество и ширина полос которых подобраны так, чтобы перекрыть весь слышимый частотный диапазон, а затем суммировать их звуковые сигналы, предварительно отрегулировав выходной уровень каждого из них, то получится прибор, который обычно называют графическим эквалайзером. На стандартном графическом эквалайзере (в том числе и в компьютерных реализациях), как правило, выходной уровень сигнала каждого фильтра регулируется ползунковым регулятором, и общий вид расположения этих регуляторов дает графическое представление о преобразовании сигнала.
Чем шире полоса каждого фильтра, тем меньшее количество фильтров требуется, чтобы перекрыть весь частотный диапазон, и тем грубее будет звуковое преобразование. В дешевых музыкальных центрах, например, обычно имеются встроенные 3- или 5-полосные эквалайзеры. Для более или менее серьезной работы необходимы как минимум 10- или 15-полосные эквалайзеры, причем с возможностью независимой обработки каждого стереоканала. В связи с малой крутизной среза аналоговых фильтров аналоговые эквалайзеры обычно не бывают больше чем 25-полосными. А вот цифровая техника здесь имеет большое преимущество. Известна, например, замечательная компьютерная реализация 512-полосного графического эквалайзера, выполненная московским программистом и музыкантом Д. Жалниным в виде небольшой программы, работающей под управлением DOS, но с великолепным графическим интерфейсом.
Как известно, даже в бытовых условиях эквалайзеры применяются для того, чтобы скорректировать звучание (амплитудно-частотную характеристику) выходного сигнала. Для тех же целей они широко используются в звукозаписи и звукоре-жиссуре, а также в процессе звуковой обработки или синтеза.
Цифровая задержка, эхо и мультиэхо
После записи оцифрованного звукового сигнала, синтеза или сэмплирования, а также в процессе исполнения к основному звуку часто добавляют различные звуковые эффекты. Это делается обычно с целью улучшить звучание — придать звуку естественность, поместить в некое виртуальное пространство, сгладить шероховатости исполнения и т. п.
Звуковых эффектов существует множество, и каждый из них иногда может оказаться в роли самого необходимого элемента.
Рассмотрим наиболее распространенные эффекты, ставшие уже стандартными. Они могут быть реализованы как в виде отдельных студийных приборов, так и в виде различных функций или подключаемых модулей какой-либо программы звуковой обработки, о чем пойдет речь в главе 8.
Один из самых простых звуковых эффектов называется задержкой (delay). Поскольку обычно он бывает реализован в цифровых приборах, его часто называют цифровой задержкой (digital delay). Принцип действия весьма прост: входной сигнал в неизменном виде поступает на выход, но с небольшой временной задержкой и обычно с чуть более низким уровнем. Будучи смешан с прямым сигналом, он дает различные интересные эффекты. Например, при малом времени задержки (менее ОД с) и большом выходном уровне (-3 дБ и более) мы получим эффект драблекса (применяется чаще всего для обработки вокала, как бы раздваивая голос). Если же, напротив, время задержки превышает 1-1,5 с, а выходной уровень меньше -6 дБ, то получается эффект эха.
Еще более интересные эффекты можно получить, используя принцип обратной связи (подача выходного сигнала задержки обратно на вход с небольшим уменьшением уровня). При этом основной звук будет многократно повторен, постепенно затухая. В данном случае время полного затухания сигнала будет зависеть от уровня сигнала обратной связи. Такой эффект неплохо звучит, например, на протяжных вокальных линиях, особенно если вокальная партия исполняется без слов.
Иногда применяют параллельно несколько эффектов цифровой задержки (с разным временем задержки). В этом случае результат называют мультизадержкой или мультиэхом.
Когда источник и приемник звука находятся в естественной акустике (в каком-либо помещении), приемник получает не только прямой звуковой сигнал, но и его многочисленные отражения (рис. 2.49): звук от источника, как известно, распространяется во все стороны. Прямой сигнал достигает приемника быстрее отраженных (поскольку его путь более короткий) и с более сильным уровнем (при отражении от окружающих предметов звук частично поглощается, поэтому все отраженные звуковые сигналы более слабые, чем прямой).
В результате первым к приемнику приходит прямой сигнал (он звучит наиболее громко), а после небольшой паузы его достигает так называемый пучок первичных отражений — сигнал, однократно отразившийся от стен и других предметов. Как видно из рисунка 2.49, такой сигнал может достичь приемника разными путями, которые обычно незначительно отличаются длиной, а значит и временем следования. Поскольку звуковой сигнал продолжает летать по помещению, отражаясь от стен и мебели до тех пор, пока окончательно не затухнет, приемника постепенно будут достигать вторичные, третичные и последующие его отражения. Появление сигналов будет настолько частым, а сами они столь ослабленными, что практически сольются в один постепенно затухающий шлейф.
Рис. 2.49. Схема естественной реверберации
Таким образом, восприятие сигнала в естественной акустике можно разделить на несколько этапов:
Рис. 2.50. Временная диаграмма естественной реверберации
Восприятие акустических особенностей помещения зависит от времени предза-держки, длины и уровня пучка первичных отражений, а также от времени затухания концевого шлейфа.
Существует множество алгоритмов для искусственной имитации описанных выше процессов. Такую имитацию называют реверберацией. Алгоритмы реверберации обычно основаны на сочетании множества цифровых задержек, величины которых не кратны одна другой, и их последующей обработки с помощью так называемых ячеек Шредера и/или рециркуляторов. Подробное описание алгоритмов реверберации можно найти в технической литературе, а для пользователя, как правило, остаются открытыми лишь немногие их параметры, с помощью которых, однако, можно достаточно гибко управлять искусственной акустикой (подробнее см. в главе 8).
Данный эффект, также основанный на цифровой задержке, обычно используется при обработке звучания мелодических линий. Как видно из названия, хорус как бы создает эффект хора, несколько утолщая звук.
Для этого обычно используется цифровая задержка или мультизадержка на очень маленький временной интервал с неглубокой модуляцией задержанного сигнала по частоте. Каждый задержанный сигнал звучит практически одновременно с прямым, но на отличающейся на несколько десятков центов высоте. Собственно говоря, то же самое происходит в реальном хоровом унисоне.
Иногда эффект хоруса достигается без использования задержки, исключительно методами модуляции, но в последнее время такой способ применяют все реже.
Эффекты флэнджера и фазера также построены на цифровой задержке. Дело в том, что при уменьшении времени задержки до очень маленьких значений, сравнимых с временем одного периода звукового сигнала, сложение прямого и задержанного сигнала дает очень интересные спектральные эффекты, в частности яркость звука начинает изменяться во времени.
Эти эффекты обычно применяют к звукам со сложным, богатым спектром. Для того чтобы эффект произвел эффект на слушателя, исходный сигнал должен состоять из долгих, протяженных звуков. Особенно хорошо, если флэнджер и фазер приложены к многоголосной фактуре.
Для получения эффекта флэнджера прямой сигнал складывается с задержанным. При этом время задержки должно быть очень мало, а задержанный сигнал обычно модулируется по высоте (наподобие эффекта вибрато). Иногда задержанный сигнал несколько ослабляют и вновь направляют на вход эффекта, образуя обратную связь. Эффект фазера на слух часто бывает очень похож на флэнджер, да и способ его получения отличается лишь тем, что вместо задержки всего сигнала используют фазовый сдвиг на некоторых его частотах. Обработанный сигнал при этом также модулируется по высоте и складывается с прямым.
Гитаристам обычно очень хорошо знаком также эффект вау-вау, который на слух несколько напоминает флэнджер или фазер. Однако в его основе лежит несколько иной принцип — сигнал пропускается через полосовой фильтр. При этом центральная частота этого фильтра быстро изменяется, может меняться во времени также ширина полосы пропускания.
Динамическая компрессия, гэппер и другие эффекты
Все рассмотренные до сих пор эффекты так или иначе основаны на цифровой задержке. Однако существует и множество других эффектов, также широко применяемых в музыкальной практике.
К ним, например, относятся динамическая компрессия (сужает динамический диапазон выходного сигнала), так называемый гэппер (прореживает звуковую волну очень короткими фрагментами тишины, будучи примененным к речевому сигналу, создает голос робота), эффект искажения (обычно срезает амплитудные пики на звуковой волне, порождая довольно громкие высокочастотные составляющие; традиционно применяется на звуках гитарного типа), эффект расширения стереобазы и т. д.
Эти и многие другие эффекты реализованы в виде функций в программах звуковой обработки, которые рассмотрены в главе 8. Но прежде чем завершить эту главу об оцифровке, синтезе и обработке звука, необходимо рассмотреть понятие инструмента в звуковых картах и внешних сэмплерных и синтезаторных модулях.
Отличие от традиционного понятия
Оперируя понятиями традиционной музыки, мы привыкли считать, что инструментом называется некий физический объект, с помощью которого можно издавать музыкальные звуки. Во избежание путаницы очень важно не трактовать аналогичным образом понятие инструмент применительно к электронике. Любой внешний звуковой модуль с клавиатурой, например Korg X5D, хочется назвать словом инструмент, но это неверно, поскольку он уже содержит в себе несколько десятков инструментов, а еще некоторые инструменты могут быть в него загружены дополнительно. Что же в данном случае называют инструментом? Этим словом называется набор сэмплированных и/или синтезированных звуков и параметров для их воспроизведения, предназначенный для управления с клавиатуры или через MIDI-интерфейс (о MIDI см. в главе 3). Один звуковой модуль, внешний или встроенный в звуковую карту, содержит десятки и даже сотни таких наборов, а при наличии ОЗУ они могут быть загружены в него с внешнего накопителя (CD-ROM, флоппи-диски, специальные картриджи и пр.). Инструменты, загруженные в оперативную память, могут использоваться так же, как и находящиеся в постоянной памяти.
Из чего может состоять инструмент. . Требования к памяти
Для максимальной гибкости исполнения каждый инструмент обычно состоит из нескольких слоев (layers), которые звучат одновременно. Звуки этих слоев могут либо накладываться друг на друга, либо переключаться в зависимости от каких-либо условий. Например, часто различной силой удара по клавише включаются соответствующие слои инструмента. Каждый слой может состоять из нескольких десятков различных сэмплов (в случае использования синтезированных звуков обычно обходятся меньшим их количеством). Переключение между этими сэмплами происходит в зависимости от регистра нажатой клавиши, причем клавиатура может быть разделена на практически неограниченное количество таких регистров. Другие параметры исполнения могут влиять, например, на время атаки, глубину вибрато, яркость звука и пр.
Если для построения инструмента используются сэмплированные звуки, то, как правило, единственное, что ограничивает музыканта в возможностях построения инструмента, — это количество оперативной памяти. Посмотрим, сколько ОЗУ потребуется, если необходимо, например, построить хорошую имитацию рояля с помощью техники сэмплирования.
Для того чтобы избежать тембровых искажений, звуки рояля должны быть засэм-плированы через тон, то есть 44 звука на весь диапазон рояля. Кроме того, каждый из них должен быть записан по крайней мере в трех вариантах — акцент, нормальный громкий звук, тихий звук, поэтому в целом получается 132 сэмпла. Длина каждого сэмпла должна быть не меньше секунды, иначе не построить хорошую звуковую петлю. При частоте дискретизации 32 кГц, часто употребляющейся в сэмплерах, секунда 16-битного монофонического звука займет 64 000 байт. Соответственно весь объем памяти для звуковых сэмплов будет равен 8 448 000 байт, или 8,06 Мбайт. Пара таких инструментов способна полностью забить оперативную память сэмплера (хотя это в меньшей степени относится к некоторым современным звуковым картам для шины PCI, позволяющим отъедать под сэмплы часть основного ОЗУ компьютера). Поэтому музыканты, занимающиеся созданием инструментов, обычно вынуждены от чего-то отказываться ради экономии памяти. Например, в библиотеке инструментов для сэмплера Ensoniq EPS 16+ имеется имитация фортепиано объемом всего 241 Кбайт.
Полифония, многотембровость, наборы инструментов
У любого сэмплерного или синтезаторного модуля есть два очень важных показателя, которые существенно влияют на конечные музыкальные результаты. Это полифония и политембральность (или, иначе, многотембровость). Первый параметр (полифония) указывает, какое максимальное число голосов одновременно способно воспроизвести данное устройство. Например, если устройство имеет 32-голосную полифонию, это означает, что на нем можно одновременно воспроизвести не более 32 звуков. Еще недавно 32-голосная полифония считалась хорошим показателем, однако сегодня многие производители предлагают 64-голосную или даже 128-голосную полифонию.
На первый взгляд может показаться, что такое количество голосов одновременно воспроизводить ни к чему — ведь даже полная фортепианная клавиатура состоит всего из 88 клавиш. Но, во-первых, может потребоваться одновременное воспроизведение многоголосия разными тембрами, а, к примеру, четырехголосие в восьми тембрах — это уже 32 голоса. Во-вторых, часто бывает, что один голос полифонии означает использование одного слоя в инструменте, а если инструмент состоит из, допустим, четырех слоев, то один звук этого инструмента займет 4 голоса из всей полифонической фактуры. Кроме того, музыканту могут потребоваться различные нестандартные решения (например, сонорный 72-звуч-ный кластер в пределах одной октавы, по 6 разновысотных звуков на полутон). Другой показатель — политембральность — означает максимальное количество инструментов, которые может воспроизводить одновременно данное устройство. Как правило, нет большого смысла в том, чтобы это значение было выше 16, поскольку один MIDI-порт все равно содержит только 16 MIDI-каиалов (см. главу 3).
Вы, наверное, уже обратили внимание на то, что в этой главе то и дело встречаются фразы типа на некоторых устройствах возможно..., некоторые устройства позволяют... (а другие, значит, не позволяют) и т. п. В связи с этим необходимо заметить, что устройство, которому, собственно говоря, и посвящена данная книга, — компьютер — позволяет все перечисленное выше и даже больше. Конечно, не любая программа будет содержать все необходимые функции, но вы их всегда / сможете создать с помощью универсальной системы C-Sound, которая будет рассмотрена в главе 12. И не надо пугаться того, что она напоминает обычное программирование — система настолько проста в управлении, что даже если вы никогда не программировали, все равно сможете быстро и легко в ней разобраться, и тогда перед вами откроются прямо-таки необъятные творческие горизонты.
Главная страничка Архив midi Обработка звука Видео школа Архив звуковых эфектов Почта Ссылки