Основные компоненты звуковой подсистемы ПК. Звуковая система компьютера. звуковая система компьютера звуковая система пк

Каждый, кто работает с профессиональным звуком, наверняка хоть раз сталкивался с интегрированными системами фонового звука. Ведь ни для кого не секрет, что из таких малых и средних проектов может состоять едва ли не бо льшая часть продаж и у дистрибьютора оборудования, и у дилера, и у инсталлятора. А, в отличие от больших систем, «распределёнка» не требует сложных расчетов, создания акустических моделей и другой рутинной предпродажной работы. Опытный специалист может составить типовую спецификацию «в уме», зная только габаритные размеры помещения. И, конечно, такая система будет работать, но, как говорится в известном анекдоте, есть один нюанс…

Благодаря успешной работе маркетологов и продавцов, владельцы и франчайзи кафе, ресторанов, магазинов и торговых центров по всему миру, и в нашей стране, теперь вполне понимают, что правильный звук - это важно как для настроения и лояльности клиента, так и для эффективности того же рекламного контента. И, пусть я сейчас говорю выдержками из красочных каталогов любого производителя потолочных акустических систем, результаты труда маркетологов мы видим - все серьезные мировые бренды давно вышли на российский рынок и обратили клиента в свою веру. А грамотный руководитель бизнеса в этой сфере наконец перестал пренебрегать качеством звука, как было еще не так давно.

Казалось бы, дело сделано - формируй типовое предложение и меняй в нем количество акустических систем в зависимости от конфигурации помещения. Но всё не так просто. Вернее, относительно просто, если подходить к построению систем с позиции наименьших временных затрат на единицу товара. И в этом есть логика. А самый неоспоримый аргумент - «это ж не филармония!» - уже стал практически хрестоматийным, и он идеально применим к любому объекту, кроме, собственно говоря, той самой филармонии.

Вероятно, кто-то из вас скажет: «Это праздные рассуждения ни о чем», поэтому я перейду, наконец, к главному.

Сверхзадача статьи как раз и состоит в развенчивании распространенного мнения о том, что проектирование системы фонового звука не стоит хоть сколько-нибудь серьезных временных и умственных затрат. Что касается времени, я частично соглашусь - мало кто из нас располагает им в таком количестве, чтобы позволить себе потратить часик-другой на выбор одной из двух соседних потолочных секций для громкоговорителя. А вот подключение инженерной мысли поможет нам получить лучший результат из тех же продуктов, что и у конкурентов. И результат при правильном подходе понравится как клиенту, так и вашему отделу продаж. Согласитесь, что при нынешнем ассортименте очень похожего друг на друга звукового оборудования разных производителей, предназначенного для коммерческих систем, всё же главный, если не единственный, способ привлечь и удержать клиента - предложить наиболее привлекательную цену. И поскольку редкий покупатель будет с трепетом относиться к качеству звучания и сможет его объективно оценить, в большинстве случаев выиграет тот, предложит более экономичное решение.

Но давайте попробуем абстрагироваться от всех коммерческих составляющих и сконцентрируемся на родном и близком сердцу - на инженерной части.

Инженер, твой выход!

Существует тысяча и одна рекомендация по расчету тех же потолочных акустических систем. Давайте именно с них и начнем. Что только не предлагают нам производители для упрощения нашего труда… Один вендор распространяет среди партнёров талмуды с рекомендациями по расчету, другой предлагает «юзер-френдли» акустические симуляторы, в которых любой может нарисовать нужную конфигурацию громкоговорителей, третий пишет приложения-калькуляторы, в которые достаточно ввести линейные размеры помещения, и получишь сформированный отчет со схемой расположения. Среди последних, например, JBL, предлагающий свой калькулятор чуть ли не для каждой серии продукции. Это, признаюсь, наиболее удобно, и при правильном использовании дает быстрый и приближенный к реальности результат. Но обо всём по порядку.

Считаю необходимым «разобрать по косточкам» плюсы и минусы существующих методов.

Метод, который без сомнения автономен и энергонезависим - графический, похожий по своему принципу на построение лучевого эскиза. Для него требуется знать номинальный угол раскрытия громкоговорителя и высоту потолка. Вот как выглядит результат:

Рис. 1. Графический расчет шага расположения потолочных громкоговорителей. A - расстояние от пола до ушей слушателя; B - расстояние от ушей до потолка; C - угол раскрытия громкоговорителя; D - точка пересечения лучей соседних громкоговорителей.

Все достаточно просто. Графически изображается угол раскрытия громкоговорителя, высота ушей слушателя (принято брать 1-1,2 метра человек в сидячем положении и 1,5 метра - в стоячем), и точка пересечения горизонтали и лучей угла раскрытия считается критической точкой, которую должен пересекать луч от соседнего громкоговорителя. Таким способом и определяют шаг расположения акустических систем.

А теперь копнем чуть глубже. Известно, что величина угла раскрытия, указанная в паспорте громкоговорителя является номинальной, т.е. усредненной по частотной полосе, определяемой производителем на своё усмотрение. И ни для кого не секрет, что направленные свойства любого реального излучателя серьезно разнятся в различных частотных полосах. В результате, мы выполняем расчет, порой даже не зная, в каком диапазоне получили правильное покрытие. Так что, коллеги, будьте внимательны - сделав такой расчет с использованием номинального угла раскрытия, вы вполне можете получить «ямы» в частотных полосах, например, выше 8-10 кГц.

Теперь еще один нюанс. Номинальный угол раскрытия, как правило, высчитывается из полярных диаграмм таким образом, что при отклонении в сторону от оси излучения на ½ заявленного угла раскрытия падение уровня давления составит 6 дБ. Притом, снова внимание, на равном расстоянии от излучателя.

Рис. 2. Графический расчет шага расположения потолочных громкоговорителей. A - расстояние от пола до ушей слушателя; B - расстояние от ушей до потолка; C - угол раскрытия громкоговорителя; D - точка падения уровня звукового давления на 6 дБ

Выходит, в точке пересечения горизонтали и луча падение будет уже не 6 дБ, а больше. Ну, ничего страшного, вооружаемся циркулем и решаем проблему.

Однако это тоже ещё далеко не всё. Как вы думаете, когда мы пересечем лучи от соседних громкоговорителей в правильной точке, какое давление мы там получим? Имея 2 волны с уровнем давления по -6 дБ SPL относительно оси излучения, мы можем сложить их по правилу энергетического суммирования (Л1, стр.33) как два равных давления и получить сумму, равную -3 дБ относительно оси. Однако это правило работает в случае некогерентного сложения, т.е. например, при неодинаковом расстоянии от источников, а вот в точке пересечения лучей волны когерентны (синфазны), и только в ней складываются во всём спектре, давая удвоение давления, т.е. оно будет практически таким же, как на оси излучения. На рисунке ниже представлен результат расчета в модели с двумя близко расположенными потолочными громкоговорителями.

Рис. 3. Расчет уровня звукового давления с использованием двух потолочных громкоговорителей в октавной полосе с центров на частоте 500 Гц.

В итоге получается вот какая картина: когерентное сложение волн ровно между громкоговорителями существует всегда и дает повышение до +3 дБ на довольно малой площади, а буквально в сантиметрах от этого «шва» волны суммируются некогерентно и наблюдается падение давления. И сразу поясню, что полностью избавиться от этого «шва» не удастся. Ниже приведены результаты акустического моделирования с разным шагом громкоговорителей.

Рис. 4. Диаграмма звукового давления при расположении громкоговорителей на высоте 3 метра от пола с шагом 1.5 метра. Расчет сделан в треть-октавных полосах 10 кГц (нижняя диаграмма) и 400 Гц (верхняя диаграмма).

Рис. 5. Диаграмма звукового давления при расположении громкоговорителей на высоте 3 метра от пола с шагом 3 метра. Расчет сделан в треть-октавных полосах 10 кГц (нижняя диаграмма) и 400 Гц (верхняя диаграмма).

Рис. 6. Диаграмма звукового давления при расположении громкоговорителей на высоте 3 метра от пола с шагом 4,5 метра. Расчет сделан в треть-октавных полосах 10 кГц (нижняя диаграмма) и 400 Гц (верхняя диаграмма).

Шило или мыло?

Ну что ж, результат симуляции показал, что негативный для равномерности покрытия результат даёт как слишком большой шаг громкоговорителей, так и слишком малый. И как раз слишком малое расстояние является едва ли не более серьезной проблемой, ведь распространено заблуждение, что расположив акустические системы с минимальным шагом, мы получим равномерное покрытие по всей области частот. Для высокочастотной области этот тезис справедлив, поскольку любой громкоговоритель обладает более узкой диаграммой направленности в области высоких частот. А что касается некогерентного сложения волн, благодаря интерференции в области низких частот давление в точках пересечения лучей будет гарантированно больше, чем прямо под громкоговорителем, как бы парадоксально это не звучало. Более того, интерференционная картина будет меняться в каждой точке, и чем ближе друг к другу расположены громкоговорители, тем разительнее будут эти изменения. Так стоит ли равномерное покрытие в области высоких частот таких жертв? Не думаю.

Чтобы стало немного понятнее, внесу уточнения. Как известно, направленность волны зависит от её длины - длинные волны (частотой от 160 Гц и ниже) являются всенаправленными, т.е. угол раскрытия любого громкоговорителя на частоте, например, 80 Гц будет равен 360 градусам. В случае с потолочными системами, само собой, 180 градусов. А короткие волны обладают более узкой направленностью, что обусловлено физикой процесса распространения волн. Так, в октавной полосе 16 кГц средний потолочный громкоговоритель может иметь угол раскрытия (на -6 дБ) 45-60 градусов при паспортных номинальных 120 градусах, усредненных по диапазону 1 кГц-8 кГц. Получается, чтобы избежать «звуковых ям», расчет следует проводить, беря за основу именно характеристику раскрытия громкоговорителя на высоких частотах. Верно. Только не столь узконаправленные длинные волны будут создавать несравнимо большее давление, многократно складываться и вычитаться, создавая проиллюстрированные выше суммы и разности с тем бо льшим разбросом давлений, чем ближе друг к другу расположены их источники.

На основании прочитанного Вы имеете полное право обвинить меня в том, что я не дал очевидного ответа, как же именно правильно располагать громкоговорители. Так и есть, но если бы однозначный ответ существовал, в наших услугах не было бы нужды и спроектировать звуковую систему смог бы любой. Именно в этом заключается мастерский, как сейчас его называют, «system design» - в нахождении компромиссного решения, в балансировке между взаимоисключающими требованиями и условиями.

А в остальном, прекрасная Маркиза, всё хорошо, всё хорошо!

Перфекционизм - не такая уж плохая черта, но иногда для продуктивной работы требуется достижимый ориентир. И он у нас тоже есть. В количественной оценке равномерности звукового поля неплохо помогает используемое в статистике т.н. Стандартное Отклонение (STDev). Не буду углубляться в объяснение этого понятия - велик шанс углубиться слишком сильно.

Рис. 7. Стандартное отклонение

Перед нами график распределения неких случайных величин в пределах стандартного отклонения от математического ожидания. Возьмем его за основу, используя в качестве величин распределение уровней звукового давления в помещении.

А теперь договоримся, что значение μ на горизонтальной шкале - это среднее значение уровня звукового давления по всему помещению, а именно - наше математическое ожидание. Значение σ берем за 2 дБ (-20% +25% по абсолютному значению), поскольку вероятный разброс величин относительно ожидаемого может быть различным. Теперь наша задача понять, какой разброс нас удовлетворит, а какой будет считаться неприемлемым. Если на всей измеряемой площади давление одинаковое, то график превратится в прямую линию. Чем больше разброс величин, тем более крутым будет подъем и спад графика данной функции. Так вот, при достаточно равномерном звуковом поле большинство величин сконцентрировано вблизи среднего значения. И этим достаточно равномерным покрытием мы можем считать зону в пределах 1го стандартного отклонения, т.е. если на 68% от всей площади помещения уровень давления колеблется в пределах +-2 дБ от среднего по полному частотному диапазону, то требование выполнено. Правда, увидеть подобную статистику распределения давлений можно лишь проведя акустический расчет.

Несмотря на то, что в стандартах ISO или AES такая интерпретация не зафиксирована, в практике она нередко применяется и в целом отражает реальность, поэтому может служить для Вас хорошим ориентиром и отправной точкой в определении равномерности покрытия площади.

Но не забывайте, что усредненное по всему диапазону значение не всегда описывает полную картину.

Чёрный ящик

Ну что ж, с потолочными громкоговорителями вроде бы разобрались, насколько это было возможно в этом формате. А как быть с настенными системами? Всё ли так просто с ними, как мы привыкли думать? В целом значительно проще просто потому, что, как правило, мы крайне ограничены в размещении корпусных акустических систем - стены, углы, колонны. И при том далеко не любая точка стены доступна под установку громкоговорителя - где-то дизайнерская лепнина, где-то телевизор, где-то вентиляция и так далее.

И одно дело, когда нужно озвучить 100 кв. метров - подобрал угол раскрытия, раскидал по углам 4 громкоговорителя, и всё, готова система - а как поступать с большей площадью? Ищем несущие колонны посреди помещения, радуемся их наличию и облепляем их громкоговорителями. Ну а что делать - вариантов-то нет. Согласен, но с уточнениями. За ответом, как обычно, стоит обратиться к науке.

Вот пример расположения акустических систем в помещении.

Рис. 8. Расположение настенных громкоговорителей на колоннах

В общем смысле всё хорошо, и при правильном выбор громкоговорителей и правильном монтаже проблем не будет. Забегая вперед, скажу, что все из представленных мной далее схем расположения имеют право на существование, но с некими оговорками.

В случае если громкоговорители полнодиапазонные, с раскрытием в сумасшедшие 150 градусов (и такое бывает), расположение их в непосредственной близости друг от друга создаст Вам очень интересную картину интерференции. Чтобы долго не разглагольствовать, в этот раз сразу продемонстрирую акустический расчет, поскольку что-то более наглядное и доступное для понимания придумать сложно.

Рис. 9. Диаграмма уровня звукового давления при расположении громкоговорителей на колоннах в октавной полосе с центром на 500 Гц

Обратите внимание на полученные «лепестки» - это как раз и есть результат сложения и вычитания двух когерентных волн, и расположение их, конечно же, меняется в зависимости от длины волны. Ту же самую картину можно наблюдать при расположении громкоговорителей в кластерах - для правильного сложения волн нужно принимать ряд мер как при проектировании, так и при настройке, но это уже совсем другая история. На всякий случай я обозначу одно очевидное следствие этого факта: в результате интерференции тембр звуковой программы может быть серьезно искажен из-за вычитания некоторых частотных составляющих. Многие специалисты к несчастью, уверены, что любые тембральные искажения исправляются с помощью измерительного микрофона, спектроанализатора и эквалайзера, и искренне удивляются, пытаясь при настройке АЧХ системы «вытянуть» потерянную при интерференции частоту. А на графике ничего не происходит, сколько ни увеличивай гейн фильтра - на +6 дБ, на +12 дБ, да хоть два эквалайзера последовательно включи. Давление на этой частоте просто отсутствует, и взяться ему неоткуда, если в силу одной из множества причин в этом диапазоне произошло вычитание волн.

А теперь возьмем и попробуем избавиться от этих проблем, да еще и удешевим систему, уменьшив количество громкоговорителей.

Рис. 10. Расположение настенных громкоговорителей на колоннах

Рис. 11. Диаграмма уровня звукового давления при расположении громкоговорителей на колоннах в полном частотном диапазоне.

Получается вполне прилично: интерференционные проблемы решены, покрытие в зоне между колоннами близко к идеальному, когерентное сложение волн тоже не критично. В качестве бюджетного варианта такой дизайн вполне жизнеспособен - главное, чтобы шаг колонн позволил Вам уложиться в стандартное отклонение. Но некий нюанс всё же есть. И корень его закопан глубоко в фундаментальной науке.

Благодаря физиологии слуха и, вероятно, эволюции человек способен локализовывать звуковые события, т.е. определять, откуда прибыла звуковая волна - эту способность просто необходимо было выработать для выживания. А как быть когда звуковых волн много, как, например, в первобытной пещере, где помимо прямого звука от источника существует бесчисленное количество отражений, прибывающих со всех сторон? Очень просто. Достаточно было выработать способность определять направление первой волны, которая однозначно по кратчайшему пути прибудет непосредственно из условной пасти хищника, а любое отражение точно пройдёт больший путь и придёт с неким опозданием. Это явление описывает Закон первого волнового фронта (он же Precedence Effect). При наличии нескольких идентичных волн, приходящих с задержкой, мозг определяет направление исключительно по первой волне, даже если вторая и последующие имеет более высокий уровень (превышение до 10 дБ) и приходит с запаздыванием до 30 мс. Подробнее об этом занимательном эффекте и его описании можно прочитать в литературе по психоакустике.

Так к чему всё это? Теперь давайте смоделируем слушателя, движущегося по длине помещения по прямой траектории, и проследим, как для него будет меняться локализация звука. В процессе движения мимо первого громкоговорителя человек будет четко слышать звук слева, по мере его приближения к условной границе раскрытия соотношение интенсивностей волн слева и справа изменяется, поскольку в поле зрения появляется второй громкоговоритель. Наш объект достиг точки равного расстояния между громкоговорителями и обе волны когерентно сложились, дав ему +3 дБ к уровню давления, а локализация звука мгновенно перескочила в точку равного расстояния между источниками, т.е. как раз в то место, где находится в данный момент голова объекта. А следующий же шаг резко сместит звуковое событие вправо, поскольку волна от второго источника теперь будет приходить первой.

В принципе, ничего критичного в этом нет. Но если предполагаются постоянные перемещения клиентов по площади, как, например, в магазине, будет ли им комфортно слушать скачущий из точки в точку звук? Далеко не каждый слушатель анализирует причины своего дискомфорта и связывает их со звуком, восприятие окружения для него складывается несознательно и состоит из совокупности всех ощущений - визуального, аудиального, тактильного и остальных. И достаточно, чтобы хотя бы одно из них вызывало дискомфорт, чтобы остальные оказались незначительными, а субъективное впечатление было испорчено.

На финишной прямой

Пожалуй, основные вопросы расчета расположения громкоговорителей, были рассмотрены, однако будет не совсем честно с моей стороны не упомянуть о том, что почти все эти расчеты учитывают энергию прямой волны от излучателя. А в условиях реальных помещений, наполняемых не только прямым звуком, но и многочисленными отражениями, интерференционные вычитания, конечно, не будут создавать точки с нулевым звуковым давлением. Отраженные волны будут несколько нивелировать провалы и подъемы, само собой, не избавляя от них полностью, и значительно улучшать равномерность покрытия, компенсируя собой недостаток прямого звука в удаленных от его источника точках.

Кстати, один из интересных методов создания нелокализуемого фонового звучания системы основан на использовании реверберации помещения на пользу фоновому звуку. Заключается он в расположении всех акустических систем «лицом» в потолок. Такое расположение практически полностью избавляет слушателя от прямого звука из громкоговорителя, вся энергия, получаемая им, - это множество отраженных волн со всех направлений. Крайне интересный получается эффект в плане пространственности звучания. Единственный минус такого решения - ограничение по контенту. Быстрая поп или рок музыка, не рассчитанная на столь серьезное влияние реверберации, вряд ли прозвучит хорошо из такой системы.

P.S. А что, без кабеля не запоёт?

Несмотря на кажущуюся второстепенность вопроса о кабельных трассах, трудно переоценить важность спикерного (акустического) кабеля для любой звуковой системы. Говорю об этом с полной уверенностью, поскольку, к сожалению, в моей практике не всегда имеется возможность диктовать клиенту, какой кабель ему закупить, и это иногда приводит к немым сценам в стиле чеховского Ревизора, когда на объекте узнаётся, что для звуковой системы был проложен кабель ШВВП. В ответ на свой вопрос я получаю вполне резонный ответ - «А что, работает же!». Работает. Только так работает, что лучше б не работало. В общем, вы понимаете…

И именно поэтому привожу методику расчета сечения кабеля. Те из Вас, для кого она очевидна, и кто прекрасно знает, как делаются такие расчеты, могут смело пропускать эту часть статьи - ничего нового и доселе науке неизвестного я не приведу. А вот если вдруг Вы впервые столкнулись с необходимостью расчета, то эта информация будет полезна ввиду её прикладной применимости.

Расчет эффективного тока:

Расчет эффективной мощности, выделяемой на нагрузке:

100В линии.

Расчет суммарного сопротивления громкоговорителей в линии:
,где

Количество громкоговорителей на линии
- номинальная мощность одного громкоговорителя (Tap setting)

Остальные расчеты выполняются аналогично низкоомным линиям.

Суммарное сопротивление нагрузки в 100-вольтовой линии, как можно заметить, обычно получается не менее 1000 Ом. При таком высоком сопротивлении единицы Ом сопротивления кабеля незначительно влияют на общее сопротивление линии, и, следовательно, увеличивают потери мощности незначительно по сравнению с низкоомным подключением.

Теперь немного об интерпретации результатов. Как определить, какая потеря мощности является допустимой? В общем случае пороговым значением падения уровня мощности на кабеле принято считать 0,5 дБ. Это соответствует потере в 10% относительно номинальной мощности. Например, для 8-омного громкоговорителя допустимым номиналом в 1 кВт предельного по этим нормам падения мощность достигает на линии сечением 2.5 кв.мм длиной в 30 метров. Много это или мало, конечно, решать Вам, и решение тут зависит от конкретной ситуации, но практика показывает, что увеличение сечения кабеля с 2.5 кв.мм до, например, 4 кв.мм существенно не повысит стоимость инсталляции. Поэтому я всегда рекомендую укладываться в 0,5 дБ, ведь это совершенно не трудно сделать. Да и зачем нам терять на линии драгоценные Ватты, когда мы имеем возможность добиться максимальной эффективности системы?

И, несмотря на то, что к трансляционным линиям требования существенно ниже, использование правильного кабеля поможет Вам заставить систему работать эффективнее. Более того, если в Вашей практике Вы не проводили экспериментов по оценке качества звука на разных кабелях (при прочих равных), то поверьте мне на слово, влияние сечения кабеля на звучание действительно заметно на слух. Особенно это касается низкочастотной области - диапазона, при передаче которого развивается наибольшая мощность, и который наиболее требователен к току и демпинг-фактору.

Поэтому, используя так любимую многими аналогию, давайте не будем заливать в Мерседес S-класса 92-ой бензин, а потом удивляться, почему не достигается заявленная производительность.

Как можно заметить по формулам, единственная величина, которая остается неизвестной для расчета кабеля - это его сопротивление, выраженное в Ом/км. Его значение можно найти в спецификации к кабелю. Для этого придется сначала выбрать сечение кабеля навскидку, взять соответствующее значение сопротивления, подставить в формулу и провести расчет. В случае, если Вы получите превышение падения мощности, или наоборот, сечение окажется избыточным, то придется выбрать кабель другого сечения и вернуться к исходной точке расчета. Начинать расчет я обычно рекомендую с сечения 2х2.5 кв.мм (7,5-8 Ом/км) для низкоомных линий и 2х1.5 кв.мм (около 13 Ом/км) для трансформаторных линий. Конечно, это заставит Вас потратить некоторое время на расчет, но для удобства Вы можете создать себе калькулятор в Excel, внеся туда формулы и значения сопротивлений кабелей разного сечения - это займет некоторое время разово, зато избавит от необходимости ручного расчета в дальнейшем.

Благодарим компанию DIGIS за предоставленные материалы

Аудиосистема ПК – комплекс устройств, обеспечивающих воспроизведение, запись и обработку звука с помощью ПК. Включает аудиодаптер (звуковая плата), акустическую систему (динамики с усилителем НЧ, наушники), микрофон.

Аудиоадаптер – дочерняя плата, обеспечивающая преобразование цифровых данных в аналоговые и обратно для вывода/ввода звука с помощью ПК.

Всегда имеет выход для передачи звукового сигнала на усилитель и вход для ввода звукового сигнала с внешнего источника в ПК для последующей обработки. Дорогие аудиоадаптеры имеют несколько входов и выходов.

Аудиоадаптеры различаются:

1)разрядностью ввода/вывода цифрового звука

2)способами синтеза звука

3)наличием/отсутствием микросхем создания дополнительных звуковых эффектов (преобразование звука, объемный 3D-звук и т.д.)

С помощью аудиосистемы ПК можно воспроизводить обычные аудио-CD, но для хранения звуковых данных в ПК разработаны специальные более эффективные форматы. Наиболее популярными являются – MP3 и WMA. Они позволяет на одном компакт-диске хранить в 10-15 раз больший объем звуковых данных, чем на обычном аудио-диске.

Достичь хорошего звучания можно только при использовании высококачественной компьютерной аудиосистемы, но еще лучше передавать звук через цифровой выход на качественный бытовой усилитель и колонки.

Стандарты аудиорешений: AC"97 и HD Audio В качестве интегрированного аудиорешения в системных платах Intel® для настольных ПК используется либо AC"97, либо звуковая подсистема Intel® High Definition Audio.

AC"97 AC"97 (сокращенно от Audio Codec "97) – это стандарт для аудиокодеков, разработанный в лабораториях Intel (Intel Architecture Labs) в 1997 г. Этот стандарт используется в основном в системных платах, модемах, звуковых картах и корпусах с аудио решением передней панели. AC"97 поддерживает частоту дискретизации 96 кГц при использовании 20-разрядного стерео разрешения и 48кГц при использовании 20-разрядного стерео для многоканальной записи и воспроизведения. В 2004 г. AC"97 был заменен технологией Intel® High Definition Audio (HD Audio).

HD Audio Звуковая подсистема Intel® High Definition Audio основана на спецификации, выпущенной корпорацией Intel в 2004 г., обеспечивающей воспроизведение большего количества каналов с более высоким качеством звука, чем обеспечивалось при использовании интегрированных аудио кодеков, как AC"97. Аппаратные средства, основанные на HD Audio, поддерживают 192 кГц/32-разрядное качество звучания в двухканальном и 96 кГц/32-разрядное в многоканальном режимах (до 8 каналов).

Microsoft* Windows Vista поддерживает только акустические периферийные устройства High Definition (как, например, аудиорешения передней панели).

Отсутствует вывод звука в колонках или наушниках Отсутствие вывода звука может быть связано с несколькими проблемами. Проблему отсутствия звукового выхода можно решить одним из следующих способов.

Звуковая система персонального компьютера служит для воспроизведения звуковых эффектов и речи, сопровождающей воспроизводимую видеоинформацию, и включает:

модуль записи/воспроизведения;
синтезатор;
модуль интерфейсов;
микшер;
акустическую систему.

Компоненты звуковой системы (исключая акустическую систему) конструктивно оформляются в виде отдельной звуковой платы или частично реализуются в виде микросхем на материнской плате компьютера.

Как правило, сигналы на входе и выходе модуля записи/воспроизведения имеют аналоговую форму, но обработка звуковых сигналов происходит в цифровой форме. Поэтому основные функции модуля записи/воспроизведения сводятся к аналого-цифровому и цифро-аналоговому преобразованиям.

Для этого входной аналоговый сигнал подвергается импульсно-кодовой модуляции (ИКМ), суть которой заключается в дискретизации времени и представлении (измерении) амплитуд аналогового сигнала в дискретные моменты времени в виде двоичных чисел. Необходимо так выбрать частоту дискретизации и разрядность двоичных чисел, чтобы точность аналого-цифрового преобразования соответствовала требованиям, предъявляемым к качеству воспроизведения звука.

Согласно теореме Котельникова, если шаг дискретизации по времени, отделяющий соседние отсчеты (измеренные амплитуды), не превышает половины периода колебаний высшей составляющей в частотном спектре преобразуемого сигнала, то дискретизация времени не вносит искажений и не приводит к потерям информации. Если для высококачественного звучания достаточно, чтобы воспроизводился спектр шириной в 20 кГц, то частота дискретизации должна быть не ниже 40 кГц. В звуковых системах персональных компьютеров (ПК) обычно принимают частоту дискретизации, равную 44,1 или 48 кГц.

Ограниченная разрядность двоичных чисел, представляющих амплитуды сигналов, обусловливает дискретизацию величин сигнала. В звуковых картах в большинстве случаев применяют 16-разрядные двоичные числа, что соответствует 216 уровням квантования или 96 дБ. Иногда используют 20- или даже 24-разрядное аналого-цифровое преобразование.

Очевидно, что повышение качества звучания путем увеличения частоты f дискретизации и числа k уровней квантования приводит к существенному росту объема S получающихся цифровых данных, так как

S = f t log2k / 8,

где t — длительность звукового фрагмента, S, f и t — измеряются в Мбайтах, МГц и секундах соответственно. При стереофоническом звучании объем данных увеличивается вдвое. Так, при частоте 44,1 кГц и 216 уровней квантования количество информации для представления звукового стереофонического фрагмента длительностью в 1 мин составляет около 10,6 Мбайт. Для снижения требований как к емкости памяти для хранения звуковой информации, так и к пропускной способности каналов передачи данных используют сжатие (компрессию) информации.

Модуль интерфейсов используется для передачи оцифрованной звуковой информации к другим устройствам ПК (памяти, акустической системе) через посредство шин компьютера. Пропускной способности шины ISA, как правило, недостаточно, поэтому используют другие шины — PCI, специальный интерфейс музыкальных инструментов MIDI или некоторые другие интерфейсы.

С помощью микшера можно смешивать звуковые сигналы, создавая полифоническое звучание, накладывать музыкальное сопровождение на речь, сопровождающую мультимедийные фрагменты и т.п.

Синтезатор предназначен для генерирования звуковых сигналов, чаще всего для имитации звучания различных музыкальных инструментов. Для синтеза используют частотную модуляцию, таблицы волн, математическое моделирование. Исходные данные для синтезаторов (коды нот и типов инструментов) обычно представляют в формате MIDI (расширение MID в имени файлов). Так, при применении метода частотной модуляции управляют частотой и амплитудой суммируемых сигналов от основного генератора и генератора обертонов. Согласно методу таблицы волн результирующий сигнал получают, комбинируя оцифрованные образцы звуков, полученных от реальных музыкальных инструментов. В методе математического моделирования вместо экспериментально полученных образцов используют математические модели звуков.

Звуковые устройства становятся неотъемлемой частью каждого персонального компьютера. В процессе конкурентной борьбы был выработан универсальный, широко поддерживаемый стандарт звукового программного и аппаратного обеспечения. Звуковые устройства превратились из дорогих экзотических дополнений в привычную часть системы практически любой конфигурации.

В современных компьютерах аппаратная поддержка звука реализуется в одной из следующих форм:

аудиоадаптер, помещаемый в разъем шины PCI или ISA;
микросхема на системной плате, выпускаемая компаниями Crystal, Analog Devices, Sigmatel, ESS и др.;
звуковые устройства, интегрированные в базовый набор микросхем системной платы, к которым относятся наиболее современные наборы микросхем компаний Intel, SiS и VIA Technologies, созданные для недорогих компьютеров.

Кроме основного аудиоустройства, существует еще множество дополнительных аудиоустройств: акустические системы, микрофон и др. В данной главе рассматриваются функциональность и особенности работы всех компонентов аудиосистемы компьютера.

Первые звуковые платы появились в конце 1980-х гг. на базе разработок компаний AdLib, Roland и Creative Labs и использовались только для игр. В 1989 г. компания Creative Labs выпустила стереозвуковую плату Game Blaster; позднее появилась плата Sound Blaster Pro.

Для стабильного функционирования платы требовались определенные программные (MS DOS, Windows) и аппаратные ресурсы (IRQ, DMA и адреса порта ввода-вывода).

В связи с проблемами, возникающими в процессе применения звуковых плат, не совместимых с системой Sound Blaster Pro, в декабре 1995 г. появилась новая разработка компании Microsoft - DirectX, которая представляет собой серию программируемых интерфейсов приложения (Application Program Interfaces - API) для непосредственного взаимодействия с устройствами аппаратного обеспечения.

Сегодня практически каждый компьютер оснащен звуковым адаптером того или иного типа и устройством CD-ROM или

CD-ROM-совместимым дисководом. После принятия стандартов МРС-1-МРС-3, определяющих классификацию компьютеров, системы, оборудованные звуковой платой и CD-ROM-совместимым накопителем, получили название мультимедийных компьютеров (Multimedia PC). Первый стандарт МРС-1 был представлен в 1990 г.; стандарт МРС-3, сменивший его в июне 1995 г., определил следующие минимальные требования к аппаратному и программному обеспечению:

процессор - Pentium, 75 МГц;
оперативная память - 8 Мб;
жесткий диск - 540 Мб;
дисковод CD-ROM - четырехскоростной (4х);
разрешающая способность VGA - 640 х 480;
глубина цвета - 65 536 цветов (16-битовый цвет);
минимальная операционная система - Windows 3.1.

Любые компьютеры, созданные после 1996 г., содержащие

звуковой адаптер и CD-ROM-совместимый дисковод, полностью удовлетворяют требованиям стандарта МРС-3.

В настоящее время критерии принадлежности компьютера к классу мультимедийных несколько изменились в связи с техническими достижениями в этой области:

процессор - Pentium III, Celeron, Athlon, Duron или какой-либо другой процессор класса Pentium, 600 МГц;
оперативная память - 64 Мб;
жесткий диск - 3,2 Гб;
гибкий диск - 1,44 Мб (3,5" диск с высокой плотностью размещения данных);
дисковод CD-ROM - 24-скоростной (24х);
звуковая частота дискретизации - 16-разрядная;
разрешающая способность VGA - 1024 х 768;
глубина цвета - 16,8 млн цветов (24-битовый цвет);
устройства ввода-вывода - параллельный, последовательный, MIDI, игровой порт;
минимальная операционная система - Windows 98 или Windows Me.

Несмотря на то, что звуковые колонки или наушники технически не являются частью МРС-спецификации или приведенного выше перечня, они необходимы для воспроизведения звука. Кроме того, для ввода голосовой информации, используемой для записи звука или речевого управления компьютером, требуется микрофон. Системы, оснащенные звуковым адаптером, обычно содержат также недорогие пассивные или активные колонки (могут быть заменены наушниками, обеспечивающими требуемое качество и частотные характеристики воспроизводимого звука).

Мультимедийный компьютер, оснащенный колонками и микрофоном, обладает рядом возможностей и обеспечивает:

добавление стереозвука к развлекательным (игровым) программам;
увеличение эффективности образовательных программ (для маленьких детей);
добавление звуковых эффектов в демонстрационные и обучающие программы;
создание музыки с помощью аппаратных и программных средств MIDI;
добавление в файлы звуковых комментариев;
реализацию звуковых сетевых конференций;
добавление звуковых эффектов к событиям операционной системы;
звуковое воспроизведение текста;
проигрывание аудиокомпакт-дисков;
проигрывание файлов формата.mp3;
проигрывание видеоклипов;
воспроизведение DVD-фильмов;
поддержку управления голосом.

Компоненты аудиосистемы. При выборе аудиосистемы необходимо учитывать параметры ее компонентов.

Разъемы звуковых плат. Большинство звуковых плат имеет одинаковые миниатюрные (1/8") разъемы, с помощью которых сигналы подаются с платы на акустические системы, наушники и входы стереосистемы; к аналогичным разъемам подключается микрофон, проигрыватель компакт-дисков и магнитофон. На рис. 5.4 показаны четыре типа разъемов, которые как минимум должны быть установлены на звуковой плате. Цветовые обозначения разъемов каждого типа определены в руководстве РС99 Design Guide и варьируются для различных звуковых адаптеров.

Рис. 5.4.

Перечислим наиболее распространенные разъемы:

линейный выход платы. Сигнал с этого разъема подается на внешние устройства - акустические системы, наушники или на вход стереоусилителя, с помощью которого сигнал усиливают до требуемого уровня;
линейный вход платы. Используется при микшировании или записи звукового сигнала, поступающего от внешней аудиосистемы на жесткий диск;
разъем для акустической системы и наушников. Присутствует не во всех платах. Сигналы на акустические системы подаются с того же разъема (линейного выхода), что и на вход стереоусилителя;
микрофонный вход, или вход монофонического сигнала. Применяется для подключения микрофона. Запись с микрофона является монофонической. Уровень входного сигнала при этом поддерживается постоянным и оптимальным для преобразования. Для записи лучше всего использовать электродинамический или конденсаторный микрофон, рассчитанный на сопротивление нагрузки от 600 Ом до 10 кОм. В некоторых дешевых звуковых платах микрофон подключается к линейному входу;
разъем для джойстика (MIDI-порт). Представляет собой 15-контактный D-образный разъем. Два его контакта можно использовать для управления устройством MIDI, например клавишным синтезатором. В этом случае необходимо приобрести Y-образный кабель;
разъем MIDI. Включается в порт джойстика, имеет два круглых 5-контактных разъема DIN, используемых для подключения устройств MIDI, а также разъем для джойстика;
внутренний контактный разъем - специальный разъем для подключения к внутреннему накопителю CD-ROM. Позволяет воспроизводить звук с компакт-дисков через акустические системы, подключенные к звуковой плате. Этот разъем отличается от разъема для подключения контроллера CD-ROM к звуковой плате, так как данные по нему не передаются на шину компьютера.

Дополнительные разъемы. Большинство современных звуковых адаптеров поддерживает возможности воспроизведения DVD, обработки звука и т. д., а следовательно, имеет несколько дополнительных разъемов, особенности которых приведены ниже:

вход и выход MIDI. Такой разъем, не совмещенный с игровым портом, позволяет одновременно использовать как джойстик, так и внешние устройства MIDI;
вход и выход SPDIF (Sony/Philips Digital Interface - SP/DIF). Разъем используется для передачи цифровых аудиосигналов между устройствами без их преобразования к аналоговому виду. Интерфейс SPDIF иногда называют Dolby Digital;
CD SPDIF. Разъем предназначен для подключения накопителя CD-ROM к звуковой плате с помощью интерфейса SPDIF;
вход TAD. Разъем для подключения модемов с поддержкой автоответчика (Telephone Answering Device) к звуковой плате;
цифровой выход DIN. Разъем предназначен для подключения многоканальных цифровых акустических систем;
вход Аих. Обеспечивает подключение к звуковой карте других источников сигнала, например ТВ-тюнера;
вход I2S. Позволяет подключать к звуковой карте цифровой выход внешних источников, например DVD.

Дополнительные разъемы обычно располагаются непосредственно на звуковой плате или подсоединяются к внешнему блоку или дочерней плате. Например, Sound Blaster Live! Platinum 5.1 представляет собой устройство, состоящее из двух частей. Сам звуковой адаптер подключается посредством разъема PCI, а дополнительные соединители - к внешнему коммутационному блоку LiveDrive IR, который устанавливается в неиспользуемый отсек дисковода.

Управление громкостью. В некоторых звуковых платах предусмотрено ручное регулирование громкости; на более сложных платах управление громкостью осуществляется программно с помощью комбинаций клавиш, непосредственно в процессе игры в системе Windows или в каком-либо приложении.

Синтезаторы. В настоящее время все выпускаемые платы являются стереофоническими, поддерживающими стандарт MIDI.

Стереофонические звуковые платы одновременно воспроизводят (и записывают) несколько сигналов от двух различных источников. Чем больше сигналов предусмотрено в адаптере, тем натуральнее звук. Каждая расположенная на плате микросхема синтезатора, чаще всего компании Yamaha, позволяет получить 11 (микросхема YM3812 или OPL2) сигналов или более. Для имитации более 20 сигналов (микросхема YMF262 или OPL3) устанавливается одна либо две микросхемы частотных синтезаторов.

В таблично-волновых звуковых платах вместо синтезированных звуков, генерируемых микросхемой частотной модуляции, используются цифровые записи реальных инструментов и звуковых эффектов. Например, при воспроизведении таким аудиоадаптером звука трубы слышится непосредственно звук трубы, а не его имитация. Первые звуковые платы, поддерживающие эту функцию, содержали до 1 Мб звуковых фрагментов, хранящихся в микросхемах памяти адаптера. Но в результате появления высокоскоростной шины PCI и увеличения объема оперативной памяти компьютеров в большинстве звуковых плат в настоящее время используется так называемый программируемый таблично-волновой метод, позволяющий загружать в оперативную память компьютера 2-8 Мб коротких звуковых фрагментов различных музыкальных инструментов.

В современных компьютерных играх MIDI-звук практически не используется, но, несмотря на это, изменения, произведенные в звуковой плате DirectX 8, делают его приемлемым вариантом для игровых фонограмм.

Сжатие данных. В большинстве плат качество звучания соответствует качеству компакт-дисков с частотой дискретизации

44,1 кГц, когда на каждую минуту звучания при записи даже обычного голоса расходуется около 11 Мб дискового пространства. Для того чтобы уменьшить размеры звуковых файлов, во многих платах используется сжатие данных. Например, в плате Sound Blaster ASP 16 сжатие звука осуществляется в реальном времени (непосредственно при записи) со степенью сжатия 2:1, 3: 1 или 4:1.

Поскольку для хранения звукового сигнала необходим большой объем дискового пространства, выполняется его сжатие методом адаптивной дифференциальной импульсно-кодовой модуляции (Adaptive Differential Pulse Code Modulation - ADPCM), что позволяет уменьшить размер файла примерно на 50 %. Правда, при этом ухудшается качество звука.

Многофункциональные сигнальные процессоры. Во многих звуковых платах используются процессоры цифровой обработки сигналов (Digital Signal Processor - DSP). Благодаря им платы стали более «интеллектуальными» и освободили центральный процессор компьютера от выполнения таких трудоемких задач, как очистка сигналов от шума и сжатие данных в режиме реального времени.

Процессоры устанавливаются во многих универсальных звуковых платах. Например, программируемый процессор цифровой обработки сигналов EMU10K1 платы Sound Blaster Live! сжимает данные, преобразует текст в речь и синтезирует так называемое трехмерное звучание, создавая эффект отражения звука и хорового сопровождения. При наличии такого процессора звуковая плата превращается в многофункциональное устройство. Например, в коммуникационной плате WindSurfer компании IBM цифровой процессор выполняет функции модема, факса и цифрового автоответчика.

Драйверы звуковых плат. С большинством плат поставляются универсальные драйверы для DOS- и Windows-приложений. В операционных системах Windows 9х и Windows NT уже существуют драйверы для популярных звуковых плат; драйверы для других плат можно приобрести отдельно.

Приложения DOS обычно не имеют широкого выбора драйверов, но компьютерные игры поддерживают адаптеры Sound Blaster Pro.

В последнее время требования к звуковым устройствам существенно возросли, что обусловило в свою очередь повышение мощности аппаратных средств. Современное унифицированное мультимедийное аппаратное обеспечение не может в полной мере считаться совершенной мультимедийной системой, характеризующейся следующими особенностями:

реалистичный объемный звук в компьютерных играх;
высококачественный звук в DVD-фильмах;
распознавание речи и голосовое управление;
создание и запись звуковых файлов форматов MIDI, MP3, WAV и CD-Audio.

Дополнительные требования к аппаратному и программному обеспечению, необходимые для достижения вышеперечисленных характеристик, представлены в табл. 5.3.

Таблица 5.3. Дополнительные возможности и свойства звуковых адаптеров

Назначение	Необходимые возможности	Дополнительное аппаратное обеспечение	Дополнительное программное обеспечение
	Игровой порт; трехмерный звук; аудиоускорение	Игровой контроллер; задние колонки
Фильмы формата DVD	Декодирование Dolby 5.1	Колонки с аудиоадаптером, совместимые с Dolby 5.1	Программа декодирования файлов MPEG
	Программно-совместимый аудиоадаптер	Микрофон	Программное обеспечение, позволяющее диктовать тексты
Создание файлов MIDI	Аудиоадаптер с MIDI-входом	MIDI-совместимая музыкальная клавиатура	Программа для создания MIDI-файлов
Создание файлов MP3	Оцифровка звуковых файлов	Дисковод CD-R или CD-RW	Программа для создания МРЗ-файлов
Создание файлов WAV	Микрофон		Программа звукозаписи
Создание файлов CDAudio	Внешний источник звука		Программа преобразования файлов WAV или MP3 в CD-Audio

Минимальные требования, предъявляемые к звуковым платам.

Замена прежнего аудиоадаптера Sound Blaster Pro стандарта ISA звуковой платой PCI позволила значительно улучшить рабочие характеристики системы, однако целесообразно использовать все возможности звуковых плат, к которым в частности относятся:

поддержка трехмерного звука, реализованная в наборе микросхем. Выражение «трехмерный звук» означает, что звуки, соответствующие происходящему на экране, раздаются дальше или ближе, за спиной или где-то в стороне. Интерфейс Microsoft DirectX 8.0 включает поддержку трехмерного звука, однако для этого лучше использовать аудиоадаптер с аппаратно встроенной поддержкой трехмерного звука;
использование интерфейса DirectX 8.0 наряду с другими интерфейсами API трехмерного звука, к которым относятся, например, ЕАХ компании Creative, 3D Positional Audio компании Sensaura и технология A3D ныне не существующей компании Aureal;
ЗО-звуковое ускорение. Звуковые платы с наборами микросхем, поддерживающими эту возможность, имеют достаточно низкий коэффициент загрузки процессора, что приводит к общему увеличению скорости игр. Для получения наилучших результатов следует воспользоваться наборами микросхем, поддерживающими ускорение наибольшего числа 3D-потоков; в противном случае обработка трехмерного звука центральным процессором будет затруднена, что в конечном счете скажется на скорости игры;
игровые порты, поддерживающие игровые контроллеры с силовой обратной связью.

Сегодня существует множество звуковых плат среднего уровня, поддерживающих как минимум две из перечисленных функций. При этом розничная цена аудиоадаптеров не превышает 50-100 долл. Новые наборы микросхем трехмерного звука, поставляемые различными производителями, позволяют любителям компьютерных 3D-игр модернизировать систему в соответствии со своими пожеланиями.

Фильмы в формате DVD на экране компьютера. Для просмотра фильмов в формате DVD на компьютере необходимы следующие компоненты:

программное обеспечение для воспроизведения цифровых дисков, поддерживающее выход Dolby Digital 5.1. Одним из наиболее приемлемых вариантов является программа PowerDVD;
аудиоадаптер, поддерживающий входной сигнал Dolby Digital дисковода DVD и выводящий данные на Dolby Digital 5.1-совместимые звуковые аппаратные устройства. При отсутствии соответствующего аппаратного обеспечения вход Dolby 5.1 настраивается для работы с четырьмя колонками; кроме того, можно добавить вход S/PDIF ACS (Dolby Surround), предназначенный для четырехколоночных акустических систем;
Dolby Digital 5.1-совместимые приемник и колонки. Большинство высококачественных звуковых плат, поддерживающих систему Dolby Digital 5.1, соединены со специальным аналого-входным приемником, но ряд других, например, звуковые платы серии Creative Labs Sound Blaster Live! Platinum, поддерживают и акустические системы с цифровым входом, добавляя к плате дополнительный разъем Digital DIN.

Распознавание речи. Технология распознавания речи пока несовершенна, но уже сегодня существуют программы, позволяющие отдавать компьютеру команды голосом, вызывать нужные приложения, открывать файлы и необходимые диалоговые окна и даже диктовать ему тексты, которые раньше пришлось бы набирать.

Для типичного пользователя приложения этого типа бесполезны. Так, компания Compaq некоторое время поставляла компьютеры с микрофоном и приложением для голосового управления, причем стоило приложение очень дешево. Наблюдать за множеством пользователей в офисе, говорящих с компьютерами, было, конечно, интересно, но производительность фактически не увеличилась, зато много времени было потрачено впустую, поскольку пользователи были вынуждены экспериментировать с программным обеспечением, а кроме того, в офисе стало очень шумно.

Однако для пользователей с ограниченными возможностями по здоровью программное обеспечение этого типа может представлять определенный интерес, поэтому технология распознавания речи непрерывно развивается.

Как уже было сказано выше, существует еще один тип программного обеспечения распознавания речи, которое позволяет преобразовывать речь в текст. Это необычайно трудная задача, прежде всего из-за различий в речевых моделях разных людей, поэтому почти все программное обеспечение, в том числе некоторые приложения для подачи команд голосом, предусматривают этап «обучения» технологии распознавания голоса конкретного пользователя. В процессе такого обучения пользователь читает текст (или слова), бегущий на экране компьютера. Поскольку текст запрограммирован, компьютер быстро адаптируется к манере речи говорящего.

В результате проведенных экспериментов оказалось, что качество распознавания зависит от индивидуальных особенностей речи. Кроме того, некоторые пользователи способны диктовать целые страницы текста без прикосновений к клавиатуре, в то время как другие от этого утомляются.

Существует множество параметров, влияющих на качество распознавания речи. Перечислим основные из них:

программы распознавания дискретной и слитной речи. Слитная (или связная) речь, позволяющая вести более естественный «диалог» с компьютером, в настоящее время является стандартной, но, с другой стороны, есть ряд неразрешимых пока проблем в достижении приемлемой точности распознавания;
обучаемые и необучаемые программы. «Обучение» программы для корректного распознавания речи дает хорошие результаты даже в тех приложениях, которые позволяют пропустить этот этап;
большие активные и общие словари. Программы с большим активным словарем значительно быстрее реагируют на устную речь, а программы, имеющие больший общий словарь, позволяют сохранить уникальный запас слов;
производительность аппаратного обеспечения компьютера. Увеличение быстродействия процессоров и объема оперативной памяти приводит к ощутимому повышению скорости и точности программ распознавания речи, а также позволяет разработчикам вводить дополнительные возможности в новые версии приложений;
высококачественная звуковая плата и микрофон: наушники со встроенным микрофоном предназначены не для записи музыки или звуковых эффектов, а именно для распознавания речи.

Звуковые файлы. Для хранения аудиозаписей на персональном компьютере существуют файлы двух основных типов. В файлах первого типа, называемых обычными звуковыми файлами, используются форматы.wav, .voc, .au и.aiff. Звуковой файл содержит данные о форме волны, т. е. представляет собой запись аналоговых аудиосигналов в цифровой форме, пригодной для хранения на компьютере. Определены три уровня качества записи звуков, применяемых в операционных системах Windows 9х и Windows Me, а также уровень качества записи звука с характеристиками 48 кГц, 16-разрядный стерео и 188 Кб/с. Этот уровень предназначен для поддержки воспроизведения звука из таких источников, как DVD и Dolby АС-3.

Для достижения компромисса между высоким качеством звука и малым размером файла можно преобразовать файлы формата.wav в формат.mp3.

Сжатие аудиоданных. Существует две основные области, в которых применяется сжатие звука:

использование звуковых фрагментов на веб-узлах;
уменьшение объема высококачественных музыкальных файлов.

Специальные программы редактирования звуковых файлов, в частности, RealProducer компании Real или Microsoft Windows Media Encoder 7, позволяют уменьшать объем звуковых фрагментов при минимальной потере качества.

Самый популярный формат звуковых файлов - .mp3. Качество этих файлов приближается к качеству звучания компакт-диска, а по размеру они намного меньше обычных файлов.wav. Так, звуковой файл продолжительностью звучания 5 мин формата.wav с качеством компакт-диска имеет размер около 50 Мб, в то время как тот же звуковой файл формата.mp3 - около 4 Мб.

Единственным недостатком файлов формата.mp3 является отсутствие защиты от несанкционированного использования, т. е. любой желающий может свободно загрузить такой файл из Интернета (благо веб-узлов, предлагающих эти «пиратские» записи, существует великое множество). Описываемый формат файлов, несмотря на недостатки, получил довольно широкое распространение и обусловил массовое производство трЗ-плееров.

Файлы MIDI. Звуковой файл формата MIDI отличается от формата.wav так же, как векторный рисунок от растра. Файлы MIDI имеют расширение.mid или.rmi и являются полностью цифровыми, содержащими не запись звука, а команды, используемые аудиооборудованием для его создания. Подобно тому как по командам видеоадаптеры создают изображения трехмерных объектов, звуковые платы MIDI работают с файлами MIDI, чтобы синтезировать музыку.

MIDI - мощный язык программирования, который получил распространение в 1980-е гг. и разработан специально для электронных музыкальных инструментов. Стандарт MIDI стал новым словом в области электронной музыки. С помощью MIDI можно создавать, записывать, редактировать и воспроизводить музыкальные файлы на персональном компьютере или на MIDI-co- вместимом электронном музыкальном инструменте, подключенном к компьютеру.

Файлы MIDI в отличие от других типов звуковых файлов требуют относительно небольшого объема дискового пространства. Для записи 1 ч стереомузыки, хранимой в формате MIDI, требуется менее 500 Кбайт. Во многих играх используется запись звуков в формате MIDI, а не записи дискретизированного аналогового сигнала.

Файл MIDI - фактически цифровое отображение музыкальной партитуры, составленное из нескольких выделенных каналов, каждый из которых представляет различный музыкальный документ или тип звука. В каждом канале определены частоты и продолжительность звучания нот: в результате файл MIDI, например, для струнного квартета, содержит четыре канала, которые представляют две скрипки, альт и виолончель.

Все три спецификации МРС, а также РС9х предусматривают поддержку формата MIDI во всех звуковых платах. Стандарт General MIDI для большинства звуковых плат предусматривает до 16 каналов в единственном файле MIDI, но это не обязательно ограничивает звук 16 инструментами. Один канал способен представлять звук группы инструментов; поэтому можно синтезировать полный оркестр.

Поскольку файл MIDI состоит из цифровых команд, редактировать его намного легче, чем звуковой файл типа.wav. Соответствующее программное обеспечение позволяет выбирать любой канал MIDI, записывать ноты, а также добавлять эффекты. Определенные пакеты программ предназначены для записи музыки в файле MIDI, используя стандартную музыкальную систему обозначений. В результате композитор пишет музыку непосредственно на компьютере, редактирует ее при необходимости, а затем распечатывает ноты для исполнителей. Это очень удобно для профессиональных музыкантов, которые вынуждены тратить много времени на переписывание нот.

Проигрывание файлов MIDI. Запуск файла MIDI на персональном компьютере не означает воспроизведение записи. Компьютер фактически создает музыку по записанным командам: система читает файл MIDI, синтезатор генерирует звуки для каждого канала в соответствии с командами в файле, для того чтобы придать нужный тон и длительность звучанию нот. Для получения звука определенного музыкального инструмента синтезатор использует предопределенный образец, т. е. набор команд, с помощью которых создается звук, подобный воспроизводимому конкретным инструментом.

Синтезатор на звуковой плате подобен электронному клавишному синтезатору, но с ограниченными возможностями. В соответствии со спецификацией МРС звуковая плата должна иметь частотный синтезатор, который может одновременно проиграть по крайней мере шесть мелодичных нот и две ударные.

Частотный синтез. Большинство звуковых плат генерирует звуки с помощью частотного синтезатора; эта технология была разработана еще в 1976 г. Используя одну синусоидальную волну для изменения другой, частотный синтезатор создает искусственный звук, который напоминает звучание определенного инструмента. В стандарте MIDI определен набор предварительно запрограммированных звуков, которые можно проиграть с помощью большинства инструментов.

В некоторых частотных синтезаторах используются четыре волны, и воспроизводимые звуки имеют вполне нормальное, хотя и несколько искусственное звучание. Например, синтезируемый звук трубы, несомненно, подобен ее звучанию, но никто и никогда не признает его звуком настоящей трубы.

Таблично-волновой синтез. Особенность частотного синтеза состоит в том, что воспроизводимый звук даже в лучшем случае не полностью совпадает с реальным звучанием музыкального инструмента. Недорогая технология более естественного звучания была разработана корпорацией Ensoniq в 1984 г. Она предусматривает запись звучания любого инструмента (включая фортепьяно, скрипку, гитару, флейту, трубу и барабан) и сохранение оцифрованного звука в специальной таблице. Эта таблица записывается или в микросхемы ROM или на диск, а звуковая плата может извлекать из таблицы оцифрованный звук нужного инструмента.

С помощью таблично-волнового синтезатора можно выбрать инструмент, заставить звучать единственно нужную ноту и при необходимости изменить ее частоту (т. е. воспроизвести заданную ноту из соответствующей октавы). В некоторых адаптерах для улучшения воспроизведения звука используется несколько образцов звучания одного и того же инструмента. Самая высокая нота на фортепьяно отличается от самой низкой высотой тона, поэтому для более естественного звучания нужно выбрать образец, наиболее близкий (по высоте тона) к синтезируемой ноте.

Таким образом, от размера таблицы в значительной степени зависит качество и разнообразие звуков, которые способен воспроизводить синтезатор. Лучшие качественные таблично-волновые адаптеры обычно имеют на плате память объемом в несколько мегабайт для хранения образцов. В некоторых из них предусмотрена возможность подключения дополнительных плат для установки дополнительной памяти и записи образцов звуков в таблицу.

Подключение других устройств к разъему MIDI. Интерфейс MIDI звуковой платы применяется также для подключения электронных инструментов, генераторов звуков, барабанов и других устройств MIDI к компьютеру. В результате файлы MIDI воспроизводит высококачественный музыкальный синтезатор, а не синтезатор звуковой платы, кроме того, можно создавать собственные файлы MIDI, проигрывая ноты на специальной клавиатуре. Правильно подобранное программное обеспечение позволит сочинить симфонию на компьютере типа PC с помощью записи нот каждого инструмента отдельно в собственный канал, а затем разрешить одновременное звучание всех каналов. Многие профессиональные музыканты и композиторы используют устройства MIDI для сочинения музыки прямо на компьютерах, т. е. обходясь без традиционных инструментов.

Существуют также платы MIDI с высоким качеством звучания, которые работают в двунаправленном режиме, т. е. воспроизводят предварительно записанные звуковые дорожки во время записи новой дорожки в тот же файл MIDI. Еще несколько лет назад это можно было сделать только в студии на профессиональном оборудовании, стоившем сотни тысяч долларов.

Устройства MIDI подключаются к двум круглым 5-контактным разъемам DIN звукового адаптера, используемым для входных (MIDI-IN) и выходных (MIDI-OUT) сигналов. Многие устройства также имеют порт MIDI-THRU, который передает сигналы, поступающие на вход устройства, непосредственно на его выход, но звуковые платы, как правило, такого порта не имеют. Интересно, что в соответствии со стандартом MIDI данные передаются только через контакты 1 и 3 разъемов. Контакт 2 экранирован, а контакты 4 и 5 не используются.

Основная функция интерфейса MIDI звуковой платы состоит в конвертировании (преобразовании) потока байтов (т. е. параллельно поступающих 8 бит) данных, которые передаются системной шиной компьютера, в последовательный поток данных в формате MIDI. Устройства MIDI оснащены асинхронными последовательными портами, работающими на скорости 31,25 Кбод. При обмене данными в соответствии со стандартом MIDI используются восемь информационных разрядов с одним стартовым и одним стоповым битами, причем на последовательную передачу 1 байта затрачивается 320 мс.

В соответствии со стандартом MIDI сигналы передаются по специальной неэкранированной витой паре, которая может иметь максимальную длину до 15 м (хотя большинство продаваемых кабелей имеют длину 3 или 6 м). С помощью шлейфа можно также подключить несколько устройств MIDI, чтобы объединить их возможности. Полная длина цепочки устройств MIDI не ограничена, но длина каждого отдельного кабеля не должна превышать 15 м.

В системах типа legacy-free нет разъема игрового порта (MIDI-порта) - все устройства подключаются к шине типа USB.

Программное обеспечение для устройств MIDI. С операционными системами Windows 9х, Windows Me и Windows 2000 поставляется программа «Универсальный проигрыватель» (Media Player), которая воспроизводит файлы MIDI. Для того чтобы использовать все возможности MIDI, рекомендуется приобрести специализированное программное обеспечение для выполнения различных операций редактирования файлов MIDI (задание темпа проигрывания, вырезания, а также вставки различной предварительно записанной музыки).

Ряд звуковых плат поставляется вместе с программами, в которых предусмотрены возможности редактирования файлов MIDI. Кроме того, многие бесплатные и условно-бесплатные инструментальные средства (программы) свободно распространяются через Интернет, но действительно мощное программное обеспечение, которое позволяет создавать и редактировать файлы MIDI, приходится покупать отдельно.

Запись. Практически на всех звуковых платах устанавливается входной разъем, подключив микрофон к которому, можно записать свой голос. С помощью программы «Звукозапись» (Sound Recorder) в системе Windows воспроизводят, редактируют и записывают звуковой файл в специальном формате.wav.

Ниже перечислены основные способы использования файлов формата.wav:

сопровождение тех или иных событий в системе Windows. Для этого следует воспользоваться опцией «Звук» (Sounds) панели управления Windows;
добавление речевых комментариев с помощью элементов управления Windows OLE и ActiveX к документам различного типа;
ввод сопроводительного текста в презентации, создаваемые с помощью программ PowerPoint, Freelance Graphics, Corel Presentations или др.

С целью уменьшения объема и дальнейшего использования в Интернете файлы.wav преобразуют в файлы формата.mp3 или.wma.

Аудиокомпакт-диски. С помощью накопителя CD-ROM можно прослушивать аудиокомпакт-диски не только через акустические системы, но и через наушники, параллельно работая с другими программами. К ряду звуковых плат прилагаются программы для проигрывания компакт-дисков, а через Интернет такие программы зачастую скачивают бесплатно. В этих программах обычно присутствует визуальный дисплей, имитирующий переднюю панель проигрывателя компакт-дисков для управления с помощью клавиатуры или мыши.

Звуковой смеситель (микшер). При наличии нескольких источников звука и только одной акустической системы необходимо воспользоваться звуковым смесителем. Большинство звуковых плат оснащены встроенным смесителем звука (микшером), позволяющим смешивать звук от аудио-, MIDI- и WAV-источников, линейного входа и CD-проигрывателя, воспроизводя его на едином линейном выходе. Обычно интерфейсы программ для смешивания звука на экране выглядят так же, как панель стандартного звукового смесителя. Это позволяет легко управлять громкостью звука каждого источника.

Звуковые платы: основные понятия и термины. Для того чтобы понять, что такое звуковые платы, сначала необходимо разобраться в терминах. Звук - это колебания (волны), распространяющиеся в воздухе или другой среде от источника колебаний во всех направлениях. Когда волны достигают уха, расположенные в нем чувствительные элементы воспринимают вибрацию и слышится звук.

Каждый звук характеризуется частотой и интенсивностью (громкостью).

Частота - это количество звуковых колебаний в секунду; она измеряется в герцах (Гц). Один цикл (период) - это одно движение источника колебания (туда и обратно). Чем выше частота, тем выше тон.

Человеческое ухо воспринимает лишь небольшой диапазон частот. Очень немногие слышат звуки ниже 16 Гц и выше 20 кГц (1 кГц = 1000 Гц). Частота звука самой низкой ноты рояля равна 27 Гц, а самой высокой - чуть больше 4 кГц. Наивысшая звуковая частота, которую могут передать радиовещательные FM-стан- ции, составляет 15 кГц.

Громкость звука определяется амплитудой колебаний, которая зависит в первую очередь от мощности источника звука. Например, струна фортепьяно при слабом ударе по клавише звучит тихо, поскольку диапазон ее колебаний невелик. Если ударить по клавише посильнее, то амплитуда колебаний струны увеличится. Громкость звука измеряется в децибелах (дБ). Шорох листьев, например, имеет громкость около 20 дБ, обычный уличный шум - около 70 дБ, а близкий удар грома - 120 дБ.

Оценка качества звукового адаптера. Для оценки качества звукового адаптера используются три параметра:

диапазон частот;
коэффициент нелинейных искажений;
отношение сигнал/шум.

Частотная характеристика определяет тот диапазон частот, в котором уровень записываемых и воспроизводимых амплитуд остается постоянным. Для большинства звуковых плат диапазон составляет от 30 Гц до 20 кГц. Чем шире этот диапазон, тем лучше плата.

Коэффициент нелинейных искажений характеризует нелинейность звуковой платы, т. е. отличие реальной кривой частотной характеристики от идеальной прямой, или, проще говоря, коэффициент характеризует чистоту воспроизведения звука. Каждый нелинейный элемент является причиной искажения. Чем меньше этот коэффициент, тем выше качество звука.

Высокие значения отношения сигнал/шум (в децибелах) соответствуют лучшему качеству воспроизведения звука.

Дискретизация. Если в компьютере установлена звуковая плата, то возможна запись звука в цифровой (называемой также дискретной) форме, в этом случае компьютер используется в качестве записывающего устройства. В состав звуковой платы входит небольшая микросхема - аналого-цифровой преобразователь, или АЦП (Analog-to-Digital Converter - ADC), который при записи преобразует аналоговый сигнал в цифровую форму, понятную компьютеру. Аналогично при воспроизведении цифроаналоговый преобразователь (Digital-to-Analog Converter - DAC) преобразует аудиозапись в звук, который способны воспринимать наши уши.

Процесс превращения исходного звукового сигнала в цифровую форму (рис. 5.5), в которой он и хранится для последующего воспроизведения, называется дискретизацией, или оцифровыванием. При этом сохраняются мгновенные значения звукового сигнала в определенные моменты времени, называемые выбор-

Рис. 5.5. Схема преобразования звукового сигнала в цифровую форму ками. Чем чаще берутся выборки, тем точнее цифровая копия звука соответствует оригиналу.

Первым стандартом МРС предусматривался 8-разрядный звук. Разрядность звука характеризует количество бит, используемых для цифрового представления каждой выборки.

Восемь разрядов определяют 256 дискретных уровней звукового сигнала, а если использовать 16 бит, то их количество достигает 65 536 (естественно, качество звука значительно улучшается). Для записи и воспроизведения речи достаточно 8-разрядного представления, а для музыки требуется 16 разрядов. Большинство старых плат поддерживает лишь 8-разрядное представление звука, все современные платы обеспечивают 16 разрядов и более.

Качество записываемого и воспроизводимого звука наряду с разрешением определяется частотой дискретизации (количеством выборок в секунду). Теоретически она должна быть в 2 раза выше максимальной частоты сигнала (т. е. верхней границы частот) плюс 10%-ный запас. Порог слышимости человеческого уха - 20 кГц. Записи с компакт-диска соответствует частота 44,1 кГц.

Звук, дискретизированный на частоте 11 кГц (11 000 выборок в секунду), получается более размытым, чем звук, дискретизированный на частоте 22 кГц. Объем дискового пространства, необходимый для записи 16-разрядного звука с частотой дискретизации 44,1 кГц в течение 1 мин, составит 10,5 Мб. При 8-раз- рядном представлении, монофоническом звучании и частоте дискретизации 11 кГц необходимое дисковое пространство сокращается в 16 раз. Эти данные можно проверить с помощью программы «Звукозапись»: запишите звуковой фрагмент с различными частотами дискретизации и посмотрите на объем полученных файлов.

Трехмерный звук. Одним из наиболее сложных испытаний для звуковых плат, входящих в состав игровых систем, является выполнение задач, связанных с обработкой трехмерного звука. Существует несколько факторов, усложняющих решение задач подобного рода:

разные стандарты позиционирования звука;
аппаратное и программное обеспечение, используемое для обработки трехмерного звука;
проблемы, связанные с поддержкой интерфейса DirectX.

Позиционный звук. Позиционирование звука представляет собой общую технологию для всех зЬ-звуковых плат и включает настройку определенных параметров, таких, как реверберация или отражение звука, выравнивание (баланс) и указание на «расположение» источника звука. Все эти компоненты создают иллюзию звуков, раздающихся впереди, справа, слева от пользователя или даже за его спиной. Наиболее важным элементом позиционного звука является функция преобразования HRTF (Head Related Transfer Function), определяющая изменение восприятия звука в зависимости от формы уха и угла поворота головы слушателя. Параметры этой функции описывают условия, при которых «реалистичный» звук воспринимается совершенно иначе, когда голова слушателя повернута в ту или другую сторону. Использование акустических систем с несколькими колонками, «окружающими» пользователя со всех сторон, а также сложные звуковые алгоритмы, дополняющие воспроизводимый звук управляемой реверберацией, позволяют сделать синтезированный компьютером звук еще более реалистичным.

Обработка трехмерного звука. Важным фактором качественного звучания являются различные способы обработки трехмерного звука в звуковых платах, в частности:

централизованная (для обработки трехмерного звука используется центральный процессор, что приводит к снижению общего быстродействия системы);
обработка звуковой платы (3 D-ускорение) с помощью мощного цифрового обработчика сигналов (DSP), выполняющего обработку непосредственно в звуковой плате.

Звуковые платы, осуществляющие централизованную обработку трехмерного звука, могут стать основной причиной снижения частоты смены кадров (числа анимационных кадров, выводимых на экран за каждую секунду) при использовании функции трехмерного звука. В звуковых платах со встроенным аудиопроцессором частота смены кадров при включении или отключении трехмерного звука почти не изменяется.

Как показывает практика, средняя частота смены кадров реалистичной компьютерной игры должна быть не меньше 30 кадр./с (кадров в секунду). При наличии быстродействующего процессора, например, Pentium III 800 МГц, и какой-либо современной ЗЭ-звуковой платы такая частота достигается достаточно легко. При использовании более медленного процессора, скажем, Celeron 300А с рабочей частотой 300 МГц, и платы с централизованной обработкой трехмерного звука частота смены кадров станет намного ниже 30 кадр./с. Для того чтобы увидеть, как влияет обработка трехмерного звука на скорость компьютерных игр, предусмотрена функция отслеживания частоты кадров, встроенная в большинство игр. Частота смены кадров связана непосредственно с коэффициентом использования процессора; повышение ресурсных требований к процессору приведет к уменьшению частоты смены кадров.

Технологии трехмерного звука и трехмерного видеоизображения представляют наибольший интерес прежде всего для разработчиков компьютерных игр, однако их использование в коммерческой среде также не за горами.

Подключение стереосистемы к звуковой плате. Процесс подключения стереосистемы к звуковой плате заключается в их подсоединении с помощью кабеля. Если в звуковой плате есть выход для акустической системы или наушников и линейный стереовыход, то для подключения стереосистемы лучше воспользоваться последним. В этом случае получается более качественный звук, поскольку на линейный выход сигнал поступает, минуя цепи усиления, и поэтому практически не подвергается искажениям, а усиливать сигнал будет только стереосистема.

Соедините этот выход с дополнительным входом вашей стереосистемы. Если стереосистема не имеет вспомогательных входов, следует воспользоваться другими, например, входом для проигрывателя компакт-дисков. Стереоусилитель и компьютер совсем не обязательно располагать рядом, поэтому длина соединительного кабеля может составить несколько метров.

В ряде стереомагнитол и радиоприемников на задней панели предусмотрен разъем для подключения тюнера, магнитофона и проигрывателя компакт-дисков. Используя этот разъем, а также линейные вход и выход звуковой платы, можно прослушивать звук, поступающий от компьютера, а также радиопередачи посредством акустической стереосистемы.

Звуковая система ПК в виде звуковой карты появилась в 1989 г., существенно расширив возможности ПК как технического средства информатизации.

Звуковая система ПК - комплекс программно-аппаратных средств, выполняющих следующие функции:

запись звуковых сигналов, поступающих от внешних источников, например, микрофона или магнитофона, путем преобразования входных аналоговых звуковых сигналов в цифровые и последующего сохранения на жестком диске;

воспроизведение записанных звуковых данных с помощью внешней акустической системы или головных телефонов (наушников);

воспроизведение звуковых компакт-дисков;

микширование (смешивание) при записи или воспроизведении сигналов от нескольких источников;

одновременная запись и воспроизведение звуковых сигналов (режим Full Duplex );

обработка звуковых сигналов: редактирование, объединение или разделение фрагментов сигнала, фильтрация, изменение его уровня;

обработка звукового сигнала в соответствии с алгоритмами объемного (трехмерного - 3 D - Sound ) звучания;

генерирование с помощью синтезатора звучания музыкальных инструментов, а также человеческой речи и других звуков;

управление работой внешних электронных музыкальных инструментов через специальный интерфейс MIDI.

Звуковая система ПК конструктивно представляет собой звуковые карты, либо устанавливаемые в слот материнской платы, либо интегрированные на материнскую плату или карту расширения другой подсистемы ПК. Отдельные функциональные модули звуковой системы могут выполняться в виде дочерних плат, устанавливаемых в соответствующие разъемы звуковой карты.

Классическая звуковая система, как показано на рис. 5.1, содержит:

Модуль записи и воспроизведения звука;

модуль синтезатора;

модуль интерфейсов;

модуль микшера;

акустическую систему.

Первые четыре модуля, как правило, устанавливаются на звуковой карте. Причем существуют звуковые карты без модуля синтезатора или модуля записи/воспроизведения цифрового звука. Каждый из модулей может быть выполнен либо в виде отдельной микросхемы, либо входить в состав многофункциональной микросхемы. Таким образом, Chipset звуковой системы может содержать как несколько, так и одну микросхему.

Конструктивные исполнения звуковой системы ПК претерпевают существенные изменения; встречаются материнские платы с установленным на них Chipset для обработки звука.

Однако назначение и функции модулей современной звуковой системы (независимо от ее конструктивного исполнения) не меняются. При рассмотрении функциональных модулей звуковой карты принято пользоваться терминами «звуковая система ПК» или «звуковая карта».

2. Модуль записи и воспроизведения

Модуль записи и воспроизведения звуковой системы осуществляет аналого-цифровое и цифроаналоговое преобразования в режиме программной передачи звуковых данных или передачи их по каналам DMA (Direct Memory Access - канал прямого доступа к памяти).

Звук, как известно, представляет собой продольные волны, свободно распространяющиеся в воздухе или иной среде, поэтому звуковой сигнал непрерывно изменяется во времени и в пространстве.

Запись звука - это сохранение информации о колебаниях звукового давления в момент записи. В настоящее время для записи и передачи информации о звуке используются аналоговые и цифровые сигналы. Другими словами, звуковой сигнал может быть представлен в аналоговой или цифровой форме.

Если при записи звука пользуются микрофоном, который преобразует непрерывный во времени звуковой сигнал в непрерывный во времени электрический сигнал, получают звуковой сигнал в аналоговой форме. Поскольку амплитуда звуковой волны определяет громкость звука, а ее частота - высоту звукового тона, постольку для сохранения достоверной информации о звуке напряжение электрического сигнала должно быть пропорционально звуковому давлению, а его частота должна соответствовать частоте колебаний звукового давления.

На вход звуковой карты ПК в большинстве случаев звуковой сигнал подается в аналоговой форме. В связи с тем что ПК оперирует только цифровыми сигналами, аналоговый сигнал должен быть преобразован в цифровой. Вместе с тем акустическая система, установленная на выходе звуковой карты ПК, воспринимает только аналоговые электрические сигналы, поэтому после обработки сигнала с помощью ПК необходимо обратное преобразование цифрового сигнала в аналоговый.

Аналого-цифровое преобразование представляет собой преобразование аналогового сигнала в цифровой и состоит из следующих основных этапов: дискретизации, квантования и кодирования. Схема аналого-цифрового преобразования звукового сигнала представлена на рис. 5.2.

Предварительно аналоговый звуковой сигнал поступает на аналоговый фильтр, который ограничивает полосу частот сигнала.

Дискретизация сигнала заключается в выборке отсчетов аналогового сигнала с заданной периодичностью и определяется частотой дискретизации. Причем частота дискретизации должна быть не менее удвоенной частоты наивысшей гармоники (частотной составляющей) исходного звукового сигнала. Поскольку человек способен слышать звуки в частотном диапазоне от 20 Гц до 20 кГц, максимальная частота дискретизации исходного звукового сигнала должна составлять не менее 40 кГц, т. е. отсчеты требуется проводить 40 000 раз в секунду. В связи с этим в большинстве современных звуковых систем ПК максимальная частота дискретизации звукового сигнала составляет 44,1 или 48 кГц.

Квантование по амплитуде представляет собой измерение мгновенных значений амплитуды дискретного по времени сигнала и преобразование его в дискретный по времени и амплитуде. На рис. 5.3 показан процесс квантования по уровню аналогового сигнала, причем мгновенные значения амплитуды кодируются 3-разрядными числами.

Кодирование заключается в преобразовании в цифровой код квантованного сигнала. При этом точность измерения при квантовании зависит от количества разрядов кодового слова. Если значения амплитуды записать с помощью двоичных чисел и задать длину кодового словаN разрядов, число возможных значений кодовых слов будет равно2 N . Столько же может быть и уровней квантования амплитуды отсчета. Например, если значение амплитуды отсчета представляется 16-разрядным кодовым словом, максимальное число градаций амплитуды (уровней квантования) составит 2 16 = 65 536. Для 8-разрядного представления соответственно получим 2 8 =256 градаций амплитуды.

Аналого-цифровое преобразование осуществляется специальным электронным устройством - аналого-цифровым преобразова телем (АЦП), в котором дискретные отсчеты сигнала преобразуются в последовательность чисел. Полученный поток цифровых данных, т.е. сигнал, включает как полезные, так и нежелательные высокочастотные помехи, для фильтрации которых полученные цифровые данные пропускаются через цифровой фильтр.

Цифроаналоговое преобразование в общем случае происходит в два этапа, как показано на рис. 5.4. На первом этапе из потока цифровых данных с помощью цифроаналогового преобразователя (ЦАП) выделяют отсчеты сигнала, следующие с частотой дискретизации. На втором этапе из дискретных отсчетов путем сглаживания (интерполяции) формируется непрерывный аналоговый сигнал с помощью фильтра низкой частоты, который подавляет периодические составляющие спектра дискретного сигнала.

Для записи и хранения звукового сигнала в цифровой форме требуется большой объем дискового пространства. Например, стереофонический звуковой сигнал длительностью 60 с, оцифрованный с частотой дискретизации 44,1 кГц при 16-разрядном квантовании для хранения требует на винчестере около 10 Мбайт.

Для уменьшения объема цифровых данных, необходимых для представления звукового сигнала с заданным качеством, используют компрессию (сжатие), заключающуюся в уменьшении (Количества отсчетов и уровней квантования или числа бит, при-I холящихся на один отсчет.

Подобные методы кодирования звуковых данных с использованием специальных кодирующих устройств позволяют сократить объем потока информации почти до 20 % первоначального. Выбор метода кодирования при записи аудиоинформации зависит от набора программ сжатия - кодеков (кодирование-декодирование), поставляемых вместе с программным обеспечением звуковой карты или входящих в состав операционной системы.

Выполняя функции аналого-цифрового и цифроаналогового преобразований сигнала, модуль записи и воспроизведения цифрового звука содержит АЦП, ЦАП и блок управления, которые обычно интегрированы в одну микросхему, также называемую кодеком. Основными характеристиками этого модуля являются: частота дискретизации; тип и разрядность АЦП и ЦАП; способ кодирования аудиоданных; возможность работы в режиме Full Duplex .

Частота дискретизации определяет максимальную частоту записываемого или воспроизводимого сигнала. Для записи и воспроизведения человеческой речи достаточно 6 - 8 кГц; музыки с невысоким качеством - 20 - 25 кГц; для обеспечения высококачественного звучания (аудиокомпакт-диска) частота дискретизации должна быть не менее 44 кГц. Практически все звуковые карты поддерживают запись и воспроизведение стереофонического звукового сигнала с частотой дискретизации 44,1 или 48 кГц.

Разрядность АЦП и ЦАП определяет разрядность представления цифрового сигнала (8, 16 или 18 бит). Подавляющее большинство звуковых карт оснащено 16-разрядными АЦП и ЦАП. Такие звуковые карты теоретически можно отнести к классу Hi-Fi, которые должны обеспечивать студийное качество звучания. Некоторые звуковые карты оснащаются 20- и даже 24-разрядными АЦП и ПАП, что существенно повышает качество записи/воспроизведения звука.

Full Duplex (полный дуплекс) - режим передачи данных по каналу, в соответствии с которым звуковая система может одновременно принимать (записывать) и передавать (воспроизводить) аудиоданные. Однако не все звуковые карты поддерживают этот режим в полном объеме, поскольку не обеспечивают высокое качество звука при интенсивном обмене данными. Такие карты можно использовать для работы с голосовыми данными в Internet, например, при проведении телеконференций, когда высокое качество звука не требуется.