Наиболее распространенные заблуждения на тему цифрового звука. От каких параметров зависит качество цифрового звука Качество воспроизведения звука


Звук в современном мире играет все боле важную роль, уже давно оторвавшись от тесной привязки к изображению возникшей в период расцвета телевидения и кино. Современное мультимедийное оборудование обладает широчайшими возможностями не только по его воспроизведению, но даже по изменению звука. Он уже перестал быть мертвой записью, статичным воспроизведением давно прошедших событий, намертво запечатленным на своем носителе. Важнейшую роль в преображении наших представлений о звуке сыграло развитие цифрового способа записи звука, преобразовании его в поток данных, с которым можно легко и непринужденно оперировать современными устройствами.

Форматы: каким бывает цифровой звук

В каждом из продающихся на сегодня мультимедийных устройств, будь то CD-плеер, диктофон, или плеер на флэш-памяти, используется множество самых различных видов представления потоков данных, которые преобразуются затем в звук. А уж форматов звука, используемых в профессиональных целях, придумано и того больше. Неискушенный покупатель вынужден черпать информацию об обозначениях на коробках и устройствах из самых разных источников, зачастую получая неверные сведения или запутываясь еще больше.

Практически каждое устройство из раздела каталога поддерживает сразу несколько форматов звука, а многие устройства, не относящиеся к этой категории, также снабжены надписями о поддержке воспроизведения звуковых файлов. Для того чтобы помочь нашему читателю, мы решили создать небольшой глоссарий сокращений и рассказать о наиболее распространенных форматах. Мы планируем сделать его открытым для пополнения и поправок, добавляя новые форматы и более подробно описывая преимущества и недостатки уже распространенных или забытых.

Немного теории

Для начала следует напомнить, что цифровой звук – это не более чем набор цифр. Определяющим фактором является система, с помощью которой звук как давление воздуха был преобразован в потоки данных и закодирован для последующей обработки и воспроизведения. Соответственно, цифровой звук обычно заключен в компьютерных файлах с различным расширением, по которому чаще всего (но не всегда) и можно определить его формат. А само понятие формата может иметь, как это ни парадоксально, два смысла. Во-первых, формат может существовать как всеобъемлющая характеристика, включающая в себя и тип, и физические характеристики носителя (диска или кассеты), способа записи, принципов кодирования и защиты от ошибок. Во-вторых, под форматом можно понимать только сам способ кодирования и сжатия звука, так как для переноса используются стандартные средства, например, компьютер.

Аналоговый звук, в отличие от цифрового, воспроизводится в аналоговых устройствах и имеет ряд существенных отличий. Не являясь потоком данных, аналоговый звук представляется непрерывным электрическим сигналом, отображающим изменение звуковой волны. Для перевода его в цифровой формат звук «оцифровывается», то есть разбивается на определенные отрезки, в которых фиксируется числовое значение амплитуды в данный момент. Мы не будем углубляться в принципы создания цифрового звука, однако совершенно необходимо отметить, что чем чаще происходит разбиение отрезка звука и описание его характеристик, тем яснее и полнее создается картина собственно звука.

Такой процесс порождает огромный поток данных, описывающих звук, и очевидно, что каждый формат цифрового звука является не больше чем компромиссом между необходимостью представить звук как можно более качественным и ограничениями объема памяти компьютера или устройства воспроизведения.

Еще немного теории. Человеческое ухо воспринимает в большинстве случаев звук с частотой не выше 22000 Гц, и для того чтобы его полностью описать в цифровом виде, требуется частота дискретизации не менее 44,1 кГц. Так как абсолютно точно определить значение сигнала в определенный момент времени невозможно, то при оцифровке происходит квантование, то есть замена реальных значений сигнала приближенными. Чем больше уровней квантования звука, тем точнее описывается уровень сигнала. В итоге каждый стандартный компакт-диск несет на себе звуковой сигнал с частотой дискретизации в те самые 44,1 кГц и уровнем квантования в 16 бит, а в некоторых устройствах производится дискретизация с частотой 48 кГц.

Все усилия конструкторов радиовещательных приемников направлены на достижение наиболее естественного и чистого звучания радиопередачи. Но что значит «естественное звучание»? От чего оно зависит? Многие считают, что качество звучания зависит только от громкоговорителя. Конечно, качество гром­коговорителя играет большую роль. Очевидно, что радиопередача «идеально ес­тественна», если она будет звучать абсолютно так же, как, например, в студии перед микрофоном.

Звуковые колебания создаются в радиоприемнике громкоговорителем. Имен­но поэтому качество громкоговорителя (т. е. его способность создавать опре­деленные по форме звуковые колебания воздуха) играет большую роль в работе радиоприемника. Однако чтобы громкоговоритель работал, надо подвести к его звуковой катушке определенные по форме колебания электрического тока. Та­ким образом, воспроизведение передачи радиоприемником зависит не только от качества громкоговорителя, но и от того, насколько колебания электрического, тока, подводимые к звуковой катушке громкоговорителя, соответствуют по фор­ме электрическим колебаниям тока микрофона в студии радиостанция.

В природе очень редко можно встретить абсолютно однотонный звук, т.- е. звук, представляющий собой колебания только одной частоты. Наша речь, раз­личные шумы, а тем более звучание музыкальных произведений - это слож­нейшее сочетание звуков различных частот и интенсивностей. Даже когда певец или солирующий музыкальный инструмент берет какую-то одну ноту, то она состоит не только из колебаний одной частоты, синусоидальных по форме, а из набора колебаний различных частот. При этом главную роль играют коле­бания основной частоты и наибольшей амплитуды. Именно эти колебания опре­деляют общий тон ноты, т. е. высокий звук или низкий, но кроме основного колебания в звуке присутствует множество так называемых обертонов, созда­ющих звуковую окраску. Обертоны - это колебания различных частот, кото­рые по амплитуде обычно много меньше колебаний основной частоты. Если лишить звук обертонов, он станет неузнаваем, потеряет естественность. Вспомни­те, как различаются голоса Лемешева и Козловского, а ведь это тенора, т. е. люди, обладающие высоким певческим голосом. Если сравнить осциллограммы их основных звуковых колебаний, то они одинаковы - ведь певцы берут одну и ту же ноту, по частоте одинаковую. Различаем же мы их голоса потому, что у них разные обертоны. Поэтому очень важно передать их без искажений; только тогда радиопередача будет звучать естественно. Но это означает, что надо передавать целую полосу частот, причем не изменяя частоты и соотно­шения амплитуд колебаний. При любом же изменении частотного состава пе­редаваемого звука или изменении соотношения амплитуд составляющих коле­баний появляются искажения.

Какова же связь между низкочастотными колебаниями звукового диапа­зона и высокочастотными радиодиапазона? Чтобы представить себе эту связь, надо подробнее рассмотреть модуляцию. Существуют различные способы моду­ляции. В радиовещании применяют амплитудную (AM) и частотную (ЧМ) модуляцию. Частотную используют только при радиовещании на УКВ; значительно шире применяют AM - в радиовещании в диапазонах длинных (ДВ), средних (СВ) и коротких (KB) волн. При AM низкочастотный (модулирующий) электрический сигнал воздейст­вует на амплитуду высокочастотного сигнала передатчика, называемого в данном случае сигналом весущей частоты. Амплитуда высокочастотных колеба­ний несущей частоты изменяется в такт с изменениями модулирующего сигнала.

Рис. 24. Форма высокочас­тотного сигнала при AM

Рис. 25. Модулированное колебание

На рис. 24,а показан график сигнала несущей частоты передатчика при от­сутствии модуляции. Но как только появится модулирующий сигнал звуковой частоты (рис. 24,6), форма огибающей высокочастотного напряжения становит­ся похожей на форму звукового модулирующего сигнала (рис. 24,в). (Огиба­ющей.называется кривая, соединяющая амплитудные значения модулированного высокочастотного сигнала).

Таким образом, происходит значительное усложнение формы высокочастот­ного сигнала передатчика, он перестает быть строго синусоидальным. Но всякое нарушение синусоидальности формы колебаний, как мы уже знаем, привадит к появлению новых колебаний с частотами, отличными от частоты основного ко­лебания. Иначе говоря, модулированное колебание - это целый спектр коле­баний с различными частотами. Когда модуляции нет, радиостанция излучает только колебания одной частоты - высокочастотной несущей, например 200 кГц. Но как только началась модуляция, напрвмер гармоническим сигналом с часто­той 1 кГц, то кроме колебаний с частотой 200 кГц в спектре сигнала радио­станции появятся колебания еще двух частот, отстоящие от основного коле­бания на - 1 кГц и +1 кГц, т. е. радиостанция будет излучать уже три ко­лебания с частотами 199, 200 и 201 кГц (рис. 25). Отсюда следует, что если модулированное колебание представляет собой опектр частот, то чтобы не воз­никло искажений, высокочастотные каскады должны пропустить весь опектр, т. е. частоты от 199 до 201 кГц. Другими славами, высокочастотные каскады должны обладать определенной полосой пропускания - в данном случае 2 кГп.

Рис. 26. Полоса частот 30 кГц, необходимая для передачи всего спектра мо­дулированного сигнала с максимальной частотой мо­дуляции 15 кГц

Рис. 27. Полоса частот 10 кГц, от­водимая на одну радиостанцию

Весь слышимый человеком звуковой диапазон составляет около 15 кГц (20 -15 000 Гц). Следовательно, сигнал радиостанции может быть модулиро­ван самыми разнообразными по частоте колебаниями, причем наивысшая из модулирующих частот может достигать 15 кГц. Поэтому модулированный сиг-аал будет представлять собой спектр колебаний, в нашем примере - от 185 до 215 кГц, т. е. занимать полосу частот 30 кГц (рис. 26). Однако сегодня столь широкий спектр излучаемых колебаний радиостанции, работающие с AM, не могут себе позволить. Международными соглашениями предусмотрено такое распределение частот между различными радиовещательными станциями, при котором их несущие отстоят одна от другой на 10 кГц (в диашзоне KB - на 5 кГц). Таким образам на долю каждой радиостанции приходится полоса всего 10 кГц (рис. 27). Это, конечно, мало для высококачественного радиовещания, но приходится мириться.

Итак, какие же требования предъявляются к приемнику, чтобы он безуко­ризненно воспроизводил радиопередачу?

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).

Рис. 1.1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица "децибел" (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 5.1. Громкость звука
Звук Громкость в децибелах
Нижний предел чувствительности человеческого уха 0
Шорох листьев 10
Разговор 60
Гудок автомобиля 90
Реактивный двигатель 120
Болевой порог 140
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек" (рис. 1.2).

Рис. 1.2. Временная дискретизация звука

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2I = 216 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Цифровой звук – это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды .

Оцифровка звука - технология поделенным временным шагом и последующей записи полученных значений в численном виде .
Другое название оцифровки звука - аналогово-цифровое преобразование звука.

Оцифровка звука включает в себя два процесса:

  • процесс дискретизации (осуществление выборки) сигнала по времени
  • процесс квантования по амплитуде.

Дискретизация по времени

Процесс дискретизации по времени - процесс получения значений сигнала, который преобразуется, с определенным временным шагом - шагом дискретизации . Количество замеров величины сигнала, осуществляемых в одну секунду, называют частотой дискретизации или частотой выборки , или частотой сэмплирования (от англ. « sampling» – «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды , если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал , в котором наивысшая частота спектра равна F m , может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации F d выполняется: F d >2F m .
На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (0 – 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).
Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью.

Линейное (однородное) квантование амплитуды

Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2 N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от -1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды - динамический диапазон сигнала - в виде 2 N -1 равных промежутков, разделив его на 2 N уровней - квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде – процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
Точность округления зависит от выбранного количества (2 N) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа – отсчетами или сэмплами (от англ. “ sample” – “замер”). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала - дискретизация сигнала во времени в совокупности с методом однородного квантования - называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation – PCM).
Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

Другие способы оцифровки

Аналогово-цифровые преобразователи (АЦП)

Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП) .
Это преобразование включает в себя следующие операции:

  1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
  2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени - отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП - устройства выборки-хранения.
  3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин - уровней квантования.
  4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

Кодирование оцифрованного звука перед его записью на носитель

Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

Терминология

  • кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
  • декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
  • кодек (от англ. « codec » - « Coder / Decoder ») - программный или аппаратный блок, предназначенный для кодирования/декодирования данных.

Наиболее распространённые кодеки

  • MP3 – MPEG-1 Layer 3
  • ОGG – Ogg Vorbis
  • WMA – Windows Media Audio
  • MPC - MusePack
  • AAC – MPEG-2/4 AAC (Advanced Audio Coding)
    • Стандарт MPEG-2 AAC
    • Стандарт MPEG-4 AAC

Некоторые форматы оцифровки звука в сравнении

Основная статья: Сравнение звуковых форматов

Название формата Квантование, бит Частота дискретизации, кГц Число каналов Величина потока данных с диска, кбит/с Степень сжатия/упаковки
16 44,1 2 1411,2 1:1 без потерь
Dolby Digital (AC3) 16-24 48 6 до 640 ~12:1 с потерями
DTS 20-24 48; 96 до 8 до 1536 ~3:1 с потерями
DVD-Audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 без потерь
DVD-Audio 16; 20; 24 176,4; 192 2 4608 2:1 без потерь
MP3 плавающий до 48 2 до 320 ~11:1 с потерями
AAC плавающий до 96 до 48 до 529 с потерями
AAC+ (SBR) плавающий до 48 2 до 320 с потерями
Ogg Vorbis до 32 до 192 до 255 до 1000 с потерями
WMA до 24 до 96 до 8 до 768 2:1, есть версия без потерь

Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя

Полный цикл преобразования звука: от оцифровки до воспроизведения

Основными параметрами, влияющими на качество цифровой звукозаписи, являются:

§ Разрядность АЦП и ЦАП.

§ Частота дискретизации АЦП и ЦАП.

§ Джиттер АЦП и ЦАП

§ Передискретизация

Также немаловажными остаются параметры аналогового тракта цифровых устройств звукозаписи и звуковоспроизведения:

§ Отношение сигнал/шум

§ Коэффициент нелинейных искажений

§ Интермодуляционные искажения

§ Неравномерность амплитудно-частотной характеристики

§ Взаимопроникновение каналов

§ Динамический диапазон

Техника цифровой звукозаписи

Запись цифрового звука в настоящее время осуществляется на студиях звукозаписи, под управлением персональных компьютеров и другой дорогостоящей и качественной аппаратуры. Также довольно широко развито понятие «домашней студии», в которой применяется профессиональное и полупрофессиональное звукозаписывающее оборудование, позволяющее создавать качественные записи в домашних условиях.

Применяются звуковые карты в составе компьютеров, которые производят обработку в своих АЦП и ЦАП - чаще всего в 24 битах и 96 кГц, дальнейшее повышение битности и частоты дискретизации, практически не увеличивает качества записи.

Существует целый класс компьютерных программ - звуковых редакторов, которые позволяют, работать со звуком:

§ записывать входящий звуковой поток

§ создавать (генерировать) звук

§ изменять существующую запись (добавлять сэмплы, изменять тембр, скорость звука, вырезать части и т.п.)

§ перезаписывать из одного формата в другой

§ конвертировать конвертировать разные аудиокодеки

Некоторые простые программы, позволяют осуществлять только конвертацию форматов и кодеков.

Разновидности цифровых аудиоформатов

Существуют различные понятия звукового формата.

Формат представления звуковых данных в цифровом виде зависит от способа квантования цифро-аналоговым преобразователем (ЦАП). В звукотехнике в настоящее время наиболее распространены два вида квантования:

§ импульсно-кодовая модуляция

§ сигма-дельта-модуляция

Зачастую разрядность квантования и частоту дискретизации указывают для различных звуковых устройств записи и воспроизведения как формат представления цифрового звука (24 бита/192 кГц; 16 бит/48 кГц).

Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудио данных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов:

§ аудиоформаты без сжатия, такие как WAV, AIFF

§ аудиоформаты со сжатием без потерь (APE, FLAC)

§ аудиоформаты, с применением сжатия с потерями (mp3, ogg)

Особняком стоят модульные музыкальные форматы файлов. Созданные синтетически или из сэмплов заранее записанных живых инструментов, они, в основном, служат для создания современной электронной музыки (MOD). Также сюда можно отнести формат MIDI, который не является звукозаписью, но при этом с помощью секвенсора позволяет записывать и воспроизводить музыку, используя определенный набор команд в текстовом виде.

Форматы носителей цифрового звука применяют как для массового распространения звуковых записей (CD, SACD), так и в профессиональной звукозаписи (DAT, минидиск).

Для систем пространственного звучания также можно выделить форматы звука, в основном являющиеся звуковым многоканальным сопровождением к кинофильмам. Такие системы имеют целые семейства форматов от двух крупных конкурирующих компаний Digital Theater Systems Inc. - DTS и Dolby Laboratories Inc. - Dolby Digital.

Также форматом называют количество каналов в системах многоканального звука (5.1; 7.1). Изначально такая система была разработана для кинотеатров, но впоследствии была расширена Программный кодек

Аудиокодек на программном уровне

§ G.723.1 - один из базовых кодеков для приложений IP-телефонии

§ G.729 - патентованный узкополосный кодек, который применяется для цифрового представления речи

§ Internet Low Bitrate Codec (iLBC) - популярный свободный кодек для IP-телефонии (в частности, для Skype и Google Talk)

Аудиокодек (англ. Audio codec ; аудио кодер/декодер) - компьютерная программа или аппаратное средство, предназначенное для кодирования или декодирования аудиоданных.

Программный кодек

Аудиокодек на программном уровне является специализированной компьютерной программой, кодеком, который сжимает (производит компрессию) или разжимает (производит декомпрессию) цифровые звуковые данные в соответствии с файловым звуковым форматом или потоковым звуковым форматом. Задача аудиокодека как компрессора заключается в предоставлении аудиосигнала с заданным качеством/точностью и минимально возможным размером. Благодаря сжатию уменьшается объём пространства, требуемого для хранения аудиоданных, а также возможно снизить полосу пропускания канала, по которому передаются аудиоданные. Большинство аудиокодеков осуществлены как программные библиотеки, которые взаимодействуют с одним или несколькими аудиоплеерами, такими как QuickTime Player, XMMS, Winamp, VLC media player, MPlayer или Windows Media Player.

Популярные программные аудиокодеки по областям применения:

§ MPEG-1 Layer III (MP3) - проприетарный кодек аудиозаписей (музыка, аудиокниги и т. п.) для компьютерной техники и цифровых проигрывателей

§ Ogg Vorbis (OGG) - второй по популярности формат, широко используется в компьютерных играх и в файлообменных сетях для передачи музыки

§ GSM-FR - первый цифровой стандарт кодирования речи, использованный в телефонах GSM

§ Adaptive multi rate (AMR) - запись человеческого голоса в мобильных телефонах и других мобильных устройствах

Выбор редакции
Вы хотите знать, как установить виндовс 7 на ноутбук бесплатно? Столкнулись с необходимостью переустановки операционной системы, но не...

Чтобы выбрать принтер, который подходит именно Вам, для начала необходимо составить для себя примерный перечень требований, на основе...

Компания Samsung за последнее время выпустила такое количество смартфонов линейки Galaxy, что сосчитать их не представляется возможным....

Аббревиатура СКС расшифровывается как структурированная кабельная система . По определению стандартов, СКС - это универсальная...
Персональные компьютеры обладают большими возможностями, о которых многие пользователи даже не догадываются. В данной статье будет...
Одним из популярных форматов изображений является TIF (TIFF — это то же самое). Файл данного расширения расшифровывается как Tagged Image...
Формат изображений JPG имеет более высокую степень сжатия, чем PNG, а поэтому картинки с данным расширением имеют меньший вес. С целью...
Во всех версиях операционной системы Windows установлена программа.NET Framework. Она очень важна, стирать её можно только в некоторых...
В этой статье будут подробно расписаны распространенные способы загрузки любых типов файлов на смартфон или планшет на операционной...