Наиболее распространенные заблуждения на тему цифрового звука. От каких параметров зависит качество цифрового звука Качество воспроизведения звука
Звук в современном мире играет все боле важную роль, уже давно оторвавшись от тесной привязки к изображению возникшей в период расцвета телевидения и кино. Современное мультимедийное оборудование обладает широчайшими возможностями не только по его воспроизведению, но даже по изменению звука. Он уже перестал быть мертвой записью, статичным воспроизведением давно прошедших событий, намертво запечатленным на своем носителе. Важнейшую роль в преображении наших представлений о звуке сыграло развитие цифрового способа записи звука, преобразовании его в поток данных, с которым можно легко и непринужденно оперировать современными устройствами.
Форматы: каким бывает цифровой звук
В каждом из продающихся на сегодня мультимедийных устройств, будь то CD-плеер, диктофон, или плеер на флэш-памяти, используется множество самых различных видов представления потоков данных, которые преобразуются затем в звук. А уж форматов звука, используемых в профессиональных целях, придумано и того больше. Неискушенный покупатель вынужден черпать информацию об обозначениях на коробках и устройствах из самых разных источников, зачастую получая неверные сведения или запутываясь еще больше.
Практически каждое устройство из раздела каталога поддерживает сразу несколько форматов звука, а многие устройства, не относящиеся к этой категории, также снабжены надписями о поддержке воспроизведения звуковых файлов. Для того чтобы помочь нашему читателю, мы решили создать небольшой глоссарий сокращений и рассказать о наиболее распространенных форматах. Мы планируем сделать его открытым для пополнения и поправок, добавляя новые форматы и более подробно описывая преимущества и недостатки уже распространенных или забытых.
Немного теории
Для начала следует напомнить, что цифровой звук – это не более чем набор цифр. Определяющим фактором является система, с помощью которой звук как давление воздуха был преобразован в потоки данных и закодирован для последующей обработки и воспроизведения. Соответственно, цифровой звук обычно заключен в компьютерных файлах с различным расширением, по которому чаще всего (но не всегда) и можно определить его формат. А само понятие формата может иметь, как это ни парадоксально, два смысла. Во-первых, формат может существовать как всеобъемлющая характеристика, включающая в себя и тип, и физические характеристики носителя (диска или кассеты), способа записи, принципов кодирования и защиты от ошибок. Во-вторых, под форматом можно понимать только сам способ кодирования и сжатия звука, так как для переноса используются стандартные средства, например, компьютер.
Аналоговый звук, в отличие от цифрового, воспроизводится в аналоговых устройствах и имеет ряд существенных отличий. Не являясь потоком данных, аналоговый звук представляется непрерывным электрическим сигналом, отображающим изменение звуковой волны. Для перевода его в цифровой формат звук «оцифровывается», то есть разбивается на определенные отрезки, в которых фиксируется числовое значение амплитуды в данный момент. Мы не будем углубляться в принципы создания цифрового звука, однако совершенно необходимо отметить, что чем чаще происходит разбиение отрезка звука и описание его характеристик, тем яснее и полнее создается картина собственно звука.
Такой процесс порождает огромный поток данных, описывающих звук, и очевидно, что каждый формат цифрового звука является не больше чем компромиссом между необходимостью представить звук как можно более качественным и ограничениями объема памяти компьютера или устройства воспроизведения.
Еще немного теории. Человеческое ухо воспринимает в большинстве случаев звук с частотой не выше 22000 Гц, и для того чтобы его полностью описать в цифровом виде, требуется частота дискретизации не менее 44,1 кГц. Так как абсолютно точно определить значение сигнала в определенный момент времени невозможно, то при оцифровке происходит квантование, то есть замена реальных значений сигнала приближенными. Чем больше уровней квантования звука, тем точнее описывается уровень сигнала. В итоге каждый стандартный компакт-диск несет на себе звуковой сигнал с частотой дискретизации в те самые 44,1 кГц и уровнем квантования в 16 бит, а в некоторых устройствах производится дискретизация с частотой 48 кГц.
Все усилия конструкторов радиовещательных приемников направлены на достижение наиболее естественного и чистого звучания радиопередачи. Но что значит «естественное звучание»? От чего оно зависит? Многие считают, что качество звучания зависит только от громкоговорителя. Конечно, качество громкоговорителя играет большую роль. Очевидно, что радиопередача «идеально естественна», если она будет звучать абсолютно так же, как, например, в студии перед микрофоном.
Звуковые колебания создаются в радиоприемнике громкоговорителем. Именно поэтому качество громкоговорителя (т. е. его способность создавать определенные по форме звуковые колебания воздуха) играет большую роль в работе радиоприемника. Однако чтобы громкоговоритель работал, надо подвести к его звуковой катушке определенные по форме колебания электрического тока. Таким образом, воспроизведение передачи радиоприемником зависит не только от качества громкоговорителя, но и от того, насколько колебания электрического, тока, подводимые к звуковой катушке громкоговорителя, соответствуют по форме электрическим колебаниям тока микрофона в студии радиостанция.
В природе очень редко можно встретить абсолютно однотонный звук, т.- е. звук, представляющий собой колебания только одной частоты. Наша речь, различные шумы, а тем более звучание музыкальных произведений - это сложнейшее сочетание звуков различных частот и интенсивностей. Даже когда певец или солирующий музыкальный инструмент берет какую-то одну ноту, то она состоит не только из колебаний одной частоты, синусоидальных по форме, а из набора колебаний различных частот. При этом главную роль играют колебания основной частоты и наибольшей амплитуды. Именно эти колебания определяют общий тон ноты, т. е. высокий звук или низкий, но кроме основного колебания в звуке присутствует множество так называемых обертонов, создающих звуковую окраску. Обертоны - это колебания различных частот, которые по амплитуде обычно много меньше колебаний основной частоты. Если лишить звук обертонов, он станет неузнаваем, потеряет естественность. Вспомните, как различаются голоса Лемешева и Козловского, а ведь это тенора, т. е. люди, обладающие высоким певческим голосом. Если сравнить осциллограммы их основных звуковых колебаний, то они одинаковы - ведь певцы берут одну и ту же ноту, по частоте одинаковую. Различаем же мы их голоса потому, что у них разные обертоны. Поэтому очень важно передать их без искажений; только тогда радиопередача будет звучать естественно. Но это означает, что надо передавать целую полосу частот, причем не изменяя частоты и соотношения амплитуд колебаний. При любом же изменении частотного состава передаваемого звука или изменении соотношения амплитуд составляющих колебаний появляются искажения.
Какова же связь между низкочастотными колебаниями звукового диапазона и высокочастотными радиодиапазона? Чтобы представить себе эту связь, надо подробнее рассмотреть модуляцию. Существуют различные способы модуляции. В радиовещании применяют амплитудную (AM) и частотную (ЧМ) модуляцию. Частотную используют только при радиовещании на УКВ; значительно шире применяют AM - в радиовещании в диапазонах длинных (ДВ), средних (СВ) и коротких (KB) волн. При AM низкочастотный (модулирующий) электрический сигнал воздействует на амплитуду высокочастотного сигнала передатчика, называемого в данном случае сигналом весущей частоты. Амплитуда высокочастотных колебаний несущей частоты изменяется в такт с изменениями модулирующего сигнала.
Рис. 24. Форма высокочастотного сигнала при AM
Рис. 25. Модулированное колебание
На рис. 24,а показан график сигнала несущей частоты передатчика при отсутствии модуляции. Но как только появится модулирующий сигнал звуковой частоты (рис. 24,6), форма огибающей высокочастотного напряжения становится похожей на форму звукового модулирующего сигнала (рис. 24,в). (Огибающей.называется кривая, соединяющая амплитудные значения модулированного высокочастотного сигнала).
Таким образом, происходит значительное усложнение формы высокочастотного сигнала передатчика, он перестает быть строго синусоидальным. Но всякое нарушение синусоидальности формы колебаний, как мы уже знаем, привадит к появлению новых колебаний с частотами, отличными от частоты основного колебания. Иначе говоря, модулированное колебание - это целый спектр колебаний с различными частотами. Когда модуляции нет, радиостанция излучает только колебания одной частоты - высокочастотной несущей, например 200 кГц. Но как только началась модуляция, напрвмер гармоническим сигналом с частотой 1 кГц, то кроме колебаний с частотой 200 кГц в спектре сигнала радиостанции появятся колебания еще двух частот, отстоящие от основного колебания на - 1 кГц и +1 кГц, т. е. радиостанция будет излучать уже три колебания с частотами 199, 200 и 201 кГц (рис. 25). Отсюда следует, что если модулированное колебание представляет собой опектр частот, то чтобы не возникло искажений, высокочастотные каскады должны пропустить весь опектр, т. е. частоты от 199 до 201 кГц. Другими славами, высокочастотные каскады должны обладать определенной полосой пропускания - в данном случае 2 кГп.
Рис. 26. Полоса частот 30 кГц, необходимая для передачи всего спектра модулированного сигнала с максимальной частотой модуляции 15 кГц
Рис. 27. Полоса частот 10 кГц, отводимая на одну радиостанцию
Весь слышимый человеком звуковой диапазон составляет около 15 кГц (20 -15 000 Гц). Следовательно, сигнал радиостанции может быть модулирован самыми разнообразными по частоте колебаниями, причем наивысшая из модулирующих частот может достигать 15 кГц. Поэтому модулированный сиг-аал будет представлять собой спектр колебаний, в нашем примере - от 185 до 215 кГц, т. е. занимать полосу частот 30 кГц (рис. 26). Однако сегодня столь широкий спектр излучаемых колебаний радиостанции, работающие с AM, не могут себе позволить. Международными соглашениями предусмотрено такое распределение частот между различными радиовещательными станциями, при котором их несущие отстоят одна от другой на 10 кГц (в диашзоне KB - на 5 кГц). Таким образам на долю каждой радиостанции приходится полоса всего 10 кГц (рис. 27). Это, конечно, мало для высококачественного радиовещания, но приходится мириться.
Итак, какие же требования предъявляются к приемнику, чтобы он безукоризненно воспроизводил радиопередачу?
Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.
Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).
Рис. 1.1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны
Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).
Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица "децибел" (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.
Таблица 5.1. Громкость звука
Звук Громкость в децибелах
Нижний предел чувствительности человеческого уха 0
Шорох листьев 10
Разговор 60
Гудок автомобиля 90
Реактивный двигатель 120
Болевой порог 140
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек" (рис. 1.2).
Рис. 1.2. Временная дискретизация звука
Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала.
Частота дискретизации звука - это количество измерений громкости звука за одну секунду.
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.
Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.
Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
N = 2I = 216 = 65 536.
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.
Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):
16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.
Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).
Цифровой звук – это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды .
Оцифровка звука
- технология поделенным временным шагом и последующей записи полученных значений в численном виде .
Другое название оцифровки звука - аналогово-цифровое преобразование
звука.
Оцифровка звука включает в себя два процесса:
- процесс дискретизации (осуществление выборки) сигнала по времени
- процесс квантования по амплитуде.
Дискретизация по времени
Процесс дискретизации по времени
- процесс получения значений сигнала, который преобразуется, с определенным временным шагом - шагом дискретизации
. Количество замеров величины сигнала, осуществляемых в одну секунду, называют частотой дискретизации
или частотой выборки
, или частотой сэмплирования
(от англ. « sampling» – «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды , если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал , в котором наивысшая частота спектра равна F m , может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации F d выполняется: F d >2F m .
На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (0 – 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации
(в случае, если шаг дискретизации постоянен).
Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью.
Линейное (однородное) квантование амплитуды
Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2 N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от -1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды - динамический диапазон сигнала - в виде 2 N -1 равных промежутков, разделив его на 2 N уровней - квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде
– процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
Точность округления зависит от выбранного количества (2 N) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования
(подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа – отсчетами или сэмплами
(от англ. “ sample” – “замер”). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала - дискретизация сигнала во времени в совокупности с методом однородного квантования - называется импульсно-кодовой модуляцией, ИКМ
(англ. Pulse Code Modulation – PCM).
Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи
называется PCM
(Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.
Другие способы оцифровки
Аналогово-цифровые преобразователи (АЦП)
Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП) .
Это преобразование включает в себя следующие операции:
- Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
- Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени - отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП - устройства выборки-хранения.
- Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин - уровней квантования.
- Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.
Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.
Кодирование оцифрованного звука перед его записью на носитель
Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.
Терминология
- кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
- декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
- кодек (от англ. « codec » - « Coder / Decoder ») - программный или аппаратный блок, предназначенный для кодирования/декодирования данных.
Наиболее распространённые кодеки
- MP3 – MPEG-1 Layer 3
- ОGG – Ogg Vorbis
- WMA – Windows Media Audio
- MPC - MusePack
- AAC – MPEG-2/4 AAC (Advanced Audio Coding)
- Стандарт MPEG-2 AAC
- Стандарт MPEG-4 AAC
Некоторые форматы оцифровки звука в сравнении
Основная статья: Сравнение звуковых форматов
Название формата | Квантование, бит | Частота дискретизации, кГц | Число каналов | Величина потока данных с диска, кбит/с | Степень сжатия/упаковки |
---|---|---|---|---|---|
16 | 44,1 | 2 | 1411,2 | 1:1 без потерь | |
Dolby Digital (AC3) | 16-24 | 48 | 6 | до 640 | ~12:1 с потерями |
DTS | 20-24 | 48; 96 | до 8 | до 1536 | ~3:1 с потерями |
DVD-Audio | 16; 20; 24 | 44,1; 48; 88,2; 96 | 6 | 6912 | 2:1 без потерь |
DVD-Audio | 16; 20; 24 | 176,4; 192 | 2 | 4608 | 2:1 без потерь |
MP3 | плавающий | до 48 | 2 | до 320 | ~11:1 с потерями |
AAC | плавающий | до 96 | до 48 | до 529 | с потерями |
AAC+ (SBR) | плавающий | до 48 | 2 | до 320 | с потерями |
Ogg Vorbis | до 32 | до 192 | до 255 | до 1000 | с потерями |
WMA | до 24 | до 96 | до 8 | до 768 | 2:1, есть версия без потерь |
Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя
Полный цикл преобразования звука: от оцифровки до воспроизведения
Основными параметрами, влияющими на качество цифровой звукозаписи, являются:
§ Разрядность АЦП и ЦАП.
§ Частота дискретизации АЦП и ЦАП.
§ Джиттер АЦП и ЦАП
§ Передискретизация
Также немаловажными остаются параметры аналогового тракта цифровых устройств звукозаписи и звуковоспроизведения:
§ Отношение сигнал/шум
§ Коэффициент нелинейных искажений
§ Интермодуляционные искажения
§ Неравномерность амплитудно-частотной характеристики
§ Взаимопроникновение каналов
§ Динамический диапазон
Техника цифровой звукозаписи
Запись цифрового звука в настоящее время осуществляется на студиях звукозаписи, под управлением персональных компьютеров и другой дорогостоящей и качественной аппаратуры. Также довольно широко развито понятие «домашней студии», в которой применяется профессиональное и полупрофессиональное звукозаписывающее оборудование, позволяющее создавать качественные записи в домашних условиях.
Применяются звуковые карты в составе компьютеров, которые производят обработку в своих АЦП и ЦАП - чаще всего в 24 битах и 96 кГц, дальнейшее повышение битности и частоты дискретизации, практически не увеличивает качества записи.
Существует целый класс компьютерных программ - звуковых редакторов, которые позволяют, работать со звуком:
§ записывать входящий звуковой поток
§ создавать (генерировать) звук
§ изменять существующую запись (добавлять сэмплы, изменять тембр, скорость звука, вырезать части и т.п.)
§ перезаписывать из одного формата в другой
§ конвертировать конвертировать разные аудиокодеки
Некоторые простые программы, позволяют осуществлять только конвертацию форматов и кодеков.
Разновидности цифровых аудиоформатов
Существуют различные понятия звукового формата.
Формат представления звуковых данных в цифровом виде зависит от способа квантования цифро-аналоговым преобразователем (ЦАП). В звукотехнике в настоящее время наиболее распространены два вида квантования:
§ импульсно-кодовая модуляция
§ сигма-дельта-модуляция
Зачастую разрядность квантования и частоту дискретизации указывают для различных звуковых устройств записи и воспроизведения как формат представления цифрового звука (24 бита/192 кГц; 16 бит/48 кГц).
Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудио данных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов:
§ аудиоформаты без сжатия, такие как WAV, AIFF
§ аудиоформаты со сжатием без потерь (APE, FLAC)
§ аудиоформаты, с применением сжатия с потерями (mp3, ogg)
Особняком стоят модульные музыкальные форматы файлов. Созданные синтетически или из сэмплов заранее записанных живых инструментов, они, в основном, служат для создания современной электронной музыки (MOD). Также сюда можно отнести формат MIDI, который не является звукозаписью, но при этом с помощью секвенсора позволяет записывать и воспроизводить музыку, используя определенный набор команд в текстовом виде.
Форматы носителей цифрового звука применяют как для массового распространения звуковых записей (CD, SACD), так и в профессиональной звукозаписи (DAT, минидиск).
Для систем пространственного звучания также можно выделить форматы звука, в основном являющиеся звуковым многоканальным сопровождением к кинофильмам. Такие системы имеют целые семейства форматов от двух крупных конкурирующих компаний Digital Theater Systems Inc. - DTS и Dolby Laboratories Inc. - Dolby Digital.
Также форматом называют количество каналов в системах многоканального звука (5.1; 7.1). Изначально такая система была разработана для кинотеатров, но впоследствии была расширена Программный кодек
Аудиокодек на программном уровне
§ G.723.1 - один из базовых кодеков для приложений IP-телефонии
§ G.729 - патентованный узкополосный кодек, который применяется для цифрового представления речи
§ Internet Low Bitrate Codec (iLBC) - популярный свободный кодек для IP-телефонии (в частности, для Skype и Google Talk)
Аудиокодек (англ. Audio codec ; аудио кодер/декодер) - компьютерная программа или аппаратное средство, предназначенное для кодирования или декодирования аудиоданных.
Программный кодек
Аудиокодек на программном уровне является специализированной компьютерной программой, кодеком, который сжимает (производит компрессию) или разжимает (производит декомпрессию) цифровые звуковые данные в соответствии с файловым звуковым форматом или потоковым звуковым форматом. Задача аудиокодека как компрессора заключается в предоставлении аудиосигнала с заданным качеством/точностью и минимально возможным размером. Благодаря сжатию уменьшается объём пространства, требуемого для хранения аудиоданных, а также возможно снизить полосу пропускания канала, по которому передаются аудиоданные. Большинство аудиокодеков осуществлены как программные библиотеки, которые взаимодействуют с одним или несколькими аудиоплеерами, такими как QuickTime Player, XMMS, Winamp, VLC media player, MPlayer или Windows Media Player.
Популярные программные аудиокодеки по областям применения:
§ MPEG-1 Layer III (MP3) - проприетарный кодек аудиозаписей (музыка, аудиокниги и т. п.) для компьютерной техники и цифровых проигрывателей
§ Ogg Vorbis (OGG) - второй по популярности формат, широко используется в компьютерных играх и в файлообменных сетях для передачи музыки
§ GSM-FR - первый цифровой стандарт кодирования речи, использованный в телефонах GSM
§ Adaptive multi rate (AMR) - запись человеческого голоса в мобильных телефонах и других мобильных устройствах
- Если забыл пароль от mi аккаунта, пошаговая инструкция Miui 8 как включить если забыл пароль
- HTC One M7 - Технические характеристики
- Лучшие советы: Как изменить разрешение экрана монитора
- Разделение в Excel данных по столбцам
- Как скачать и установить программу Dropbox
- Прошивка Micromax D320 Bolt 4pda прошивка micromax
- Как открыть крышку meizu m3
- Как выбрать телефон — Главные критерии выбора
- Внутренние и внешние источники питания для LCD мониторов
- "Самсунг": телефоны-раскладушки
- Скрываем друзей в вконтакте
- Как переустановить Windows на ноутбуке Asus?
- Лазерные принтеры для домашнего использования: обзор, модели, советы по выбору и отзывы о производителях Лазерные принтеры критерии выбора
- Samsung Galaxy Premier - Технические характеристики
- Структурированная кабельная система кат 5
- Как сделать скриншот на компьютере: Все возможные способы Не получается сделать скрин
- Преобразование TIFF в JPG
- Конвертируем изображения PNG в JPG Конвертировать файл в png
- Способы удаления Microsoft
- Как передать файлы с компьютера на телефон Андроид