Сжатие аудиоданных

Поделись знанием:
(перенаправлено с «Сжатие звука»)
Перейти к: навигация, поиск

Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а, соответственно, методы сокращения психоакустической избыточности — сжатием с потерями.





Сжатие без потерь

Сокращение статистической избыточности основано на учете свойств самих звуковых сигналов. Она определяется наличием корреляционной связи между соседними отсчетами цифрового звукового сигнала, устранение которой позволяет сокращать объем передаваемых данных на 15…25 % по сравнению с их исходной величиной. Для передачи сигнала необходимо получить более компактное его представление, что возможно осуществить с помощью ортогонального преобразования. Важными условиями применения такого метода преобразования являются:

  • возможность восстанавливать исходный сигнал без искажений
  • способность обеспечивать наибольшую концентрацию энергии в небольшом числе коэффициентов преобразования
  • быстрый вычислительный алгоритм

Этим требованиям отвечает модифицированное дискретно-косинусное преобразование (МДКП).

Уменьшить скорость цифрового потока позволяют методы кодирования, учитывающие статистику звуковых сигналов, например, вероятности появления уровней разной величины. Одним из таких методов является код Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются кодовыми словами большей длины. Именно в силу этих двух причин в наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты звукового сигнала, а коэффициенты МДКП.

Подобные методы применяются при архивации файлов.

Сжатие с потерями

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:

  • частотное (одновременное) маскирование
  • временное (неодновременное) маскирование

Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного.

Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости (порог слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки (изменение порога слышимости после сигнала высокого уровня) и предмаскировки (изменение порога слышимости перед приходом сигнала максимального уровня). Более слабый сигнал становится неслышимым за 5 − 20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения.

Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров который разделяет сигнал на частотные поддиапазоны. На выходе каждого фильтра оказывается та часть входного сигнала, кото­рая попадает в полосу пропускания данного фильтра. Далее, в каждой полосе с помощью психоакустической модели, анализируется спектральный состав сигнала и оценивается, ка­кую часть сигнала следует передавать без сокращений, а какая лежит ниже по­рога маскирования и может быть переквантована на меньшее число бит. Для сокращения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. Эта операция аналогична компандированию в аналоговом вещании. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами.

Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве.

Структура кодера сжатия аудиоданных с потерями

  • Исходный цифровой звуковой сиг­нал разделяется на частотные поддиапазоны и сегментируется по времени в блоке временной и частотной сегментации.
  • Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так назы­ваемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя значение психоакустической энтропии сигнала.
  • После сег­ментации сигналы частотных поддиапазонов нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки звукового сигнала, а соответствующие им коэффициенты МДКП.
  • Учет закономерностей слухового восприятия звукового сигнала вы­полняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого частотного поддиапазона рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они еще маскируются полезным сигналом данного поддиапазона.
  • Блок динамического распределения бит в соответствии с требованиями психоакустической модели для каждого поддиапазона кодирования выделяет такое минимально возможное их количество, при котором уровень искажений, вызванных квантованием, не превышал порога их слышимости, рассчитанного психоакустической моделью.
  • Также могут использоваться:
    • матрицирование стерео — сложение и вычитание левого и правого канала для устранения повторяющейся информации
    • специальные процедуры итерационных циклов, позволяющие управлять величиной энергии искажений квантования в поддиапазонах при недостаточном числе доступных для кодирования бит
    • процедуры линейного и обратного адаптивного предсказаний
    • техника сглаживания переходных шумов во временной области (Temporal Noise Shaping — TNS), позволяющая управлять микроструктурой искажений квантования внутри каждого поддиапазона кодирования

Многие другие приёмы могут послужить способом сократить объём данных звуковой информации. Даже простое сужение полосы частот сигнала вместе с уменьшением динамического диапазона может уже называться сжатием аудиоданных. Например, в стандарте сжатия звука в сотовой связи используется и то и другое. Стремясь удалить избыточность из звука, кодек при плохом качестве сигнала становится избирателен к определённым словам, упорно проглатывая их.

Субъективная оценка качества

Для сжатых аудиоданных существует субъективная оценка качества, оцениваемая как процент людей, почувствовавших разницу с оригиналом.

Соответствие битрейта кодека MP3 в режиме стерео и процента людей заметивших разницу с оригиналом
Приблизительное количество людей, услышавших разницу между оригинальной и сжатой записями, % Битрейт сжатой записи, кбит/сек
0…1 320
5…30 256
30…40 192
40…70 128

Следует учесть тот факт, что качество получившегося материала зависит от характера сжимаемых данных, от жанра, наличия фона, помех. После сжатия, например MP3, на средних битрейтах, слушатели отмечают оловянность перкуссионных. А на голосе сжатие (даже сильное) отражается мало.

См. также

Напишите отзыв о статье "Сжатие аудиоданных"

Ссылки

  • [rus.625-net.ru/audioproducer/2000/06/7.htm Компрессия цифрового звука: психоакустические основы и алгоритмы. Юрий Ковалгин]
  • [www.mediascan.by/index.files/l6_dpsi.pdf Сжатие речевых сигналов на основе психоакустической модели слухового анализатора человека. Киркоров С. И., Борискевича А.А]
  • [rus.625-net.ru/audioproducer/2007/03/techno4.htm Феномен временной маскировки и его учет при кодировании звуковых сигналов. Максим Зырянов, Юрий Ковалгин]
  • [library.tuit.uz/skanir_knigi/book/osnovi_multimediya/glava_2.htm Основы мультимедиа звук и видео. Глава 4. Сжатие звуковой информации. Г. П. Катунин]


Отрывок, характеризующий Сжатие аудиоданных

Кутузов ничего не сказал, но когда ему донесли, что войска Мюрата отступают, он приказал наступленье; но через каждые сто шагов останавливался на три четверти часа.
Все сраженье состояло только в том, что сделали казаки Орлова Денисова; остальные войска лишь напрасно потеряли несколько сот людей.
Вследствие этого сражения Кутузов получил алмазный знак, Бенигсен тоже алмазы и сто тысяч рублей, другие, по чинам соответственно, получили тоже много приятного, и после этого сражения сделаны еще новые перемещения в штабе.
«Вот как у нас всегда делается, все навыворот!» – говорили после Тарутинского сражения русские офицеры и генералы, – точно так же, как и говорят теперь, давая чувствовать, что кто то там глупый делает так, навыворот, а мы бы не так сделали. Но люди, говорящие так, или не знают дела, про которое говорят, или умышленно обманывают себя. Всякое сражение – Тарутинское, Бородинское, Аустерлицкое – всякое совершается не так, как предполагали его распорядители. Это есть существенное условие.
Бесчисленное количество свободных сил (ибо нигде человек не бывает свободнее, как во время сражения, где дело идет о жизни и смерти) влияет на направление сражения, и это направление никогда не может быть известно вперед и никогда не совпадает с направлением какой нибудь одной силы.
Ежели многие, одновременно и разнообразно направленные силы действуют на какое нибудь тело, то направление движения этого тела не может совпадать ни с одной из сил; а будет всегда среднее, кратчайшее направление, то, что в механике выражается диагональю параллелограмма сил.
Ежели в описаниях историков, в особенности французских, мы находим, что у них войны и сражения исполняются по вперед определенному плану, то единственный вывод, который мы можем сделать из этого, состоит в том, что описания эти не верны.
Тарутинское сражение, очевидно, не достигло той цели, которую имел в виду Толь: по порядку ввести по диспозиции в дело войска, и той, которую мог иметь граф Орлов; взять в плен Мюрата, или цели истребления мгновенно всего корпуса, которую могли иметь Бенигсен и другие лица, или цели офицера, желавшего попасть в дело и отличиться, или казака, который хотел приобрести больше добычи, чем он приобрел, и т. д. Но, если целью было то, что действительно совершилось, и то, что для всех русских людей тогда было общим желанием (изгнание французов из России и истребление их армии), то будет совершенно ясно, что Тарутинское сражение, именно вследствие его несообразностей, было то самое, что было нужно в тот период кампании. Трудно и невозможно придумать какой нибудь исход этого сражения, более целесообразный, чем тот, который оно имело. При самом малом напряжении, при величайшей путанице и при самой ничтожной потере были приобретены самые большие результаты во всю кампанию, был сделан переход от отступления к наступлению, была обличена слабость французов и был дан тот толчок, которого только и ожидало наполеоновское войско для начатия бегства.


Наполеон вступает в Москву после блестящей победы de la Moskowa; сомнения в победе не может быть, так как поле сражения остается за французами. Русские отступают и отдают столицу. Москва, наполненная провиантом, оружием, снарядами и несметными богатствами, – в руках Наполеона. Русское войско, вдвое слабейшее французского, в продолжение месяца не делает ни одной попытки нападения. Положение Наполеона самое блестящее. Для того, чтобы двойными силами навалиться на остатки русской армии и истребить ее, для того, чтобы выговорить выгодный мир или, в случае отказа, сделать угрожающее движение на Петербург, для того, чтобы даже, в случае неудачи, вернуться в Смоленск или в Вильну, или остаться в Москве, – для того, одним словом, чтобы удержать то блестящее положение, в котором находилось в то время французское войско, казалось бы, не нужно особенной гениальности. Для этого нужно было сделать самое простое и легкое: не допустить войска до грабежа, заготовить зимние одежды, которых достало бы в Москве на всю армию, и правильно собрать находившийся в Москве более чем на полгода (по показанию французских историков) провиант всему войску. Наполеон, этот гениальнейший из гениев и имевший власть управлять армиею, как утверждают историки, ничего не сделал этого.
Он не только не сделал ничего этого, но, напротив, употребил свою власть на то, чтобы из всех представлявшихся ему путей деятельности выбрать то, что было глупее и пагубнее всего. Из всего, что мог сделать Наполеон: зимовать в Москве, идти на Петербург, идти на Нижний Новгород, идти назад, севернее или южнее, тем путем, которым пошел потом Кутузов, – ну что бы ни придумать, глупее и пагубнее того, что сделал Наполеон, то есть оставаться до октября в Москве, предоставляя войскам грабить город, потом, колеблясь, оставить или не оставить гарнизон, выйти из Москвы, подойти к Кутузову, не начать сражения, пойти вправо, дойти до Малого Ярославца, опять не испытав случайности пробиться, пойти не по той дороге, по которой пошел Кутузов, а пойти назад на Можайск и по разоренной Смоленской дороге, – глупее этого, пагубнее для войска ничего нельзя было придумать, как то и показали последствия. Пускай самые искусные стратегики придумают, представив себе, что цель Наполеона состояла в том, чтобы погубить свою армию, придумают другой ряд действий, который бы с такой же несомненностью и независимостью от всего того, что бы ни предприняли русские войска, погубил бы так совершенно всю французскую армию, как то, что сделал Наполеон.
Гениальный Наполеон сделал это. Но сказать, что Наполеон погубил свою армию потому, что он хотел этого, или потому, что он был очень глуп, было бы точно так же несправедливо, как сказать, что Наполеон довел свои войска до Москвы потому, что он хотел этого, и потому, что он был очень умен и гениален.
В том и другом случае личная деятельность его, не имевшая больше силы, чем личная деятельность каждого солдата, только совпадала с теми законами, по которым совершалось явление.
Совершенно ложно (только потому, что последствия не оправдали деятельности Наполеона) представляют нам историки силы Наполеона ослабевшими в Москве. Он, точно так же, как и прежде, как и после, в 13 м году, употреблял все свое уменье и силы на то, чтобы сделать наилучшее для себя и своей армии. Деятельность Наполеона за это время не менее изумительна, чем в Египте, в Италии, в Австрии и в Пруссии. Мы не знаем верно о том, в какой степени была действительна гениальность Наполеона в Египте, где сорок веков смотрели на его величие, потому что эти все великие подвиги описаны нам только французами. Мы не можем верно судить о его гениальности в Австрии и Пруссии, так как сведения о его деятельности там должны черпать из французских и немецких источников; а непостижимая сдача в плен корпусов без сражений и крепостей без осады должна склонять немцев к признанию гениальности как к единственному объяснению той войны, которая велась в Германии. Но нам признавать его гениальность, чтобы скрыть свой стыд, слава богу, нет причины. Мы заплатили за то, чтоб иметь право просто и прямо смотреть на дело, и мы не уступим этого права.
Деятельность его в Москве так же изумительна и гениальна, как и везде. Приказания за приказаниями и планы за планами исходят из него со времени его вступления в Москву и до выхода из нее. Отсутствие жителей и депутации и самый пожар Москвы не смущают его. Он не упускает из виду ни блага своей армии, ни действий неприятеля, ни блага народов России, ни управления долами Парижа, ни дипломатических соображений о предстоящих условиях мира.


В военном отношении, тотчас по вступлении в Москву, Наполеон строго приказывает генералу Себастиани следить за движениями русской армии, рассылает корпуса по разным дорогам и Мюрату приказывает найти Кутузова. Потом он старательно распоряжается об укреплении Кремля; потом делает гениальный план будущей кампании по всей карте России. В отношении дипломатическом, Наполеон призывает к себе ограбленного и оборванного капитана Яковлева, не знающего, как выбраться из Москвы, подробно излагает ему всю свою политику и свое великодушие и, написав письмо к императору Александру, в котором он считает своим долгом сообщить своему другу и брату, что Растопчин дурно распорядился в Москве, он отправляет Яковлева в Петербург. Изложив так же подробно свои виды и великодушие перед Тутолминым, он и этого старичка отправляет в Петербург для переговоров.
В отношении юридическом, тотчас же после пожаров, велено найти виновных и казнить их. И злодей Растопчин наказан тем, что велено сжечь его дома.
В отношении административном, Москве дарована конституция, учрежден муниципалитет и обнародовано следующее:
«Жители Москвы!
Несчастия ваши жестоки, но его величество император и король хочет прекратить течение оных. Страшные примеры вас научили, каким образом он наказывает непослушание и преступление. Строгие меры взяты, чтобы прекратить беспорядок и возвратить общую безопасность. Отеческая администрация, избранная из самих вас, составлять будет ваш муниципалитет или градское правление. Оное будет пещись об вас, об ваших нуждах, об вашей пользе. Члены оного отличаются красною лентою, которую будут носить через плечо, а градской голова будет иметь сверх оного белый пояс. Но, исключая время должности их, они будут иметь только красную ленту вокруг левой руки.