Тарифы        26.04.2019   

Типы сжатия музыкальных файлов. Какой кодек выбрать? Зачем вообще пользоваться lossy, когда есть доступный lossless

В мире музыки существует огромное количество музыкальных форматов их модификаций и версий, созданных гигантами музыкальной индустрии и небольшими компаниями, получившими общественное признание в электронном мире.

Для этих целей были разработаны различные физические методы хранения аудиоданных, например: виниловые пластинки, магнитная лента, компакт-диски, DAT, MD (минидиск), DVD или преобразование нот в музыкальных форматах (MIDI), точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных – digital: OGG, Mp3, Flac, Wav форматов.

Невозможно рассмотреть и обсудить все звуковые форматы, кодеки их достоинства и недостатки, по этому в своей статье постараюсь рассказать о наиболее популярных расширениях audio files, с которыми Вы сталкиваетесь.

Почему мы не можем использовать какой ни будь один универсальный формат кодирования аудио-файлов? Потому, что для реализации различных функций необходим свой формат. Например: для воспроизведения CD в дисководе компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа, для проигрывания в мобильных телефонах или передачи файлов через Интернет, кроме того, существует ряд операционных систем получивших наибольшее распространение в мире. В их число входят: Amiga, Macintosh, NEXT и персональные компьютеры с операционной системой Windows.

Кроме того работа dj, звукорежиссера, cj, видеоинженера или простого любителя музыки – достаточно сильно отличаются по своей сути. Для этого может потребоваться, чтобы Ваши аудиоданные были сохранены своим способом. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает примерно 10 Мбайт, т.е. средний трэк продолжительностью 5 минут составит 50 “метров” – это слишком большой объем данных для среднестатистического пользователя. В этой статье представлена краткая информация о самых популярных музыкальных форматах.

AA (Audible Audio Book File) – формат является закрытым, разработан компанией Audible. Применяется, для записи аудиокниг, которые продаются через сервисы Audible и iTunes. Существует возможность замедлять или ускорять скорость прослушивания файлов – digital pitch, возможность оставлять закладки при прослушивании аудио книг, защита файлов, при доставке звуковых записей посредством internet.

AAC (Advanced Audio Coding) – формат аудио-файла с меньшей потерей качества при кодировании, чем Mp3 при одинаковых размерах. Кодирование музыки без потерь качества оригинала с помощью профиля ALAC. AAC – семейство алгоритмов аудио кодирования MPEG4. В отличие от гибридного набора фильтров mp3, AAC использует MDST технологию (модифицированное косинусное преобразование) – это значит, что слушатель получает более лучшее качество звука, чем при MP3 кодировании с таким же или меньшим битрейтом. Возможные расширения AAC файлов: [.m4a ], [ .m4b ], [ .m4p ] .

Также AAC - это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.

На 2009 год распространён значительно меньше, чем MP3 и другие альтернативные решения. AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Преимущества AAC перед MP3:

– до 48 звуковых каналов;

– большая эффективность кодирования как при постоянном, так и при переменном битрейте;

– частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц);

– более гибкий режим Joint stereo.

ADX – основанный на АДИКМ проприетарный формат сжатия с потерями и хранения звукозаписи, разработанный CRI Middleware специально для использования в видеоиграх. Наиболее характерная особенность - возможность зациклить звукозапись, что делает применение формата удобным для использования в качестве фоновой музыки в различных играх, поддерживающих этот медиаконтейнер. Его поддерживают множество игр для SEGA Dreamcast некоторые игры для PlayStation 2 и GameCube.

В отличие MP3, в нём не применяется психоакустическая модель уменьшения объёма данных о звуке (уменьшения его сложности). Вместо этого модель ADPCM использует для сохранения образцов запись данных относительной ошибки функции предсказания, что означает бо́льшую сохранность исходного сигнала после кодирования; по существу, сжатие ADPCM, вместо использования полных переразмерянных образцов звукозаписи, предоставляет образцы отклонения сигнала от предыдущего значения, которые имеют гораздо меньший размер, обычно - 4 бита. Для человеческого уха такое отклонение находится на уровне шума, что делает потерю качества едва заметной.

AIFF – это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Если вам когда-нибудь потребуется пересылать аудиофайлы между персональным компьютером и компьютером Macintosh, используйте именно этот формат. Он поддерживает 8- и 16-битные монофонические и стереофонические аудиоданные. Файлы этого формата могут содержать заголовок Mac-Binary, а могут и не иметь его. Если файл данного типа не содержит заголовка Mac-Binary, он, скорее всего, имеет расширение aif. Если файл данного типа содержит заголовок Mac-Binary, то Sound Forge откроет его, но идентифицирует как файл формата Macintosh Resource (см. следующий раздел). В этом случае файл, скорее всего, имеет расширение snd. Замечание При сохранении файлов на компьютерах Macintosh к ним добавляется так называемый заголовок Mac-Binary. Это маленький фрагмент информации, записываемый в начале файла, идентифицирующий тип файла для операционной системы Mac OS и других приложений. Таким способом компьютеры Macintosh сообщают, что содержит файл: текст, графику или, например, аудиоданные.

AMR (Adaptive multi rate) [. amr ] - адаптивное кодирование с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. Стандартизован ETSI (European Telecommunications Standards Institute). Использование AMR позволяет обеспечить высокую ёмкость сети с одновременно высоким качеством передачи речи. AMR обладает широким набором скоростей кодирования/декодирования речи и позволяет гибко переключаться на различные режимы в зависимости от окружающих условий или загрузки сети, в любых условиях обеспечивая кристально чистую передачу голоса.

APE – (Monkey ‘ s Audio ) [. ape ] – разработчик Мэтью Т. Эшланд – формат цифрового звука без потерь качества (lossless ). Кодек Monkey’s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для MacOS, Linux, BeOS. Файлы Monkey’s Audio используют следующие расширения: .ape – для хранения аудио и.apl – для хранения метаданных. Данный формат не является свободным, т.к. лицензия на него серьезно ограничивает распространение.

Apple Lossless [. m 4 a ]это аудио кодек, разработанный Apple Inc, для сжатия цифровой музыки без потерь данных.Apple Lossless данные хранятся в контейнере MP4 с расширением.m4a. Хотя Apple Lossless имеет такое же расширение файла, как AAC, это не AAC, кодек схож с другими Lossless кодеками, такими как FLAC и др. Плеер iPod с док разъемом (не shuffle) и последней прошивкой может проигрывать файлы в формате Apple Lossless. Он не использует какие-либо управления цифровыми правами (DRM), но, с учётом характера контейнера, считается, что DRM может применяться к ALAC.

Тесты показали, что сжатые в ALAC файлы получаются примерно от 40 % до 60 % размера оригиналов в зависимости от вида музыки, подобно другим Lossless форматам. Кроме того, скорость, с которой он может быть декодирован, делает его полезным для устройств с ограниченной производительностью, такие как iPod.

Apple Lossless Encoder был представлен в качестве одного из компонентов QuickTime 6.5.1 28 апреля 2004 года и как функция iTunes 4.5. Кодек используется также в AirPort Express в AirTunes осуществления.

Декодер для Apple Lossless формата теперь есть в открытых источниках библиотеки libavcodec. Это означает, что любой мультимедийный проигрыватель на основе этой библиотеки, включая мультимедиа VLC и MPlayer, может иметь возможность играть Apple Lossless файлы.

CDDA (Compact Disc Digital Audio ) - звуковой компакт-диск, международный стандарт хранения оцифрованного звука на компакт-дисках, представленный фирмами Philips и Sony. Звуковая информация представлена в импульсно-кодовой модуляции с частотой дискретизации 44,1 кГц и битрейтом 1411,2 кбит/с, 16 бит стерео.

С пецификация аудио в стандарте Red Book:

– максимальное время всех записей составляет 79,8 минут;

минимальное время трека - 4 секунды (включая 2-секундную паузу);

максимальное количество треков - 99;

– максимальное число точек отсчёта (разделов трека) - 99 без ограничений по времени;

– должен присутствовать International Standard Recording Code (ISRC).

DTS – (Digital Theater System ) , по сути – это Dolby Digital , а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby , так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате.

DTS это цифровая театральная система - семейство систем цифровой многоканальной звукозаписи, созданное компанией «Диджитал Тиэтер Систем» для демонстрации цифровых фонограмм в кинотеатрах синхронно с прокатными фильмокопиями. Кроме сопровождения плёночных фильмокопий, обе системы (DTS и Dolby Digital ) в упрощённом виде используются на оптических видеодисках для домашнего просмотра. DTS использует меньший уровень сжатия, чем Dolby , но абсолютного превосходства нет ни у одной из систем. Споры о преимуществах DTS или Dolby Digital не прекращаются по сей день. Формат DTS Stereo практически идентичен Dolby Surround . DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. DTS в домашних театрах допускает полный битрейт (1509,75 кбит/с).

FLAC (свободный кодек из проекта Ogg) [.flac ] – (англ. Free Lossless Audio Codec - свободный аудио-кодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, FLAC не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высокачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями. Чтобы хранить основные типы метаданных, базовый декодер использует теги ID 3 v 1 и ID 3 v 2, поэтому их можно свободно добавлять и редактировать.

MIDI (Musical Instrument Digital Interface ) – цифровой интерфейс музыкальных инструментов. Это стандарт цифровой звукозаписи на формат обмена данными между электронными музыкальными инструментами.

Интерфейс позволяет единообразно кодировать в цифровой форме такие данные как нажатие клавиш, настройку громкости и других акустических параметров, выбор тембра, темпа, тональности и др., с точной привязкой во времени. В системе кодировок присутствует множество свободных команд, которые производители, программисты и пользователи могут использовать по своему усмотрению. Поэтому интерфейс MIDI позволяет, помимо исполнения музыки, синхронизировать управление другим оборудованием, например, осветительным, пиротехническим и т.п.

Последовательность MIDI-команд может быть записана на любой цифровой носитель в виде файла, передана по любым каналам связи. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

MP 2 (MPEG -1 Audio Layer II или Musicam) [. mp 2 ] – один из трёх форматов (уровень 2) сжатия звука с потерями, определённых в стандарте MPEG-1. Применяется в цифровом радиовещании DAB и устаревшем стандарте Video CD, который в 90-е годы использовался для распространения фильмов на оптических компакт-дисках и существовал до широкого распространения DVD.

Кодер MPEG-1 Audio Layer 2 развился из аудиокодека MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing - универсальное полосное кодирование и мультиплексирование с адаптацией к шаблону маскировки), разработанного CCETT, Philips и IRT в 1989 как часть исследований EUREKA 147 европейских межправительственных разработок для систем цифрового радиовещания для стационарных, портативных и мобильных приёмных устройств. Основные параметры MPEG-1 Audio были унаследованы из MUSICAM, включая банк фильтров, обработку во временной области, размер аудиокадра и т.д. Однако, после дополнительного усовершенствования, алгоритм MUSICAM не был использован в финальной версии стандарта MPEG-1 Layer II.

MP 3 (MPEG Layer 3) [. mp 3 ] третий формат кодирования звуковой дорожки MPEG - лицензируемый формат файла для хранения аудио-информации.На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия. При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG. Многие музыкальные гурманы, предпочитают сжимать музыку с максимальным качеством – 320 kbps , либо переходить на другие форматы, например FLAC , где битрейт в среднем ~1000 kbps .

MusePack [. mpc ]нелицензируемый формат файла для хранения аудиоинформации, распространяемый по GNU General Public License .

В Musepack’е применяется разбиение на полосы частот, поэтому он относится к так называемым subband-кодекам. Основная особенность - точная настройка психоакустики, что позволяет работать с чистым VBR-кодированием (кодирование с переменным битрейтом). Основной задачей Musepack является прозрачность звучания закодированной музыки.

В современных форматах, таких как: MP3, Vorbis, AAC, AC3, WMA производится второе dct-преобразование, что позволяет им добиться лучшего качества на средних и низких битрейтах, но не позволяет добиться высоких результатов на более высоких. MusePack не производит второго dct-преобразования, что позволяет достичь непревзойденного качества на битрейтах выше 180.

Так же как в AAC и некоторых других современных форматах, в Musepack производится спаривание каналов по полосам частот, что незначительно отражается на качестве, но позволяет сильно сэкономить на размере. В MP3 спаривание каналов производится не по полосам частот, а для всей полосы целиком, разбивая сигнал на частотные подполосы, затем производит разложение сигнала в ряд косинусов (MDCT - частный случай преобразования Фурье) и записывает округленные (квантованные) значения полученных после преобразования коэффициентов (квантование происходит в соответствии с проводимым психоакустическим анализом). MPC же после разбиения сигнала на частотные подполосы просто производит переквантование (опираясь на психоакустику) амплитудного сигнала в каждой подполосе и полученные округленные (квантованные) значения записывает в выходной поток. Этим же фактом объясняется и большая скорость компрессии и декомпрессии MPC.

MOD – формат разработан для платформы Amiga. Каждый файл MOD содержит оцифрованные записи real звучания инструментов, так называемые сэмплы, чем-то похож на структуру MIDI. Cj или композитор, пишущий в формате MOD, применяет программу, называемую трэкером, в которой указывает, какой именно инструмент, в какое время, какой нотой и октавой должен прозвучать – эта последовательность нот записывается в список – трек, а несколько параллельно звучащих треков образуют блок, называемый паттерном. Совокупность паттернов образует модуль – файл в формате MOD, с расширением.mod. Одна линейка трекера соответствует одному реальному каналу, в котором cj может проиграть или отредактировать пронумерованные ноты. Нотам могут назначаться различные “орнаментами” – например: тремоло, глиссандо и т.д.

OGG [.ogv ], [.oga ], [.ogx ], [.ogg ] – открытый стандарт формата мультимедиа контейнера, являющийся основным файловым и потоковым форматом для мультимедиа кодеков фонда Xiph.Org, а также название проекта, занимающегося разработкой этого формата и кодеков для него. Как и все технологии, разрабатываемые под эгидой Xiph.Org, формат Ogg является открытым и свободным стандартом, не имеющим патентных или лицензионных ограничений.

Ogg является всего лишь контейнером. Музыка или видео сжимаются кодеками, а результат обработки хранится в подобных контейнерах. Контейнеры Ogg могут хранить потоки, закодированные несколькими кодеками. Например, файл с видео и звуком может содержать данные, закодированные аудио и видео кодеками.

В контейнере Ogg можно хранить звук и видео в различных форматах (таких как MPEG-4, Dirac, MP3 и другие).

RealAudio [. ra ],[. ram ]Пропиарный стандарт на потоковое вещание и на формат медиафайлов, принадлежащий фирме « RealNetworks Products and Services ». RealAudio впервые представленный в составе пакета RealAudio 10, кодек для сжатия звука без потери качества.

Среди плюсов данного кодека - поддержка потокового вещания, очень быстрое декодирование. К минусам относят закрытость кода и отсутствие многоканальности. Доступен для Microsoft Windows , Macintosh и GNU / Linux .

RKAU [.rka ]Среди всех аудиокодеков RKAU занимает совершенно особое место. Во-первых это – самый маленький (всего 25kB!) и самый быстрый кодер. Во-вторых помимо того, что он является программой сжатия звука без потерь (lossless), в нём предусмотрены режимы сжатия с потерями, обеспечивающие большую, нежели все известные lossless-алгоритмы, степень сжатия. Однако благодаря особенностям алгоритма, лежащего в основе rkau искажения, вносимые кодеком лежат не в спектральной (как в случае психоакустических моделей кодеров MP3, MP+, AAC и других), а в реальной области. То есть имеют, грубо говоря, нелинейную природу, как и искажения большинства трактов. При этом не происходит потери мелких деталей и микропланов фонограммы. Однако если “переусердствовать” в этом отношении, то звук может стать совершенно неудобоваримым: в звучании появятся жёсткие шумоподобные артефакты, а само звучание приобретёт ярко выраженное окрашивание.

В иерархии аудиокодеков программа rkau стоит стовершенно особняком. Она настолько оригинальна, что не имеет аналогов среди прочих алгоритмов сжатия аудиоданных. Малый размер программы-кодера (25kB) и высокая скорость работы при сходных с остальными lossless-алгритмами степенями сжатия выводят rkau в безусловные лидеры. И хотя самым эффективным lossless-кодером можно считать OptimFROG, рассмотренный в прдыдущей части статьи, rkau лишь ненамного отстаёт от него по эффективности. Однако при активации режима сжатия “с потерями”, rkau даже в режиме наивысшего качества оставляет далеко позади все lossless-алгоритмы, приближаясь по эффективности к программ, основанным на психоакустической модели (MP3, MP+, AAC, VQF и другие). При этом не происходит характерной для MPEG-подобных алгоритмов потери микропланов и нюансов исходного аудиоматериала, а неизбежно возникающие при этом артефакты можно заметить только на очень качественной аппаратуре при многократном сравнительном прослушивании.

Shorten [.shn ] – представляет собой формат, используемый для сжатия аудиоданных. Это форма сжатия файлов используется для сжатия CD-качества, tp gjnthm аудио файлов (44,1 кГц, 16 бит, стерео PCM ). Этот формат до сих пор используется некоторыми людьми, потому что по закону продаются концертные записи в, которые кодируются как Shorten файлы.

Speex [. spx ] – это свободный кодек для сжатия речевого сигнала, который может использоваться в приложениях «голос-через-интернет» (VoIP ). С высокой вероятностью он не имеет никаких патентных ограничений и лицензирован под последней версией лицензии BSD (без третьей статьи). Сжатые кодеком Speex данные можно хранить либо в формате хранения звуковых данных Ogg , либо передавать напрямую с помощью пакетов UDP / RTP .

Разработчики противопоставляют свою разработку другим открытым кодекам, например, кодеку Vorbis , утверждая, что именно кодек Speex лучше всего подходит для передачи голоса по сети с ненадёжной доставкой пакетов данных. При этом авторы разработки специально подчёркивают, что кодек подходит для использования в сетях с ненадёжной передачей пакетов, то есть либо пакет пришёл, либо нет.

Speex относится к классу так называемых Code Excited Linear Prediction (CELP )-кодеков, то есть кодеков, построенных на основе так называемого Линейного Предсказательного кодирования ЛПК. ЛПК использует для аппроксимации отрезка речевого сигнала цифровой фильтр только с обратными связями (т. н. «авторегрессионный фильтр»). Коэффициенты этого фильтра «подгоняются» под отрезок сигнала с помощью процедуры Левинсона (в западной литературе - Левинсона-Дурбина). CELP -модификация ЛПК предусматривает наличие т. н. «кодовой книги», которая содержит предопределённые наборы возбуждающих ЛПК-фильтр единичных импульсов.

Речевой сигнал в кодеке Speex разбивается на неперекрывающиеся отрезки длительностью 20 мс (160 отсчётов при 8 КГц). При этом, для оценки возбуждающего набора вышеуказанный отрезок разбивается на четыре подотрезка длительностью 5 мс соответственно. На каждом из подотрезков отыскиваются возбуждающие наборы импульсов как текущего подотрезка (из кодовой книги), так и двух предыдущих подотрезков. В отличие от других кодеков, с целью избежать патентных ограничений, Speex не использует алгебраическое кодирование, а только векторное. Возбуждения двух предыдущих подотрезков складываются с переменными весами, в отличие от ряда других кодеков, где используются переменные положения по времени.

По заявлению разработчиков, Speex оптимизирован для получения высококачественного речевого сигнала при низких скоростях. Кодек Speex также позволяет использовать переменную степень сжатия сигнала и поддерживает сигналы с различной шириной полосы: сверхширокополосный (частота дискретизации 32 кГц), широкополосный (16 кГц) и узкополосный (8 кГц).

TAK (Tom ‘ s lossless Audio Kompressor ) [. tak ]Аудиокодек и формат сжатия цифрового звука без потерь. Отличается высокой степенью сжатия и скоростью кодирования и декодирования.Распространяется бесплатно вместе c набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам: Winamp, foobar2000 и др.Разработчик - Thomas Becker, Германия.Относительно новый кодек. Первая финальная версия 1.0 была опубликована 26 января 2007 года.

Формат продолжает активно развиваться (последняя версия 1.1.1) и в настоящее время, согласно проводимому опросу на форуме hydrogenaudio.org, входит в число трёх наиболее популярных форматов аудиосжатия без потерь (после FLAC и WavPack)

TTA (True Audio) – бесплатный, аудио кодек, осуществляющий сжатие музыкальных файлов без потерь в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает всеми улучшенными характеристиками, как и большинство современных кодеров. Сжатый размер файлов будет на 30 % – 70 % меньше, чем original music file. TTA формат поддерживает тэги ID3v1 и ID3v2. Используя True Audio кодек, можно разместить до 20 audio CD на одном DVD-R диске.

TwinVQ (Transform – domain Weighted Interleave Vector Quanization ) - векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Labolatories .

VQF-файлы примерно на 30-35 % меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также на 30 % выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы.

Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2-3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плеера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с MP3.

VQF (Interleave Vector Quanization) – разработан в Японии и основывается на технологии TwinVQ. Если сравнить VQF и MP3, то первый формат на 30-50% будет “компактнее”, при одинаковом качестве звука. Это дает VQF – значительное преимущество перед MP3 форматом. Но процесс при кодировании, декодировании (decoder) VQF, занимает примерно на 30% больше ресурсов процессора PC, чем Mp3 аудио.

Тесты показывают превосходство TwinVQ по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра TwinVQ на 2-3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плеера, что объективно ставит TwinVQ на ступень выше по качеству звука по сравнению с MP3.

Vorbis [. ogg ] – свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. По функциональности и качеству аналогичен таким кодекам как AAC, AC3 и VQF, превосходящим MP3. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 500 до 1000 кбит/с. Такой же гибкостью обладает частота дискретизации - пользователям предоставляется любой выбор в пределах от 2 до 192 кГц.

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов MP3, Ogg Vorbis имеет полную поддержку на всех популярных платформах (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Однако несмотря на все свои преимущества перед конкурентами, популярность данного формата пока невелика.

WAV (Waveform audio format ) [. wav ], [. wave ] – разработан совместно с IBM . Формат записи (стерео- или моно-) звука без сжатия. Так всего одна минута стереозаписи звука сделанная с CD-качеством (частота дискретизации 44,1 КГц) содержит 60 с х 44100Гц х 2 канала = 5 292 000 отсчетов. На каждый отсчет может приходиться 8 или 16 бит. Таким образом, в варианте 8 бит на отсчет, одна минута звука займет в памяти 42 336 000 бит = 5 292 000 байт (около 5 Мб).

WavPack [.wv ], [.wvс ] – Бесплатный аудиокодек c открытым исходным кодом для сжатия аудио без потери качества. Разработан Дэвидом Бриантом.

WavPack формат позволяет сжимать (и восстанавливать) 8-, 16-, 24- и 32-битные аудиофайлы в.WAV формате. Он также поддерживает потоки звук вокруг и высокие частоты дискретизации (sampling rate). Как у других способов компрессии без потери качества, эффективность сжатия зависит от исходных данных, но обычно она лежит в диапазоне между 30 % и 70 % для обычной популярной музыки, немного выше для классической музыки и других источников с более широким динамическим диапазоном.

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого (точнее, указанного при кодировании) качества с потерей (.WV), который может проигрываться сам по себе, а также файл «коррекции» (.WVC), который (в комбинации с предыдущим.WV) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

WMA (Windows Media Audio ) [. wma ]лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.Изначально формат WMA позиционировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC (используется в популярном онлайновом музыкальном магазине iTunes).

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft. Особенно стоит отметить что ранние версии формата (или его реализации) имели проблемы на низких скоростях потока. Также многие меломаны и владельцы цифровых плееров недолюбливают формат WMA за низкую стойкость к ошибкам. Если при кодировании/передаче файла WMA некоторая часть его повреждается, то воспроизведение файла становится невозможным, как после места повреждения, так и за несколько десятков секунд до него. (Для сравнения: при повреждении файла формата MP3, его всё ещё можно воспроизвести от начала до самого места повреждения, затем пропустить несколько секунд и воспроизвести дальше до конца; иногда же ошибки в несколько байт в файле MP3 бывают на слух малозаметны или не заметны вообще.) Однако данный формат постоянно развивается, так что можно предполагать, качество будет оптимизироваться.

Большинство портативных аудиоплейеров поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах (вследствие его закрытости).

Microsoft включила в WMA поддержку цифровой системы управления авторскими правами (DRM) (система защиты). Основным следствием ее является невозможность прослушивать защищенные композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина.

В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества англ. lossless, многоканальное кодирование объемного звука и кодирование голоса.

Прежде чем приступить к обзору наиболее распространенных аудиокодеков, поясним, что это такое и каково их назначение. Кодек, или, другими словами, кодировщик, — это программное либо аппаратное средство для кодирования и декодирования информации (в нашем случае — аудиоинформации) по определенному алгоритму. На рынке представлено огромное количество кодеков, мы же рассмотрим лишь некоторые из них — самые популярные и востребованные.

одирование, или сжатие, может быть двух видов: с потерями информации и без потерь. Для каждого вида кодирования существуют свои виды аудиокодеков. Чем же кодирование информации без потерь отличается от кодирования информации с потерями?

При кодировании информации без потерь сжатие данных не приводит к потере информации, а следовательно, декодируемый аудиофайл абсолютно идентичен оригиналу. При кодировании данным способом сокращение первоначального объема информации достигает 20-50%. Все чаще к такому способу прибегают не только аудиоманы, но и простые пользователи. По мере роста дискового пространства и снижения цен на накопители все больше пользователей предпочитает хранить аудиоданные, закодировав их именно этим способом. Сегодня алгоритмов, позволяющих выполнить данную операцию, существует довольно много, но самыми популярными являются те, что реализованы в кодеках FLAC, Monkey’s Audio, WavPack, и TTA.

Сжатие данных с потерями используется для получения файла минимального размера. Полного соответствия между оригиналом и его преобразованной копией при таком кодировании уже нет, и возможность восстановления потерянной информации тоже отсутствует. Для достижения минимального объема файла применяются различные алгоритмы кодирования — от математических алгоритмов сжатия, при которых качество дорожки не страдает, до так называемой психоакустической модели, предусматривающей удаление из оригинала «ненужных» звуков и сужение частотного диапазона. В связи с особенностями восприятия звука человеческим ухом «ненужными» звуками можно условно назвать те детали аудидорожки, удаление которых не будет сильно заметно. Сам процесс удаления «ненужных» звуков называется квантованием. При кодировании данных с потерями размер оригинала удается уменьшить в несколько раз (в основном от 3 до 12 раз), при этом чем выше степень сжатия, тем меньше соответствие между оригиналом и получаемым аудиофайлом.

Методов сжатия с потерями существует достаточно много, наиболее известные из них — MPEG-1 Layer 3, MPEG-2/4 AAC, Ogg Vorbis, Windows Media Audio, MusePaсk и др.

Сжатие без потерь качества

FLAC

Одним из наиболее популярных форматов для сжатия звука без потерь качества является кодек FLAC. Основными достоинствами этого аудиокодека являются его постоянное обновление и, конечно же, многоплатформенность: FLAC компилируется на множестве платформ — Unixes (Linux, BSD, Solaris, OS X), Windows, BeOS и OS/2. Такая всеобъемлющая поддержка операционных систем способствует широкому использованию данного аудиокодера.

Еще одно достоинство аудиокодека FLAC — наличие (помимо базовых кодера и декодера в виде библиотек, которые входят в комплект инсталлятора) графической оболочки, позволяющей упростить процесс кодирования, а также внешних модулей (плагинов) для разных проигрывателей (включая Winamp разных версий, Foobar2000 и т.д.). В комплект также входят утилита командной строки, выполняющая сжатие и распаковку файлов, и утилита для редактирования метаданных в файлах.

Интересная отличительная особенность FLAC состоит в том, что он позволяет делать архивную копию аудиодиска, записываемую в один файл. В дальнейшем такая копия может быть легко записана на диск в случае утери оригинального диска или его повреждения. FLAC использует восемь степеней сжатия. Как и в любом кодере, от степени сжатия зависит скорость кодирования и размер получаемого файла. К потоку FLAC могут быть добавлены тэги ID3v1 и ID3v2. Эти данные не относятся к формату, однако декодер умеет их пропускать.

Monkey’s Audio

Пожалуй, самым популярным в настоящее время кодеком, сжимающим информацию без потерь, является Monkey’s Audio. Обусловлено это прежде всего бесплатностью данного кодека и достаточно качественным сжатием аудиопотока, которое он обеспечивает. Единственным фактором, ограничивающим сферу его применения, является отсутствие поддержки мультиплатформенности — кодек Monkey’s Audio присутствует только на платформе Windows. Тем не менее поддержка данного формата реализована в ряде проигрывателей, а, например, плагин для проигрывателя Winamp поставляется вместе с Monkey’s Audio. Кроме того, существует возможность установки DirectShow-фильтров для других совместимых плееров. Плагин для воспроизведения поддерживает все распространенные функции и ID3-тэги.

Кодек Monkey’s Audio, безусловно, оценят те, кому необходим максимально качественный звук. Кодек обеспечивает сжатие около 40-50%. При кодировании данных доступны несколько различных степеней сжатия — от параметра, обеспечивающего быстрое кодирование, до параметра, осуществляющего более качественное сжатие с затратой большего процессорного времени. Еще раз отметим, что пользователю при применении компрессии с наивысшей степенью сжатия стоит учитывать, что при проигрывании такого файла программным плеером потребуется больше процессорного времени для его декодирования.

По заверениям разработчика, Monkey’s Audio позволяет кодировать WAV-файлы с любой частотой дискретизации, с 8-, 16- или 24-битным динамическим диапазоном, в моно- или стереорежимах.

После установки дистрибутива Monkey’s Audio пользователь получает возможность кодировать аудиофайлы не только во внутренний формат Monkey’s Audio (*.ape), но и в некоторые другие форматы, которые осуществляют сжатие данных с потерями. Все эти кодеки поддерживаются через графическую оболочку программы. Отметим, правда, что в поставку входят только кодеки, осуществляющие компрессию без потери качества, а все остальные пользователю придется установить в систему самостоятельно.

Как уже подчеркивалось, при всех своих достоинствах Monkey’s Audio остается абсолютно бесплатным, а кроме того, открыт его исходный код, что позволяет разработчикам включать поддержку кодека в свои программы.

WavPack

WavPack — открытый кодек под платформу Windows. При разработке данного формата предполагалось, что он будет использоваться для сжатия информации без потерь, и только впоследствии в него были добавлены функции кодирования с потерями. Кодек является бесплатным, что повышает его привлекательность. Обладает он также и плагинами под более распространенные плееры, установка которых осуществляется пользователем вручную.

Основной особенностью WavPack является возможность создания сразу двух файлов, один из которых является файлом, полученным с потерей качества, а другой — корректирующим: с его помощью можно восстановить основной файл до оригинального состояния.

TTA

TTA (True Audio) — бесплатный мультиплатформенный аудиокодек для компрессии без потерь 8- ,16- или 24-битных аудиофайлов формата WAV. Создан он российскими разработчиками. Кодек TTA обеспечивает компрессию до 30% и способен работать в режиме реального времени. Из достоинств данного кодека стоит отметить тот факт, что пакет TTA содержит DirectShow-кодеки (компрессор, декомпрессор, сплиттер), позволяющие другим приложениям легко работать с потоками True Audio. С корректно установленными кодеками пользователь может проигрывать файлы формата TTA в таких плеерах, как RealOne, RadLight, Windows Media, и в других DirectShow-совместимых проигрывателях.

Сжатие с потерями качества

MPEG-1 Layer 3, или MP3

История формата MPEG началась еще 1988 году, когда был основан комитет Moving Pictures Expert Group. В этом же году была начата разработка формата MPEG-1, который является форматом видеосжатия. Завершение работы над форматом и его стандартизация произошли несколько позже. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства — MPEG-1 Layer I, Layer II и Layer 3. Последний из них является в настоящее время самым популярным цифровым форматом аудиосжатия. Формат MPEG-1 Layer 3 (его более привычное название — MP3) был разработан немецким институтом Fraunhofer IIS совместно с университетом Erlangen. Работа над ним была начата в 1987 году, но только в 1992-м формат приобрел официальный статус и стал неотъемлемой частью MPEG-1.

Продвижение формата MP3 происходило довольно медленно, что объясняется двумя причинами: платность формата и отсутствие проигрывателей музыки данного формата (кроме плеера от Fraunhofer IIS).

Формат MP3 разрабатывался специально для передачи звука по сети, при этом закодированный файл должен был обладать небольшим объемом при качественном звуке. Именно эти параметры (небольшой размер файла при битрейте 128 Кбит/с и достаточно качественное звучание по сравнению с оригиналом) стали в конечном счете главными факторами успеха формата.

Многие пользователи уже поняли, что данный формат не отвечает больше потребностям времени. На смену МР3 идут новые, улучшенные форматы, однако у него еще много приверженцев, и его отмирание, по нашему мнению, произойдет не скоро. Этому тоже есть простое объяснение: если раньше MP3-файлы можно было слушать только на компьютере, то теперь появляется все больше различных аппаратных средств для их прослушивания — формат поддерживается бытовыми DVD-приводами, автомагнитолами, современными мобильными телефонами, карманными компьютерами и т.д.

MPEG-2/4 AAC

В 1994 году был утвержден новый стандарт MPEG-2, который получил продолжение в виде одного из достаточно известных аудиокодеков MPEG-2 AAC (MPEG-2 Advanced Audio Coding). Чуть позже, после того как компания Apple лицензировала MPEG-4, формат стал называться MPEG-4 AAC. Первоначальным разработчиком формата MPEG-2 AAC является все тот же институт Fraunhofer IIS, который совместно с компаниями AT&T, Sony, NEC и Dolby представил данный формат в начале 1998 года.

Сегодня это один из главных конкурентов формата MP3. Как и в MP3, в основе алгоритма AAC лежит психоакустическая модель кодирования. Однако MPEG-4 AAC обладает рядом достоинств по сравнению с MP3. Прежде всего это поддержка многоканального звука и большое количество усовершенствований, направленных на улучшение качества выходного аудиосигнала.

Формат, несомненно, стал бы популярным, если бы не одно обстоятельство, которое несколько приостановило его развитие. После окончания работ над MPEG-2 AAC некоторые из компаний-соучредителей забрали исходные коды стандарта и на их базе создали собственные форматы. Получившиеся форматы не совместимы друг с другом, а кроме того, являются коммерческими. На данный момент существует несколько AAC-кодеков, среди которых наиболее известным является AAC LC, применяемый в технологии Apple QuickTime. Также распространен Nero AAC, используемый в пакете Nero Burning Rom.

Достоинством кодека MPEG-2 AAC является то, что он поддерживается аппаратными плеерами, один из ярких представителей которых популярный плеер Apple iPod. Кроме того, файлы данного формата доступны для покупки через Интернет-магазин компании Apple. Столь широкая поддержка этого формата именитой компанией, а также его применение в промышленных масштабах вселяют в пользователей доверие к данному аудиокодеку.

Ogg Vorbis (OGG)

Аудиокодек Ogg Vorbis увидел свет в 2000 году. Он является открытым и свободным для распространения. Алгоритм Ogg Vorbis рассчитан на сжатие данных на всех возможных битрейтах без ограничений, то есть от 8 до 512 Кбит/с, но при этом только в режиме переменного битрейта (VBR). Алгоритм предполагает хранение внутри файлов подробных комментариев об исполнителе и названии композиции. В алгоритме предусмотрена возможность кодирования нескольких аудиоканалов, а также редактирование содержимого файлов. Кодек поддерживает потоковое воспроизведение. Для хранения данных используется собственный универсальный формат, рассчитанный на хранение любой мультимедийной информации системы Ogg Squish.

Аудиокодек лучше работает на низких битрейтах — до 128 Кбит/с, чем на высоких. В связи с этим существует альтернативный кодек, улучшающий работу кодека Ogg Vorbis на более высоких битрейтах.

В пользу формата Ogg Vorbis можно привести аргумент, который уже упоминался при описании формата MP3, — широкая аппаратная поддержка формата. Недостатком его является невозможность обработки многоканального звука.

Windows Media Audio (WMA)

Разработку аудиокодека, известного сейчас как Windows Media Audio (WMA), начала фирма Voxware, и тогда он назывался Voxware Audio Codec. Впоследствии компания отказалась от разработки данного продукта, а компания Microsoft купила его и доработала. Вследствие этого у кодека изменилось название — на Windows Media Audio — и он стал бесплатным.

В последнее время кодек WMA набирает популярность, поскольку компания Microsoft встроила его в свои операционные системы Windows 2000 и Windows XP.

Сейчас существует несколько версий WMA, которые отличаются друг от друга как поддержкой различных битрейтов, так и качеством кодирования.

На данный момент WMA9 является последней версией кодека и логическим продолжением WMA8. Кодек WMA9 практически не отличим от старой версии, за исключением того, что в нем появилась поддержка переменного битрейта (VBR) и применяется технология Fast Streaming, призванная сократить время буферизации передаваемого конечному пользователю WMA-контента. Разработчики также заявляют о заметном повышении качества кодирования по сравнению с WMA8.

Отметим, правда, что теперь в комплект включены два кодека, один из которых осуществляет сжатие с потерей качества, а другой — без.

Среди основных преимуществ формата нужно упомянуть его достаточно широкую распространенность, возможность воспроизведения на любой Windows-системе и аппаратную поддержку большинством современных плееров. Но и недостатков, останавливающих пользователей от применения данного формата, довольно много. Назовем лишь некоторые из них: формат является закрытым и разрабатывался в коммерческих целях; кодек обладает системой защиты от произвольного копирования (DRM) и различными несовместимыми версиями; имеет низкую скорость кодирования и автоматически добавляет незначительный участок тишины в конце аудиотрека во избежание щелчков.

MusePack (MPC)

Кодек MusePack (первоначальное название — Mpeg Plus) базируется на MPEG-1 Layer II, отсюда его направленность на кодирование преимущественно на более высоких битрейтах, нежели MP3. Данным аудиокодеком предусмотрено кодирование только в режиме переменного битрейта (VBR). Скорость компрессии и декомпрессии в формат заметно выше скорости выполнения этих операций применительно к MP3-файлам. В среднем качество кодирования MPC на высоких битрейтах заметно выше качества, обеспечиваемого MP3, что прежде всего связано с различиями в механизмах кодирования. Недостатком кодека является отсутствие поддержки многоканального звука и аппаратной поддержки.

В MusePack можно настроить качество кодирования, реализованное в виде нескольких встроенных настроек (presets), каждая из которых рассчитана на определенный диапазон. Другой интересной особенностью MusePack является то, что он позволяет использовать в качестве исходного материала не только WAV-файлы, но и файлы, закодированные большинством популярных кодеков, которые выполняют сжатие без потери качества.

Наверняка вы хоть раз в жизни сталкивались с тем, что ваш компьютер отказывался воспроизводить скачанную музыку, видеоролик или фильм с диска именно в тот день, когда вы решили провести приятный вечер у экрана монитора. От этой проблемы можно избавиться раз и навсегда, если переустановить или обновить кодеки.

Не знаете, что такое кодеки и как они работают? Тогда эта статья – для вас! Из нее вы узнаете, для чего нужны кодеки и какими они бывают, а также поймете, как устроен процесс воспроизведения видео на ПК и мобильных устройствах.

Всё, что нужно знать о кодеках


Кодеком (от английского codec ) называют программу, предназначенную для кодирования и декодирования данных мультимедиа (например, аудио- и видеопотоков). Каждый кодек «специализируется» только на одном типе данных. За обработку звуковых записей отвечают аудиокодеки (AAC, AIF, AU, MP3, RA, RAM, WMA, FLAC), с видео работают видеокодеки (DivX, AVI, H.261, H.263, H.264, MPEG, RM, RV, WMV). Над роликами, в которых содержится и звук, и видео, «колдуют» оба этих типа кодеков.

Также существуют кодеки, предназначенные для обработки цифровых изображений и текста, однако в этой статье речь пойдет именно об аудио- и видеокодеках.

Как работают кодеки?

Представьте, что вы записали ролик на видеокамеру, загрузили его в компьютер и открыли с помощью проигрывателя. Казалось бы, пустяковое дело! Но кодекам на вашей камере и компьютере пришлось немало потрудиться, чтобы вы смогли это сделать. Давайте посмотрим, чем же занимаются эти программы, когда вы записываете видео и проигрываете снятые клипы.


Кодеки принимаются за работу в тот самый момент, когда вы нажимаете кнопку записи на своей камере. Прямо во время съемки видеокодек сжимает и кодирует видеодорожку, а аудиокодек работает со звуковой дорожкой. Затем оба потока синхронизируются и сохраняются в одном медиаконтейнере, а если говорить проще – формате. Камеры могут вести запись как в популярных форматах типа AVI и MP4, так и в более экзотических.

Теперь, когда вы перенесли снятый клип на свой компьютер, в дело вступают кодеки, установленные на нем: видеокодек распаковывает изображение, аудиокодек – звуковую дорожку, а проигрыватель выводит эту информацию на экран и в колонки вашего компьютера.

Зачем все эти сложности?

Неужели нельзя обойтись без кодирования? Теоретически – можно, на практике – лучше не стоит. Дело в том, что кодеки выполняют очень важную функцию: они сжимают файлы до размеров, приемлемых для современных устройств.

Видеофайлы, создаваемые камерами в процессе записи, имеют слишком большой размер: пятиминутный ролик, снятый на современный смартфон, в несжатом состоянии может занимать несколько гигабайт памяти! Вспомните, сколько места есть на дисках вашего компьютера и мобильных устройств, и представьте, сколько несжатых видеороликов вы могли бы на нем хранить – вряд ли эта цифра будет слишком большой.

Возможно, в будущем, когда память компьютеров и гаджетов будет исчисляться десятками и сотнями терабайтов, необходимость в использовании кодеков отпадет, но сейчас без этих шустрых программ, превращающих гигабайтные видео в мегабайтные, нам не обойтись.

Как же кодеки уменьшают размер файлов?

Сжатие видео и аудио происходит за счет устранения так называемой избыточности данных. Как это происходит? Представьте, что вы в течение 5 минут снимали морской пейзаж – такой, как на картинке:


Допустим, ваша камера снимает со скоростью 30 кадров в секунду. Получается, за 1 секунду записи она сохраняет в своей памяти 30 уникальных изображений. А за 5 минут (300 секунд) она снимет целых 9000 кадров!

Но что может кардинально измениться в этом пейзаже за 1 секунду? Позеленеет небо? Испарится вода?

Даже если произойдут какие-то изменения, то они будут плавными, и на их осуществление потребуется время. Вывод: ежесекундно камера снимает 30 практически полностью идентичных друг другу кадров.

Так зачем же сохранять в памяти все эти кадры целиком? Для записи пейзажа на видео кодеку достаточно сохранить один исходный кадр, найти все похожие на него и удалить из похожих кадров повторяющиеся части изображения. Затем, при воспроизведении видео, кодек будет наслаивать изменяющиеся части на исходное изображение. Если в картинке что-то поменяется, кодек выделит еще один исходный кадр и все на него похожие. Описанный алгоритм называют компенсацией движения и считают одним из основных методов сжатия видеоданных.

Компенсация движения – это всего лишь один из множества методов, применяемых видеокодеками при обработке записей с камер. Свои способы устранения избыточной информации используют и аудиокодеки. В результате работы кодеков из аудио- и видеопотоков удаляется большая часть «лишних» данных. За счет этого и происходит изменение объема закодированного файла.

Какой кодек выбрать?

Существует множество видео- и аудиокодеков, предназначенных для различных целей. Вот краткий список самых популярных кодеков:

  • H.264 (MPEG-4)
  • MPEG-2
  • H.265 (MPEG-H, HEVC)
  • Flash

Чтобы вам не пришлось подолгу искать, какой кодек лучше подойдет вам, мы советуем скачать K-Lite Codec Pack – универсальный пакет для Windows, в котором есть все, что понадобится для проигрывания практически любого видео: самые хорошие кодеки для AVI, MKV, MP4 и других форматов.

А вдруг кодек сработает неправильно и удалит нужную информацию?
Можно ли обработать видеофайл без потерь?

В основе современных кодеков лежат сложные комплексные алгоритмы сжатия данных, которые помогают свести потери информации к минимуму. Однако если вы все-таки хотите перестраховаться, у нас есть хорошие новости: существуют так называемые lossless-кодеки, обрабатывающие видео без потерь. Это значит, что при декодировании потока информация будет воспроизведена бит к биту. Однако следует быть готовыми к тому, что размер видеофайла, обработанного такими кодеками, будет довольно большим.

Практически любой пользователь компьютера периодически слушает на нем музыку, которая хранится в электронном виде. Форматов для хранения музыки существует достаточно много, каждый из них был разработан для конкретных задач:

  • Воспроизведение с CD диска;
  • Звуковое сопровождение компьютерной игры;
  • Аудиодорожка в ;
  • Потоковое воспроизведение через Интернет;
  • Рингтоны для мобильных телефонов.

Попробуем разобраться в некоторых из них, также как и в …
Основные определения

  • Битрейт – объем информации, используемый при кодировании для воспроизведения 1 секунды. Чем он выше – тем меньше искажений, и звук максимально соответствует оригиналу.
  • Lossless – кодирование звука без потерь качества. При конвертировании в lossless-форматы и обратно получаем абсолютно одинаковый звук.
  • Lossy – форматы сжатия, рассчитанные на то, что человек просто физически не может слышать определенные частоты, которые пропускаются в процессе конвертации. При этом можно значительно сэкономить на объеме дискового пространства.

Audio-CD

Формат, положивший начало эпохе цифрового звука после перехода с виниловых пластинок. Был принят за стандарт в 1979 году компаниями Philips и Sony. В формате audio-CD физически музыка может храниться только на оптическом носителе, при записи на жесткий диск звуковая дорожка должна быть переконвертирована.

Благодаря высочайшему качеству звука и возможности воспроизведения на любом проигрывателе формат остается очень популярным, несмотря на то, что он достаточно устарел.

Flac

Пожалуй, самый распространенный формат для хранения музыки в losseless. По сравнению с остальными кодеками, обеспечивающими сжатие аудио без потерь, flac, разработанный компанией xiph.org , абсолютно бесплатен и дает минимальный размер выходного файла.

Mp3

Самый массовый музыкальный формат, принятый в качестве неофициального стандарта для любого устройства воспроизведения. Его популярность основана на том, что благодаря срезанию неслышимых ухом частот при практически том же качестве звука mp3 файл составляет 30% от оригинального losseless-файла.

Первая звуковая дорожка в mp3-формате появилась еще в 1994 году. Одна из причин популярности – возможность хранения разнообразной дополнительной информации в тегах аудиофайлов и удобство организации музыкальной библиотеки.

Ogg

Новый lossy-формат, увидевший свет в 2002 году как бесплатная альтернатива платным форматам. В отличие от своих предшественником, в частности mp3, допускает возможность многоканального кодирования и хранения многоканального аудио. Получил наибольшее распространение в видеоиграх.

Страница 1
Музыкальные audio форматы.

В мире музыки существует огромное количество музыкальных форматов их модификаций и версий, созданных гигантами музыкальной индустрии и небольшими компаниями, получившими общественное признание в электронном мире.


Для этих целей были разработаны различные физические методы хранения аудиоданных, например: виниловые пластинки, магнитная лента, компакт-диски, DAT, MD (минидиск), DVD или преобразование нот в музыкальных форматах (MIDI), точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных - digital: OGG, Mp3, Flac, Wav форматов.
Невозможно рассмотреть и обсудить все звуковые форматы, кодеки их достоинства и недостатки, по этому в своей статье мы постараемся рассказать о наиболее популярных расширениях audio files, с которыми Вам, возможно, придется работать.

Почему мы не можем использовать какой ни будь один универсальный формат кодирования аудио-файлов?

Потому, что для реализации различных функций необходим свой формат. Например: для воспроизведения CD в дисководе компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа, для проигрывания в мобильных телефонах или передачи файлов через Интернет, кроме того, существует ряд операционных систем получивших наибольшее распространение в мире. В их число входят: Amiga, Macintosh, NEXT и персональные компьютеры с операционной системой Windows. Кроме того работа dj, звукорежиссера, cj, видеоинженера или простого любителя музыки - достаточно сильно отличаются по своей сути. Для этого может потребоваться, чтобы Ваши аудиоданные были сохранены своим способом. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает примерно 10 Мбайт, т.е. средний трэк продолжительностью 5 минут составит 50 "метров" - это слишком большой объем данных для среднестатистического пользователя. В этой статье представлена краткая информация о самых популярных музыкальных форматах.

AA (Audible Audio Book File)

AA (Audible Audio Book File) - формат является закрытым, разработан компанией Audible. Применяется, для записи аудиокниг, которые продаются через сервисы Audible и iTunes. Существует возможность замедлять или ускорять скорость прослушивания файлов - digital pitch, возможность оставлять закладки при прослушивании аудио книг, защита файлов, при доставке звуковых записей посредством internet.

AAC (Advanced Audio Coding)

AAC (Advanced Audio Coding) - формат аудио-файла с меньшей потерей качества при кодировании, чем Mp3 при одинаковых размерах. Кодирование музыки без потерь качества оригинала с помощью профиля ALAC. AAC - семейство алгоритмов аудио кодирования MPEG4. В отличие от гибридного набора фильтров mp3, AAC использует MDST технологию (модифицированное косинусное преобразование) - это значит, что слушатель получает более лучшее качество звука, чем при MP3 кодировании с таким же или меньшим битрейтом. Возможные расширения AAC файлов: .m4a . m4b .m4p.

AIFF

AIFF - Это формат аудиоданных для платформы Apple Macintosh. Формат.aiff поддерживает 8бит и16-битные mono и stereo. Если файлы этого формата содержат заголовок Mac-Binary (тексты, фото, информацию о правообладателе, единый номер и т.п.), в этом случае файл будет иметь расширение.snd. Аудиофайл с расширением.snd можно прослушать с помощью программы Sound Forge. "Форж" конечно откроет такой файл, но распознает его, как формат Macintosh Resource, на качестве звучания - это не отразится.

APE (Monkey"s Audio)


APE - (Monkey"s Audio), разработчик Мэтью Т. Эшланд - формат цифрового звука без потерь качества (lossless). Кодек Monkey"s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для MacOS, Linux, BeOS. Файлы Monkey"s Audio используют следующие расширения: .ape - для хранения аудио и.apl - для хранения метаданных. Данный формат не является свободным, т.к. лицензия на него серьезно ограничивает распространение.ape files.

DTS

DTS - Digital Theater System , по сути - это Dolby Digital, а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby, так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате. DTS в домашних кинотеатрах используется максимальный битрейт 1,536 kbps (full bitrate), такой звук более качественный, чем AC-3 format от Dolby Digital. DTS - использует 6 свободных аудио дорожек и поддерживает систему распределения звука 7.1, при таком битрэйте DTS 4.0 - будет звучать также объемно, как и "Долби" 5.1.

FLAC

FLAC - (Free Lossless Audio Codec). В отличие от кодеков с потерями - Mp3, Ogg и AAC, не удаляет никакой информации из аудиопотока и предназначен для прослушивания музыки на высококачественной Hi-Fi, Hi-End аппаратуре и для архивирования профессиональной аудио-коллекции. В настоящее время формат FLAC поддерживается многими аудио плейерами и музыкальными приложениями. Чтобы хранить основные типы метаданных, базовый декодер использует теги ID3v1 и ID3v2, поэтому их можно свободно добавлять и редактировать.

MIDI

MIDI - (Musical Instrument Digital Interface), в отличие от других форматов, MIDI хранит не цифровой звук, а наборы команд: проигрываемые ноты, ссылки на инструменты, параметры звука. Удобство формата MIDI, заключается в использовании устройства, производящего аранжировку по обозначенным аккордам. Миди файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук такого же качества. Формат MIDI - универсален и разработан так, чтобы любой секвенсор мог читать и записывать данные без потерь. При этом, непонятная другим программным приложениям информация MIDI - не приводит к недоразумениям, а просто игнорируется. Мидюшный формат минусовки позволяет сохранять информацию об используемом инструменте, темпе, обозначении размера, информацию о музыкальных ключах, названии трека и паттернов и их количестве.

MP3

MP3 - (MPEG Layer версия 3) На данный момент, MP3 является самым популярным форматом цифрового кодирования музыки. MP3 является форматом сжатия с потерями, то есть часть звуковой информации, согласно психоакустической модели, ухо человека воспринять практически не может удаляется из исходного файла - безвозвратно. До сих пор не утихают споры по поводу качества Mp3…Во-первых, качество полученного MP3 зависит не только от битрейта сжатого файла, но и от версии используемой кодирующей программы - кодека. Многие музыкальные гурманы, предпочитают сжимать музыку с "максимальным качеством" - 320kbps, либо переходить на другие форматы, например FLAC, где битрейт в среднем ~1000 kbps. На данный момент MP3 является лидером по общепризнанности, но при этом не является профессиональным, по техническим параметрам, форматом. Профессиональные музыканты и dj уже давно не используют треки с битрейтом менее 320kbps.

MOD

MOD - формат разработан для платформы Amiga. Каждый файл MOD содержит оцифрованные записи real звучания инструментов, так называемые сэмплы, чем-то похож на структуру MIDI. Cj или композитор, пишущий в формате MOD, применяет программу, называемую трэкером, в которой указывает, какой именно инструмент, в какое время, какой нотой и октавой должен прозвучать - эта последовательность нот записывается в список - трек, а несколько параллельно звучащих треков образуют блок, называемый паттерном. Совокупность паттернов образует модуль - файл в формате MOD, с расширением.mod. Одна линейка трекера соответствует одному реальному каналу, в котором cj может проиграть или отредактировать пронумерованные ноты. Нотам могут назначаться различные "орнаментами" - например: тремоло, глиссандо и т.д..

OGG

OGG - Vorbis был разработан в 2002 г. коллективом Xiphophorus, как альтернатива всем платным лицензионным аудио форматам. Ogg Vorbis совместим со всеми популярными платформами. Формат не ограничивает пользователя только двумя аудиоканалами (левый и правый), он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит, поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio для домашнего кинотеатра.

TTA

TTA - True Audio - бесплатный, аудио кодек, осуществляющий сжатие музыкальных файлов без потерь в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает всеми улучшенными характеристиками, как и большинство современных кодеров. Сжатый размер файлов будет на 30 % - 70 % меньше, чем original music file. TTA формат поддерживает тэги ID3v1 и ID3v2. Используя True Audio кодек, можно разместить до 20 audio CD на одном DVD-R диске.

VQF

VQF - (Interleave Vector Quanization) - разработан в Японии и основывается на технологии TwinVQ. Если сравнить VQF и MP3, то первый формат на 30-50% будет "компактнее", при одинаковом качестве звука. Это дает VQF - значительное преимущество перед MP3 форматом. Но процесс при кодировании, декодировании (decoder) VQF, занимает примерно на 30% больше ресурсов процессора PC, чем Mp3 аудио.

WAV

WAV - (Microsoft Wave) - не менее популярен чем MP3, но wave файлы не имеют сжатия. Звук сохраняется в моно или стерео с частотой дискретизации 44,1 КГц, 8 или 16 бит.

WMA - (Windows Media Audio) разработанный компанией Microsoft, как альтернатива mp3. Многие меломаны недолюбливают формат WMA за большое количество ошибок различного рода, формат WMA постоянно развивается и улучшается. Например, в новых версиях этого расширения добавлены сложные алгоритмы кодирования звука без потерь (lossless), многоканальное кодирование объемного звука - это очень перспективное свойство, для WMA т.к. файлы могут содержать еще и видео данные. Файлы обозначены расширением.wma и.asf.
страница 1