Что такое мп3 формат
Какой аудиоформат выбрать? MP3 WMA FLAC WAV CDA
решил я написать статью про аудиоформаты и человеческим языком попытаться объяснить тем, кто не в курсе. Постараюсь избежать заумных терминов и описания характеристик, чтобы лишний раз не травмировать мозг читающих.
Сразу же признаюсь, что не буду петь дифирамбы в честь какого-то конкретного аудиоформата, равно как и «опускать» никого не собираюсь. Пускай каждый сам решает. Не буду залезать в «дебри» и пробегусь по наиболее известным форматам.
Я считаю, что споры эти ведут люди, мягко говоря, не сведущие в этой теме. Так как профессионалы (то есть люди, которые знают, что они делают и зачем они это делают) не будут заниматься подобной мурой. При нынешнем изобилии аудиоформатов любой нуждающийся найдет то, что ему нужно. Согласитесь, глупо будет выглядеть спор тракториста и шофера, на тему что лучше — трактор или машина. Для одних целей — трактор, для других — машина. Вот и здесь так же.
WAV — справедливо считается основным форматом звука. Используется при записи и обработке звука, так как запись в WAV происходит без сжатия. Кодируется в любой другой аудиоформат. Ну и как результат — довольно много «весит», поэтому используется преимущественно при звукозаписи.
Далее идут различные «интерпретации», которые можно разделить на:
Сжатие звука с потерями
Начну со всем известного и всеми применяемого (хоть и не всегда любимого) формата MP3. Этот аудиоформат активно используется везде и всюду, где надо и где не надо. Но это не значит, что он недостоин места, которое занимает в своей нише. Очень даже достоин. Хоть «сидит» он в своей нише уже около двух десятков лет, никто его пока оттуда не «вышиб». А желающих было много надо сказать. И главный фаворит из них WMA (Windows Media Audio), который задуман был Microsoft, как альтернатива MP3. В итоге он альтернативой и является, не смотря на старания разработчиков. Следующий персонаж — OGG. Несмотря на более широкие возможности, чем MP3, например, так и не получил массового признания. Хоть и поддерживается многими операционными системами. Пожалуй, стоит упомянуть еще аудиоформат AAC, который должен был в эстафете сменить MP3. В нем улучшено качество кодирования и уменьшены потери при сжатии. Но… увы.
Главным преимуществом этих форматов является небольшой размер. Из минусов — потеря качества.
Сжатие звука без потерь
FLAC — пожалуй, самый популярный кодек кодирования звука без потерь. Меломаны постепенно переходят на этот формат. WavPack составляет ему достойную конкуренцию, но не так популярен. Такая же история и с Apple Lossless, в котором размер сжимается до 60%.
Скептики утверждают, что на слух практически невозможно отличить MP3 (320 кбит/c) от Losless. «А если разницы нет, зачем платить больше?». Действительно, на обычной аппаратуре почувствовать разницу аудиоформатов достаточно сложно, даже меломанам. Но есть и такие, которые эту разницу сразу чувствуют (лично присутствовал на эксперименте). А вот при прослушивании на хорошем аппарате разница огромная. Вся беда в том, что хороший аппарат далеко не все себе могут позволить.
Формат файла MP3
MP3 – цифровой формат для хранения аудиофайлов, который был разработан программистами MPEG. Относится к категории наиболее востребованных кодеков для выполнения цифрового кодирования. Широко распространен в различных файлообменниках, где применяется для оценочного скачивания музыкальных файлов.
Позволяет сжимать CD треки до уровня 1/10 их нормального размера с сохранением высокого качества воспроизведения. Формат удаляет неразличимые для человека гармоники и с помощью сложных алгоритмов сокращает размер аудиозаписи. В результате на один компакт диск можно записать несколько сотен песен. MP3 совместим со всеми популярными ОС и поддерживается абсолютным большинством современных DVD-проигрывателей и музыкальных центров.
До появления этого формата был распространен MPEG-1, который содержал вместе со звуковыми данными изображения. MP3 дифференцирует звуковой файл на одинаковые по длине части, каждая из которых по завершении обработки запаковывается в собственный фрейм. Применяемая для этого технология спектрального ограничения требует безостановочного входного сигнала, что обеспечивает использование двух соседних фреймов.
После выполнения спектрального удаления подключаются математические методы сжатия файлов. У кадров (фреймов) может быть более одного контейнера, благодаря чему данные сохраняются в несколько потоков. При необходимости степень сжатия может изменяться, в том числе в границах одного кадра. Файлы с битрейтом 128 кбит/с обладают одиннадцатикратным сжатием, дальнейшее уменьшение размера приводит к существенному ухудшению качества записи.
Формат mp3, что это такое, работа с ним, как создать mp3 файл
Формат mp3, что это такое? В статье расскажем подробно об этом формате. Кроме того, разберем вопрос, как создавать файл mp3 и с ним работать. С помощью этой информации начинающие пользователи будут знать, какой формат использовать для работы с аудио.
Формат mp3, что это такое, где используется
Здравствуйте, друзья! Многие пользователи ПК знают, что есть такой формат, как mp3, но не все понимают, что он обозначает. Сегодня мы ответим на вопрос, формат mp3, что это такое.
Итак, форматом mp3 называют цифровой формат, который хранит аудио-файлы. Его разработали программисты MPEG в 1993 году. Простыми словами, mp3 относят к кодекам, которые выполняют задачу цифрового кодирования. Они воспроизводят и передают аудио-информацию (скрин 1).
Формат mp3 используется для воспроизведения музыки на Андроид, компьютере или других устройствах. Вместе с тем, аудио файлы в этом формате загружают в социальные сети, на сайты в Интернете, записывают речь в mp3 формате, используют в музыке.
Далее рассмотрим характеристики формата mp3 и виды. Также разберем, какие программы работают с данным форматом.
Характеристики формата(файла) mp3
В этом разделе будут показаны технические характеристики формата mp3. С помощью характеристик вы сможете определить, какой формат для аудио-файлов лучше использовать:
Теперь, вы знаете, какие имеет основные характеристики формат mp3.
Виды и типы аудио форматов
Кратко сделаем обзор на виды аудио форматов. Они разделены на три типа:
Перечисленные форматы отлично подойдут для работы со звуком и медиа-файлами.
Битрейт, что это такое? Это нужно знать для работы с аудио форматами
Важно знать, битрейт, что это такое? Давайте рассмотрим подробно понятие, чтобы понять значимость битрейта в работе с аудио форматами.
Итак, битрейт – это количество бит, которые используются для обработки и передачи информации в единицу времени. Проще говоря, битрейтом можно назвать скорость потокового воспроизведения аудио-файла.
Битрейт принято разделять на три вида: Постоянный – когда значение битрейта не меняется, Переменный – число битрейта может меняться в зависимости от пользовательских настроек, Усредненный – когда сочетаются первые два вида битрейта.
Стандартные значения битрейта следующие – «32 kbps-1411 kbps». Показатель битрейта можно увидеть в свойствах аудио файла (скрин 2).
Далее будут рассмотрены программы, которые работают с аудио-форматом mp3.
Программы для mp3
Если вам нужно открыть аудио файл в формате mp3, для этого есть специальные программы (скрин 3).
Они работают в качестве аудио-плееров. Некоторые программы не нужно устанавливать на ваши устройства – они уже установлены. Чтобы открыть формат mp3, достаточно запустить аудио-файлы в нужном проигрывателе. Далее по инструкции это сделаем.
Программы для работы с mp3 на компьютере с ОС Windows
Для работы с mp3 форматом можно использовать бесплатные программы:
Остальные утилиты можно найти и скачать с этого ресурса: «soft.mydiv.net/win/cname47/cname48/proigryvateli/».
Итак, чтобы открыть mp3 на компьютере или ноутбуке, воспользуемся программой Windows Media Player. Приготовьте заранее аудио-файл в формате mp3 на рабочем столе компьютера. Далее нажмите по данному файлу правой кнопкой компьютерной мыши и из меню кликните кнопку «Воспроизвести» (скрин 4).
После этого аудио файл формата mp3 будет открыт для воспроизведения. Если у вас установлены другие проигрыватели для аудио файлов mp3, то нажмите по файлу правой кнопкой мыши далее «Открыть с помощью». Затем выберите программу, которая воспроизведет аудио-файл в этом формате.
Программы для работы с mp3 на компьютере с ОС Mac
Для операционной системы Mac есть специальные аудио-программы, которые работают с mp3 файлами:
Чтобы пользоваться проигрывателями, скачайте и установите их на Mac. Далее открываете стандартными способами файл mp3 в этих программах. Вместе с тем, компьютеры OC Mac имеют свои проигрыватели, которые запускают mp3. Есть еще такие программы, которые можно использовать для других форматов – «xmediasoft.ru/macintosh/media-players».
Формат mp3, что это такое для телефона? Работа на Андроиде и iOS
Для Андроид и iOS есть приложения, которые воспроизводят аудио файлы в mp3. Если вы работаете с телефона с ОС Андроид, то в таком случае можете скачать и установить с Плей Маркета следующие приложения:
Практически все Андроид оснащены встроенным проигрывателем. Можно скачать музыку, например, из ВК и сразу ее воспроизвести на телефоне в формате mp3.
Некоторые пользователи работают с операционной системой iOS и слушают музыку в формате mp3. Чтобы успешно открыть этот формат файлов в данной OC, можете воспользоваться приложениями:
Конечно, это еще не все программы, которые работают с форматом mp3 на iOS. Остальные вы можете скачать с магазина АппСторе.
Как создать файл mp3, простые шаги
Создать файл mp3 вам поможет любая программа для записи звука. Практически на каждом компьютере есть приложение, которое записывает звук, либо установите другую программу. Чтобы активировать приложение записи голоса, наберите в поиске Windows: «Запись голоса».
Далее нажмите по программе. Затем подключите к компьютеру микрофон. Кликните на значок записи и запишите с помощью приложения свой голос (скрин 5).
После чего остановите запись и найдете в разделе «Документы», далее «Аудио-записи» файл в формате mp3.
Чем конвертировать формат mp3 в ogg, wav и другие форматы и наоборот
При необходимости, пользователи конвертируют формат mp3 в другие форматы. Сделать это можно с помощью онлайн-конвертеров или программ. В статье: «Бесплатный конвертер видео в видео — Video to video converter» рассказывается о бесплатном конвертере, который конвертирует разные форматы. Вы можете его применить.
Принцип работы сервисов и программ конвертеров простой. Загружаете в них аудио файл в формате mp3 далее выбираете, например, формат wav и нажимаете Конвертировать. После этого на компьютер скачиваете обработанный файл с другим форматом.
Кроме того, вы можете загрузить в этот конвертер, например, формат WAV и перевести его обратно в формат mp3.
Заключение
В статье рассмотрен вопрос, формат mp3, что это такое. Кроме того мы рассмотрели характеристики формата, какие программы запускают файлы mp3. Использование данного формата даст вам много преимуществ: вы сможете не только слушать музыку в этом формате, но и создавать аудио-файлы, редактировать.
Как устроен формат MP3
Формат MP3 – сокращение от MPEG Layer3. Это один из потоковых форматов хранения и передачи аудиосигнала в цифровой форме, разработанный Fraunhofer IIS и THOMSON, позднее утвержденный как часть стандартов сжатого видео и аудио MPEG1 и MPEG2. Данная схема является наиболее сложной схемой семейства MPEG Layer 1/2/3. Она требует наибольших затрат машинного времени для кодирования по сравнению с двумя другими и обеспечивает более высокое качество кодирования. Используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.
Формат MP3 – потоковый формат. Это означает, что передача данных происходит потоком независимых отдельных блоков данных – фреймов. Для этого исходный сигнал при кодировании разбивается на равные по продолжительности участки, именуемые фреймами и кодируемые отдельно. При декодировании сигнал формируется из последовательности декодированных фреймов.
Высокая степень компактности формат MP3 по сравнению с PCM 16Bit Stereo 44.1kHz (CD Audio) и ему подобными форматами при сохранении аналогичного качества звучания достигается с помощью дополнительного квантования по установленной схеме, позволяющей минимизировать потери качества.
Последнее, в свою очередь, достигается учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом предыдущего фрейма, вызывающего временное понижение чувствительности уха к сигналу текущего фрейма. Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов.
Подобные техники называются адаптивным кодированием и позволяют экономить на наименее значимых с точки зрения восприятия человеком деталях звучания. Степень сжатия, и, соответственно, объем дополнительного квантования, определяются не форматом, а самим пользователем в момент задания параметров кодирования. Ширина потока (bitrate) про кодировании сигнала, аналогичного CD Audio (44.1kHz 16Bit Stereo) варьируется от наибольшего, 320kbs (320 килобит в секунду, также пишут kbs, kbps или kb/s), до 96kbs и ниже.
Термин битрейт в общем случае обозначает общую величину потока, количество передаваемой за единицу времени информации, и поэтому не связан с внутренними тонкостями строения потока, его смысл не зависит от того, содержит ли поток моно или стерео, или пятиканальное аудио с текстом на разных языках, или что-либо еще.
На проведенных тестах специально приглашенные опытные эксперты, специализирующиеся на субъективной оценке качественности звучания, не смогли различить звучание оригинального трека на CD и закодированного в формат MP3 с коэффициентом сжатия 6:1, то есть с битрейтом в 256kbs. Правда, тесты были проведены на небольшом количестве материала, и на самом деле не все столь хорошо, нередко бывает действительно нужно пользоваться 320kbs. Для себя я счел это достаточным основанием для полного перехода на кодирование с битрейтом 320kbs.
Более низкие битрейты, несмотря на их популярность, не дают возможности обеспечить надлежащее качество кодирования, что незаслуженно обеспечило MP3 дурную славу любительского формата. На самом деле, хотя и 256kbs, и даже 320kbs тоже не дают возможности осуществить полностью прозрачное кодирование, но отличия от CD Audio, по которому кодируется тестовый MP3, сравнимы с отличиями самого CD Audio от исходного аналогового сигнала, из которого он был получен путем оцифровки. То есть потери, конечно, есть, но несущественны с точки зрения того, кому качество CD Audio представляется достаточным. Фактически, их обнаружение обычно является задачей нетривиальной на аппаратуре класса Hi-Fi.
Настоящее и будущее MP3.
Для формата MP3 также написано множество удобного программного обеспечения. Этот факт отражает второе, не менее важное преимущество – на ближайшие годы, а возможно, и на все десятилетие, формат MP3 стал стандартом де факто, настолько много сделано в него вложений пользующимися им сторонами, в том числе и цифровыми радиостанциями.
Несмотря на то, что формат MP3 появился достаточно давно, более новые форматы, претендующие на его место, появившиеся к настоящему моменту, все на поверку оказались любительскими. Они могут быть или не быть хороши по сравнению с форматом MP3 на низких битрейтах, это зависит от трека и особенностей слуха конкретного человека, но на место формата MP3 256kbs… 320kbs претендовать не способны.
Возможно, ‘монополия’ формата MP3 в сфере компьютеров на низких битрейтах все же будет отчасти сломлена новым форматом от Microsoft — WMA. Но пока рано говорить об этом. С другой стороны, появление Microsoft на данном рынке со столь сильной разработкой означает быстрое отсеивание оказавшимися неудачными ветвей AAC и VQF. Впрочем, остается надежда, что AAC еще будет доработан.
Описание процесса кодирования
Подготовка к кодированию. Фреймовая структура Перед кодированием исходный сигнал разбивается на участки, называемые фреймами, каждый из которых кодируется отдельно и помещается к конечном файле независимо от других. Последовательность воспроизведения определяется порядком расположения фреймов. Каждый фрейм может кодироваться с разными параметрами. Информация о них содержится в заголовке фрейма.
Начало кодирования Кодирование начинается с того, что исходный сигнал с помощью фильтров разделяется на несколько, представляющих отдельные частотные диапазоны, сумма которых эквивалентна исходному сигналу.
Работа психоакустической модели Для каждого диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если она превышает мощность сигнала интересующего диапазона или мощность сигнала в нем оказывается ниже определенного опытным путем порога слышимости, то для данного фрейма данный диапазон сигнала не кодируется.
Для оставшихся данных для каждого диапазона определяется, сколькими битами на сэмпл мы можем пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта. При этом учитывается, что потеря одного бита ведет к внесению шума квантования величиной порядка 6 dB.
Завершение кодирования После завершения работы психоакустической модели формируется итоговый поток, который дополнительно кодируется по Хаффману, на этом кодирование завершается.
Замечание На практике схема несколько сложнее. Например, необходимо согласовываться с требованиями битрейта. В зависимости от кодера это приводит при повышении битрейта к разного рода релаксациям при отборе сохраняемой части исходного сигнала, а при понижении – наоборот, к ужесточению критериев.
Способы кодирования стерео сигнала
В рамках формата MP3 кодирование стереосигнала допустимо четырьмя различными методами:
Dual Channel – Каждый канал получает ровно половину потока и кодируется отдельно как моно сигнал. Рекомендуется главным образом в случаях, когда разные каналы содержат принципиально разный сигнал – скажем, текст на разных языках.
Выставляется в некоторых кодерах по требованию.
Stereo – Каждый канал кодируется отдельно, но кодер может принять решение отдать одному каналу больше места, чем другому. Это может быть полезно в том случае, когда после отброса части сигнала, лежащей ниже порога слышимости или полностью маскируемой, оказалось, что код не полностью заполняет выделенный для данного канала объем, и кодер имеет возможность использовать это место для кодирования другого канала. В документации к mp3enc замечено, что этим, например, избегается кодирование ‘тишины’ в одном канале, когда в другом есть сигнал.
Данный режим выставлен по умолчанию в большинстве ISO-based кодеров, а также используется продукцией FhG IIS на битрейтах выше 192kbs. Применим и на более низких битрейтах порядка 128kbs… 160kbs.
Joint Stereo (MS/IS Stereo) – Вводит еще один метод упрощения стереосигнала, повышающий качество кодирования на особо низких битрейтах. Состоит в том, что для некоторых частотных диапазонов оставляется уже даже не разностный сигнал, а только отношение мощностей сигнала в разных каналах. Понятно, для кодирования этой информации употребляется еще меньший битрейт.
В отличие от всех предыдущих, этот метод приводит к потере фазовой информации, но выгоды от экономии места в пользу среднего сигнала оказываются выше, если речь идет о очень низких битрейтах.
Этот режим по умолчанию используется продукцией FhG IIS для высоких частот на битрейтах от 96kbs и ниже (другими качественными кодерами этот режим практически не используется).
Но, как уже говорилось, при применении данного режима происходит потеря фазовой информации, также теряется любой противофазный сигнал.
Простые ошибки пользователей MP3
Одно из самых больших заблуждений, связанных с форматом MP3, постоянно проявляется в споре ‘128kbs vs 256kbs – с каким битрейтом кодировать’. Аргументы сторонников первого варианта исчерпываются напоминанием, что такие MP3 вдвое меньше. Утверждение, что уж лучше держать CD Audio вместо MP3 256kbs, несостоятельно – качество формата MP3 256kbs… 320kbs практически сответствует оригиналу, а занимаемый объем в 4.5-6 раз меньше. Заблуждение же состоит в том, что и 128kbs дает достаточно высокое качество. На самом же деле для людей, сознательно выбирающих 128kbs, сохранение близкого к исходному качества просто не является слишком важным, так как их аппаратура обычно не лучше плееров – ‘мыльниц;’. В то же время многие владельцы CD кодируют их в формате MP3 даже просто потому, что гораздо реже нужно CD менять – на моем 8Gb винчестере поместится более пятидесяти часов музыки в формате MP3 битрейта 320kbs. Как говорится, в этом случае мотивы пользователей 128kbs нам непонятны.
Чтобы не суметь отличить формат MP3 128kbs от оригинала, нужно либо не иметь слуха, либо взять аппаратуру похуже. И то, что на большинстве компьютерных систем с момента покупки стоит ужасно шумная звуковая плата от ESS, известно всем хорошо. Только мне с некоторых пор кажется, что дело еще и в постоянном отравлении некачественным звуком, и, как следствие, временной (но постоянно возобновляемой) потере чувствительности. Мы слишком часто слушаем то, что слушать не стоило бы, и дело не только характеристиками компьютерной техники – формат MP3 128kbs при нормальном слухе не понравится и на ESS. Конечно, по сравнению с дребезгом колонок уличного киоска под аккомпанемент трамвая звучание формат MP3 128kbs может казаться весьма неплохим, но это не нормально.
Что со всем этим делать? Да просто берегите уши от лишних истязаний, оно полезно. А что до карты – простая малошумная карта и относительно приличные наушники стоят не так уж много. Поэтому в обзоре не учитываются шумы компьютера и карты – эти трудности вполне преодолимы.
Кроме того, в большинстве учебников прямо говорится о неспособности человека слышать частоты выше 16kHz. Но во-первых, это просто неверно, многое зависит от мощности сигнала и от возраста слушателя. Во-вторых, человек – существо, не лишенное оригинальности. Даже когда он не слышит такие звуки с помощью уха осознанно, он все же ощущает их. И это влияет на восприятие. Поэтому обрезание частот выше 16kHz можно считать обоснованным на низких битрейтах, когда оно позволяет намного лучше закодировать более низкие диапазоны, но нельзя не брать в расчет, когда речь заходит о высоких битрейтах, приближающих качество сигнала к уровню CD Audio. Да, кстати, у детей частотный порог слышимости куда выше 16kHz.
Способы хранения MP3
Стандарт формата MP3 не определяет никакого точного стандартного математического алгоритма кодирования, его разработка целиком и полностью остается на совести разработчиков кодеров. Вместо этого он определяет общую схему процесса кодирования, а также формат закодированного фрейма. Сами последовательности фреймов могут передаваться потоком (процесс передачи такого потока называется streaming) или храниться в файлах.
Часто к последовательности фреймов добавляют стандартный заголовок мета-аудиоформата WAV, и получается то, что называют WAV-MP3. Еще чаще к MP3-файлу добавляется информационный блок ID3v2, содержащий информацию об исполнителе, жанре, названии композиции, и другую подобную информацию о треке. Он добавляется в конец файла. В середину пока никто ничего ставить не придумал. Хотя, вообще говоря, может представлять некоторый интерес вставка спецтэга для VBR с информацией о том, в какой части трека мы, собственно, находимся.
Характер потерь при кодировании
На низких битрейтах всегда срезаются мелкие, сравнительно тихие детали, наличие или отсутствие которых нередко серьезно меняет эмоциональную окраску композиции, придает или лишает ее таких эффектов, как ощущение ‘кристальной’ чистоты звука (в той мере, в которой она присутствует в CD Audio). Кроме того, в соответствии с психоакустической моделью, высшие (выше 16 кГц) частоты на низких битрейтах кодируются с очень низким приоритетом.
Далее, имеют место разные особенности кодеров. Так, у кодеров от FhG IIS на 128 kbs оказываются ‘смазаны’ верхние частоты, наблюдается эффект ‘шепелявости’, в то время как у ISO-based вместо этого – ‘звон’. Скорее всего, это связано с разным отношением к частотам выше 16kHz у данных кодеров. В кодере Lame, кстати, они по умолчанию срезаются, что увеличивает качество кодирования на 128kbs.
На высших битрейтах при последовательном следовании психоакустической модели, разработанной FhG IIS, проблемы могут доставлять только ошибки, внесенные при написании кодера. Впрочем, из-за не слишком большой озабоченности FhG IIS качеством его кодеров на высоких битрейтах уже не раз оказывалось, что новая версия звучит иногда даже несколько хуже старой. Полагаю, причина кроется в недостаточном или неправильном ослаблении ограничений психоакустической модели при повышении битрейта. Опять же, первый серьезный заказчик, и проблема исчезнет.