Как правильно кодировать аудиофайлы в MP3, или Почему не все кодеки одинаково полезны

Как правильно кодировать аудиофайлы в MP3, или Почему не все кодеки одинаково полезны

Не будем морщить носы — без MP3 сегодня никуда. WEB-презентация, автомобиль, телефон или другой портативный гаджет, когда в устройстве нет поддержки ни FLAC, ни Apple Lossless, не говоря уж о других редких форматах сжатия звуковых файлов. Но даже в этих непростых условиях можно оставаться требовательным слушателем, а степень деградации качества сигнала сделать осознанной.

Периодически возникают сообщения о новом кодеке, который-де побил старую «эмпетриху». Какие-то из них получают ограниченное распространение, например — Ogg Vorbis, другие остаются экзотикой. Тем не менее, не они, а именно MP3 остается в главном фокусе нашего интереса, как формат, по которому наблюдается полный консенсус среди всего воспроизводящего аудиооборудования. И вот вопрос, в каком битрейте его готовить?

Казалось бы, ответ очевиден — с емкостью носителей сейчас проблем не наблюдается. Гигабайт туда, гигабайт сюда — ставь 320 кбит/c и не разводи мелочную экономию со всякими VBR-режимами. Но не тут-то было. По сути, 320 кбит/c — это всего лишь формальный диаметр трубы, но что по ней течет и можно ли это пить, решается в другом месте.

320 кбит/с ≠ 320 кбит/с

Начнем с полевого теста. Мой портативный рекордер Sony PCM-D100 имеет две цепи АЦП: таким образом, можно одновременно фиксировать аудиосигнал как в PCM, так и MP3 формате. Его мы и установим на искомые 320 кбит/c, а PCM оформим в стандартные 16 бит/44 кГц. Из этого же РСМ-файла затем будем вручную перепаковывать файлы в 320 кбит/c, но уже по версиям того или иного кодера. Я намеренно выполнил запись одинокого инструмента (фортепиано) с высоким фоном окружающего шума, чтобы по изменению его характера можно было наглядно оценить прирост дополнительных артефактов.


Оригинальная PCM-запись 16 бит/44.1 кГц, выполненная рекордером Sony PCM-D100

Параллельная МР3-версия от рекордера Sony выглядит вполне адекватной. Характер шума становится немного более грубым, «зернистым». Спектрограмма показывает, что, в отличие от PCM-версии, высокие частоты фильтруются на 22 кГц, то есть практически в полушаге от потолка возможности дискретизации. Но в целом отличия от полноценной PCM-версии минимальные.


Дубликат MP3 320 кбит/c, выполненный непосредственно рекордером Sony PCM-D100

Одной из популярных оболочек для конвертирования является dBpowerAMP Music Converter. Он многое кодирует в обе стороны: WAVE, MP3, MP4, WMA, Ogg Vorbis, AAC, Monkeys Audio, FLAC. Даже ресемплингом занимается. Но нас интересует качество обработки в 320 кбит/c.

На странице настроек можно выбрать несколько алгоритмов: Lame, Fraunhofer и Helix. Сначала пробуем самый продвинутый Lame. Добросовестность кодирования ставим на Slow (High Quality) и никаких Joint Stereo.

Батюшки, а это что за новости? Спектр жестко отсечен по 19 кГц, а характер шума начиная от 16 кГц стал еще более грубым и чешуйчатым. Вот тебе и Slow (High Quality)… Может быть, старый-добрый Fraunhofer исправит ситуацию?


320 кбит/c по версии Lame 3.99 в оболочке dBpowerAMP — пресет Slow (High Quality)

Кошмар, а Fraunhofer вообще отчекрыжил все, начиная с 16 кГц. И это, замечу вам, те же самые 320 кбит/c, практически CD-качество по заверениям разработчиков. Что же тогда творится на 192 кбит/с? Кодер Helix не может ответить даже на этот вопрос, у него предельный битрейт 160 кбит/c, так что и смотреть его не будем.


320 кбит/c по версии кодера Fraunhofer

Посмотрим возможности популярного плеера Foobar2000. В нем используется кодек Lame предыдущей версии 3.98. Здесь следует напомнить, что любые программы, использующие Lame, хоть dBpowerAMP, хоть Foobar2000 — это, так называемые, front-end оболочки, то есть интерфейс к работе модуля. Сам же Lame довольно гибко управляется командной строкой, где можно указать прорву условий — битрейт, пресеты для VBR, ширину фильтров и прочее. Но для всего этого в Foobar следует создать отдельный кастомный пресет со списком задач командной строки. А мы пока смотрим работу кодера по умолчанию. В Foobar стоит простая шкала — Best Quality равно 320 кбит/с.

Этот вариант, конечно, оказался лучше Fraunhofer, но адаптивный фильтр по чуть-чуть надкусил спектр в районе 19 кГц. Психоакустическая модель определенно разбушевалась!

320 кбит/с по версии Lame 3.98 в оболочке Foobar2000 — пресет Best Quality

Я вообще не понимаю, почему в lossy-кодировании все кодеки первым делом набрасываются на высокие частоты, пускай и малослышимые? Энергии, «массы» аудиосигнала там, в отличие от басов, совсем немного. Экономия выходит на копейку, а все легкое и нежное из фонограммы выдувается. А потом, когда все это убрали из фонограммы, и получается тот MP3, который долго слушать довольно утомительно. Может лучше бы резали сначала инфраниз, стоит же рокот-фильтр в фонокорректорах, например, и никто не жалуется.

Найди правильную опцию

В моем dBpowerAMP стоит Lame 3.99. В разделе advanced можно увидеть суть командной строки Lame, которая по умолчанию выглядит следующим образом:

$ –b 320 –q2 -noreplaygain

Эти символы обозначают постоянный битрейт 320 кбит/с, качество нойз-шейпинга и алгоритма обработки «2» — т.е. высокое, но еще не максимальное, которое обозначается цифрой «0». Функция «replaygain», которая снижает уровень сигнала для предотвращения клиппирования, не задействована. Но самая полезная опция — «-k», которая активирует обход фильтра, не только отсутствовала, но и действительно более не поддерживается в современных кодеках Lame.

Конспирологическая версия гласит, что возможность не трогать спектр отменили, чтобы избежать подделок под lossless-форматы. Оптимисты говорят, что, наоборот не в спектре счастье, да и психоакустическая технология была существенно доработана. Но я бы все-таки предпочел видеть все частоты на месте, максимально приближенными к оригиналу. В dBpowerAMP, как и многих других «оболочках», оказалось невозможно прописать кастомные настройки Lame.

Можно наткнуться на предания старых людей о том, что нынешние версии никуда не годятся, а все хорошее закончилось на 3.93.1. Кодер, который я нашел, не захотел работать в моем Foobar2000. Может у кого-то получится — дерзайте и сообщите в комментариях о результатах. Настройку компонентов можно посмотреть здесь.

Словом, эта карусель вокруг не такого уж и ценного формата сжатия данных начала откровенно надоедать. И тут коллега Максим Семейкин из журнала ProHighEnd напомнил мне о программе EAC, который в отсутствие необходимости я уже стал забывать, спасибо ему. Оказалось, что у EAC вполне дружественный интерфейс, где даже рассказывается, какие инструменты Lame собирается применить к вашему WAV-файлу, например:

Using polyphase lowpass filter, transition band: 21517 Hz - 22050 Hz

Проклятый 3.93.1 так и не завелся, так что я плюнул и взял еще более древнюю версию 3.90.3, и, наконец выставил в командной строке EAC опции «–k» и «–q0». Вот этот вариант меня и устроил более всего.

Попробуйте мои или сделайте свои варианты. Возможно, у вас будут другие впечатления. Тестовые файлы можно забрать, послушать и изучить здесь.

.

320 кбит/с по версии Lame 3.90.3 с выключенным фильтром (опция -k)
73.01 дБ +

Комментарии

#
Я вообще не понимаю, почему в lossy-кодировании все кодеки первым делом набрасываются на высокие частоты, пускай и малослышимые? Энергии, «массы» аудиосигнала там, в отличие от басов, совсем немного. Экономия выходит на копейку, а все легкое и нежное из фонограммы выдувается.

Там самая большая дельта (изменения по времени), соответственновсе паковщики работают с ней, отрезаешь по 16Кгц это вот сразу не думая на 30% уменьшил. И там сигнал не музыкальный а весьма стахастический, плохо поддающийся сжатиям мп3

- 50 дБ +
#

ну какие 30 процентов? Все файлы в обзоре практически одинакового размера, а разница сами видите.

- 50 дБ +
#

См теорему котельникова и следствия

- 50 дБ +
#

паковщики работают по другой модели

- 50 дБ +
#

конечно, но фундаментальные законы при этом сохраняются

- 50 дБ +
#

значит законы опрокинуты вместе с фундаментом )

- 50 дБ +
#

тогда поздравляю с открытием)))

- 50 дБ +
#

я послушал все ваши файлы на Audio-Technica AT-PHA100 + Klipsch x20i, через прямой аутпут из f2k. Файлы звучат практически идентично(разве что lame398 чуть тише). Что еще раз говорит, за то, что кодеки срезают ненужный шум. Давайте сделаем тест мощных файлы.

- 50 дБ +
#

не идентично, послушайте на колонках

во-первых немного разный характер фона

и обратите внимание как возникает звук фортепиано, в неудачных случаях в атаке нет слитности - просто тенькает как игрушка

- 50 дБ +
#

а смысл тащить мп3 на колонки? это портативный формат, его суть в использовании на бегу. Имея полноценное стерео и сетевой проигрыватель по меньшей мере извращение - не завести себе NAS с коллекцией в lossless

- 50 дБ +
#

я бы хотел посмотреть на теже тесты с более насыщенными информацией файлами. Возможно, только лишь возможно, более новые версии кодеков намеренно срезают полосу шумов в 16+кГц, так как там действительно нет значимой информации.

Все таки мп3 построено на психоакустической модели сжатия, и как раз весь его смысл в том, чтобы отрезать лишнее.

- 50 дБ +
#

срежут с информацией или без т.к. lowpass filter работает в установленном диапазоне

- 50 дБ +
#

так почему вы его используете. LAME -

--preset insane

и на выходе 320кбит и никаких фильтров

- 50 дБ +
#

insane использует joint stereo

- 50 дБ +
#

вас не смущает, что алгоритм сам отключает jstereo, при сверке разницы каналов исходного файла? К тому же, в записях где стерео панорама не ощущается, больше битрейта уйдет на сохранение общей детализации. Помните, кодек ограничен в 320кбит и работает, чтобы поместить в этот "тунель" максимум информации.

поищите статьи по BMLD (Binaural Masking Level Depression)

- 50 дБ +
#

вам не угодишь, то все на бегу звучит одинаково, то рекламируете мне новые пресеты -))

делайте и выкладывайте сюда

- 50 дБ +
#

я к тому, что в вашей статье вы искусственно заставили кодек работать в 2 дорожки по 160кбит, хотя в вашем конкретном файле ЛОГИЧНО применить jstereo и получить более детальный результат. Сейчас немного освобожусь и сделаю свой вариант пережатия.

- 53.01 дБ +
#

Не соглашусь про "лишнее" - ведь мп3 как формат изначально был скорее, для удобства, ведь жесткие диски раньше были небольшие, да и интернет - не радовал своей скоростью.

Скорее "убрать" то не слышно или почти не слышно на бюджетных аудио системах.

Тем более на компьютере для которого он был предназначен изначально. имхо

ЗЫ На сколько я помню первые мп3 файлы не имели битрейта более 192 к.бит/сек.

- 50 дБ +
#

на комплекте наушников с усилителем почти за 1300 евро разница едва уловима. И все же, в записи автора настолько мало контента, что обсуждать, на мой взгляд, нечего.

Ввиду того, что мп3 формат в ПЕРВУЮ ОЧЕРЕДЬ - портативный, звука на мой взгляд достаточно, чтобы послушать любимый альбом перцев по пути на их концерт :)

- 53.01 дБ +
#

вы невнимательно считали посыл материала

лошади кушают овес, никто в мире не парится, что там мр3 срезает - это все понятно и не имеет к данному исследованию никакого отношения

меня интересовало - возможны ли в данных рамках формата варианты максимального приближения к оригиналу

- 53.01 дБ +
#

я понял смысл материала. вы не поняли смысл МОЕГО посыла.

Вы пытаетесь получить от кодека то, что он делать не должен. Чтобы получить желаемый результат, вам нужно не пытатся расширить диапазон в графиках - в конкретном случае там и музыки то нет, что lame и срезал :) Обратите внимание на ЛОГИКУ работы кодека, подумайте почему разработчики, допустим предлагают jstereo по стандарту, и поймете, что приблизится к оригиналу на мп3 можно как раз именно методами оптимизации хранения информации, а не попытками впихнуть невпихуемое

- 60 дБ +
#

ну да.

а паразитный звон после ЦАПа надо фильтровать, а Audio Note не фильтрует и всем нравится

и звукореж должен компрессануть динамику в 0 дб для мяска, а мы неблагодарные чего-то еще и бурчим

от разработчиков в первую очередь ждут оптимального размер файла и скорости кодирования

- 60 дБ +
#

ну да, ведь именно поэтому форумы hydrogenaudio просто завалены обсуждениями качества того или иного подхода.

- 50 дБ +
#

значит мой подход вот таков

а по вашей логике кодер фраунхофера самый умный - обрезал ненужное и всю пользу вложил на нижние полезные частоты

- 50 дБ +
#

алгоритм фраунхофер мне тоже не нравится, хотя по звучанию он тоже мало отличим от исходного файла. LAME работает лучше.

Тем не менее - заглавие статьи не соответсвует содержимому. Вы не ответили на вопрос "как правильно кодировать мп3" и продемонстрировали некоторые ОЧЕНЬ неправильные приёмы.

- 53.01 дБ +
#

Как вам такой вариант сжатия? Lame3.1a2 vbr

https://yadi.sk/d/ceoIEJPRqCBts

- 50 дБ +
#

Собственно кодировка lame 3.99.5 в пресете insane, 320kbit, jstereo.

спектрограммы оригинала и файла ниже. кодек смело дошел до 22кГц, что есть категорически хороший результат.


- 50 дБ +
#

обрезает ваш insane, не выдумывайте

- 50 дБ +
#

и по пиковым уровням есть ошибки

- 50 дБ +
#

мы говорим сейчас о разнице в 0.37дб на частоте в 22кГц. При том, что файл в 7 раз меньше оригинала.

ЗЫ На частоте в 22кГц есть информация, но частично потерянная. И это нормально - в вашем файле там нет ничего, что стоило бы слышать.

- 50 дБ +
#

понятия не имею, что это за список

в вашем файле на 22 кГц спад больше 40 дБ, фактически отрезано в тишину - смотрите мой график - там полный анализ всего трека

- 50 дБ +
#

Выше выложил аудиофайл в Lame3.1vbr320кб в котором polyphase lowpass filter disable.

Предлагайте сложнее материалы, для большей наглядности.

- 50 дБ +
#

он интересно сжал, выкинул только некоторые ячейки чуть выше 22кГц, уйдя совсем наверх. Однако есть провалы примерно до 16кГц. Согласен, что нужен более насыщенный и чистый материал. Обрезает ли кодек шумы - не столь важно. Важно, что он делает со слышимой частью записи.

- 50 дБ +
#

Всё верно. Лэйм в последних версия полностью основывается на психоакустике.

Вот интересное тестирование кодеков. Lame3.100VBR оставляет позади 3.99

https://hydrogenaud.io/index.php?PHPSESSID=950ave028o0u2p8vub7k7bvi33&topic=97769.msg816614#msg816614

- 53.01 дБ +
#

YG, послушал Вами предложенные файлы, на слух я бы их расположил по убывающему качеству звучания - сначала original.WAV, потом sony.MP3 и lame3.90-q0.mp3 звучат практически одинаково, при чём lame3.90-q0 акцентирует паразитные обертона, потом lame3.98.mp3, далее lame3.99.mp3 и наиболее схематично и картонно звучит fraunhofer.mp3. В любом случае разницу между вариантами mp3 достаточно хорошо слышно и явно слышно в сравнении с wav-кой

- 60 дБ +
#

да, в целом схожие впечатления, при том что сони вероятно использует не lame, а какойто модифицированный фраунхофер - характер пиков немного другой чем у всех леймовских файлов

- 50 дБ +
#

Господа, судя по этой статье и комментариям, у вас очень много свободного времени.

- 50 дБ +
#

Не в наличии свободного времени дело!

Мне, например всегда были интересны сравнительные прослушивания разных звуковых форматов, о чём много писал в форуме на ixbt, например т ы р к

- 50 дБ +
#

Esuro и ilan, вы вообще серьезно считаете, что кодер 3.99 такой умный и лучше меня знает, где есть полезный спектр с музыкой, а где нету и какие частоты мне следует слушать?

а можно мне положить с прибором (электронным!) на мнение кодера 3.99 и комьюнити гидрогена?

вот что делает ваш insane с записью с плотным спектром


- 50 дБ +
#

Вам следует поточнее разобраться, что к чему в Lame... Обрезание спектра, как вы уже смогли, наверное, убедиться - вовсе не главное и к тому-же легко отключаемое...

Я кодирую сейчас в Lame 3.100Alpha2. 320кб в VBR. ключ пока не скажу))). спектр там не обрезается и отличий в своих mp3-воспроизводящих устройствах я не вижу.

а без mp3 до сих пор никуда. это единственный верный вывод в вашей статье.

- 50 дБ +
#

Можно Вас попросить закодировать предложенный рояль от YG из wav-ки в Ваших настройках кодера Lame 3.100Alpha2. 320кб в VBR закинуть на любой файлообменник и дать сюда ссылку для скачивания, - мне было бы интересно послушать и сравнить с wav-кой!

- 50 дБ +
#

Пожалуйста!

https://yadi.sk/d/1OZi9nukqCtoG

Один из файлов был кодирован 3.1а2, второй 3.99.5. ключ одинаковый. Интересно любое мнение.

- 50 дБ +
#

Спасибо, качнул, уши уже "замылились" - будет выходной в четверг послушаю внимательно заново, а так с ходу - файл 2.wav звучит лучше и ближе к файлу original.WAV, но нужно будет на свежую голову послушать

- 50 дБ +
#

где это легко отключаемое, покажете?

я ведь готовя статью делал и vbr0 и если к данному пианино он отнесся гуманно, то на других файлах демонстрировал адское выгрызание спектра, поэтому для чистоты эксперимента я предпочел дальнейшую работу только с cbr320

- 50 дБ +
#

Развитие последних версий кодировщиков Lame идет в психоакустической модели сжатия, сохранение спектра - вторично. Психоакустика неотключаема - абсолютно верное решение.

По спектру оценивать сжатый с потерями(lossy) файл неверно.

режим CBR неактуален - в последних версиях Lame VBR ощутимо выигрывает у CBR и в качестве звучания и в скорости кодирования и в... частотном диапазоне тоже....

P.S. попробуйте хотя-бы ключ -V0+ на Lame3.99.5 и Lame 3.100alpha2... в обоих случаях: polyphase lowpass filter disable

- 50 дБ +
#

пусть развивается куда хочет, но про скорость кодирования в данном случае неинтересно и вообще проще уж лослесс юзать, чем ждать от lame новых откровений

в 3.99 в V0 - убивается же спектр все равно, какие можете предложить другие инструменты оценки различий между оригиналом и компрессированным файлом?

- 50 дБ +
#

Где юзать лоззлесс? У меня, допустим, в машине магнитолка окромя wma\mp3 никаких других сжатых форматов не читает. приходится в mp3 катать. и выхода другого никакого нет, кроме как выжимать из него максимум...

http://oi45.tinypic.com/2mdnfv7.jpg

Спектр не убивается). всё с ним хорошо. Предлагаю больше слушать, чем смотреть на картинки. Но и по картинкам, как вы уже убедились, Лэйм может и не трогать естественную частоту среза...

- 50 дБ +
#

а может и потрогать

поэтому я и говорю - предсказуемость 3.90 -k меня вполне устроила - как внешне, так и на слух

- 50 дБ +
#

3.9 серьезно проиграет по качеству звука последним кодерам Lame. "теплое, ламповое" звучание 3,90-3,93 - это всего лишь миф...

Для кодирования(и всяческого преобразования аудиофаулов) пользуюсь програмулиной Xrecode.

C mp3 просто - указываем проге путь до lame.exe. вручную задаем ключ. Можно тут-же проверить настройки кодирования.

http://i075.radikal.ru/1603/ed/2637d0997912.png

http://s41.radikal.ru/i093/1603/93/5d96773bbec3.png

- 50 дБ +
#

YG, спасибо за Ваши измерения! Всегда интересно читать. Пожалуйста, продолжайте.

- 50 дБ +
#

Все здорово и интересно с точки зрения науки. Но на практике то какая польза??? Во что диктофон пишет голос меня никогда не беспокоило, пишет и ладно. А для всего прочего - тот же Fiio X5 и 256 памяти, или смартфон со 126 Гб памяти, или уже устаревший iPod Classic на 160 Гб решают все проблемы, что в машине, что в пешей дороге. Зачем что то жать, такой объем позволяет набрать фонотеку хоть на две недели отпуска с почти непрерывным прослушиванием. Потом надо только потереть карту и залить что то новое-актуальное.

- 60.79 дБ +
#

начнем с того, что количество людей забивающих свои классики apple lossless даже меньше, чем перебирающих пресеты lame

на этом и закончим -)

- 50 дБ +
#

Кину и я свои 5 копеек. У меня получилось запустить 3.93.1 с -k. Действительно, там где через какой-нибудь EZ-CD Converter срезается даже с выключенными фильтрами, тут показывает высокие частоты в районе 23kHz (через анализатор). Быстрые переключения с трека на трек на слух выявили крайне незначительные изменения. Чуток мягче высокие, но опять же повторюсь, если бы был слепой тест, я бы никогда в жизни не словил разницы, только быстрым переключением треков можно что-то распознать. И то, ещё надо попадать на определённый момент, когда эти самые 23kHz проявляются в спектре, если проявляются вообще. Но даже с таким MP3 без среза, сочнее всё-равно звучит оригинал (192kHz, 24 bit), хотя и на столько же, насколько MP3 без среза отличается от MP3 со срезом. Так что, даже подумываю частично сморщить в MP3 фонотеку, места много занимает, а толку почти столько же, сколько и в мп3. Что-нибудь высокое и великое можно оставить в лосслессе.

- 53.01 дБ +
#

в слепом тесте вы ошибетесь между мр3 и рсм, самое чуткое ухо замыливается однообразным паттерном и адаптируется к некоему усредненному ощущению

тут надо учитывать не сиюминутные, а долговременные нюансы - на перспективу: устаете ли вы больше с мр3-плейлистом по сравнению с обычным, и т.п.

- 60.79 дБ +
#
в слепом тесте вы ошибетесь между мр3 и рсм

Не спорю. Как бы там не было, не лучше ли заведомо лучшим способом конвертировать? И я также думаю.

устаете ли вы больше с мр3-плейлистом по сравнению с обычным, и т.п.

Смотря что Вы имеете ввиду, если о количестве песен, то зачастую нет, при условии качественных ушей/колонок. Если про разное качество форматов, то никогда не сравниваю, когда слушаю) Я бы и мп3 не конвертировал, но мне проще скачать на флешку музыку и включить через проигрыватель, чем записывать каждый раз CD на болванку. А тут, тем более, ещё прирост качества.

- 53.01 дБ +
#

Вы прямо у меня с языка фразу сняли!

Я точно так же оцениваю уровень аппаратуры и само звучание, а именно, что все цифровые форматы, в отличии от аналоговых носителей, где больше , где меньше, но вызывают чувство усталости когда раньше, когда позже (мне 53-и и далеко уже не пацан), а некоторые сетапы и их звучание даже головную боль через 15-20 минут их прослушивания

- 50 дБ +
#

Взял xrecorder II, поставил кодек LAME 3.99.5 в ручных настройках поставил "вручную" и -V0, всё работает

Внешний кодировщик настроен правильно.

LAME 3.99.5 64bits (http://lame.sf.net)CPU features: SSE (ASM used), SSE2polyphase lowpass filter disabledEncoding <stdin> to C:\Users\ADMINI~1\AppData\Local\Temp\xrecode2\52863235636.dummyEncoding as 44.1 kHz j-stereo MPEG-1 Layer III VBR(q=0)

- 50 дБ +
#
- 50 дБ +
#

Галку "Применить максимальный уровень..." можно и нужно снять.

Попробуйте ключ: -V0+ -b320 -q0

- 50 дБ +
#

этот пресет свыше 16 кгц напрямую не режет, но что-то другое химичит, где-то ослабляются частоты сильнее, где-то слабее

кроме того, немного меньше файл чем просто 320

- 50 дБ +
#

Как обещал, сегодня у меня выходной и не торопясь послушал предложенные файлы.

Не зря немцы говорят, что первые впечатления, наиболее правильные!

Короче, разницу между вариантами кодирования в mp3 слышно достаточно хорошо, расположил бы их по убыванию качества звучания точно так же, как упоминал выше. Сложно описать разницу, но я её слышу как некую схематичность или контурность звучания рояля, - что-то неуловимо теряется в палитре звуков при кодировании в мп3, становится менее натуральным и живым. Менее комфортно и для моих измученных цифрой ушей ...

Слушал с флэшки в рес 3067-ую ямаху, которая подключена с преаута фронтов в деноновского 2000мк4 уся в режиме мощника Power Amp на акустику Иллюминати Юниверсе, межблок тайваньский серебрянный литц и акустический тоже литцендрат медный кимбер 8TC.

Я не хочу, чтобы расценили как вброс, но я лично считаю, что чем выше уровень компонентов сетапа, тем слышнее любую разницу. Чтобы не показаться пустомелей, покажу ссылку, на пост о моём сетапе с фотками. Или т у т как сетап выглядит целиком.

- 50 дБ +
#

рояль уже был оцифрован если что, на микрофон играла его запись

- 50 дБ +
#

Роли не играет, я же писал о том, что формат mp3 звучит хуже чем исходник в wav.

О своих же сравнениях аналога и цифры с материалом даже одного издателя, я, к примеру писал на разных форумах - например

- 50 дБ +
#

Ну конечно mp3, в любом случае, будет хуже исходника - это как-никак сжатие с потерями)

P.S.

Предлагаю-таки закодировать и послушать что-то посерьезнее шума помещения...

инструментал Soulfly - Soulfly II, например?

- 50 дБ +
#

я же кодировал и вывешивал в каментах запись с плотным спектром.

видели что insane делает?

- 50 дБ +
#

--insane-то может и делает, да только есть ключи куда качественней. Чем вас не устроил -V0+ -b320? может тем, что он выбивается из вашей стройной теории "судить по спектру"?)

- 50 дБ +
#

На плотных записях разницу, как правило, слышно сильнее.

Могу показать часть своего тестового материала, может вдруг кому пригодится, - т ы р к .

- 50 дБ +
#

Простой житейский совет - доверяйте больше своим ушам и своему опыту!

- 50 дБ +
#

Совет абсолютно бесполезный. Вы никогда не отличите мр3 от исходника из серии неизвестных Вам записей. Ибо Вы не знаете как они должны звучать. По этому, простой, житейский совет - слушайте музыку, а не свой опыт.

- 50 дБ +
#

Я и не ставил задачу отличать, я предложенные файлы просто сравнил по звучанию, расположив их в порядке ухудшения качества звучания на моё восприятие ... Вы можете их расположить в другом порядке, ведь восприятие этого самого звучания у всех разное, как и представление о его правильности.

Или для Вас они звучат одинаково?

- 50 дБ +
#

Я не про Ваши задачи, я утверждаю, что совет: "доверяйте больше своим ушам"- бессмысленен. Совет: "доверяйте своему опыту" - вообще за гранью добра и зла..... Зачем вы так плохо думаете о форумчанах! :))))))))

Как только слышите совет: "слушайте сами", значит всё, что человек сказал до этой фразы - словоблудие, а его утверждения - ничтожны, ибо..... недоказуемы.

- 50 дБ +
#

Интересно, а чему призвали бы Вы доверять?

Графикам, замерам , спектрам и прочему?

Я не графики слушаю, а музыку и не глазами, а ушами ... так почему я не могу им доверять?

И потом, Вы не используете Ваш опыт совсем?

Или отталкиваетесь только от чужого, но авторитетного?

А про совет слушать самому, я так замечу, что даётся он как раз их добрых побуждений!

Ведь мы все разные, с разным восприятием звучания и разным представлением о его правильности!

И звучание должно прежде всего нрaвиться мне самому, а не поручику васе пупкину с любого форума ... который пишет такие мысли. Ну ежели чего, то вот мой пост о себе .

- 50 дБ +
#

При наличии бесплатного ААС от Nero с его возможностями (многоканал, ч.д - до 96кГц) и уровнем поддержки в "железе" - разговоры про МР3 - уже моветон.

Но уж если надо - то только LAME 3.93.1

В foobar2000 с параметрами командной строки:

-m s -b 320 -q 0 -k %s %d


Вот исходник, предложенный автором:


А вот его "сморщенная" версия:

Сравнивайте сами:

ЗАГРУЗИТЬ


- 50 дБ +
#

ну и какая головная система в машине поддержит ваш ААС-неро? я же кажется специально все оговорил в начале статьи

а то, что 3.93.1 запустили это хорошо

- 50 дБ +
#

и кстати киньте линк на версию 3.93 только чтобы там был ехешный файл а не батник

- 50 дБ +
#
- 50 дБ +
#

http://forum.ru-board.com/topic.cgi?forum=5&topic=8879&start=180

Наткнулся на интересное обсуждение Lame:

В этой строке присутствует этакий параметр -k, который отключает фильтры, делая спектрограмму более "красивой". Но дело в том, что как я уже ранее говорил, спектрограмма у lossy как таковая о качестве говорит лишь косвенно, как показали практические ABX тесты, отключение фильтров негативно сказывается, люди более эффективно отличают lossy от оригинала, а это значит, что качество ухудшается, было решено выпилить этот параметр к едрени, ввиду того, что некоторые индивидумы, начали его использовать налево и направо не понимая для чего он предназначен, а предназначен он для отладки, для тестеров, а не для практического применения, таким образом, убрав его, сделали защиту от дурака. Думаю теперь понятно, почему такая разница в спектрах? Или еще раз разжевать?

Остальное тоже...

Ещё раз повторю: возможность кодировать с polyphase lowpass filter disabled в последних Lame ЕСТЬ. Надо просто сделать над собой усилие - скачать 3.99.5\3.100alpha2 (скачать можно здесь: http://www.rarewares.org/mp3-lame-bundle.php )

и ввести ключик -V0+ или -V0+ -b320. шаманство с "теплыми, ламповыми" 3,90-3,93 качества сжатому звуку не дает. Всё это давно обсосано, съедено, переварено и выкакано много-много лет назад.

- 50 дБ +
#

по ссылке что-то доказывает лицо, аффилированное с разработчиками, ему там тоже правильно кто-то нервы мотает с этими спектрами -)

что касается отключения этого фильтра, могу предложить вам пари, что на ваших пресетах спектрограмму все равно покорежит в области ВЧ - желаете?

- 50 дБ +
#

Я не слушаю спектры. SoundForge давно удален. На чем остановился для машины уже писал - это Lame3.100alpha2 vbr320. магнитолка читает без проблем. Пришел к выводу, что не стоит боятся альфы - звучит она слегка лучше 3.99.5 и артефактов за более чем год использования не выявил...

В одинаковых условиях прослушивания(в заглушенной машине) разницы между lame3.100 и AudioCD нет.

дома mp3 не слушаю. стандарт, сам по себе, сильно мутнит звук.

- 50 дБ +
#

А что не так с Joint Stereo? Я тут проверил одну вещь, с JS высоких наравне с оригиналом, а на обычном стерео - в 2 раза меньше. Да и отличий по звучанию совсем не стало.

Lame 3.93.1, -b 320 -q 0 -k -m js

- 50 дБ +
#

Можно сколь угодно долго ругать "спектрофилов" - но именно спектр сигнала, полученного после кодирования и отображённый в аудиоредакторе - это вполне объективный показатель соответствия сжатого исходному. Про

...Ещё раз повторю: возможность кодировать с polyphase lowpass filter disabled в последних Lame ЕСТЬ. Надо просто сделать над собой усилие...

могу сказать только одно - да ЕСТЬ, но реализована эта возможность весьма своеобразно:

Lame 3.93.1 (-m s -b 320 -q 0 -k %s %d)

Lame 3.99.5 (-S --noreplaygain -b 320 - %d --lowpass -1 -q 0 -m s)


ОРИГИНАЛ

ТАКИМ ОБРАЗОМ:

- 59.03 дБ +
#

т.е. эти ключи и есть путь к максимальному качеству? объясните зачем принудительно отключать jstereo?

(-S --noreplaygain -b 320 - %d --lowpass -1 -q 0 -m s)

месье знает толк в извращениях?

- 50 дБ +
#

Сама статья вполне на мой взгляд адекватная, все так и есть. Не я один слышу разницу в звучании любого mp3 и lossless на насыщенных композициях (где lossless дал бы более 800 кбит/сек). Небольшое дополнение: автор не понимает, почему при кодировании срезаются именно высокие частоты, а не инфранизкие. Сообщает автор кодека lame: файл mp3 разделен на последовательности блоков, начальный содержит информацию об НЧ, последний - о ВЧ. При этом нет возможности впихнуть все ВЧ в старший блок последовательности, поскольку для их хранения нужно в разы больше бит, чем для НЧ. Начинаются отсечения "лишнего", ака "цифрового шума". Более того, поскольку блоки по размеру одинаковые, в старший блок (где ВЧ) должно попасть в разы больше информации, чем в младший (НЧ), существует проблема установления для них единого коэффициента сжатия, который в итоге даст эти самые 320 кбит/сек. Надо еще резать. Исходя из этого, получаем, что у мужчин и женщин много лишних выступающих деталей на теле, кто там под одеждой разберет... Смотреть на совпадение графиков можно долго и пристально, особенно в районе 19 кГц. Я уже как-то писал в одной теме, что lame с правильными ключами запишет пики сигнала выше 16 кГц. Но звук реальных и не очень инструментов характеризуется богатством палитры обертонов, в том числе высших гармоник, они придают естественность звучанию. Они и срезаются, как "цифровой шум". Без этого mp3 сразу выдает себя деревянным характером звука без изысков, что слышно даже на бюджетного уровня аппаратуре (я уже различал на ресивере Pioneer VSX-814).

Ну это ладно то, субъективный анализ звука скачанных из Интернета файлов mp3 320 кбит/сек обозначил наличие в них большого числа слышимых искажений. К сожалению, в файле, полученном таким путем, почти никогда не присутствует информация о кодеке, и тем более, с какими параметрами или ключами он был использован. Догадываюсь, что они были не самые максимально допустимые. Ситуация напоминала таковую в эпоху магнитной записи, когда удавалось сравнить звук оригинала на CD (пусть и пиратском) и копии печально вспоминаемой ленте тип I (Fe). Хоть на Nakamichi пиши, все равно будут искажения. Особо отличившиеся экземпляры напоминали еще при этом дополнительно зажатый компадером Dolby B звук.

Проблема этих дебатов в том, что люди слушают по разному (а не слышат). Для одних важнее хорошо поставленный бас, другим - чтобы звону было побольше. Мне так и то и то плохо, звук должен быть естественным, а им это не важно. Не то, что человеку медведь приходил на ухо пошептать (хотя и такое бывает), они эти нюансы просто не слушают, как ненужные. Им другое важно, антураж, напор, и т.п. Поэтому так много людей, вполне довольных звуком mp3, особенно на портативе или встроенной звуковой карте без усилителя.

Посему эти споры будут бесконечные. Мой совет: бросьте это дело. Как там по Жванецкому:

-S --noreplaygain -b 320 - %d --lowpass -1 -q 0 -m s - два часа на пару, не берет. Может, руки помыть фармацевту? Желательно, в его же присутствии.

Оставим mp3 для портатива, и для нетребовательных слушателей, для чего он и существует по сей день. Если бы другого не было, тогда пришлось бы кушать тюрю. А так, если есть выбор из mp3 и lossless, зачем отказывать себе в качестве? Конечно, найдутся те, кто будет говорить о "расходовании лишнего места на диске", но таким лишним будет и качественный усилитель, и колонки выше уровнем, лишь бы бухало в наушниках Sony с моторчиком на НЧ. Как я догадываюсь, если меломан переводит свою старую фонотеку из lossless или CD в mp3 "для экономии места", то потом он ее слушать не будет вообще, или не поймет, почему слушать не хочется. С другой стороны, если аудиофил много рассуждает об истинности "английского звука" своего любимого NAD, а сам слушает mp3, это вызывает сомнение: может, в консерватории что-то не то сложилось?

- 56.02 дБ +
#
месье знает толк в извращениях?

Месье просто "знает толк". Если "генерал мэсседж" этой статьи - чисто побакланить - продолжайте делать это вместе с автором. Если задача - выжать максимум из "наиболее распространённого" для хэдюнита своего тарантаса - тупо вбивайте в настройки фубара указанное или опровергните к едреням все мои выкладки. Удачи...)))

- 50 дБ +
#

Какие такие ваши выкладки? что в них хорошего?

Ещё раз - по mp3_lame все давным-давно разжевано, разжевано до невозможности...

Тут есть про ваш "аудиофильский" режим "стерео":

http://audiophilesoft.ru/publ/my/delusions/11-1-0-80

Здесь тоже интересно: http://audiophilesoft.ru/forum/3-2-8#6949

Про "теплый мегаламповый" 3,93)))

- 50 дБ +
#

ilan

"Тёплый мегаламповый" - это из области ваших фантазий, равно как и "рассуждения" про непогрешимость режимов Joint Stereo и отключения фильтров в последних версиях LAME.)))

Предметно и из собственного опыта "есть чо" ??? Или как всегда - "... а поговорить ???" )))

- 50 дБ +
#

Я кстати говоря полностью разделяю мнение уважаемого JaroslavS и сам подчёркивал, что для меня важна натуральность звучания, что и даёт в итоге комфортность прослушивания!

- 50 дБ +
Чтобы оставить комментарий, войдите, пожалуйста.