ВСТУПЛЕНИЕ

Если с работой усилителя все понятно, ну или хотя бы это так на первый взгляд, то вот с тем, за счет какой магии работает ЦАП (цифро-аналоговый преобразователь), еще предстоит разобраться. 

Ну посудите сами. В эту загадочную коробочку подается бесконечный поток единиц и нулей, а на выходе мы получаем последний альбом Tool. Каким образом бинарный код превращается в звук? Какие варианты преобразования есть? В чем отличия, преимущества и недостатки? Попытаемся разобраться.

Из прошлого текста мы помним, что “электрический звук” это и есть ток – комбинация напряжения и силы тока. Различные походы к усилению сигнала не меняют единого подхода к преобразованию его цифровой личины в ток. Это превращение нулей и единиц, единиц и нулей в то самое напряжение на выходе. Которое подается на усилитель для дальнейшего усиления в достаточной мере для раскачки колонок и наушников. 

Как же ЦАП понимает сигнал и читает его? Попробуем разобраться.

ЦИФРОВОЙ ЗВУК И ЕГО ФОРМАТЫ

Как вы помните, если упростить, звуковой сигнал имеет форму синусоиды. Цифровой формат аудио подразумевает перевод этой кривой в код из нулей и единиц, который зашифровывает основные характеристики синусоиды. Ее частоту и амплитуду. Можно сказать, что речь идет о выражении звука через математическую функцию. 

Независимо от исходного формата, мы храним данные в формате кода. То, как эти данные “скармливаются” ЦАПу, определяет их формат. Они могут идти пакетом (MQA), методом импульсно-кодовой модуляции (наиболее распространенный формат – PCM) и однобитным потоком (великий и ужасный DSD). Современный ЦАП может обрабатывать все эти виды потоков данных. Только MQA остается отчасти экзотикой, но с каждым годом все больше и больше устройств получает сертификацию MQA.

Кроме того, данные могут быть как сжатые (MP3, OGG), так и без сжатия (lossless). Несжатый поток может быть как “сырым” (wav, DSD), так и архивированным (flac, ape, alac). С точки зрения содержания информации архивированный и не архивированный формат не отличается. Однако, есть мнение, что нагрузка на систему при “распаковке” архива может негативно сказываться на итоговом звучании. Но оставим эти предположения тем, кто слышит разницу между разными картами памяти.

Итак, мы имеем несколько видов цифровых форматов и их вариаций. Но за их масками скрыты все те же нули и единицы. Отличаются только “порции” (сэмплы), скармливаемые ЦАПу. В случае с однобитным DSD это 1 бит. То есть ЦАП получает однобитные семплы, но с очень высокой частотой. В случае с PCM идет подача пакетного семпла, который может содержать 16/24/32 бит. Обычный flac содержит 16 бит в семпле, hi-res – 24 или 32. 

Зачем понадобилось при нормально работающем формате PCM выдумывать однобитный формат? Формат DSD разработали Sony и Philips для перевода архива записей звукозаписывающего подразделения Sony в “цифру”. Если обычный формат audio CD имеет разрядность 16 бит при частоте 44,1 кГц, то DSD при однобитной разрядности имеет частоту в 64/128/256/512 раз превышающую частоту сигнала обычного компакт-диска! Эти значения обычно пишутся сразу за обозначением формата – например, DSD128. Это значит, что частота дискретизации при однобитной разрядности достигает 5,6 МГц!

Зачем? Ведь по теореме Найтквиста частота дискретизации должна быть не менее, чем вдвое выше частоты исходного сигнала. Зачем такие значения? Избыточность дискретизации способствует уменьшению шума квантования. Проще говоря, шумы квантования распределяются на более широкую полосу частот, уходя при этом далеко за пределы нашей слышимости. То есть повышение частоты дискретизации улучшает соотношение сигнал шум, а также динамический диапазон.

Кроме всего прочего, DSD еще и проще для обработки. Снижаются затраты ресурсов ЦАПа на его “чтение” и влияние ошибок самого “чтения” на итоговое звучание. Грубо говоря, передискретизация не увеличивает количество звуковой информации. Она лишь создает “пространство”, где теряется шум квантования, ошибки чтения, оставляя в центре внимания предельно правильный сигнал.

ПРИНЦИП РАБОТЫ ЦАП

Итак, с форматами все ясно. Форматы – они как картошка. Не важно, в каком виде (пюре, драники, зразы, фри) – они попадают в организм, и он воспринимает их как “картошку”.

Так и ЦАП. Что бы мы не подали в него (главное, чтобы он поддерживал формат, иначе не избежать несварения), он “переварит” это в поток 0 и 1. Но как, черт возьми, мы получаем ЗВУК?

ЦАП преобразует поток бинарного кода в напряжение или ток. Можно описать это как функцию напряжения, которое определяется кодом. Чем выше или ниже значение в коде, тем выше или ниже получаем на выходе напряжение. Зависимость уровня напряжения или тока от кода в литературе называется монотонностью. 

Но все немного сложнее. Так как ЦАП широко распространенное в электронике устройство, оно обладает множеством характеристик. Основные, значимые для нас, это:

  • разрядность – количество бит во входном коде;
  • частота дискретизации – максимальная частота, на которой ЦАП может работать корректно. По Найтквисту, для корректного воспроизведения аналогового сигнала из цифровой формы необходимо, чтобы частота дискретизации была не меньше удвоенной максимальной частоты в спектре сигнала. Чем выше – тем лучше. 

Так как однобитные дельта-сигма ЦАПы появились позже, то базовой технологией считалась многоразрядная. Тут как с усилителями – нужно сперва разобраться в работе класса А, чтобы понять остальные. 

Каждому разряду присваивается порядковый номер, начиная с 0 (вы же помните из школы, что в бинарной системе числа записываются справа налево?). “Вес” разряда снижается слева направо. Чем ниже разряд, тем ниже его “вес” и влияние его значения на итоговый ток. 

Принцип работы ЦАП – это суммирование долей производимых токов. То есть 20-битный ЦАП “понимает” 2^20=1 048 576 значений. Чтоб вы поняли, насколько 20-битный ЦАП превосходит 8-битный, просто посчитайте, сколько значений способен он “понять”. Это 11111111 – так как бит всего 8, самое больше 8-битное число будет восемь единиц. То есть 2^8=256. Не густо. Чем с большим диапазоном значений в единицу времени может работать ЦАП, тем больший поток информации может обработать ЦАП и сделать это с максимальной точностью. 

РАЗНОВИДНОСТИ ЦАП И ПЕРЕДИСКРЕТИЗАЦИЯ

По типу входных данных ЦАПы делят на параллельные и последовательные. По разрядности – высокоточные (более 14 бит) и с высоким быстродействием (6-8 бит). Также может отличаться выходной сигнал. Это может быть ток, напряжение или разряд. Как я уже говорил, ЦАП применяется в многочисленных сферах, не ограничиваясь только аудио.

Последовательные ЦАПы преобразуют сигнал поразрядно (по 1 биту) по единой схеме. Среди разновидностей последовательных ЦАПов нас интересуют только цифро-аналоговые преобразователи передискретизации. Или дельта-сигма ЦАПы. Они обладают наивысшей кост-эффективностью, условно просты в разработке и обладают превосходными вычислительными характеристиками. То есть на бумаге могут дать фору более сложным и старым параллельным R-2R матрицам

Дельта-сигма ЦАПы преобразовывают сигнал при помощи  дельта-сигма модуляции. При этом квантования осуществляется только одним разрядом (битом). Но частота модуляции значительно более высокая и может превосходить частоту Найтквиста во много раз. То есть происходит передискретизация – в итоге к потоку 0 и 1 добавляются “лишние” нули, не влияющие на содержание сигнала, но увеличивающие частоту дискретизации и позволяющие избежать шумов квантования. Например, 8-кратная передискретизация увеличивает частоту дискретизации с 44,1 кГц до 44,1*8=352,8 кГц. Это не убирает цифровые шумы, но отодвигает далеко от диапазона частот, несущих звуковую информацию.

Принцип работы параллельного ЦАПа уже упоминался в предыдущем разделе. Он основан на суммировании токов, “вес” которых пропорционален разряду в мультибитной матрице. При этом суммирование производится с коэффициентами, равными нулю или единице, в зависимости от значения соответствующего разряда. Из многообразия параллельных преобразователей наш выбор – лестничный ЦАП. Также известный как R-2R-матрица, потому как он представляет собой внезапно матрицу (токов или напряжений), набранную из резисторов с сопротивлением R или 2R. То есть из резисторов с сопротивлениями равными или базовому значению, скажем, 5 Ом, или его удвоенному значению. То есть 10 Ом. 

Такие схемы сложнее, дороже, оставляют больше шансов на ошибку из-за необходимости кропотливого подбора элементов и их точечной подгонки. Но все затраты окупаются сторицей, благодаря высочайшему уровню звучания. Тут следует добавить “потенциально”, так как результат целиком и полностью зависит от реализации проекта и общей схемотехники, а не от принципиального выбора технологии.

МУЛЬТИБИТНЫЕ ЦАП

Мы рассмотрим, как работает классическая R-2R схема. Схема состоит из набора резисторов и набора ключей. Число разрядов ЦАПа определяет число ключей и пар резисторов. У каждого резистора есть “пара” – резистор с вдвое превышающим его сопротивлением. Такой ЦАП может работать как в нормальном, так и в инверсном режиме – то есть в режиме напряжения или тока. Зачастую на выходе устанавливают преобразователь тока в напряжение – такая схема наиболее распространенная. 

При включении источника опорного напряжения через каждый резистор потечет ток. Значения токов по резисторам будут неодинаковы из-за различного номинала разрядов. При подаче кода из нулей и единиц происходит замыкание ключей только в том случае, если значение разряда равно единице. То есть 0 – мимо, 1 – ключ замыкается. Так и происходит суммирование токов с учетом “веса” разряда в резисторной цепи. Сама величина тока будет пропорциональна входящему коду. 

ВЗВЕШИВАНИЕ ТОКОВ В ЦАП

А каким же образом схема, работающая на резисторах, определяет “вес” разряда? Это достаточно просто, если помнить, как себя ведут резисторы при параллельном и последовательном подключении. Обратимся к рисунку ниже.

Как мы видим, резисторы R1 и R2 подключены параллельно друг другу, но последовательно с резистором R3. Напомню, что номиналы у них могут быть только R и 2R. Так как же ток делится по разрядам? Очень просто. Нужно рассчитать эквивалентное сопротивление лестничной цепи. Без паники:

r-2r ladder resistor Ra

Таким образом, номинал сопротивления Ra равен 2R. Эта группа сопротивлений Ra соотносится параллельно с R4 и последовательно с R5. По тому же принципу (пусть это будет сопротивление Rb) номинал группы будет тоже 2R. То есть вдвое больше предыдущей группы. Таким образом, имея в схеме только номиналы R и 2R, мы получаем “лесенку” из двойных номиналов, которые регулируют “вес” тока каждого разряда.

Помните, я говорил про монотонность? Идеальная монотонность – это отсутствие ошибок при взвешивании токов. Почему это важно? Прежде всего, это точность ЦАПа. Почему это сложно? Представьте себе 16-битную схему. В ней номинал наименьшего бита отличается от номинала старшего бита в 2^16 раз. Представьте себе головную боль, с какой сталкивались разработчики в 80-х. Когда нужно подобрать и откалибровать резисторы для предельной точности работы матрицы.

На рисунке ниже находится древний артефакт – 8-битная монофоническая звуковая карта Covox 4, при помощи которой наши предки преобразовывали цифровой звук в аналоговый. Так как никакого USB тогда не было, подключалась она по LPT-порту, в народе “принтерному”. 

Мульти (есть “много”) бит значит, что данные поступают одновременно. И чем больше бит (разрядов), тем больше одновременных “источников” данных. Пусть источниками будут краны, наполняющие резервуар (тут начинает ныть старая школьная психотравма, полученная на уроках математики). Пусть наш ЦАП – 8-битный (да тот же Covox). 8 бит – 8 резисторов. Считаем мы, надеюсь, вы помните, справа налево. Допустим, подается код 01101101. А теперь запишем его с номером бита (в скобках), его разрядом: 0(7)1(6)1(5)0(4)1(3)1(2)0(1)1(0). Число в скобках – это степень двойки. Суммируем, как вы помните, только те разряды, которые имеют значение “1”. 2^0+2^2+2^3+2^5+2^6=109. Образно говоря, это “поток” из открытых и закрытых кранов. При этом сами краны – неодинаковы и имеют разную “мощность” потока.

Это значение – ток или напряжение. Не буквально, конечно, а абстрактно. При частоте дискретизации 44,1 кГц в секунду ЦАП делает 44100 обработок пакетов по 8 бит. То есть каждую 1/44100 долю секунды он переводит двоичный код посредством взвешенных токов в информацию – ток или напряжение. Так и получается итоговый массив физических “аналоговых” величин, которые далее воспринимаются нами после каскадов усиления в качестве звуковой информации.

Лестничным такой ЦАП еще называют потому что в бинарных расчетах принято использовать метод “лесенки”. Эта информация мне пригодилась впервые с 10 класса. Не зря учил же!

ИНТЕГРАЛЬНЫЕ СХЕМЫ ЦАП

Но это – схема, матрица. На ней построены самые суровые устройства старины (и некоторые современные портативные решения). А как же интегральные схемы? Чипы от Burr-Brown, Philips?  Обратимся к истории легенд – TDA1540 и TDA1541. 

Инженеры Philips нашли простое и изящное решение, как уйти от матриц и добиться высокой разрядности, которую на тот момент требовали CD-проигрыватели. А они, напомню, работали с 16-битной разрядностью. Они пришли к применению активного делителя тока. Кстати, делители тока применялись и в параллельных резисторных матрицах, однако, такие решения были куда менее востребованы, чем R-2R матрицы. В 1976 году Philips запатентовали систему Dynamic Element Matching, использовавшую динамическое усреднение тока для резисторов старших битов. В данном случае это было чем-то вроде самокалибровки. DEM объединяла 6 старших бит. 10 “младших” битов “взвешивались” пассивным делителем на транзисторах. 16 бит переключался одним транзистором, 15-й – двумя, 10-й бит уже обслуживался 2^9 степени, то есть 512, транзисторами. 

Интегральную схему приводить не буду, лучше полюбуемся непосредственно чипами. Я, пожалуй, вас и так немного перегрузил цепочками резисторов и этой математикой номиналов.

ДЕЛЬТА-СИГМА ЦАП

Говоря о дельта-сигма ЦАПах, прежде всего современных, их не совсем правильно называть “однобитными”. Но у их истоков как раз-таки стояли однобитные решения. Недорогие, эффективные, простые в реализации. Поэтому начинать рассматривать вопрос нужно все-таки с них.

Дельта-сигма ЦАПы, ЦАПы с формированием шума или ЦАПы с передескритизацией, для преобразования двоичного кода в ток/напряжение вместо многобитной резисторной матрицы с различным значением “веса” битов использует только два значения (состояния) в одном бите – ноль и единицу. Однобитный поток – это последовательность импульсов одинаковой амплитуды, но различной продолжительности. Помните широтно-импульсную модуляцию в статье об усилителях? Тут работает похожий принцип. Ширина импульса определяет напряжение на выходе. Однобитное кодирование – частный случай ШИМ.

За счет высокой частоты семплирования становится возможным “выделение” полезного сигнала всего из двух логических состояний, нуля и единицы. Вместо амплитудного разрешения (помните про классы усилителей A, AB?) однобитное высокочастотное семплирование использует разрешение по времени (продолжительность импульса). Такие решения просты и имеют хорошую точность без необходимости сверхточной подгонки номиналов, так как подобный ЦАП не имеет такого понятия как соотношение весов MSB и LSB, то есть самого старшего и самого младшего бита.

Как уже было сказано, в дельта-сигма ЦАПах преобразование осуществляется посредством дельта-сигма модуляции. В этом случае квантование производится одним разрядом, но на частоте в сотни раз превышающей частоту Найтквиста. Модулятор “распаковывает” цифровой сигнал в поток нулей и единиц. Но предварительно сигнал проходит через интерполирующий цифровой фильтр. Этот фильтр не “фильтрует” данные, а напротив, как это понятно из названия, интерполирует их. 

Пилообразный сигнал формируется на основе пиков (верхних и нижних) аналогового сигнала, а уже на основе полученного сигнала происходит широтно-импульсная модуляция. 

Помните из курса математики или статистики, что такое интерполяция? Это способ нахождения значений функции, лежащих за пределами ее известных значений. Грубо говоря, интерполяция позволяет расширить диапазон известных значений функции (сигнала) за счет предполагаемых. В случае с передискретизацией в ЦАПах это достигается с предельной точностью. Потому что “расширение” значений функции (сигнала) происходит путем добавления нулей, не изменяющих в итоге значения битов. Чем выше значение кода, тем меньше добавляется нулей, чем ниже – тем больше нулей “дорисовывает” оверсемплер.

Выход “фильтруется” ФНЧ, синхронзизированным по одной опорной частоте с интерполирующим фильтром. В результате на выходе выделяется “полезный сигнал”, который поступает далее – на нагрузку или в каскады усилителя. 

В работе ЦАПа важное значение имеют аналоговый и цифровой фильтры. Но бывают реализации ЦАПов, где не применяется один из них или даже оба. Но такие случаи нечастые и обладают рядом недостатков и сопутствующих требований и ограничений для разработчика. 

Сама тема цифровых фильтров и работы ЦАПа в режиме NOS – без оверсемплинга и цифрового фильтра – интересная и довольно глубокая. Пожалуй, она заслуживает отдельной публикации. Когда-нибудь.

ПОЧЕМУ РАНЬШЕ РУГАЛИ ДЕЛЬТА-СИГМА ЦАП?…

А вот и нет. Я не хочу писать, что та или иная принципиальная схема сегодня лучше или хуже. Во-первых, сегодня разработчики научились готовить дельта-сигму так, что все детские болезни этих ЦАПов остались если не в прошлом, то вне поля нашего зрения. Во-вторых, сам факт ухода с рынка мультибитных решений говорит о том, что не стоит заниматься археологией и искать те самые AD’шки и TDA’шки на мировых барахолках. Разве что для того, чтобы унять свое любопытство. 

Сегодня мультибит-ЦАПы и R-2R матрицы стали чем-то вроде экзотики. Встречаются нечасто. Вызывают неподдельный интерес. И мой опыт говорит, что не понапрасну. Но раньше, когда дельта-сигма была относительно молода, сложились определенные стереотипные паттерны о ее звуке супротив правоверного R-2R решения. 

Основная претензия, закидываемая в лагерь дельта-сигмы, это то, как она работает с атакой. Звук имеет три фазы: атаку (установление), стационарную часть и затухание (спад). При искажении воспроизведение любой из фаз, в частности атаки, нарушается структура звука, что изменяет тембр и его восприятие. Грубо говоря, звучание одного инструмента, правильно записанного, но воспроизводимого с искажением, скажем, атаки, уже не ощущается как оригинальное звучание. При этом у каждого инструмента эти фазы имеют разные временные характеристики и ведут себя по-разному.

Отсюда вывод, что правильное “течение” фазы атаки (в один такт) – залог натуральности звучания и точной передачи тембра. И замеры, проводимые ранее с ЦАПами, построенными на разных архитектурах, говорили о проблемах дельта-сигмы с сохранением идентичности фаз. В частности – атаки. Если вы когда-нибудь общались с адептом секты свидетелей Святого Хлопка, то понимаете, о чем я. Пожалуй, тема звука и тембра – хороша для отдельного материала. Не так ли?

МЕАНДР: R-2R vs ДЕЛЬТА-СИГМА ЦАП

Итак, как проводились такие замеры? При помощи подачи на ЦАП импульсного сигнала – меандра – и замера получаемого графика. Меандр в данном случае это функция напряжения от времени. Проще говоря, это график, где на оси X время, а на оси Y – напряжение. Выглядит он следующим образом.

Штука эта широко используется в технике, в частности для проведения замеров в аудио. Меандр состоит из прямой линии нулевой отметки (фаза отсутствия сигнала), вертикальной линии фронта, или атаки, прямой линии положительного или отрицательного полупериода (стационарная фаза) и спада (затухания). Меандр показывает через напряжение, как ведет себя сигнал на разных стадиях своего существования.

На рисунке выше приведен исходный сигнал в идеальном виде. Это случай in vitro – эталон для дальнейшего сравнения. Не более. 

Далее мы видим меандр, образованный посредством R-2R-преобразователя. Он отличается от исходного тестового меандра, но посмотрите на фронт атаки: он перпендикулярен к нулевой отметке. Фактически атака сформирована в один такт. Скругление меандра на краях атаки и затухания неизбежны из-за ограничения частотного диапазона. При этом кривая стационарной фазы линейна.

А теперь смотрим на меандр, полученный после дельта-сигма преобразования. Во-первых, атака. Атака явно не “умещается” в один такт и ее наклон далек от прямого угла. Во-вторых, стационарная фаза имеет волнообразные искажения на всей ее продолжительности. Также отмечаем всплеск напряжения на конце фронта. Это и есть тот самый подзвон, за который было принято ранее ругать дельта-сигму. Ну и за размазанность атаки (во всяком случае по замерам!). Помимо искажений, атака нарастала постепенно, не давая того самого “хлопка”. Как я уже писал выше, при нарушении течения фаз или искажения в них, нарушается передача и восприятие тембра. 

…И ПОЧЕМУ СЕЙЧАС ЭТОГО ДЕЛАТЬ НЕ СТОИТ

Но что мы имеем сегодня? Современные дельта-сигма ЦАПы, во-первых, это уже не классические “однобитники”. По сути это уже гибридные преобразователи. Сохраняя однобитную архитектуру самого чипа, они могут похвастаться высоким разрядом. Как? Хотел бы сказать, что это просто, но не совсем. Интерполирующий цифровой фильтр принимает 16 или 24-битный поток, далее дельта-сигма модулятор “справляется” с ним в 3/6/X битной разрядности за счет… многоуровневого выхода. Да, той самой технологии DEM, лежавшей в основе интегральных мультибитных схем Philips. 

Кроме того, современный дельта-сигма чипы могут похвастаться недостижимыми ТТХ для R-2R решений. Крайняя мультибитная интегральная схема PCM1704k обеспечивала THD+N 0,0008% и динамический диапазон на уровне 112 дБ. У актуального топа от ESS – ES9038PRO – эти показатели соответственно следующие: 0,0004% и 140 дБ.

Но не цифры звучат. Звучит готовое, завершенное изделие. И влияние множества прочих факторов на итоговый звук куда больше, чем то, по какому принципу работает ЦАП. До сих с теплом в сердце вспоминаю ЦАПы от Wolfson. Устаревшие по сегодняшним меркам они все еще могут впечатлить. Но не сами по себе, а лишь как часть грамотно спроектированного и добросовестно реализованного устройства. 

ЗАКЛЮЧЕНИЕ

Фуууух. Это было непросто. Надеюсь, вам, дорогие мои, было легче, чем мне. Главное, не забываем, что звучит не микросхема. И не технология. Звучит все в совокупности. И уж точно стоит отказаться от стереотипов о звучании схем в зависимости от марки и способа реализации преобразования.