Как найти период дискретизации

      1. Дискретизация

Дискретизацию лучше всего описывать
как выборку мгновенных значений из
непрерывно изменяющихся данных. Давайте
возьмем пример из стоимости акций на
фондовой бирже. Цены на акции изменяются
непрерывно. Для наших целей будем
фиксировать изменение цены акции в
течение 14 недель каждый понедельник.
Поскольку период дискретизации равен
одной неделе, можно из этих данных
уловить некую закономерность. Так
например, можно еженедельно регистрировать
скорости повышения и понижения цены
акции между определенными датами. Если
же делать выборки иногда раз в неделю,
иногда ежедневно, а иногда и с промежутками
в десять дней, то извлечь смысл из таких
данных намного сложнее.

      1. Период дискретизации и время дискретизации

Период дискретизации– это интервал
между отсчетами.

Что такое время дискретизации, объяснить
немного сложнее. Мы всегда думаем о
длительности выборки как о мгновенном
значении. В действительности фиксация
отсчета всегда требует некоторого
конечного времени, и именно этот отрезок
времени и называется временем
дискретизации
. В примере отсчет
(выборка) фиксируется каждый понедельник
между 5 и 6 часами. Следовательно, время
дискретизации равно одному часу. Как
правило, время дискретизации много
меньше периода дискретизации.

Теперь давайте вернемся к примеру. На
основании имеющихся данных и
вышеприведенного графика, можно
констатировать, что цена акции была
минимальной в течение 4-й недели и
достигла своего пика в течение 9-й недели.

Является ли точным описание процесса
изменения цены акции? Можем ли мы с
уверенностью утверждать, что между 4-й
и 5-й неделями не было ее дальнейшего
понижения? Нам потребуются ответы на
эти вопросы, если мы не хотим потерять
свои деньги в бирже.

      1. Непериодические мгновенные значения

На первом графике показан пример
непериодической дискретизации. Мы не
только не можем разумно интерпретировать
эти данные, но мы вообще пропустили
момент падения цены акции в период между
Т2 и Т3. На наше счастье цена акции пошла
вверх, и мы не потеряли свои деньги. Но
такое падение могло бы оказаться
признаком тенденции к понижению цены,
и в этом случае последствия оказались
бы намного серьезнее.

Непериодическая дискретизация имеет
два недостатка. Она затрудняет
интерпретацию данных и может привести
к пропуску важной информации.

      1. Периодическая дискретизация

На втором графике показан пример
периодической дискретизации. Хотя
данные в этом случае легче интерпретировать,
тем не менее, мы опять упустили момент
падения цены акции между Т2 и Т3. Значит,
периодическая дискретизация сама по
себе еще не гарантирует сохранение всех
важных данных.

К тому же, если бы соединить имеющиеся
отсчеты, то предполагаемая кривая будет
весьма далекой от оригинала. Итак, при
дискретизации со слишком низкой частотой
мы можем необратимо потерять данные.

      1. Ключ

Ключом в данном случае является частота
дискретизации. Давайте задумаемся, как
можно гарантировать сохранение всех
важных моментов изменения цены акции.
Если выбрать больше отсчетов (например,
дополнительно десять между Т2 и Т3), мы
определенно сможем уловить момент
падения цены.

Существует ли правило, с помощью которого
можно определять безопасный период
дискретизации, такой, чтобы не пропускать
информацию? К счастью, ответ на этот
вопрос «да».

Соседние файлы в папке Лекции Широ

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Цифровое представление аналогового аудиосигнала. Краткий ликбез

Время на прочтение
7 мин

Количество просмотров 40K

Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.

Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.

Чем отличается цифровой аудиосигнал от аналогового?

Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).

рис. 1

Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).

рис. 2

Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.

Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).

рис. 3

Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).

рис. 4

Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

рис. 5

Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).

рис. 6

Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)

рис. 7

Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).

рис. 8.

Данная формула позволяет вычислить количество уровней квантования:

Если N — количество уровней квантования,
n — разрядность, то

$N = 2^n$

Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.

При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.

Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением

$X$ и квантованным значением

$X'$ (

$X-X'$)

Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).

Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).

рис. 9

Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).

рис. 10. Интенсивность шумов при разрядности 6 бит и 8 бит

Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

шум квантования

амплитуда сигнала при разрядности 1 бит (сверху) и 4 бит

Аудиопример 1: 8bit/44.1kHz, ~50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.

Аудиопример 1

Аудиопример 2: 4bit/48kHz, ~25dB SNR

Аудиопример 2

Аудиопример 3: 1bit/48kHz, ~8dB SNR

Аудиопример 3

Теперь о дискретизации.

Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то

$F=1/T$

Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).

Теорема Котельникова гласит:

Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.

Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.

Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?

Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.

Алиасинг

Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.

Аудиопример 4: Линейно возрастающая частота от ~100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.

Спектральный анализ

Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг

Спектральный анализ

Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.

Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.

Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):

Битрейт = Частота дискретизации * Разрядность * Количество каналов

Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s

При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.

При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.

Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину. 

При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.

ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.

Существуют 3 метода хранения цифрового аудиоматериала:

  • Несжатые («сырые») данные
  • Данные, сжатые без потерь
  • Данные, сжатые с потерями

Несжатый (RAW) формат данных

содержит просто последовательность бинарных значений.
Именно в таком формате хранится аудиоматериал в Аудио-CD. Несжатый аудиофайл можно открыть, например, в программе Audacity. Они имеют расширение .raw, .pcm, .sam, или же вообще не имеют расширения. RAW не содержит заголовка файла (метаданных).

Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.

Аудиоформаты с сжатием без потерь

Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.

Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.

Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).

рис. 11

Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…

При сжатии с потерями

акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».

Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.

Этим и пользуется кодек: 2kHz-звук можно убрать.

Спектральный анализ кодека mp3 с разными уровнями компрессии

Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…

Спасибо за внимание.

UPD:
Если по каким-либо причинам аудиофайлы не загружаются, можете их скачать здесь: cloud.mail.ru/public/HbzU/YEsT34i4c

Сигнал это изменение физической величины во времени или пространстве. К примеру, это может быть изменение одномерного сигнала в зависимости от времени. Если мы рассматриваем цифровое изображение это может быть изменение яркости пикселей в зависимости от его положения в пространстве.

Что такое сигнал ЦОС

Но с точки зрения математики сигнал это функция одной или нескольких независимых переменных. В нашем случае независимыми переменными являются время и положение в пространстве, а зависимыми переменными могут быть значения нашего сигнала x от t или яркости пикселей на цифровом изображении.

Непрерывные и дискретные сигналы:

Непрерывный аналоговый сигнал определен на всем промежутке времени, то есть мы в любой момент времени t можем узнать значение сигнала x. Если мы возьмем эти значения с периодом дискретизации T, то мы получаем дискретный сигнал, значение которого определены только в конкретные моменты времени.

Непрерывный аналоговый сигнал

Дискретный сигнал теперь записываем как x[n], и n это номера отчетов дискретной последовательности. Если взглянуть на процесс дискретизации с точки зрения математики, то выходная дискретная последовательность с x[n] формируется, когда мы подставляем в нашу функцию x(t) значение времени t равный nT, где n — это номер дискретного отчета, а T — это период дискретизации.

Периодические сигналы

Периодический сигнал это сигнал, форма которого повторяется во времени. Повторяться во времени может, как форма непрерывных сигналов, так и форма дискретных сигналов. Периодом сигнала называем интервал повторения.

К примеру, у дискретного сигнала y[n] форма повторяется каждые 4, 8, 12 и так далее отчетов, для непрерывного сигнала z[t] форма повторяется каждые 2, 4, 6 и так далее секунд.

Периодические сигналы

Фундаментальным или основным периодом сигналом называется наименьший интервал повторения, то есть для нашего дискретного сигнала y[n] это 4 отчета, а для нашего непрерывно сигнала это две секунды.

Фундаментальная частота

От понятие фундаментального периода мы можем перейти к понятию фундаментальной частоты. Фундаментальная или основная частота также именуемая первая гармоника, это количество основных периода сигнала, приходящихся на единицу времени. Частота измеряется в Герцах, то есть в количестве периодов приходящейся на одну секунду, и фактически является обратной величиной основного периода.

Фундаментальная частота сигнала

Если мы рассмотрим наш непрерывный сигнал z[t] его основной период равен двум секундам, а это значит, что на одну секунду приходится ровно половина его периода.

Основная частота дискретного сигнала

Но если с непрерывным сигналом все более менее понятно, то есть можем взглянуть на него на временной оси, оценить величины основного периода и подсчитать значение основной частоты, то с дискретным сигналом все не так просто.

непрерывный и дискретный сигнал

Нам доступны значение отчетов, мы знаем их номера в последовательности, но мы не знаем, как они соотносятся с его фундаментальной частотой, и как они соотносятся с частотой дискретизации. Давайте в этом попробуем разобраться на примере.

Возьмем дискретный сигнал, который мы используем для описания в предыдущих статьях. Он имеет период в 4 отчета, где два первых отчета в периоде имеют большую амплитуду, а два последних отчета имеют малую амплитуду.

Нашей задачи в данном примере будет при помощи такого сигнала услышать ноту ля первой октавы, то есть частоту 440 Гц. Для того чтобы это сделать нам обязательно надо понять, как основная частота соотносится с частотой дискретизации сигнала.

Пример первой гармоники дискретного сигнала

Для этого давайте перенесем наш сигнал на временную ось. Основной период данного сигнала высчитывается также, как для непрерывного сигнала, то есть это обратная величина его фундаментальной частоты, в нашем случае единицы делить на 440. Но мы также видим то, что период дискретизации нашего сигнала, обозначим здесь его как ∆t в 4 раза меньше, чем основной период, так как на основной период приходится ровно 4 отсчета.

частота дискретизации через период дискретизации

Выразим частоту дискретизации через период дискретизации, частоту дискретизации можно записать, как единицу делить на ∆t, что получить равно 4 делить на T0, то есть в нашем случае частота дискретизации должна быть в 4 раза больше, чем наша фундаментальная частота ноты ля первой октавы.

Изменение частоты дискретизации

Если мы рассмотрим наши манипуляции над дискретным сигналом, как манипуляции на аналоговом сигнале, а после этого дискретизацию аналогового сигнала, то вот к чему мы приходим. Когда мы увеличиваем частоту дискретизации, то мы фактически берем дискретные отчеты более быстрого аналогового сигнала, или кладем отчеты того же дискретного сигнала на другую временную сетку.

изменение частоты дискретизации

К примеру, наш дискретный сигнал с периодом дискретизации ∆t можно представить как оцифрованные значения аналогового сигнала с периодом Т0,

оцифрованные значения аналогового сигнала

Если теперь те же самые отчеты сигнала, мы положим на более плотную временную сетку с меньшим периодом ∆t, это фактически то же самое как если мы оцифровали более быстрый аналоговый сигнал с меньшим периодом Т0.

оцифровка сигнала

В качестве эталонного, аналогового сигнала мы представили синусоиду, а почему мы так часто используем синусоиду, когда говорим о цифровой обработки сигналов об этом в следующей статье.

Понравилась статья? Поделить с друзьями:
  • Как составить дорожную карту для доу
  • Как найти свой город в одноклассниках
  • Как найти успокоение для души
  • Как составить ребусы проекты
  • Как найти нужный оквэд