Как найти дискретизации звука ком

Как определить частоту дискретизации

Одной из основных характеристик цифровой аудиозаписи является частота дискретизации звука. Данный параметр указывает на то, сколько моментальных значений аналогового сигнала в секунду снималось при его оцифровке. Частоту дискретизации конкретной записи можно определить при помощи различных программных средств.

Как определить частоту дискретизации

Вам понадобится

  • — Winamp;
  • — Sound Forge;
  • — Virtual Dub.

Инструкция

Определите частоту дискретизации звука в медиа-файле при помощи проигрывателя Winamp. Он доступен для бесплатной загрузки на сайте winamp.com. Откройте окно редактора списка воспроизведения, если оно не отображено. Для этого нажмите сочетание клавиш Ctrl+E или в главном меню выберите пункты View и Playlist Editor. Добавьте файл в список воспроизведения, кликнув по кнопке Add и выбрав пункт Add file(s) появившегося контекстного меню. Правой кнопкой мыши кликните по записи в списке воспроизведения. Выберите пункт «View file info…» контекстного меню. Отобразится диалог, в котором среди прочих значений будет выведена частота дискретизации.

Как определить частоту дискретизации

Воспользуйтесь аудио-редактором Sound Forge для определения частоты дискретизации. В главном меню выберите пункты File и «Open…». Также можно нажать клавиши Ctrl+Alt+F2. В диалоге «Открыть» выделите нужный файл. В графе Audio блока со статистической информацией, расположенного снизу, появится нужное значение.

Как определить частоту дискретизации

Если файл уже открыт в Sound Forge, нажмите клавиши Alt+Enter или Alt+2. Либо выберите пункты View и File Properties главного меню. Отобразится окно со списком атрибутов и соответствующих им значений. Найдите в нем графу Audio sample rate. Из поля Value получите значение частоты дискретизации.

Как определить частоту дискретизации

Узнайте частоту дискретизации звука, содержащегося в файле видео. Используйте редактор Virtual Dub. Он бесплатно распространяется на сайте virtualdub.org. Откройте видео в программе, выбрав пункты File и «Open…» главного меню. Отобразите диалог свойств файла. Для этого в меню выберите пункты File и «File Information…». В группе элементов управления Audio stream найдите значение Sampling rate.

Как определить частоту дискретизации

Узнайте частоту дискретизации при помощи диалога свойств графической оболочки Windows. В окне папки, проводника или какого-либо файлового менеджера кликните правой кнопкой по файлу. В контекстном меню выберите пункт «Свойства». переключитесь на вкладку «Сводка» отобразившегося диалога. В разделе «Аудио» найдите нужное значение.

Как определить частоту дискретизации

Видео по теме

Войти на сайт

или

Забыли пароль?
Еще не зарегистрированы?

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

I switched over to Windows 7 a month or two ago and was dismayed to find out that you can no longer view things like the sample rate and channel info (i.e. mono/stereo) in the explorer. In Windows XP, these were flags you could enable in the File Options menu.

If anyone knows of any good third-party apps that restore this functionality, it would be much appreciated.

Thanks.

JoshP's user avatar

JoshP

1,7811 gold badge18 silver badges32 bronze badges

asked Aug 9, 2010 at 23:30

espgaluda's user avatar

2

You can do this workaround in Windows 7 if you switch your folder view to ‘details’, right click on the bar at the top of the file viewer & display the bit rate of the files.
Then you need to memorise the bit rates of your commonly used sampling frequency / bit depth combinations ;)

  • 512kbps = 32kHz 16 bit Mono
  • 705kbps = 44kHz 16 bit Mono
  • 1024kbps = 32kHz 16 bit Stereo
  • 1058kbps = 44kHz 24bit Mono
  • 1152kbps = 48kHz 24 bit Mono
  • 1411kbps = 44kHz 16 bit Stereo
  • 2116kbps = 44kHz 24bit Stereo
  • 2304kbps = 48kHz 24 bit Stereo

If you are using lots of non standard sampling frequencies for game sound effects then this might not be a realistic solution

edit

There’s actually a formula to calculate the bitrate:

bitrate (kbps) = sampling rate (kHz) * bit depth (bit) * num of
channels (mono/stereo)

  • 512kbps = 32kHz * 16bit * 1 channel
  • 1411kbps = 44kHz * 16 bit * 2 channels (CD standard)
  • 2116kbps = 48kHz * 24bit * 2 channels

Séb Cô's user avatar

answered Aug 18, 2010 at 17:33

Haydn Payne's user avatar

Haydn PayneHaydn Payne

1,1587 silver badges10 bronze badges

1

You could also download Wave Agent from http://sounddevices.com. It’s free, and gives you access to the file’s metadata as well. Ryan is correct about iTunes, but quicktime will let you look at it as well. Go to the «Window» column in the menu and open the «movie inspector».

answered Aug 10, 2010 at 0:14

Shaun Farley's user avatar

Shaun FarleyShaun Farley

14.8k1 gold badge24 silver badges54 bronze badges

4

This is an old one, but for whom I might help with this hint:

You might as well check out Media Info from mediaarea.net

This tool lets you either enable a context menu entry to view extensive media-file properties in a separate window (not only audio, but also all kinds of video), or it lets you enable an explorer tooltip with basic information (sample rate included).

answered Oct 27, 2018 at 9:42

Rene Baas's user avatar

To follow up on @Haydn Payne’s answer, there’s actually a formula to calculate the bitrate:

bitrate (kbps) = sampling rate (kHz) * bit depth (bit) * num of channels (mono/stereo)

  • 512kbps = 32kHz * 16bit * 1 (for mono)
  • 2116kbps = 48kHz * 24bit * 2 (for stereo)

Admittedly, this is just a way to check that a bitrate is correct for known sampling rate and bit depths. For unknown sampling rates/bit depths, I use my favorite free audio player MPC-BE (https://sourceforge.net/projects/mpcbe/), which shows this information for a playing audio file by selecting File -> Properties and scrolling the bottom window to the right (see below).

Screenshot of MPC-BE displaying audio properties

answered Sep 8, 2020 at 15:36

xhamyd's user avatar

1

С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны

определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым

. Количество бит, которое при этом отводится на один звуковой сигнал, называют
глубиной кодирования звука
. В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется
дискретным
, то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Общие сведения о звуковой информации

В течение дня обычный человек слышит большое количество различных звуков. Давайте попытаемся кратко понять, что же такое звук. Звук – колебания воздуха, которые были созданы неким источником. Под источником звука можно понимать любой предмет, объект, который способен генерировать звуковые волны:

  • Человек, который что-то произнес.
  • Проезжающий поезд, от которого исходит шум.
  • Музыкальные инструменты, на которых играет музыкант.

В самом широком физическом смысле под звуком следует понимать простую волну. Если говорить о графической интерпретации звука, то звуковые волны следует представлять, как множество синусоидальных графиков функций, каждый из которых имеет ряд обязательных параметров.

Звук обладает множеством характеристик, но ключевыми являются лишь две:

  1. Амплитуда звуковой волны.
  2. Частота звуковой волны.

Об этих свойствах будет детально рассказано в следующем разделе данной статьи.

Сейчас я вам покажу график функций идеальной звуковой волны, которой в природе физически не существует.

Идеальная звуковая волна

Графическое представление идеальной звуковой волны

Также хочу продемонстрировать график функций неидеальной звуковой волны, которая является речью обыкновенного человека.

Неидеальная звуковая волна

Графическое представление неидеальной звуковой волны, которая является речью человека

Посмотрев на оба выше представленных графика функций, у вас должны возникнуть следующие мысли и закономерный вопрос: если перед нами изображен график функций, то где координатная ось, координатная сетка, градуированные шкалы осей ОХ и оси ОY, а также нужно понять, на основании каких закономерностей построены данные графики функций? То есть, какие параметры выступают значением по оси абсцисс и по оси ординат. О данных характеристиках, параметрах будет рассказано ниже.

Характеристики звуковой информации

Как было сказано выше, что звук обладает двумя ключевыми характеристиками: амплитудой и частотой.

Амплитуда – по сути, громкость или сила звука, измеряемая в децибелах. В физике принято сокращение единицы децибел до дБ. Человек в дневное время суток способен воспринимать звуки громкостью от 10-15 дБ. Уровень громкости звука является относительной величиной. Болевой порог для человека составляет уровень громкости звука в 120-130 дБ.

Частота – отношение количества колебаний звуковой волны в единицу времени. Иногда вместо термина «частота звука» используется термин «высота звука». Единицей измерения частоты в мировой системе СИ является герц. Обозначается единица герц как Гц. Человек воспринимает звуковые волны в диапазоне от 20 Гц до 20000 Гц. Звуковые волны, имеющие частотность меньше, чем 20 Гц, называют инфразвуком. Звуковые волны, имеющие частотность выше, чем 20000 Гц, называют ультразвуком.

Влияние частоты на тип звука

Влияние частоты на тип звука

Давайте вернемся к графикам функций идеальной и неидеальной звуковой волны.

Наша задача – разобраться, какая величина откладывается на оси абсцисс, а какая – на оси ординат.

Очевидно, что одной из осей является популярнейшая характеристика большинства физических графиков функций – время. Мы не сможем исследовать поведение звуковой волны, если не будем рассматривать ее в различные отрезки времени. Следовательно, осью абсцисс является параметр время. Единицей измерения является, например, секунда или миллисекунда.

Осью ординат выступает амплитуда или громкость рассматриваемой звуковой волны. Чем больше громкость или выше амплитуда, тем выше проходит график функций, соответствующий анализируемой звуковой волне.

Представим те же самые графики функций звуковых волн, но уже с обозначениями осей координат и их градуировкой.

Идеальная звуковая волна

Неидеальная звуковая волна

Содержание

Кодирование и обработка звуковой информации

Звуковая информация.

Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся
интенсивностью
и
частотой
.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости

и
тона
. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица «децибел»

(дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 5.1. Громкость звука
Звук

Громкость в децибелах
Нижний предел чувствительности человеческого уха 0
Шорох листьев 10
Разговор 60
Гудок автомобиля 90
Реактивный двигатель 120
Болевой порог 140

Временная дискретизация звука.

Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» (рис. 1.2).

Рис. 1.2. Временная дискретизация звука

Частота дискретизации.

Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е.
частоты дискретизации
. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука

— это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука.

Каждой «ступеньке» присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука

— это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2I = 216 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.

Качество оцифрованного звука.

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы.

Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.

При сохранении звука в форматах со сжатием отбрасываются «избыточные» для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

Контрольные вопросы

1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?

Задания для самостоятельного выполнения

1.22. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала? 1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.

1.23. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука: а) моно, 8 битов, 8000 измерений в секунду; б) стерео, 16 битов, 48 000 измерений в секунду.

1.24. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5″ (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый): а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду; б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.

Частота дискретизации звука

Необходимо знать, что процессор персонального компьютера взаимодействует с любыми данными на уровне двоичного кода. Двоичный или бинарный код – цепочки битов, которые принимают только одно из двух предопределенных значений, – 0 или 1.

Под кодированием звуковой информации следует понимать преобразование аналогового звукового сигнала в формат, понятный процессору персонального компьютера, то есть в двоичный код. Аналоговый или непрерывный звуковой сигнал у нас представлен в виде графика функций, как зависимость амплитуды от времени.

Чтобы оцифровать аналоговый звуковой сигнал разобьем ось, выражающую время, на некоторое количество равных отрезков и произведем замеры амплитуды/громкости в каждом отрезке. Предлагаю произвести разбивку с шагом 0.1 секунды.

Дискретизация – процесс преобразования непрерывного сигнала в дискретный, то есть прерывный сигнал. Под частотой дискретизации следует понимать частоту взятия отсчетов непрерывного во времени сигнала при его дискретизации. В нашем случае дискретизация – операция, связанная с разбивкой оси абсцисс, отвечающей за время, на отдельные одинаковые участки. А частотой дискретизации является значение, равное 10 Гц. То есть мы производим 10 замеров амплитуды звуковой волны за 1 секунду.

Дискретизация неидеальной звуковой волны

Дискретизация неидеальной звуковой волны

Таблица значений громкости звуковой волны при частоте дискретизации 10 Гц:

Время, сек 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Громкость, дБ 90 20 80 30 90 10 40 20 90 20 60

Периодические сигналы

Периодический сигнал это сигнал, форма которого повторяется во времени. Повторяться во времени может, как форма непрерывных сигналов, так и форма дискретных сигналов. Периодом сигнала называем интервал повторения.

К примеру, у дискретного сигнала y[n] форма повторяется каждые 4, 8, 12 и так далее отчетов, для непрерывного сигнала z[t] форма повторяется каждые 2, 4, 6 и так далее секунд.

Периодические сигналы

Фундаментальным или основным периодом сигналом называется наименьший интервал повторения, то есть для нашего дискретного сигнала y[n] это 4 отчета, а для нашего непрерывно сигнала это две секунды.

Разрядность звука при кодировании звуковой информации

В теории кодирования звуковой информации понятие разрядности взаимосвязано с понятием квантования. В грубом приближении под квантованием можно понимать операцию, которая преобразует значения громкости или амплитуды звукового сигнала в двоичный код.

Обратимся еще раз к графику функций, который выражает аналоговый неидеальный звуковой сигнал. Значения громкости находятся в диапазоне от 0 до 100 децибел. Следовательно, у нас должна быть возможность запоминания 101 различного состояния, значения. Давайте рассчитаем минимальное количество бит информации, необходимой для кодирования 101 различного значения. Для этого решим простейшее показательное неравенство: 2x ≥ 101. Очевидно, что x = 7, так как 27 = 128 ≥ 100. Следовательно, для кодирования звуковой информации нам будет достаточности разрядности в 7 бит.

Сейчас мы произведем операцию квантования по отношению к замеренной громкости звуковой волны:

Время, сек 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Громкость, дБ 90 20 80 30 90 10 40 20 90 20 60
Двоичный код 1011010 0010100 1010000 0011110 1011010 0001010 0101000 0010100 1011010 0010100 0111100

На этом этап кодирования звуковой информации можно считать законченным. В оперативной памяти персонального компьютера входной аналоговый звуковой сигнал будет представлен в следующем виде:

101101000101001010000001111010110100001010 01010000010100101101000101000111100

Хочу обратить ваше внимание, что в приведенном примере мы использовали ничтожно малую частоту дискретизации, равную 10 Гц. В современных условиях кодирование звуковой информации осуществляют при частоте дискретизации 44100 Гц. То есть мы провели 10 замеров в течение 1 секунды, а на практике обеспечивают 44100 замеров за 1 секунду. Чем чаще производятся замеры исследуемой величины, тем точнее кодируется звуковая информация.

Для ради эксперимента давайте рассчитаем информационный объем, которые требуется для хранения звуковой волны в нашем примере, при частоте дискретизации 10 Гц и разрядности 7 бит.

V = [Частота дискретизации] ∙ [Разрядность] ∙ [Промежуток времени] = 10 ∙ 7 ∙ 1 = 70 [бит].

Данная формула справедлива для монозвука. Информационный объем для стереозвука рассчитывается по аналогичной формуле, но в начале стоит коэффициент 2. Это связано с тем, что при кодировании стерео звуковой информации используется две дорожки.

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N cdot f cdot k$,

где $N$ — общая длительность звучания, выражаемая в секундах,

$f$ — частота дискретизации (Гц),

$k$ — глубина кодирования (бит).

Пример 1

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 cdot 24000 cdot 16 бит=23040000 бит=2880000 байт = 2812,5 Кбайт=2,75 Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 бит cdot 24000 cdot 2 = 768000 бит = 96000 байт = 93,75 Кбайт.$

Уровни громкости звука

Громкость, дБ Характеристика Источник звука
0 Абсолютная тишина
5 Почти идеальная тишина
10 Почти идеальная тишина Шорох листьев
15 Едва слышно Качание веток деревьев
20 Едва слышно Шепот человека
25 Очень тихо Шепот человека
30 Тихо Тиканье часов на стене
35 Ниже среднего Речь человека на расстоянии 10 метров
40 Ниже среднего Обыкновенная речь человека
45 Ниже среднего Обыкновенная речь человека
50 Средне Печатная машинка
55 Выше среднего Офисное помещение
60 Шумно Отдел продаж
65-75 Шумно Громкий разговор, крики, смех
80 Очень громко Крик человека
85 Очень громко Громкий крик человека
90 Очень шумно Движение поезда на расстоянии в 1 метр
95 Очень шумно Движение метро снаружи
100 Крайне шумно Оркестр
120 Невыносимо громко Отбойный молоток
130 Болевой порог Самолет при взлете
150 Контузия Старт ракеты
160 Шок, тяжелые травмы слухового аппарата Ударная волна при взрыве ядерной бомбы
200 Смерть Шумовое оружие

Громкость звука необходимо учитывать при кодировании звуковой информации, так как ее величина влияет на разрядность кодирования звуковых волн, а следовательно, и на информационный вес закодированного в двоичном коде звукового файла.

Звук.

Звук – это звуковая волна, у которой непрерывно меняется амплитуда и частота. При этом амплитуда определяет громкость звука, а частота — его тон. Чем больше амплитуда звуковых колебаний, тем он громче. А частота писка комара больше частоты сигнала автомобиля. Частоту измеряют в Герцах. 1Гц — это одно колебание в секунду.

Кодирование звука.

Компьютер является мощнейшим устройством для обработки различных типов информации, в том числе и звуковой. Но аналоговый звук непригоден для обработки на компьютере, его необходимо преобразовать в цифровой. Для этого используются специальные устройства — аналого-цифровые преобразователи или АЦП. В компьютере роль АЦП выполняет звуковая карта. Каким же образом АЦП преобразует сигнал из аналогового в цифровой вид? Давайте разберемся.

Пусть у нас есть источник звука с частотой 440Гц, пусть это будет гитара. Сначала звук нужно превратить в электрический сигнал. Для этого используем микрофон. На выходе микрофона мы получим электрический сигнал с частотой 440Гц. Графически он выглядит таким образом:

Следующая задача — преобразовать этот сигнал в цифровой вид, то есть в последовательность цифр. Для этого используется временная дискретизация — аналоговый звуковой сигнал разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина интенсивности звука, которая зависит от амплитуды. Другими словами через какие-то промежутки времени мы измеряем уровень аналогового сигнала. Количество таких измерений за одну секунду называется частотой дискретизации. Частота дискретизации измеряется в Герцах. Соответственно, если мы будет измерять наш сигнал 100 раз в секунду, то частота дискретизации будет равна 100Гц.

Вот примеры некоторых используемых частот дискретизации звука:

  • 8 000 Гц — телефон, достаточно для речи;
  • 11 025 Гц;
  • 16 000 Гц;
  • 22 050 Гц — радио;
  • 32 000 Гц;
  • 44 100 Гц — используется в Audio CD;
  • 48 000 Гц — DVD, DAT;
  • 96 000 Гц — DVD-Audio (MLP 5.1);
  • 192 000 Гц — DVD-Audio (MLP 2.0);
  • 2 822 400 Гц — SACD, процесс однобитной дельта-сигма модуляции, известный как DSD — Direct Stream Digital, совместно разработан компаниями Sony и Philips;
  • 5,644,800 Гц — DSD с удвоенной частотой дискретизации, однобитный Direct Stream Digital с частотой дискретизации вдвое больше, чем у SACD. Используется в некоторых профессиональных устройствах записи DSD.

Современные звуковые карты способны оцифровывать звук с частотой дискретизации 96Кгц и даже 192 кГц.

В итоге наш аналоговый сигнал превратится в цифровой, а график станет уже не гладким, а ступенчатым, дискретным:

Глубина кодирования звука — это количество возможных уровней сигнала. Другими словами глубина кодирования это точность измерения сигнала. Глубина кодирования измеряется в битах. Например, если количество возможных уровней сигнала равно 255, то глубина кодирования такого звука 8 бит. 16-битный звук уже позволяет работать с 65536 уровнями сигнала. Современные звуковые карты обеспечивают глубину кодирования в 16 и даже 24 бита, а это возможность кодирования 65536  и 16 777 216 различных уровней громкости соответственно.

Зная глубину кодирования, можно легко узнать количество уровней сигнала цифрового звука.  Для этого используем формулу:

N=2i,

где N — количество уровней сигнала, а i — глубина кодирования.

Например, мы знаем, что глубина кодирования звука 16 бит. Значит количество уровней цифрового сигнала равно 216=65536.

Чтобы определить глубину кодирования если известно количество возможных уровней применяют эту же формулу. Например, если известно, что сигнал имеет 256 уровней сигнала, то глубина кодирования составит 8 бит, так как 28=256.

Как понятно из данного вышеприведенного рисунка, чем чаще мы будем измерять уровень сигнала, т.е. чем выше частота дискретизации и чем точнее мы будем его измерять, тем более график цифрового сигнала будет похож на аналоговый график, соответственно, тем выше качество цифрового звука мы получим. И тем больший объем будет иметь файл.

Кроме того, мы рассматривали монофонический (одноканальный) звук, если же звук стереофонический, то размер файла увеличивается в 2 раза, так как он содержит 2 канала.

Рассмотрим пример задачи.

Какой объем будет иметь звуковой монофонический файл содержащий звук, если длительность звука 1 минута, глубина кодирования 8 бит, а частота дискретизации 22050Гц?

Зная частоту дискретизации и длительность звука легко установить количество измерений уровня сигнала за все время. Если частота дискретизации 22050Гц — значит за 1 секунду происходит 22050 измерений, а за минуту таких измерений будет 22050*60=1 323 000.

На одно измерение требуется 8 бит памяти, следовательно на 1 323 000 измерений потребуется 1 323 000*8 = 10 584 000 бит памяти. Разделив полученное число на 8 получим объем файла в байтах — 10584000/8=1 323 000 байт. Далее, разделив полученное число на 1024 получим объем файла в килобайтах — 1 291,9921875 Кбайт. А разделив полученное число еще раз на 1024 и округлив до сотых получим размер файла в мегабайтах — 1 291,9921875/1024=1,26Мбайт.

Ответ: 1,26Мбайт.

Автор:

Понравилась статья? Поделить с друзьями:
  • Как найти гештальт терапевта
  • Как составить договор с магнитом
  • Как найти лаги в полу хрущевки
  • Как исправить челюстной сустав
  • Как найти телефон если его украли программа