Как найти размер стерео файла

Содержание

  1. 7. Кодирование и декодирование информации
  2. ЗВУКОВАЯ ИНФОРМАЦИЯ
  3. ФОРМУЛА ОПРЕДЕЛЕНИЯ ОБЪЕМА ЗВУКОВОГО ФАЙЛА
  4. I = F*i*t*k
  5. I — объем звукового файла (бит) F — частота дискретизации (Гц) или измерений в секунду i — глубина (вес) кодирования звука (бит) t — время звучания звука (сек) k — количество каналов в записи (моно k=1, стерео k=2, квадро k=4)
  6. ФОРМУЛА ОБЪЕМА ЧЕРЕЗ СКОРОСТИ ПЕРЕДАЧИ ИНФОРМАЦИИ И ВРЕМЯ
  7. I = v*t
  8. I — объем звукового файла (бит) v — скорость передачи информации (бит/сек) t — время передачи информации (сек)
  9. 1. Передача звуковых файлов
  10. Задача 1
  11. ПАСКАЛЬ
  12. PYTHON
  13. ОТВЕТ:4320
  14. Задача 2
  15. 2. Хранение звуковых файлов
  16. Задача 1
  17. ПАСКАЛЬ
  18. PYTHON
  19. Получили t = 2.18453333333333, время записи примерно равно 2 минутам ОТВЕТ:2
  20. Задача 2
  21. Получили 87.890625, округляем до ближайшего целого кратного 10, получаем 90(МБайт) ОТВЕТ: 90
  22. РЕШИТЬ САМОСТОЯТЕЛЬНО:
  23. ПЕРЕДАЧА ИЗОБРАЖЕНИЙ
  24. ФОРМУЛА ОПРЕДЕЛЕНИЯ ОБЪЕМА КАРТИНКИ
  25. I = K*i
  26. I — объем графического файла (бит) К — общее количество точек картинки или разрешающая способность монитора (пиксел) i — глубина цвета (бит) или вес одного пиксела
  27. ФОРМУЛА ОПРЕДЕЛЕНИЯ ЦВЕТОВОЙ ПАЛИТРЫ
  28. N = 2 i
  29. N — цветовая палитра i — глубина цвета (бит) или вес одного пиксела
  30. ФОРМУЛА ОБЪЕМА ЧЕРЕЗ СКОРОСТИ ПЕРЕДАЧИ ИНФОРМАЦИИ И ВРЕМЯ
  31. I = v*t
  32. I — объем графического файла (бит) v — скорость передачи информации (бит/сек) t — время передачи информации (сек)
  33. Задача 1
  34. ОТВЕТ: 75
  35. РЕШИТЬ САМОСТОЯТЕЛЬНО
  36. ПЕРЕДАЧА ТЕКСТОВ
  37. ФОРМУЛА ОПРЕДЕЛЕНИЯ ОБЪЕМА ТЕКСТОВОЙ ИНФОРМАЦИИ
  38. I = K*i
  39. I — объем текстового файла (бит) К — общее количество символов i — вес одного символа (бит)
  40. МОЩНОСТЬ АЛФАВИТА
  41. N = 2 i
  42. N — мощность алфавита i — вес одного символа(бит)
  43. Задача 1
  44. ОТВЕТ: 108 Попробуйте самостоятельно составить программу
  45. СРАВНЕНИЕ ДВУХ СПОСОБОВ ПЕРЕДАЧИ ДАННЫХ
  46. Задача 1
  47. Попробуйте разобраться в программе и решить самостоятельно задачу
  48. ОПРЕДЕЛЕНИЕ ВРЕМЕНИ ПЕРЕДАЧИ ФАЙЛА
  49. Оставить комментарий Отменить ответ
  50. Как найти объем звукового файла в информатике

7. Кодирование и декодирование информации

  • ЗВУКОВАЯ ИНФОРМАЦИЯ
  • ПЕРЕДАЧА ИЗОБРАЖЕНИЙ
  • ПЕРЕДАЧА ТЕКСТОВ
  • Сравнение двух способов передачи данных
  • Определение времени передачи файла

ЗВУКОВАЯ ИНФОРМАЦИЯ

ФОРМУЛА ОПРЕДЕЛЕНИЯ ОБЪЕМА ЗВУКОВОГО ФАЙЛА

I = F*i*t*k

I — объем звукового файла (бит)
F — частота дискретизации (Гц) или измерений в секунду
i — глубина (вес) кодирования звука (бит)
t — время звучания звука (сек)
k — количество каналов в записи (моно k=1, стерео k=2, квадро k=4)

ФОРМУЛА ОБЪЕМА ЧЕРЕЗ СКОРОСТИ ПЕРЕДАЧИ ИНФОРМАЦИИ И ВРЕМЯ

I = v*t

I — объем звукового файла (бит)
v — скорость передачи информации (бит/сек)
t — время передачи информации (сек)

1. Передача звуковых файлов

Задача 1

Стереоаудиофайл передается со скоростью 32 000 бит/с. Файл был записан при среднем качестве звука: глубина кодирования – 16 бит, частота дискретизации – 48 000 измерений в секунду, время записи ─ 90 сек.Сколько времени будет передаваться файл? Время укажите в секундах.

ПАСКАЛЬ

var Iob,F,i,t1,t2,k,v:real;
begin
F := 48000;
i := 16;
t1 := 90;
k := 2;
Iob := F*i*t1*k;
v := 32000;
t2 := Iob/v;
writeln(‘t2 = ‘,t2);
end.

PYTHON

ОТВЕТ:4320

Задача 2

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 30 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 2 раза выше и частотой дискретизации в 1,5 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б; пропускная способность канала связи с городом Б в 4 раза выше, чем канала связи с городом А. Сколько секунд длилась передача файла в город Б? В ответе запишите только целое число, единицу измерения писать не нужно.

РЕШЕНИЕ: Пусть I1 первоначальный размер оцифрованного фрагмента, тогда размер второго I2 = I1*2/1.5 = 4/3*I1, то есть в 4/3 объем второго получился больше первого файла, и передаваться будет дольше на 4/3. Пропускная способность (скорость) канала в город Б в 4 раза выше, получаем t = (30*4/3)/4 = 10

2. Хранение звуковых файлов

Задача 1

Производилась двухканальная (стерео) звукозапись с частотой дискретизации 64 кГц и 24-битным разрешением. В результате был получен файл размером 48 Мбайт, сжатие данных не производилось. Определите приблизительно, сколько времени (в минутах) проводилась запись. В качестве ответа укажите ближайшее к времени записи целое число.

ПАСКАЛЬ

var Iob,F,i,t,k:real;
begin
F := 64000;
i := 24;
k := 2;
Iob := 48*1024*1024*8;
t := Iob/(F*i*k);
writeln(‘t = ‘,t/60);
end.

PYTHON

Как вариант, кто не хочет составлять программу считаем вручную, используя степени двоек:

48=3*16=3*2^4, 1024 = 2^10, 8 = 2^3, 64000 = 64*1000= 2^6*2^3*125, 24=3*2^3, 2=2^1

t = (48 *1024*1024*8)/(64000*24*2)=3*2^4*2^10*2^10*2^3)/(2^6*2^3*125*3*2^3*2^1)=(2^24)/(125*2^13)=2^14/125= 16384/125=131,072/60=2.18453333333333

Получили t = 2.18453333333333, время записи примерно равно 2 минутам
ОТВЕТ:2

Задача 2

Производится четырёхканальная (квадро) звукозапись с частотой дискретизации 32 кГц и 32-битным разрешением. Запись длится 3 минуты, её результаты записываются в файл, сжатие данных не производится.

Определите приблизительно размер полученного файла в Мбайт. В качестве ответа укажите ближайшее к размеру файла целое число, кратное 10.

РЕШЕНИЕ:Мы знаем: F = 32кГц = 32000Гц, i = 32бита, k = 4, t = 3мин=180с. Находим I = F*i*t*k , легко составим программу что бы не запутаться в переводе и вычислениях

var Iob,F,i,t,k:real;
begin
F := 32000;
i := 32;
t :=180;
k := 4;
Iob := (F*i*t*k)/(1024*1024*8);

Получили 87.890625, округляем до ближайшего целого кратного 10, получаем 90(МБайт)
ОТВЕТ: 90

РЕШИТЬ САМОСТОЯТЕЛЬНО:

Производится звукозапись музыкального фрагмента в формате стерео (двухканальная запись) с частотой дискретизации 32 кГц и 32-битным разрешением. Результаты записываются в файл, сжатие данных не производится; размер полученного файла – 64 Мбайт. Затем производится повторная запись этого же фрагмента в формате моно (одноканальная запись) с частотой дискретизации 16 кГц и 16-битным разрешением. Сжатие данных не производилось. Укажите размер файла в Мбайт, полученного при повторной записи. В ответе запишите только целое число, единицу измерения писать не нужно.

ПЕРЕДАЧА ИЗОБРАЖЕНИЙ

ФОРМУЛА ОПРЕДЕЛЕНИЯ ОБЪЕМА КАРТИНКИ

I = K*i

I — объем графического файла (бит)
К — общее количество точек картинки или разрешающая способность монитора (пиксел)
i — глубина цвета (бит) или вес одного пиксела

ФОРМУЛА ОПРЕДЕЛЕНИЯ ЦВЕТОВОЙ ПАЛИТРЫ

N = 2 i

N — цветовая палитра
i — глубина цвета (бит) или вес одного пиксела

ФОРМУЛА ОБЪЕМА ЧЕРЕЗ СКОРОСТИ ПЕРЕДАЧИ ИНФОРМАЦИИ И ВРЕМЯ

I = v*t

I — объем графического файла (бит)
v — скорость передачи информации (бит/сек)
t — время передачи информации (сек)

Задача 1

Сколько секунд потребуется модему, передающему информацию со скоростью 32000 бит/с, чтобы передать 24─цветное растровое изображение размером 800 на 600 пикселей, при условии что цвет кодируется минимально возможным количеством бит.

РЕШЕНИЕ:Мы знаем: K = 800*600, N= 24 бита, v = 32000 бит/c. С помощью N бит можно закодировать 2 N вариантов, 2 4 5 , следовательно, один цвет кодируется i=5 битами. Находим I = K*i , находим время t = I/v,

Q = 800 * 600 * 5 бит = 480 000 * 5 бит. t = 480 000 * 5 бит / 32 000 бит/с = 75 с.

легко составим программу что бы не запутаться в переводе и вычислениях

ОТВЕТ: 75

РЕШИТЬ САМОСТОЯТЕЛЬНО

Сколько секунд потребуется модему, передающему сообщения со скоростью 19200 бит/с, чтобы передать цветное растровое изображение размером пикселей, при условии, что цвет каждого пикселя кодируется 24 битами?

ПЕРЕДАЧА ТЕКСТОВ

ФОРМУЛА ОПРЕДЕЛЕНИЯ ОБЪЕМА ТЕКСТОВОЙ ИНФОРМАЦИИ

I = K*i

I — объем текстового файла (бит)
К — общее количество символов
i — вес одного символа (бит)

МОЩНОСТЬ АЛФАВИТА

N = 2 i

N — мощность алфавита
i — вес одного символа(бит)

Задача 1

Модем передает данные со скоростью 7680 бит/с. Передача текстового файла заняла 1,5 мин. Определите, сколько страниц содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode, а на одной странице – 400 символов.

Объём информации вычисляется по формуле I = v * t, где t — время передачи v — cкорость передачи данных. Поэтому I = 7680 бит/c * 90с = 691200 бит. Каждый символ в данной кодировке кодируется 16-ю битами, i = 16. Следовательно, количество символов определится так: K= I/i = 691200 бит / 16 бит = 43200, на одной странице 400 символов, поэтому количество страниц опредлится так: St = 43200 / 400 = 108.

ОТВЕТ: 108
Попробуйте самостоятельно составить программу

СРАВНЕНИЕ ДВУХ СПОСОБОВ ПЕРЕДАЧИ ДАННЫХ

Задача 1

Документ объемом 10 Мбайт можно передать с одного компьютера на другой двумя способами:

А) Сжать архиватором, передать архив по каналу связи, распаковать

Б) Передать по каналу связи без использования архиватора.

Какой способ быстрее и насколько, если

– средняя скорость передачи данных по каналу связи составляет 2 18 бит в секунду,

– объем сжатого архиватором документа равен 30% от исходного,

– время, требуемое на сжатие документа – 7 секунд, на распаковку – 1 секунда?

В ответе напишите букву А, если способ А быстрее или Б, если быстрее способ Б. Сразу после буквы напишите количество секунд, насколько один способ быстрее другого.

Так, например, если способ Б быстрее способа А на 23 секунды, в ответе нужно написать Б23. Слов «секунд», «сек.», «с.» к ответу добавлять не нужно.

Попробуйте разобраться в программе и решить самостоятельно задачу

Документ объемом 5 Мбайт можно передать с одного компьютера на другой двумя способами:

А) Сжать архиватором, передать архив по каналу связи, распаковать.

Б) Передать по каналу связи без использования архиватора.

Какой способ быстрее и насколько, если

– средняя скорость передачи данных по каналу связи составляет 2 18 бит в секунду,

– объем сжатого архиватором документа равен 80% от исходного,

– время, требуемое на сжатие документа – 35 секунд, на распаковку – 3 секунды?

В ответе напишите букву А, если способ А быстрее или Б, если быстрее способ Б. Сразу после буквы напишите количество секунд, насколько один способ быстрее другого.

Так, например, если способ Б быстрее способа А на 23 секунды, в ответе нужно написать Б23.

Слов «секунд», «сек.», «с.» к ответу добавлять не нужно.

ОПРЕДЕЛЕНИЕ ВРЕМЕНИ ПЕРЕДАЧИ ФАЙЛА

У Толи есть доступ к сети Интернет по высокоскоростному одностороннему радиоканалу, обеспечивающему скорость получения информации бит в секунду. У Миши нет скоростного доступа в Интернет, но есть возможность получать информацию от Толи по низкоскоростному телефонному каналу со средней скоростью бит в секунду. Миша договорился с Толей, что тот будет скачивать для него данные объемом 5 Мбайт по высокоскоростному каналу и ретранслировать их Мише по низкоскоростному каналу.

Компьютер Толи может начать ретрансляцию данных не раньше, чем им будут получены первые 512 Кбайт этих данных. Каков минимально возможный промежуток времени (в секундах) с момента начала скачивания Толей данных до полного их получения Мишей?

В ответе укажите только число, слово «секунд» или букву «с» добавлять не нужно.

РЕШЕНИЕ PYTHON: print((512*1024*8)/2**19 + (5*1024*1024*8)/2**15)

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Источник

Как найти объем звукового файла в информатике

Урок « Определение объема звукового файла»

Размер цифрового моноаудиофайла измеряется по формуле: A = D * T * i ,

где D – частота дискретизации (Гц), T – время звучания или записи звука, i – разрядность регистра (разрешение).

Задача 1. Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?

Решение: 1,3 Мбайт = 1363148,8 байт 1363148,8 байт : 60 : 1 = 22719,1 Гц
Ответ: 22,05 кГц

Задача 2. Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Решение: 5,25 Мбайт = 5505024 байт 5505024 байт: 22050 Гц : 2 байта = 124,8 сек
Ответ: 124,8 секунды

Задача 3. Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации — 22050 Гц. Какова разрядность аудиоадаптера?

Решение: 5, 1 Мбайт= 5347737,6 байт 5347737,6 байт: 120 сек : 22050 Гц= 2,02 байт =16 бит
Ответ: 16 бит

Задача 4. Определите качество звука (качество радиотрансляции, среднее качество, качество аудио-CD) если известно, что объем моноаудиофайла длительностью звучания в 10 сек. равен: а) 940 Кбайт; б) 157 Кбайт.

а)
1) 940 Кбайт= 962560 байт = 7700480 бит
2) 7700480 бит : 10 сек = 770048 бит/с
3) 770048 бит/с : 16 бит = 48128 Гц –частота дискретизации – близка к самой высокой 44,1 КГц
Ответ: качество аудио-CD

б)
1) 157 Кбайт= 160768 байт = 1286144 бит
2) 1286144 бит : 10 сек = 128614,4 бит/с
3) 128614,4 бит/с : 16 бит = 8038,4 Гц
Ответ: качество радиотрансляции

Ответ: а) качество CD; б) качество радиотрансляции.

Задача 5 . Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Во сколько раз различаются информационные объемы оцифрованного звука?

Решение: Длина кода аналогового сигнала с использованием 256 уровней интенсивности сигнала равна 8 битам, с использованием 65536 уровней интенсивности сигнала равна 16 битам. Так как длина кода одного сигнала увеличилась вдвое, то информационные объемы оцифрованного звука различаются в 2 раза.

Дополнительные задачи для самостоятельной работы:

Задача 1*. Определите длительность звукового файла, который уместится на гибкой дискете 3,5”. Учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байт.
а) при низком качестве звука: моно, 8 бит, 8 кГц;

б) при высоком качестве звука: стерео, 16 бит, 48 кГц.

Задача 2*. Рассчитать объем видеофильма при частоте 200 МГц, 50 кадров/сек, длительность 120 минут.

Задача 3*. Согласно теореме Найквиста—Котельникова, для того чтобы аналоговый сигнал можно было точно восстановить по его дискретному представлению (по его отсчетам), частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты этого сигнала.

а) Какова должна быть частота дискретизации звука, воспринимаемого человеком?

б) Что должно быть больше: частота дискретизации речи или частота дискретизации звучания симфонического оркестра?

Домашнее задание – решить задачи:

Задача 1. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит.

Задача 2. Объем свободной памяти на диске — 0,01 Гб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44100 Гц?

Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.

Цель-мотивация. Подготовка к ЕГЭ.

1. Просмотр презентации по теме с комментариями учителя. Приложение 1

Материал презентации: Кодирование звуковой информации.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ:

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так

далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Аудиоадаптер (звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:

  • Частотой дискретизации
  • Разрядностью(глубина звука).

Частота временной дискретизации

– это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.

Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 =65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2 I = 2 16 = 65536, где I — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

Звуковой файл – файл, хранящий звуковую информацию в числовой двоичной форме.

2. Повторяем единицы измерения информации

1 Кбайт = 2 10 байт=1024 байт

1 Мбайт = 2 10 Кбайт=1024 Кбайт

1 Гбайт = 2 10 Мбайт=1024 Мбайт

1 Тбайт = 2 10 Гбайт=1024 Гбайт

1 Пбайт = 2 10 Тбайт=1024 Тбайт

3. Закрепить изученный материал, просмотрев презентацию, учебник [1]

4. Решение задач

Учебник [1], показ решения на презентации.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

V=1 ×16 × 48 000 × 2=

1536000 бит/8 =192000 байт/1024 = 187,5 Кбайт

Задача (самостоятельно). Учебник [1], показ решения на презентации.
Определить информационный объем цифрового аудио файла длительностью звучания которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении 8 битов.

10 × 8 × 22 050 бит/8 = 220500 байт/1024 = 215,332/1024 Кбайт = 0,21 Мбайт

5. Закрепление. Решение задач дома, самостоятельно на следующем уроке

Определить объем памяти для хранения цифрового аудио­файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

V=2×60 ×16 × 44,1 × 1=

(120 × 16 × 44 010) бит = 84672000 бит/8= 10584000байт/1024 = 10335,9375 Кбайт/1024 = 10,09 Мбайт

В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретиза­ции и разрядность?

V= T ×I × H × 1; I × H= V / T

I × H= 2,6 Мб/1 мин. = 2,6×1024×1024×8 бит/ 60 сек=21810380,8/60=

Если I=8 ,бит, то H=44,1 кГц.

Если I=16 бит, то H=22,05 кГц.

Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифро­вого аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Одна минута записи цифрового аудиофайла занимает на дис­ке 1,3 Мб, разрядность звуковой платы – 8. С какой частотой дискретизации записан звук?

Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

Цифровой аудиофайл содержит запись звука низкого качест­ва (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?

Две минуты записи цифрового аудиофайла занимают на дис­ке 5,05 Мб. Частота дискретизации — 22 050 Гц. Какова раз­рядность аудиоадаптера?

Объем свободной памяти на диске — 0,1 Гб, разрядность зву­ковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

№ 92. 124,8 секунды.

№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти — 15,1 Мб.

№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации — 11 кГц, разрядность аудиоадаптера — 8. Длительность звучания равна 60,5 с.

1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера )

2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.

3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.

Рассмотрим задание, в котором подробно разберем как определить информационный объем звукового файла.

Для решения подобных задач досаточно знать одну простую формулу

I = H*b*t*k

I — информационный объем звукового файла (иногда обозначают Q)

H — частота дискретизации (количество измерений в секунду времени)

b — глубина кодирования информации (количество уровней громкости в измерениях)

k — количество каналов по которым производится запись (моно — 1 канал, стерео — 2 канала, квадро — 4 канала)

При решении подобных задач, как и многих других нужно помнить, что чаще всего все расчеты удобнее производить в степенях двойки.

Источник

Разрешение 16 бит — столько информации записывалось при оцифровке одного мгновенного значения аналогового сигнала во входном канале.

Сказано про стерео аудиофайл — то есть, записан стерео звук (два независимых канала, каждый со своим сигналом). Значит, тут за один раз записывались два значения по 16 бит каждое. Итого, получим:

2 · 16 = 32 бит

Частота дискретизации равна (переведём в герцы):

44,1 кГц = (44,1 · 1000) Гц = 44 100 Гц

Это значит, что за одну секунду 44 100 раз записываются выше указанные значения. То есть, за одну секунду мы получим объём информации, равный:

32 · 44 100 = 1 411 200 бит

Запись велась 45 секунд (время звучания файла). Итого, общий объём данных в этом файле равен:

1 411 200 · 45 = 63 504 000 бит

Далее, переводим в байты (делим на 8), затем в килобайты (делим на 1024), затем в мегабайты (ещё раз делим на 1024) и округляем до сотых (т.е. до двух знаков после запятой):

63 504 000 : 8 : 1 024 : 1 024 ≈ 7,57 Мбайт

Ответ: 7,57 Мбайт

Либо, всё это можно сделать одним примером (при переводе из байт в мегабайты двойное деление на 1024 = 2¹⁰ можно заменить одним делением на 2²⁰):

M = 2 · 16 · 44,1 · 1000 · 45 : 8 : 2²⁰ ≈ 7,57 Мбайт

УРОК №30

Тема

Решение задач на
кодирование звуковой информации

Типы задач:

1.
Размер цифрового аудиафайла (моно и
стерео).

2.
Определение качества звука.

3.
Двоичное кодирование звука.

При решении задач
учащиеся опираются на следующие понятия:

Временная дискретизация
процесс,
при котором, во время кодирования
непрерывного звукового сигнала, звуковая
волна разбивается на отдельные маленькие
временные участки, причем для каждого
такого участка устанавливается
определенная величина амплитуды. Чем
больше амплитуда сигнала, тем громче
звук.

Глубина звука (глубина
кодирования) —

количество бит на кодировку звука.

Уровни громкости
(уровни
сигнала)

— звук может иметь различные уровни
громкости. Количество различных уровней
громкости рассчитываем по формуле
N=
2
I

где
I
– глубина звука.

Частота дискретизации
количество
измерений уровня входного сигнала в
единицу времени (за 1 сек). Чем больше
частота дискретизации, тем точнее
процедура двоичного кодирования. Частота
измеряется в герцах (Гц). 1 измерение за
1 секунду -1 ГЦ.

1000 измерений за
1 секунду 1 кГц. Обозначим частоту
дискретизации буквой
D.
Для кодировки выбирают одну из трех
частот:
44,1 КГц, 22,05 КГц,
11,025 КГц.

Считается, что диапазон
частот, которые слышит человек, составляет
от 20 Гц до 20 кГц.

Качество двоичного
кодирования –

величина, которая определяется глубиной
кодирования и частотой дискретизации.

Аудиоадаптер (звуковая
плата) –
устройство,
преобразующее электрические колебания
звуковой частоты в числовой двоичный
код при вводе звука и обратно (из числового
кода в электрические колебания) при
воспроизведении звука.

Характеристики
аудиоадаптера:

частота дискретизации и разрядность
регистра.).

Разрядность регистра
число
бит в регистре аудиоадаптера. Чем больше
разрядность, тем меньше погрешность
каждого отдельного преобразования
величины электрического тока в число
и обратно. Если разрядность равна
I,
то при измерении входного сигнала может
быть получено 2
I
=N
различных значений.

Размер цифрового
моноаудиофайла (
A)
измеряется по формуле:

A=D*T*I/8,
где
D
частота
дискретизации (Гц),
T
– время звучания или записи звука,
I
разрядность
регистра (разрешение). По этой формуле
размер измеряется в байтах.

Размер цифрового
стереоаудиофайла (
A)
измеряется по формуле:

A=2*D*T*I/8,
сигнал записан для двух колонок, так
как раздельно кодируются левый и правый
каналы звучания.

Учащимся
полезно выдать
таблицу
1
,
показывающую, сколько Мб будет занимать
закодированная одна минута звуковой
информации при разной частоте
дискретизации:

Тип
сигнала

Частота
дискретизация, КГц

44,1

22,05

11,025

16
бит, стерео

10,1
Мб

5,05
Мб

2,52
Мб

16
бит, моно

5,05
Мб

2,52
Мб

1,26
Мб

8
бит, моно

2,52
Мб

1,26
Мб

630
Кб

Уровень «3»

1. Определить размер (в байтах)
цифрового аудиофайла, время звучания
которого составляет 10 секунд при частоте
дискретизации 22,05 кГц и разрешении 8
бит. Файл сжатию не подвержен. ([1], стр.
156, пример 1)

Решение:

Формула для расчета размера
(в байтах)
цифрового аудио-файла:
A=D*T*I/8.

Для
перевода в байты полученную величину
надо разделить на 8 бит.

22,05 кГц =22,05 *
1000 Гц =22050 Гц

A=D*T*I/8
=
22050 х 10 х 8 / 8 =
220500 байт.

Ответ: размер файла 220500
байт.

2. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит. ([1], стр. 157, №88)

Решение:

A=D*T*I/8.
– объем памяти для хранения цифрового
аудиофайла.

44100
(Гц) х 120 (с) х 16 (бит) /8 (бит) = 10584000 байт=
10335,9375 Кбайт= 10,094 Мбайт.

Ответ:
≈ 10 Мб

Уровень «4»

3. В распоряжении пользователя имеется
память объемом 2,6 Мб. Необходимо записать
цифровой аудиофайл с длительностью
звучания 1 минута. Какой должна быть
частота дискретизации и разрядность?
([1], стр. 157, №89)

Решение:

Формула для расчета частоты
дискретизации и разрядности: D*
I
=А/Т

(объем памяти в байтах) : (время звучания
в секундах):

2, 6 Мбайт= 2726297,6 байт

D*
I
=А/Т= 2726297,6 байт: 60 = 45438,3 байт

D=45438,3
байт : I

Разрядность адаптера может
быть 8 или 16 бит. (1 байт или 2 байта).
Поэтому частота дискретизации может
быть либо 45438,3 Гц = 45,4 кГц ≈ 44,1 кГц
–стандартная характерная частота
дискретизации, либо 22719,15 Гц = 22,7 кГц ≈
22,05 кГц — стандартная характерная
частота дискретизации

Ответ:

Частота
дискретизации

Разрядность
аудиоадаптера

1
вариант

22,05
КГц

16 бит

2
вариант

44,1 КГц

8 бит

4. Объем свободной памяти на диске
— 5,25 Мб, разрядность звуковой платы —
16. Какова длительность звучания цифрового
аудиофайла, записанного с частотой
дискретизации 22,05 кГц? ([1], стр. 157, №90)

Решение:

Формула для расчета длительности
звучания: T=A/D/I

(объем памяти в байтах) : (частота
дискретизации в Гц) : (разрядность
звуковой платы в байтах):

5,25 Мбайт = 5505024 байт

5505024
байт: 22050 Гц : 2 байта = 124,8 сек
Ответ:
124,8 секунды

5. Одна минута записи цифрового
аудиофайла занимает на диске 1,3 Мб,
разрядность звуковой платы — 8. С какой
частотой дискретизации записан звук?
([1], стр. 157, №91)

Решение:

Формула для расчета частоты дискретизации
: D
=А/Т/I

(объем
памяти в байтах) : (время записи в секундах)
: (разрядность звуковой платы в байтах)

1,3
Мбайт = 1363148,8 байт

1363148,8
байт : 60 : 1 = 22719,1 Гц

Ответ:
22,05 кГц

6. Две минуты записи цифрового
аудиофайла занимают на диске 5,1 Мб.
Частота дискретизации — 22050 Гц. Какова
разрядность аудиоадаптера? ([1], стр.
157, №94)

Решение:

Формула
для расчета разрядности: (объем памяти
в байтах) : (время звучания в секундах):
(частота дискретизации):

5, 1
Мбайт= 5347737,6 байт

5347737,6
байт: 120 сек : 22050 Гц= 2,02 байт =16 бит

Ответ:
16 бит

7. Объем свободной памяти на диске —
0,01 Гб, разрядность звуковой платы — 16.
Какова длительность звучания цифрового
аудиофайла, записанного с частотой
дискретизации 44100 Гц? ([1], стр. 157, №95)

Решение:

Формула для расчета длительности
звучания T=A/D/I

(объем
памяти в байтах) : (частота дискретизации
в Гц) : (разрядность звуковой платы в
байтах)

0,01 Гб
= 10737418,24 байт

10737418,24
байт : 44100 : 2 = 121,74 сек =2,03 мин
Ответ:
20,3 минуты

8.
Оцените информационный объем
моноаудиофайла длительностью звучания
1 мин. если «глубина» кодирования
и частота дискретизации звукового
сигнала равны соответственно:
а) 16
бит и 8 кГц;
б) 16 бит и 24 кГц.

([2],
стр. 76, №2.82)

Решение:

а).
1) Информационный объем звукового
файла длительностью в 1 секунду равен:

16 бит х 8 000 = 128000 бит = 16000 байт = 15,625
Кбайт/с
2) Информационный объем
звукового файла длительностью 1 минута
равен:
15,625 Кбайт/с х 60 с = 937,5 Кбайт

б).
1) Информационный объем звукового
файла длительностью в 1 секунду равен:

16 бит х 24 000 = 384000 бит = 48000 байт = 46,875
Кбайт/с
2) Информационный объем
звукового файла длительностью 1 минута
равен:
46,875 Кбайт/с х 60 с =2812,5 Кбайт =
2,8 Мбайт

Ответ: а) 937,5 Кбайт; б) 2,8
Мбайт

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Основные понятия

Частота дискретизации(f) определяет количество отсчетов, запоминаемых за
1 секунду;

1 Гц (один герц) – это один отсчет в секунду,

а 8 кГц – это 8000
отсчетов в секунду

Глубина кодирования (b) – это количество бит, которое
необходимо для кодирования 1 уровня громкости

Время звучания (t)

Объем памяти для хранения данных 1
канала (моно)

I=f·b·t

(для хранения информации о звуке
длительностью  t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется
I бит памяти)

При двухканальной записи
(стерео)
  объем памяти, необходимый для
хранения данных одного канала, умножается на 2
 

I=f·b·t·2
 

Единицы измерения I — биты, b -биты, f — Герцы,  t – секунды

Частота дискретизации 44,1
кГц, 22,05 кГц, 11,025 кГц

Кодирование звуковой информации

Основные
теоретические положения

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук,
непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную
форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается
на отдельные маленькие временные участки, для каждого такого участка
устанавливается определенная величина интенсивности звука.

Таким
образом, непрерывная зависимость громкости звука от времени A(t) заменяется на
дискретную последовательность уровней громкости. На графике это выглядит как
замена гладкой кривой на последовательность «ступенек».

Частота дискретизации.
Для записи аналогового звука и его преобразования в цифровую форму
используется
микрофон, подключенный к звуковой плате. Качество полученного цифрового
звука
зависит от количества измерений уровня громкости звука в единицу
времени, т.е.
частоты дискретизации. Чем большее количество измерений производится за 1
секунду (чем больше частота дискретизации), тем точнее «лесенка»
цифрового звукового сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука — это количество измерений громкости звука за одну
секунду, измеряется
в герцах (Гц). Обозначим частоту дискретизации буквой
f.

Частота дискретизации звука может лежать в диапазоне от
8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Глубина кодирования звука. Каждой «ступеньке» присваивается определенное
значение уровня громкости звука. Уровни громкости звука можно рассматривать как
набор возможных состояний N, для кодирования которых необходимо определенное
количество информации
b, которое называется глубиной
кодирования звука

Глубина кодирования звука — это количество информации, которое необходимо для кодирования
дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней
громкости цифрового звука можно рассчитать по формуле N = 2b. Пусть глубина кодирования звука составляет 16 битов,
тогда количество уровней громкости звука равно:

N = 2b = 216
= 65 536.

В процессе кодирования каждому уровню громкости звука
присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет
соответствовать код 0000000000000000, а наибольшему — 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем
более качественным будет звучание оцифрованного звука. Самое низкое качество
оцифрованного звука, соответствующее качеству телефонной связи, получается при
частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и
записи одной звуковой дорожки (режим «моно»). Самое высокое качество
оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте
дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи
двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука,
тем больше информационный объем звукового файла.

Задачи для
самостоятельной подготовки
.

1. Рассчитайте  объём 
монофонического  аудиофайла  длительностью 
10 с  при  16-битном 
кодировании  и  частоте 
дискретизации 44,1 к Гц. 
(861  Кбайт)

2. Производится двухканальная (стерео) звукозапись с
частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту,
ее результаты записываются в файл, сжатие данных не производится. Какое из
приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному
в мегабайтах?

 1)0,3   2) 4   3) 16   4) 132

3.
Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и
глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются
в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее
близко к размеру полученного файла, выраженному в мегабайтах?

 1) 11     2)
13    3) 
15              4)  22

4.
Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц
и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты
записываются в файл, сжатие данных не производится. Какое из приведенных ниже
чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1)
11                2) 12           3) 
13         4)  15

5. При 
16-битном  кодировании,  частоте 
дискретизации  32 кГц  и 
объёме моноаудиофайла 700 Кбайт время 
звучания  равно:

                          1)
20 с             2) 10 с             3) 1,5 мин                  4) 1,5 с

6. Одна минута
записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой
платы — 8. С какой частотой дискретизации записан звук?

7. Аналоговый звуковой сигнал  был 
дискретизирован  сначала  с 
использованием  256 уровней  интенсивности 
сигнала  (качество  звучания 
радиотрансляции),  а  затем 
65 536 уровней (качество звучания аудио-
CD). 
Во  сколько  раз 
различаются  информационные  объёмы 
оцифрованного  звука?

                          1)
16                2)
24               3) 4                 4) 2

Литература.

  1. http://wiki.iteach.ru/images/f/fe/Лазарева_примеры_реш_задач.pdf
  2. http://kpolyakov.narod.ru/school/ege.htm
  3. http://fipi.ru/view/sections/217/docs/514.html
  4. Диагностические
    и тренировочные работы МИОО 2011-2012 http://www.alleng.ru/d/comp/com_ege-tr.htm
  5. http://festival.1september.ru/articles/103548/
  6. http://www.5byte.ru/9/0009.php
  7. Информатика. Задачник-практикум в 2 т. /Под ред. И.Г. Семакина,
    Е.К. Хеннера: Том 1. – Лаборатория Базовых Знаний, 2008 г. – 304 с.: ил.
     
  8. Практикум по информатике и информационным
    технологиям. Учебное пособие для общеобразовательных учреждений / Н.Д.
    Угринович, Л.Л. Босова, Н.И. Михайлова. – М.: Бином. Лаборатория Знаний, 2002.
    400 с.: ил.

Время на прочтение
5 мин

Количество просмотров 98K

Однажды мне понадобилось решить простенькую (как мне тогда казалось) задачу – в PHP-скрипте узнать длительность mp3-файла. Я слышал о ID3 тегах и сразу подумал, что информация о длительности хранится либо в тегах, либо в заголовках mp3-файла. Поверхностные поиски в интернете показали что за пару-тройку минут решить эту задачу не получится. Поскольку от природы я довольно любопытен а время не поджимало — решил не использовать сторонние инструменты а разобраться в одном из самых популярных форматов самостоятельно.

Если Вам интересно, что там внутри – добро пожаловать под кат (трафик).

В данной статье мы не будем подробно останавливаться на извлечении ID3v2 тегов – это можно вынести в отдельную статью, так как там есть различные нюансы. А так же на фрагментах заголовков, которые практически не используются в настоящее время (например, часть Emphasis заголовка mp3-фрейма). Так же мы не рассматриваем структуру самих аудиоданных — тех самых, которые слышим из колонок.

ID3 теги

ID3 (от англ. Identify a MP3) — формат метаданных, наиболее часто используемый в звуковых файлах в формате MP3. ID3 подпись содержит данные о названии трека, альбома, имени исполнителя и т. д., которые используются мультимедиапроигрывателями и другими программами, а также аппаратными проигрывателями, для отображения информации о файле и автоматического упорядочивания аудиоколлекции.

Wikipedia

Существует две абсолютно разных версии ID3-данных: ID3v1 и ID3v2.

ID3v1 – имеет фиксированный размер в 128 байт, которые дописываются в конец mp3-файла. Там можно хранить: название трека, исполнитель, альбом, год, комментарий, номер трека (для версии 1.1) и жанр.

Довольно быстро всем стало понятно, что 128 байт – очень уж небольшое место для хранения таких данных. И поэтому, со временем, появилась и успешно используется вторая версия данных – ID3v2.
В отличии от первой версии, теги v2 имеют переменную длину и размещаются в начале файла, что позволяет поддерживать потоковое воспроизведение. (Формат ID3v2.4 позволяет так же хранить данные и в конце файла).
Данные ID3v2 состоят из заголовка и последующих фреймов ID3v2. Например, в версии ID3v2.3 существует более 70 типов фреймов.

  • маркер всегда равен ‘ID3’
  • В данный момент имеются три версии ID3v2.2, ID3v2.3 и ID3v2.4
    Версия v2.2 считается устаревшей.
    v2.3 – самая популярная версия.
    v2.4 – набирает популярность. Одно из отличий от v2.3 в том, что позволяет использовать кодировку UTF-8 (а не только UTF-16)
  • Флаги. В настоящее время используются только три (5,6,7) бита:
    bin: %abc00000
    a ‘unsynchronisation’ – используется только с MPEG-2 и MPEG-2.5 форматами.
    b ‘Extended header’ – указывает на наличие расширенного заголовка
    с ‘Experimental indicator’ – эксперементальный индикатор
  • Длина. Особенность указания длины данных ID3v2 в том, что в каждом байте 7-й бит не используется и всегда установлен в 0.

Рассмотрим пример:

В данном случае вместе с заголовком ID3v2 (10 байт) – данные ID3v2 занимают 1024 байта.

После ID3v2-заголовка идут собственно теги. Подробный разбор чтения тегов ID3v2, как сказано выше, я решил не включать в эту статью.

Теперь у нас есть информация о наличии и длине тегов ID3 и мы можем приступать в разбору mp3-фрейма и понять-таки – где же хранится длительность. А заодно понять и всё остальное.

MP3-фрейм

Весь mp3-файл состоит из фреймов, которые можно извлекать только последовательно. Фрейм содержит в себе заголовок и аудио-данные. Поскольку мы не ставим себе целью написать прошивку для магнитофона – нас интересует именно заголовок фрейма.

О нем подробнее (куча таблиц и сухой информации)

Размер заголовка – 4 байта.

Описание:

Режимы сжатия данных или какой бывает битрейт

Существует 3 режима сжатия данных:

CBR (constant bitrate) – постоянный битрейт. Не меняется на всем протяжении трека.

VBR (variable bitrate) – переменный битрейт. При этом сжатии битрейт постоянно меняется на протяжении трека.

ABR (average bitrate) – усредненный битрейт. Это понятие используется только при кодировании файла. На «выходе» получается файл с VBR.

CBR

Если файл закодирован с постоянным битрейтом – то мы уже можем

наконец-то!

получить длительность нашего трека по следующей формуле:

Длительность = Размер аудиоданных / Битрейт (в битах!) * 8

Например, файл имеет размер 350670 байт. Есть ID3v1 теги (128 байт) и ID3v2 теги (1024 байта). Битрейт = 96. Следовательно размер аудиоданных равен 350670 – 128 – 1024 = 349518 байт.
Длительность = 349518 / 96000 * 8 = 29,1265 = 29 секунд

VBR

Необходимо пояснить – как определить режим сжатия. Всё просто. Если файл сжат с VBR – то добавляется VBR-заголовок. По его наличию мы и можем понять, что используется переменный битрейт.
Есть два вида заголовков: Xing и VBRI.
Xing размещается со смещением от начала первого mp3-фрейма в позиции, согласно таблице:

Например: у нас ID3v2 тег занимает 1024 байта. Если наш mp3-файл имеет режим канала «Стерео» — то заголовок VBR Xing будет начинаться со смещения 1024 + 32 = 1056 байт.

Заголовок VBRI всегда размещается со смещением +32 байта от начала первого mp3-фрейма.

Первые четыре байта в обоих заголовках содержат маркер ‘Xing’ или ‘Info’ для Xing. И ‘VBRI’ для VBRI.

Эти VBR заголовки имеют переменную длину и содержат различную информацию о кодировании файла. Подробнее о структуре заголовков VBR (и не только) можно почитать, например, тут.

Я же расскажу только о том, что нас интересует в данный момент. А именно – количество фреймов (Number of Frames). Это число длиной 4 байта.
В заголовке Xing оно содержится по смещению +8 байт от начала заголовка. В VBRI +14 байт от начала заголовка.

Используя таблицу Сэмплов на фрейм (Sampler Per Frame) мы можем получить длительность mp3-файла, закодированного с переменным битрейтом.

Длительность = Количество фреймов * Сэмплов на фрейм / Частоту дискретизации

Например: из заголовка VBRI получили количество фреймов 1118, сэмплов на фрейм = 1152. Частота дискретизации = 44100.
Длительность = 1118 * 1152 / 44100 = 29.204 = 29 секунд.


На этом на сегодня всё. Если был кому-то полезен — спасибо.

Для тех, кто захочет немедленно поковырять внутренности mp3 — Тут лежат скрипт на php, которые я писал для себя одновременно с данной статьей и четыре небольших mp3-файла для теста.

Ссылки

id3.org — Читаем о ID3
id3.org — и кое-что о mp3 frame
Довольно подробно о mp3 frame
getID3: Неплохая библиотека для получения информации о mp3. (PHP)

Понравилась статья? Поделить с друзьями:
  • Как правильно составить резюме при устройстве на работе
  • Форум как найти игру
  • Как найти отличия в сторис
  • Как составить приглашение для визы
  • Как найти наставника в вов