Как найти один символ в информатике

Пример 1. Алфавит содержит 32 буквы определить информационный вес 1 символа.

Решение: Алфавитный подход измеряется по формуле: 2i = N. Где i – это информационный вес одного символа в битах, N – мощность алфавита, которая измеряется в буквах. Исходя из этого, подставляем имеющиеся в условии задачи данные в формулу: 2i = N,   2i = 32 (буквы).

25 = 32. Значит I = 5 бит.

Ответ: Информационный вес одного символа составляет 5 бит.

Пример 2. Алфавит содержит 16 букв определить информационный вес 1 символа.

Решение: Алфавитный подход измеряется по формуле 2i = N. Подставляем данные в формулу:

2i = N,   2i = 16 (букв).   24 = 16. Значит I = 4 бит(а).

Ответ: Информационный вес одного символа составляет 4 бита.

Пример 3. Сообщение, записанное буквами 8 символьного алфавита, содержит 30 символов. Какой объем информации оно несет?   Решение:

1. Алфавитный подход измеряется по формуле 2i = N. Сначала найдем информационный вес одного символа. Подставляем данные в формулу: 2i = N, 2i = 8, 23 = 8. Значит I = 3 бит(а).  

2. Информационный вес одного символа 3 бита, в сообщении 8 символов, значит:

3 бита * 30 символов = 90 бит.

Ответ: Информационный вес сообщения составляет 90 бит.

Пример 4. Сообщение, записанное буквами 128 символьного алфавита, содержит 20 символов. Какой объем информации оно несет?   Решение:

1. Подставляем данные в формулу: 2i = N, 2i = 128, 27 = 128. Значит I = 7 бит.  

2. Информационный вес одного символа 7 бит, в сообщении 20 символов, значит:

7 бита * 20 символов = 140 бит.

Ответ: Информационный вес сообщения составляет 140 бит.

Пример 5.

Определить мощность алфавита, если сообщение, содержащее 40 символов, занимает 30 байт.

Решение:

1) В алфавитном подходе все измеряется в битах, поэтому переводим 30 байт в биты.

Так как 1 байт = 8 бит, то 30 байт* 8 = 240 бит.

2) 240 бит / 40 символов = 6 бит (информационный вес одного символа ).

3) Алфавитный подход измеряется по формуле 2i = N. Подставляем данные в формулу: 26 = N, 26 = 64.

Ответ: мощность алфавита составляет 64 символа.

Пример 6.

Определить мощность алфавита, если сообщение, содержащее 64 символа, составляет 32 байта.

1) В алфавитном подходе все измеряется в битах . Переводим 32 байта в биты. 32 байт * 8 = 256 бит.

2) 256 бит / 64 символа = 4 бита (информационный вес одного символа ).

3) Алфавитный подход измеряется по формуле 2i = N. Подставляем данные в формулу: 24 = N, 24 = 16.

Ответ: мощность алфавита составляет 16 символов.

§ 1.6. Измерение информации

Информатика. 7 класса. Босова Л.Л. Оглавление


Ключевые слова:

  • бит
  • информационный вес символа
  • информационный объём сообщения
  • единицы измерения информации

1.6.1. Алфавитный подход к измерению информации

Одно и то же сообщение может нести много информации для одного человека и не нести её совсем для другого человека. При таком подходе количество информации определить однозначно затруднительно.

Алфавитный подход позволяет измерить информационный объём сообщения, представленного на некотором языке (естественном или формальном), независимо от его содержания.

Для количественного выражения любой величины необходима, прежде всего, единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет определённый информационный вес — несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.

Обратите внимание, что название единицы измерения информации «бит» (bit) происходит от английского словосочетания binary digit — «двоичная цифра».

За минимальную единицу измерения информации принят 1 бит. Считается, что таков информационный вес символа двоичного алфавита.

1.6.2. Информационный вес символа произвольного алфавита

Ранее мы выяснили, что алфавит любого естественного или формального языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением: N = 2i.

Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2i.

Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?

Решение. Составим краткую запись условия задачи.

§ 1.6. Измерение информации

Известно соотношение, связывающее величины i и N : N = 2i.

С учётом исходных данных: 8 = 2i. Отсюда: i = 3.

Полная запись решения в тетради может выглядеть так:

§ 1.6. Измерение информации

1.6.3. Информационный объём сообщения

Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i;I = К • i.

Задача 2. Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?

§ 1.6. Измерение информации

Задача 3. Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?

§ 1.6. Измерение информации

1.6.4. Единицы измерения информации

В наше время подготовка текстов в основном осуществляется с помощью компьютеров. Можно говорить о «компьютерном алфавите», включающем следующие символы: строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и др. Такой алфавит содержит 256 символов. Поскольку 256 = 28, информационный вес каждого символа этого алфавита равен 8 битам. Величина, равная восьми битам, называется байтом. 1 байт — информационный вес символа алфавита мощностью 256.

1 байт = 8 битов

Бит и байт — «мелкие» единицы измерения. На практике для измерения информационных объёмов используются более крупные единицы:

1 килобайт = 1 Кб = 1024 байта = 210 байтов
1 мегабайт = 1 Мб = 1024 Кб = 210 Кб = 220 байтов
1 гигабайт = 1 Гб = 1024 Мб = 210 Мб = 220 Кб = 230 байтов
1 терабайт = 1 Тб = 1024 Гб = 210 Гб = 220 Мб = 230 Кб = 240 байтов

Задача 4. Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?

§ 1.6. Измерение информации

Ответ: 8 битов, 256 символов.

Задача 5. В велокроссе участвуют 128 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер цепочкой из нулей и единиц минимальной длины, одинаковой для каждого спортсмена. Каков будет информационный объём сообщения, записанного устройством после того, как промежуточный финиш пройдут 80 велосипедистов?

Решение. Номера 128 участников кодируются с помощью двоичного алфавита. Требуемая разрядность двоичного кода (длина цепочки) равна 7, так как 128 = 27. Иначе говоря, зафиксированное устройством сообщение о том, что промежуточный финиш прошёл один велосипедист, несёт 7 битов информации. Когда промежуточный финиш пройдут 80 спортсменов, устройство запишет 80 • 7 = 560 битов, или 70 байтов информации.

Ответ: 70 байтов.


Самое главное.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет опредёленный информационный вес — несёт фиксированное количество информации.

1 бит — минимальная единица измерения информации.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2i.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = K•i.

1 байт = 8 битов.

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (210) раза.


Вопросы и задания.

1.Ознакомтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Используйте эти материалы при подготовке ответов на вопросы и выполнении заданий.

2. В чём суть алфавитного подхода к измерению информации?

3. Что принято за минимальную единицу измерения информации?

4. Что нужно знать для определения информационного веса симво­ла алфавита некоторого естественного или формального языка?

5. Определите информационный вес i символа алфавита мощ­ностью N, заполняя таблицу

6. Как определить информационный объём сообщения, представлен­ного символами некоторого естественного или формального языка?

7. Определите количество информации в сообщении из Ксимво­лов алфавита мощностью N, заполняя таблицу

8. Племя Мульти пишет письма, пользуясь 16-символьным алфави­том. Племя Пульти пользуется 32-символьным алфавитом. Вож­ди племён обменялись письмами. Письмо племени Мульти содер­жит 120 символов, — а письмо племени Пульти — 96. Сравните информационные объёмы сообщений, содержащихся в письмах

9. Информационное сообщение объёмом 650 битов состоит из 130 символов. Каков информационный вес каждого символа этого сообщения?

10. Выразите количество информации в различных единицах, заполняя таблицу

11. Информационное сообщение объёмом 375 байтов состоит из 500 символов. Каков информационный вес каждого символа этого сообщения? Какова мощность алфавита, с помощью кото­рого было записано это сообщение?

12. Для записи текста использовался 64-символьный алфавит. Какое количество информации в байтах содержат 3 страницы текста, если на каждой странице расположено 40 строк по 60 символов в строке?

13. Сообщение занимает 6 страниц по 40 строк, в каждой строке за­писано по 60 символов. Информационный объём всего сообще­ния равен 9000 байтам. Каков информационный вес одного сим­вола? Сколько символов в алфавите языка, на котором записано это сообщение?

14. Метеорологическая станция ведёт наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается цепочкой из нулей и единиц минимальной длины, одинаковой для каждого изме­рения. Станция сделала 8192 измерения. Определите информа­ционный объём результатов наблюдений.

15. Племя Пульти пользуется 32-символьным алфавитом. Свод основных законов племени хранится на 512 глиняных таблич­ках, на каждую из которых нанесено ровно 256 символов. Какое количество информации содержится на каждом носителе? Какое количество информации заключено во всём своде законов?


Оглавление

§ 1.5. Двоичное кодирование

§ 1.6. Измерение информации

Тестовые задания для самоконтроля


1. Найди информационный объём следующего сообщения, если известно, что один символ кодируется одним байтом.

Кто владеет информацией, тот владеет миром.

Решение: посчитаем количество символов в сообщении, будем учитывать буквы, знаки препинания и пробелы.

Всего (43) символа. Каждый символ кодируется (1) байтом.

(I = К · i), (43 · 1) байт (= 43) байта.

Ответ: (43) байта.

2. Найди информационный объём слова из (12) символов в кодировке Unicode (каждый символ кодируется двумя байтами). Ответ дайте в битах.

Решение.

Мы знаем из условия задачи, что каждый символ кодируется двумя байтами. Найдём сколько это бит.

(2) байта (·  8 = 16) бит; 

Слово состоит из (12) символов, поэтому

(16) бит (· 12) символов (= 192) бита.

Ответ: (192) бита.

3. Найди информационный вес книги, которая состоит из (700) страниц, на каждой странице (70) строк и в каждой строке (95) символов . Мощность алфавита — (256) символов. Ответ дать в Мб.

Решение: если мощность алфавита (256) символов, то информационный объём одного символа (8) бит.

Найдём количество символов в книге: (700·70·95 = 4655000) символов.

Информационный вес сообщения: (4655000·8=37240000) бит.

Ответ нужно дать в Мб, поэтому переведём биты в Мб

(37240000:8:1024:1024 = 4,44) Мб

Ответ: (4,44) Мб.

1.     Информационный объём текстового
сообщения

Расчёт
информационного объёма текстового сообщения (количества информации,
содержащейся в информационном сообщении) основан на подсчёте количества
символов
 в этом сообщении, включая пробелы, и на определении
информационного веса одного символа, который зависит от кодировки, используемой
при передаче и хранении данного сообщения.

Для расчёта
информационного объёма текстового сообщения используется формула 

I=K*i, где

I  – это информационный объём текстового сообщения,
измеряющийся в байтах, килобайтах, мегабайтах; 

K  –  количество символов в
сообщении

i  –  информационный вес одного символа, который
измеряется в битах на один символ.

Информационный
объём одного символа связан с количеством символов в алфавите формулой

N=2i, где

Nэто количество символов в алфавите (мощность
алфавита),

iинформационный
вес одного символа
в битах на один символ.

2.     Информационный объём растрового
графического изображения

Расчёт
информационного объёма растрового графического изображения (количества
информации, содержащейся в графическом изображении) основан на подсчёте количества
пикселей
 в этом изображении и на определении глубины
цвета
 (информационного веса одного пикселя).

Для расчёта
информационного объёма растрового графического изображения используется
формула 

I=K*i, где

I  – это информационный объём растрового графического
изображени
я, измеряющийся в байтах, килобайтах, мегабайтах; 

K количество пикселей (точек) в
изображении
, определяющееся разрешающей способностью носителя информации
(экрана монитора, сканера, принтера); 

i глубина цвета, которая
измеряется в битах на один пиксель.

         Глубина цвета связана с
количеством отображаемых цветов формулой 

N=2i, где

N – это количество цветов в палитре

глубина цвета в битах на
один пиксель.

Мощность алфавита

Описание термина

Понятие мощности алфавита находится в основании изучения информатики. Алфавитом принято называть набор многочисленных символов. Сумма всех их в определённом языке и есть алфавитная мощность. Иными словами, это количество всех символов, входящих в конкретно взятый язык. Сюда входят не только буквы, но и прочие обозначения, в частности:

Понятие мощности алфавита

  • числа;
  • спецсимволы;
  • двоеточия;
  • пробел;
  • скобки;
  • запятые;
  • точки;
  • многоточия и прочее.

Это определение считается обобщённым и не принимает во внимание вычисления информационной составляющей сообщения. Она может содержать в себе числа, знаки препинания и прочее. В этом случае прибегают к использованию другого способа. Его суть основывается на том, что любая буква, цифра или знак обладают собственным информационным объемом данных. Компьютер работает с этим информационным кодом и распознает то, что было написано.

Основным постулатом в информатике является тот факт, что устройство разбирает введённую информацию исключительно в двоичном коде в форме нуля и единицы. В итоге получается, что абсолютно любой символ алфавита может быть успешно закодирован при помощи соответствующего подбора этих двух цифровых символов. Самая маленькая последовательность, применяемая при обозначении какой-либо цифры, буквы или другого знака, состоит из двух элементов.

Информационная масса отдельно взятого символа обычно изображается в форме информационной стандартной измерительной единицы, которая называется «бит». Восемь битов становятся равны одному байту.

Отображение символов в двоичном коде

Алфавитная мощность может быть использована на практике только при наличии двоичного кода. В качестве примера можно использовать упрощённый алфавит, состоящий всего из четырёх символов. В этом случае разрядность их и информационное представление описываются следующим образом:

  • 1 — 00;
  • 2 — 01;
  • 3 — 10;
  • 4 — 11.

Алфавит в двоичном коде

Из этого списка можно сделать вывод о том, что если алфавитная мощность равняется 4, то масса отдельного единичного символа будет составлять 2 бита. Если же есть алфавит, состоящий из 8 символов, то при подборе двоичного трёхзначного кода для него комбинационное количество будет следующим:

  • 1 — 000;
  • 2 — 001;
  • 3 — 010;
  • 4 — 011;
  • 5 — 100;
  • 6 — 101;
  • 7 — 110;
  • 8 — 111.

Иными словами, если алфавитная мощность равна 8, то вес отдельно взятого символа для двоичного трёхзначного кода составит 3 бита.

Вычисление мощности алфавита

Численность знаков в коде и мощность алфавита всегда выражают определённую зависимость. Для того чтобы определить информационный объём, который заключается в сообщении, прибегают к специальному способу измерения, которое выражается в формуле мощности алфавита: N = 2 в n -ной степени.

Вычисление мощности алфавита

Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад. Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём). n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.

Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.

При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.

Существует также и клавиатурный язык, куда входят не только буквы, но и дополнительные знаки. Так, в русском языке есть ещё 10 цифр и 11 символов, а также пробел и пара скобок. Их мощность прибавляется к аналогичному буквенному показателю, и на выходе получается N = 33+10+11+1+2=57. В некоторых случаях букву «ё» не выделяют в качестве отдельного самостоятельного символа, и в таком случае полная мощность русского алфавита становится равна 56.

Определение информационного объёма в тексте

Почти всегда при наборе текста на компьютерах и других электронных устройствах приходится сталкиваться с написанием различных символов. К ним следует отнести:

  • заглавные и жирные буквы;
  • курсив;
  • скобки;
  • знаки препинания;
  • вычислительные операции и прочее.

По всем расчётам получается, что мощность компьютерного алфавита составляет 256 различных символов и вариантов. В соответствии с формулой Хартли, N = 256, а i — масса любого из значков в клавиатурном алфавите соответствует одному байту, или восьми битам.

Набор текста на компьютерах

Размер любой напечатанной фразы может быть вычислен по формуле V=K ⋅ log2N. В этом случае N обозначает количество всех символов в алфавите, а K — это численность знаков непосредственно в напечатанной фразе. Так, например, имеется произвольный текст объёмом в 25 листов. На каждом из них расположено по 45 строчек текста, содержащих по 58 символов.

Исходя из этого, на любой отдельной странице будет 45*58 = 2610 байт информации. В целом же по всему тексту этот объём будет равен 2610*25 = 65250 байт. Для обозначения мощности алфавита в информатике общепринятым вариантом является буква N из формулы Хартли. Именно ее чаще всего указывают в большинстве учебников и профессиональной литературе.

В кодовой таблице ASCII используют восьмибитную кодировку текстовых сообщений. Она позволяет полностью вместить основной набор символов кириллического и латинского алфавитов как в строчном, так и в прописном вариантах. Также с её помощью можно отобразить знаки препинания, цифры и прочие базовые знаки. Часто пользователям приходится иметь дело с более крупными объёмами, состоящими из триллионов байтов.

Для удобства их всегда переводят в увеличенные величины — кило-, мега-, гигабайты и прочее. Для их упрощённого обозначения используются специальные сокращения: Кб, Мб, Гб и так далее. 1 Кб равняется 1024 байтам (2 байта в десятой степени), 1 Мб составляет 1024 Кб (2 Кб в десятой степени) и так далее. Исходя из этого, 65250 байт будут составлять 63,72 килобайта.

Поскольку один отдельный символ состоит из 8 битов, то устанавливать их кодировку целиком не представляется возможным. Вместо этого предпочтительнее образовать кодировку трёхбитовых комбинаций. Расчёт этого действия проводится по формуле Хартли, где n-ная степень будет равняться трём. В результате получается N, равная 8.

При определении мощности чаще всего используют алфавитный подход. Он говорит о том, что объём информации, заложенной в тексте, зависит исключительно от мощности самого алфавита и размера сообщения (то есть количества символов, содержащихся в нём). Этот показатель не имеет никакой связи со смысловым наполнением для человека.

Примеры расчёта мощности

Как определить информационный объём

От пользователей или обучающихся в задачах часто требуют научиться определять информационный объём какого-либо сообщения, приняв информационный вес символа за один байт. Так, в отрывке из поэмы Н. Н. Некрасова «Крестьянские дети»:

«Однажды, в студеную зимнюю пору,

Я из лесу вышел; был сильный мороз»

будет 67 символов вместе с пробелами, то есть, в соответствии с условиями задания, 67 байт. Их количество умножают на 8 (количество битов в байте), и на выходе получается 536 битов.

Таким образом, зная в теории суть мощности, можно без проблем определять информационный объем различных сообщений.

Понравилась статья? Поделить с друзьями:
  • Как найти яндекс на телевизоре самсунг смарт
  • Как найти большую сторону прямой трапеции
  • Расслоился крем чиз на сливках как исправить
  • Как исправить осанку пожилому человеку
  • Как найти частоту события по графику