Как найти информационный объем текста информатика

1. Найди информационный объём следующего сообщения, если известно, что один символ кодируется одним байтом.

Кто владеет информацией, тот владеет миром.

Решение: посчитаем количество символов в сообщении, будем учитывать буквы, знаки препинания и пробелы.

Всего (43) символа. Каждый символ кодируется (1) байтом.

(I = К · i), (43 · 1) байт (= 43) байта.

Ответ: (43) байта.

2. Найди информационный объём слова из (12) символов в кодировке Unicode (каждый символ кодируется двумя байтами). Ответ дайте в битах.

Решение.

Мы знаем из условия задачи, что каждый символ кодируется двумя байтами. Найдём сколько это бит.

(2) байта (·  8 = 16) бит; 

Слово состоит из (12) символов, поэтому

(16) бит (· 12) символов (= 192) бита.

Ответ: (192) бита.

3. Найди информационный вес книги, которая состоит из (700) страниц, на каждой странице (70) строк и в каждой строке (95) символов . Мощность алфавита — (256) символов. Ответ дать в Мб.

Решение: если мощность алфавита (256) символов, то информационный объём одного символа (8) бит.

Найдём количество символов в книге: (700·70·95 = 4655000) символов.

Информационный вес сообщения: (4655000·8=37240000) бит.

Ответ нужно дать в Мб, поэтому переведём биты в Мб

(37240000:8:1024:1024 = 4,44) Мб

Ответ: (4,44) Мб.

1.     Информационный объём текстового
сообщения

Расчёт
информационного объёма текстового сообщения (количества информации,
содержащейся в информационном сообщении) основан на подсчёте количества
символов
 в этом сообщении, включая пробелы, и на определении
информационного веса одного символа, который зависит от кодировки, используемой
при передаче и хранении данного сообщения.

Для расчёта
информационного объёма текстового сообщения используется формула 

I=K*i, где

I  – это информационный объём текстового сообщения,
измеряющийся в байтах, килобайтах, мегабайтах; 

K  –  количество символов в
сообщении

i  –  информационный вес одного символа, который
измеряется в битах на один символ.

Информационный
объём одного символа связан с количеством символов в алфавите формулой

N=2i, где

Nэто количество символов в алфавите (мощность
алфавита),

iинформационный
вес одного символа
в битах на один символ.

2.     Информационный объём растрового
графического изображения

Расчёт
информационного объёма растрового графического изображения (количества
информации, содержащейся в графическом изображении) основан на подсчёте количества
пикселей
 в этом изображении и на определении глубины
цвета
 (информационного веса одного пикселя).

Для расчёта
информационного объёма растрового графического изображения используется
формула 

I=K*i, где

I  – это информационный объём растрового графического
изображени
я, измеряющийся в байтах, килобайтах, мегабайтах; 

K количество пикселей (точек) в
изображении
, определяющееся разрешающей способностью носителя информации
(экрана монитора, сканера, принтера); 

i глубина цвета, которая
измеряется в битах на один пиксель.

         Глубина цвета связана с
количеством отображаемых цветов формулой 

N=2i, где

N – это количество цветов в палитре

глубина цвета в битах на
один пиксель.

Информатика

7 класс

Урок № 6

Единицы измерения информации

Перечень вопросов, рассматриваемых в теме:

  • Алфавитный подход к измерению информации.
  • Наименьшая единица измерения информации.
  • Информационный вес одного символа алфавита и информационный объём всего сообщения.
  • Единицы измерения информации.
  • Задачи по теме урока.

Тезаурус:

Каждый символ информационного сообщения несёт фиксированное количество информации.

Единицей измерения количества информации является бит – это наименьшаяединица.

1 байт = 8 бит

1 Кб (килобайт) = 1024 байта= 210байтов

1 Мб (мегабайт) = 1024 Кб = 210Кб

1 Гб (гигабайт) = 1024 Мб = 210 Мб

1 Тб (терабайт) =1024 Гб = 210 Гб

Формулы, которые используются при решении типовых задач:

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2i.

Информационный объём сообщения определяется по формуле:

I = К · i,

I – объём информации в сообщении;

К – количество символов в сообщении;

i – информационный вес одного символа.

Основная литература:

  1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Дополнительная литература:

  1. Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
  2. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  3. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  4. Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.

Теоретический материал для самостоятельного изучения.

Любое сообщение несёт некоторое количество информации. Как же его измерить?

Одним из способов измерения информации является алфавитный подход, который говорит о том, что каждый символ любого сообщения имеет определённый информационный вес, то есть несёт фиксированное количество информации.

Сегодня на уроке мы узнаем, чему равен информационный вес одного символа и научимся определять информационный объём сообщения.

Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.

Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.

Алфавит любого понятного нам языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита связана с разрядностью двоичного кода соотношением: N = 2i.

Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.

Рассмотрим пример:

Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.

Составим краткую запись условия задачи и решим её:

Дано:

N=16, i = ?

Решение:

N = 2i

16 = 2i, 24 = 2i, т. е. i = 4

Ответ: i = 4 бита.

Информационный вес одного символа этого алфавита составляет 4 бита.

Сообщение состоит из множества символов, каждый из которых имеет свой информационный вес. Поэтому, чтобы вычислить объём информации всего сообщения, нужно количество символов, имеющихся в сообщении, умножить на информационный вес одного символа.

Математически это произведение записывается так: I = К · i.

Например: сообщение, записанное буквами 32-символьного алфавита, содержит 180 символов. Какое количество информации оно несёт?

Дано:

N = 32,

K = 180,

I= ?

Решение:

I = К · i,

N = 2i

32 = 2i, 25 = 2 i, т.о. i = 5,

I = 180 · 5 = 900 бит.

Ответ: I = 900 бит.

Итак, информационный вес всего сообщения равен 900 бит.

В алфавитном подходе не учитывается содержание самого сообщения. Чтобы вычислить объём содержания в сообщении, нужно знать количество символов в сообщении, информационный вес одного символа и мощность алфавита. То есть, чтобы определить информационный вес сообщения: «сегодня хорошая погода», нужно сосчитать количество символов в этом сообщении и умножить это число на восемь.

I = 23 · 8 = 184 бита.

Значит, сообщение весит 184 бита.

Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.

Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.

1 байт = 8 бит

1 Кб (килобайт) = 1024 байта= 210байтов

1 Мб (мегабайт) = 1024 Кб = 210Кб

1 Гб (гигабайт) = 1024 Мб = 210 Мб

1 Тб (терабайт) =1024 Гб = 210 Гб

Итак, сегодня мы узнали, что собой представляет алфавитный подход к измерению информации, выяснили, в каких единицах измеряется информация и научились определять информационный вес одного символа и информационный объём сообщения.

Материал для углубленного изучения темы.

Как текстовая информация выглядит в памяти компьютера.

Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.

Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.

В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:

01100110 01101001 01101100 01100101.

А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:

01100100 01101001 01110011 01101011?

В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.

Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.

Сейчас используют целых пять систем кодировок русского алфавита (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO). Из-за количества систем кодировок и отсутствия одного стандарта, очень часто возникают недоразумения с переносом русского текста в компьютерный его вид. Поэтому, всегда нужно уточнять, какая система кодирования установлена на компьютере.

Разбор решения заданий тренировочного модуля

№1. Определите информационный вес символа в сообщении, если мощность алфавита равна 32?

Варианты ответов:

3

5

7

9

Решение:

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2i.

32 = 2i, 32 – это 25, следовательно, i =5 битов.

Ответ: 5 битов.

№2. Выразите в килобайтах 216 байтов.

Решение:

216 можно представить как 26 · 210.

26 = 64, а 210 байт – это 1 Кб. Значит, 64 · 1 = 64 Кб.

Ответ: 64 Кб.

№3. Тип задания: выделение цветом

8х = 32 Кб, найдите х.

Варианты ответов:

3

4

5

6

Решение:

8 можно представить как 23. А 32 Кб переведём в биты.

Получаем 2=32 · 1024 ·8.

Или 2 = 25 · 210 · 23.

2 = 218.

3х = 18, значит, х=6.

Ответ: 6.

Вопросы урока:

·                  
кодовая
таблица;

·                  
восьмиразрядный
код;

·                  
информационный
объем текста.

Ежедневно каждый человек сталкивается с разными видами
информации. Увидев важную информацию, можно записать её в компьютер, чтобы
затем воспользоваться ей. В компьютер можно поместить фотографию своего друга
или видеосъёмку о том, как вы провели каникулы. Но ввести в компьютер вкус
мороженого или мягкость пледа никак нельзя.

Компьютер
— это электронная машина, которая работает с сигналами. То есть он работать
только информацией, которую можно превратить в сигналы. Если бы люди умели
превращать в сигналы вкус или запах, то компьютер мог бы работать и с такой
информацией.

Как вы уже знаете, вся информация, независимо от того,
какая она графическая, видео или звуковая, представляется в компьютере с
помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести
в сигналы.

Более 60% информации, представленной в компьютере,
является текстовой информацией. В компьютерном алфавите 256 символов. Сюда
входят заглавные и прописные буквы латинского и русского алфавитов, знаки
препинания, печатные и непечатные символы, а также комбинации клавиш.  человек
различает текст по начертанию символов.

А вот компьютер различает символы, которые вводят в
компьютер, по их двоичному коду. Вы нажимаете на клавиатуре символьную клавишу,
в компьютер мгновенно поступает определённая последовательность электрических
импульсов разной силы, которую можно представить в виде цепочки из восьми нулей
и единиц (двоичного кода).

Мы уже говорили о том, что разрядность двоичного кода i
и количество возможных кодовых комбинаций N связаны соотношением:

Восьмиразрядный двоичный код позволяет получить 256
различных кодовых комбинаций, то есть:

С помощью 256 кодовых комбинаций можно закодировать
все символы, расположенные на клавиатуре компьютера, — строчные и прописные русские
и латинские буквы, цифры, знаки препинания, знаки арифметических операций,
скобки и т. д., а также ряд управляющих символов, без которых невозможно создание
текстового документа (удаление предыдущего символа, переход на новую строку строки,
пробел и др.).

Для создания 256 комбинаций необходимо 8 ячеек,
содержащих 1 или 0. Поэтому каждому символу компьютерного алфавита в памяти
компьютера отводится регистр – 8 ячеек.

Чтобы информация на всех компьютерах читалась
одинаково, были созданы различные таблицы кодов. В СССР – это КОИ7 и КОИ8, в
Америке –ASCII. Для кодирования информации в Windows используют таблицу ANSI.

С помощью кодовых таблиц устанавливается соответствие
между изображениями и кодами символов.

Кодовая таблица содержит коды для 256 различных
символов, пронумерованных от 0 до 255. Первые 128 кодов во всех кодовых таблицах
соответствуют одним и тем же символам:

·                  
коды
с номерами от 0 до 32 соответствуют управляющим символам;

·                  
коды
с номерами от 33 до 127 соответствуют изображаемым символам — латинским буквам,
знакам препинания, цифрам, знакам арифметических операций и т. д.

·                  
Коды
с номерами от 128 до 255 используются для кодирования букв национального
алфавита, символов национальной валюты и т. п.

Поэтому в кодовых таблицах для разных языков одному и
тому же коду соответствуют разные символы. Более того, для многих языков существует
несколько вариантов кодовых таблиц. Так для русского языка их более десятка.

Например, последовательности двоичных кодов:

в кодировке Windows будет соответствовать слово «Урок»,
а в кодировке КОИ-8 — бессмысленный набор символов.

Естественно, пользователь не будет каждый раз
перекодировать текстовые документы, это делают специальные программы-конверторы,
встроенные в операционную систему и приложения.

Однако, восьмиразрядные кодировки обладают одним
серьёзным ограничением: их количество различных кодов символов не хватает, для
того чтобы можно было одновременно пользоваться более чем двумя языками. Для
того чтобы на компьютере можно было устанавливать больше языков был разработан
новый стандарт кодирования символов, получивший название Юникод.

Юнико́д или Унико́д (англ. Unicode) —
стандарт кодирования символов, позволяющий представить знаки практически всех
письменных языков.

Этот стандарт был предложен в 1991 году некоммерческой
организацией «Консорциум Юникода».

С помощью этого стандарта можно закодировать очень
большое число символов из разных письменностей: в документах Unicode могут
соседствовать китайские иероглифы, математические символы, буквы греческого
алфавита, латиницы и кириллицы, при этом становится ненужным переключение
кодовых страниц.

Универсальная система кодирования (Юникод)
представляет собой набор графических символов и способ их кодирования для
компьютерной обработки текстовых данных.

В Юникод каждый символ кодируется шестнадцатиразрядным
двоичным кодом. Такое количество разрядов позволяет закодировать

 различных символов.

С каждым годом Юникод получает всё более широкое
распространение.

Вам известно, что информационный объём сообщения

В зависимости от разрядности используемой кодировки
информационный вес символа текста, создаваемого на компьютере, может быть
равен:

•        8 битов или 1 байт — если используется восьмиразрядная
кодировка;

•        16 битов или 2 байта — если используется шестнадцатиразрядная
кодировка.

Информационным объёмом фрагмента текста будем называть
количество битов, байтов или производных единиц (килобайтов, мегабайтов и т. д.),
необходимых для записи этого фрагмента заранее оговорённым способом двоичного
кодирования.

Перейдём к практической части урока.

Давайте практически найдём информационный объем
текста.

Итак, Книга содержит 150 страниц. На каждой странице —
40 строк. В каждой строке 60 символов (включая пробелы). Нужно найти
информационный объем текста, если используется восьмиразрядная кодировка.

Рассмотрим следующую задачу

Информационный объем текста, подготовленного с помощью
компьютера, равен 3,5 Мегабайт. Нужно найти сколько символов содержит этот
текст, если используется восьмиразрядная кодировка.

Рассмотрим следующую задачу

Информационное сообщение на русском языке,
первоначально записанное в восьми — битном коде Windows, было перекодировано в шестнадцати
— битную кодировку Unicode. В результате информационный объём сообщения стал
равен 2 Мегабайта. Нужно найдите количество символов в сообщении.

Следующая задача.

Средняя скорость передачи данных по некоторому каналу
связи равна 29 Килобит в секунду. Сколько секунд потребуется для передачи по
этому каналу 50 страниц текста, если считать, что один символ кодируется одним
байтом и на каждой странице в среднем 96 символов?

И последняя задача.

Пользователь компьютера, хорошо владеющий навыками
ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность
алфавита, используемого в компьютере равна 256. Какое количество информации в
байтах может ввести пользователь в компьютер за 1 минуту.

Пришло время подвести итоги урока.

Текст состоит из символов
— букв, цифр, знаков препинания и т. д., которые человек различает по
начертанию. Компьютер различает вводимые символы по их двоичному коду.

Соответствие между изображениями и кодами символов
устанавливается с помощью кодовых таблиц.

В зависимости от разрядности используемой кодировки информационный
вес символа текста
, создаваемого на компьютере, может

быть равен:

• 8 бит (1 байт) — если используется восьмиразрядная
кодировка;

• или 16 бит (2 байта) — если используется шестнадцатиразрядная
кодировка.

Информационный объём фрагмента текста
— это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи
фрагмента оговорённым способом кодирования.

Задачи на определение информационного объема текста

Проверяется умение оценивать количественные параметры информационных объектов.

Теоретический материал:

N = 2i , где N – мощность алфавита (количество символов в используемом
алфавите),

i – информационный объем одного символа (информационный
вес символа), бит

I = K*i, где I – информационный объем текстового документа (файла),

K – количество символов в тексте

Задача 1.

Считаем количество символов в заданном тексте (перед и после тире – пробел, после знаков препинания, кроме последнего – пробел, пробел – это тоже символ). В результате получаем – 52 символа в тексте.

Дано:

i = 16 бит

K = 52

I — ?

Решение:

I = K*i

I = 52*16бит = 832бит (такой ответ есть — 2)

Ответ: 2

Задача 2.

Дано:

K = 16*35*64 – количество символов в статье

i = 8 бит

I — ?

Решение: Чтобы перевести ответ в Кбайты нужно разделить результат на 8 и на 1024 (8=23, 1024=210)

I=16*35*64*8 бит==35Кбайт Ответ: 4

Задача 3.

Пусть x – это количество строк на каждой странице, тогда K=10*x*64 – количество символов в тексте рассказа.

Дано:

I = 15 Кбайт

K =10*x*64

i = 2 байта

x — ?

Решение:

Переведем информационный объем текста из Кбайт в байты.

I = 15 Кбайт = 15*1024 байт (не перемножаем)

Подставим все данные в формулу для измерения количества информации в тексте.

I = K*i

15*1024 = 10*x*64*2

Выразим из полученного выражения x

x = – количество строк на каждой странице – 4

Ответ: 4

Задачи для самостоятельного решения:

Задача 1.

Задача 2.

Задача 3.

Задача 4.

Задача 5.

Задача 6.

Задача 7.

Задачи взяты с сайта fipi.ru из открытого банка заданий (с.1-7)

Понравилась статья? Поделить с друзьями:
  • Msvcr72 dll что это за ошибка как исправить
  • Как составить акт инвентаризации материальных ценностей образец
  • Как найти электронный дневник своего ребенка что
  • Как найти массовую долю вещества калькулятор
  • 800736b3 ошибка обновления windows 7 как исправить