Как составить статистику в графике

Содержание курса лекций «Статистика»

Графический метод в статистике

Графический метод в статистике

В результате сводки и дальнейшей обработки данных отчетности, различного рода обследований, переписей, наблюдений и т.п. экономист получает большое количество различных статистических показателей, которые он располагает в виде таблиц. Применение табличного метода значительно облегчает ориентацию в материале. Однако из этого не следует, что можно ограничиться одними таблицами. Для того чтобы сделать дальнейший шаг в понимании материала, надо от табличного метода перейти, к графическому.


График в статистике – условное изображение статистических данных в виде различных геометрических образов: точек, линий, фигур и т.п.  Главное достоинство графиков ‑ наглядность.


 Для чего используются в статистике графики?

Во-первых, в целях широкой популяризации данных и для облегчения их восприятия неспециалистами. Поэтому в различного рода докладах, речах и сообщениях представление статистических данных часто осуществляется при помощи графиков. Графики облегчают ознакомление масс со статистическими данными, оживляют таблицу, делают ее более доступной.


Во-вторых, графики широко ис­пользуются для обобщения и анализа статистических данных. Они находят большое применение в исследовательской работе. Именно при помощи графиков легче уяснить закономерности развития, распределения и размещения явлений. При помощи графиков в ряде случаев можно сделать выводы, которые на базе табличного метода были бы затруднительными.


В-третьих, надо еще указать и на контрольное значение графиков. Под этим следует понимать тот факт, что во многих случаях различного рода ошибки и неточности выявляются при применении графиков, т.е. они иногда являются контролером точности расчётов и вычислений.


В настоящее время графики прочно вошли в практику экономического анализа в связи с внедрением в статистическую работу новых математических методов и современной вычислительной техники и информационных технологий, с использованием пакетов прикладных программ компьютерной графики.

Наиболее распространёнными пакетами прикладных программ являются: «Excel», «Stat Graff», «Super call», «Hazard graphics» и др. Эти программы облегчают задачу исследователя в практическом применении графиков, так как с помощью дисплеев можно демонстрировать графики на световом экране, при необходимости оперативно изменяя в них одни данные, вводя другие и т. д. Такого рода графики в принципе могут заменить громоздкие таблицы компактными изображениями.


Графики различаются по своему виду, и задача состоит в том, чтобы найти наиболее подходящий график. Нужно научиться правильно пользоваться орудием графического метода при изображении статистических данных. Кроме этого, график надо уметь строить, понимать принцип его построения. В противном случае можно выбрать правильный график, но сделать его таким, что он исказит действительную картину.



Общие правила  построения графиков,  классификация

При построении графика важно найти такие способы изображения, которые наилучшим образом отвечают содержанию и логической природе изображаемых показателей.

В графике, кроме заголовка, обязательно даются словесные пояснения условных знаков и смысла отдельных элементов графического образа. Сюда относятся названия и цифры масштабов, названия ломаных линий, цифры, характеризующие величины отдельных частей графика, ссылки на источники и т.д.



Классификация статистических графиков

по : характеру графического образа, способу построения и назначению (содержанию)

По способу построения графики можно разделить на диаграммы и статистические карты  представлены на (рис. 7.1).

Рисунок 7.1 Классификация статистических графиков по способу построения и содержанию изображаемых данных

Различные виды диаграмм применяются для сравнения одноименных статистиче­ских данных, характеризующих разные территории или объекты. Наиболее распространённым видом таких диаграмм являются столбиковые диаграммы.


Столбиковые диаграммы представляют собой график, в котором различные величины представлены расположенными в высоту прямоугольниками. Столбиковые диаграммы применяются для сравнения некоторых объектов во времени. Масштабная шкала должна начинаться с нуля, быть непрерывной и на ней записы­ваются лишь круглые или округленные значения. Столбики должны быть даны на некотором, одинаковом для всех расстоянии или вплотную друг к другу. Ширина столбиков берется произвольно. На шкале должна быть указана единица измерения. При выборе масштаба надо рассчитать так, чтобы максимальное число было представлено на графике.

Примеры построения графиков и диаграмм

Пример 1 . Требуется изобразить с помощью столбиковой диаграммы данные о тру­доустройстве граждан органами государственной службы занятости региона (цифры условные): в 2007 г. трудоустроено 2822 чел.; в 2006 г. – 2398 чел.; в 2005 г. – 2406 чел.; в 2004 г. – 2218 чел. Примем масштаб: 500 чел. Наглядность данной диаграммы достигается сравнением высоты столбиков (рис. 7.2).

Рис. 7.2 Динамика трудоустройства граждан органами государственной службы занятости в регионе за 2004-2007 гг.


Если прямоугольники, изображающие показатели, расположить не по вертикали, а по горизонтали, то диаграмма получит название ленточной. В качестве примера приведем полосовую диаграмму сравнения, характеризующую данные о количестве сотрудников на предприятии N за 2009 г. (рис. 7.3, табл. 7.1,)

Рис.7.3 Динамика количества сотрудников на предприятии N за 4 квартала 2018 г.


Таблица 7.1 ‑ Данные о количестве сотрудников на предприятии N за 2018 г. (цифры условные)

Квартал

1

2 3 4
Количество работников , чел 2040 2000 950

960


Вторую большую группу показательных графиков составляют структурные диаграммы.

Структурные диаграммы – диаграммы, в которых отдельные статистические совокупности сопоставляются по их структуре, характеризующейся соотношением разных параметров совокупности или ее отдельных частей.

Пример. Рассмотрим построение секторной диаграммы по данным табл. 5.4 .

Таблица 7.2 ‑ Структура иностранных инвестиций в РФ в 2018 г

Тип инвестиций

прямые портфельные прочие
Доля инвестиций, в % 20 2

78

Рис. 7.4 Удельный вес иностранных инвестиций в РФ за 2018 г. (цифры условные)


Секторные диаграммы выглядят убедительно при существенных различиях сравниваемых структур, а при небольших различиях они могут быть не достаточно выразительны.


Для изображения и внесения суждений о развитии явления во времени строится диаграммы динамики. В рядах динамики используются для наглядного изображения явлений многие диаграммы: столбиковые, ленточные, квадратные, круговые, линейные, радиальные и другие. Выбор вида диаграмм зависит в основном от особенностей исходных данных, от цели исследования. Например, если имеется ряд динамики с неравноотстоящими уровнями во времени (1913, 1940, 1950, 1980, 2000, 2005, 2015, 2018 гг), то часто для наглядности используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не годны для изображения большого числа уровней, так как громоздки, и если число уровней в ряду динамики велико, то целесообразно применять линейные диаграммы, которые воспроизводят непрерывность процесса развития в виде непрерывной ломаной линии.

Для построения линейных диаграмм используют систему прямоугольных координат. Обычно по оси абсцисс откладывается время (годы, месяца и т.д.), а по оси ординат наносят масштабы для отображения явлений или процессов. Особое внимание следует обратить на масштаб осей координат, так как от этого зависит общий вид графика. Обеспечение равновесия, пропорциональности между осями координат необходимо в диаграмме, так как нарушение равновесия дает неправильное изображение развития явления. Если масштаб для шкалы на оси абсцисс очень растянут по сравнению с масштабом на оси ординат, то колебание в динамике явлений мало выделяются, и наоборот, преувеличение масштаба по оси ординат по сравнению с масштабом на оси абсцисс дает резкие колебания. Если в ряду динамики данные за некоторые года отсутствуют, это должно быть учтено при построении графика. Равным периодом времени и размером уровня должны соответствовать равные отрезки масштабной шкалы.

Пример. Рассмотрим построение линейной диаграммы на основании следующих данных:

Таблица 7.3 ‑ Динамика валового сбора кормовых в регионе за 1995-2004 гг.

Год 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Валовой сбор,              млн. тонн 237 179 189 158 186 192 172 190 210 211

Изображение динамики валового сбора кормовых культур на координатной сетке с неразрывной шкалой значений, начинающихся с нуля, вряд ли целесообразно, так как 2/3 поля диаграммы остается неиспользованным и ничего не дает для выразительности изображения. Поэтому в данных условиях рекомендуется строить шкалу без вертикального нуля, то есть шкала значений разрывается недалеко от нулевой линии и на диаграмму попадает лишь часть возможного поля графика. Это не приводит к искажениям в изображении динамики явления и процесс его изменения рисуется диаграммой более четко (Рис. 7.5).

Рис. 7.5 Динамика валового сбора кормовых культур в регионе за 1995-2004 гг

Контрольные задания

По данным статистических сборников о численности населения, динамики производства отдельных видов продукции, экспорта, импорта товаров и др. показателям за последние 5-10 лет постройте диаграммы и графики.

Содержание курса лекций «Статистика»

Современную науку
невозможно представить себе без
применения графических методов. Графики
прочно вошли в практическую работу
экономистов, статистиков и работников
учета. Они помогают описанию, а затем и
анализу данных. С их помощью легко
выявить и наглядно представить
закономерности, которые часто трудно
бывает уловить в сложных статистических
таблицах. В ряде случаев они являются
незаменимым средством обобщения
статистических данных, подведения
итогов сложных исследований и выявления
связи между явлениями. Поэтому так
необходимо уметь строить и читать
статистические графики.

Статистический
график —

условное изображение числовых величин
и их соотношений в виде различных
геометрических образов — точек, линий,
плоских фигур и т.п. Использование
графиков позволяет придать стат.
показателям наглядность, и выразительность,
облегчить их восприятие, а во многих
случаях помогает уяснить сущность
изучаемого явления, его закономерности
и особенности, увидеть тенденции его
развития, взаимосвязь характеризующих
его показателей.

Значение
графического метода
при
обобщении и анализе статистических
данных заключается в установлении
закономерностей развития
социально-экономических явлений,
выявлении взаимосвязей признаков,
анализе тенденций изменения явления
во времени, оценке выполнения плана.
Графики также используются для
характеристики структуры явлений и их
пространственных сопоставлений.
Следовательно, графики являются
незаменимым средством для научного
обобщения статистической информации.

Каждый график
состоит из графического образа и
вспомогательных элементов.
Графический
образ
– это
символические знаки, с помощью которых
изображаются статистические данные:
линии, точки, фигуры. Эти знаки образуют
основу графика.

Вспомогательными
элементами

графика являются:

1) поле
графика —
то
площадь, на которой изображены графические
образы. Это географические карты, листы
бумаги, план местности и т.п. Поле графика
характеризуется его форматом, т.е.
размером и пропорциями (соотношением
сторон);

2) пространственные
ориентиры
,
определяющие расположение графических
образов в поле графика. Задаются системой
координатных сеток или контурных линий,
которые делят это поле на части. В
большинстве случаев в стат. графиках
применяется система прямоугольных
(декартовых) координат, но нередко
встречаются и круговые графики,
построенные по принципу полярных
координат;

3) масштабные
ориентиры
,
придающие геометрическим знакам
количественную определенность,
определяются системой масштабных шкал
или специальными масштабными знаками.
Масштаб

это мера перевода числовой величины в
графическую. Масштабной шкалой является
линия, на которой в определенном порядке
нанесены штрихи и соответствующие им
числа, расположенные строго под штрихами;

4) экспликация
графика

это словесное описание его содержания,
включает название рисунка, подписи
вдоль масштабных шкал и смысловое
значения каждого знака, применяемого
на данном графике. Без экспликации
график нельзя прочитать и понять.

Название графика
должно кратко и точно раскрывать его
содержание. Пояснительные тексты могут
располагаться в пределах графического
образа или рядом с ним (ярлыки), а также
выноситься за его пределы (ключ).

В современных
условиях широкое распространение
получили пакеты прикладных программ
компьютерной графики значительно
облегчающие задачи исследования при
построении и практическом применении
графиков. Наиболее известными из них
являются: Exel, Statgraf,
STATISTIKA, STADIA,
Supercalс, Harvard
graphicsи др.

Классификация
графиков.

Существует много
видов графических изображений. Их
классификация основана на ряде признаков,
в основе которых:

  • способ
    построения графического образа;

  • геометрические
    знаки, изображающие статистические
    показатели;

  • задачи,
    решаемые с помощью графического
    изображения (цели использования).

По способу
построения
статистические графики
делятся на диаграммы и статистические
карты.

Диаграммы
наиболее распространенный способ
графических изображений. Это графики
количественных отношений. Виды и способы
их построения разнообразны.

Статистические
карты
графики количественного
распределения по конкретной территории.
Они специфичны лишь в том отношении,
что представляют собой условные
изображения статистических данных на
контурной географической карте.

Рис
4.3. Классификация графиков.

Геометрические
знаки
, как было сказано выше,
представляют собой точки, линии или
плоскости, либо геометрические фигуры.
В соответствии с этим различают графики
точечные линейные, плоскостные, объемные
и д.п.

В зависимости
от круга решаемых задач
выделяют
диаграммы сравнения, структурные
диаграммы и диаграммы динамики.

Рассмотрение
начнем с наиболее простых видов
графиков
и в то же время достаточно
широко распространенных в
экономико-статистическом анализе –
линейных диаграмм.
Линейные диаграммыприменяются
для характеристики динамики, т.е. оценки
изменений явлений во времени.

Они строятся в
прямоугольной системе координат. По
оси абсцисс откладывают время (годы,
месяцы и т.д.), по оси ординат – размеры
изображаемых явлений или процессов.
Полученные точки соединяют отрезками
в виде ломаной линии. Каждая точка
соответствует уровню динамического
ряда на определенный момент времени.
На одном графике может быть размещено
несколько диаграмм, что позволяет
сравнивать динамику различных показателей,
либо одного показателя по разным регионам
или странам.

Рис. 4.4. Браки и
разводы в РФ.

Для тех же целей,
а именно анализа динамики
социально-экономических явлений, оценки
выполнения плана и характеристики
вариации в рядах распределений могут
использоваться также столбиковые
диаграммы
. Столбики располагаются
вплотную или раздельно на одинаковом
расстоянии. Они имеют одинаковое
основание, а их высота должна быть
пропорциональна числовым значениям
уровней признака. По высоте столбиков
этой диаграммы определяют соотношение
между уровнями изучаемых показателей.
Пример такой диаграммы приведен на рис.
4.5.

Рис.
4.5. Динамика экспорта и импорта в
Российской Федерации в 2000 г.

Столбиковые
диаграммы могут использоваться также
для пространственных сопоставлений:
сравнения по территориям, странам,
фирмам, по различным видам продукции.
Кроме того, для изучения структуры
явлений. Каждая из полос диаграммы в
этом случае будет иметь одинаковую
длину, т.к. в относительных величинах
погасятся различия абсолютных размеров
совокупностей. В то же время структурные
различия проявятся значительно четче.
Примером использования такой диаграммы
является рис. 4.6 Структура величины
прожиточного минимума.
.

На этой диаграмме
разными цветами отображается удельный
вес различных частей исследуемого
показателя, каждой из которых отведен
определенный участок столбца,
соответствующего по высоте 100%. Иногда,
кроме цвета или штриховки приводят
цифровое значение удельного веса каждой
части.

Разновидность
столбиковых диаграмм составляют так
называемые ленточные, илиполосовые,
диаграммы
. Их отличие состоит в том,
что масштабная шкала расположена по
горизонтали сверху или снизу и она
определяет величину полос по длине.
Принцип построения полосовых диаграмм
тот же, что и столбиковых диаграмм.
Например,рис. 4.7 Уровень образования
населения в РФ.

Секторные
диаграммы
характеризуют структуру
социально-экономических явлений. Анализ
структуры проводится на основе
сопоставления различных частей целого
при помощи площадей, образуемых секторами
круга. Для построения этой диаграммы
круг следует разделить на секторы
пропорционально удельному весу частей
в целом. Сумма удельных весов равна
100%, что соответствует общему объему
изучаемого явления. Размер каждого
сектора определяется по величине угла
с учетом того, что 1% соответствует 3,6°.
Для того чтобы секторы были более
наглядны, следует пользоваться штриховкой.
Например, рис. 4.8. структура денежных
доходов населения России в 2002 г.

Иногда для целей
сравнительного анализа по регионам,
странам используют квадратные,
круговые, фигурные диаграммы
(диаграммыфигур-знаков). Диаграммы геометрических
фигур отражают размер изучаемого объекта
в соответствии с размером своей площади.

Для построения
квадратной диаграммы, применяемой
при сравнительном анализе, следует
извлечь квадратные корни из сравниваемых
величин статистических показателей, а
затем построить квадраты со сторонами,
пропорциональными полученным результатам.
Пример рис. 4.9 показывает различие
доходов от услуг связи населению России
за 2000г.

16714
14560 4662

Международная
Городская Почтовая

и междугородняя и сельская
связь

телефонная связь телефонная

связь

Рис. 4.9. Доходы
от услуг связи населению в России за
2000 г., млн. руб.

При построении
круговой диаграммызначения
показателей вначале делят на число π,
т.е. 3,14, а затем из полученных величин
извлекают квадратные корни и строят
круги с радиусами, пропорциональными
полученным результатам.

Диаграммы
фигур-знаков
представляют собой
графические изображения в виде рисунков,
силуэтов, фигур, соответствующих
содержанию статистических данных.
Достоинство такого способа графического
изображения заключается высокой степени
наглядности. Рисунки отличаются друг
от друга размером (соответственно
величине показателя), либо величины
статистических показателей изображаются
на рисунках определенным количеством
одинаковых по размеру и типу фигур.
Например, динамика закупок крупнорогатого
скота символически изображается в виде
рисунков буренок. Рис 5.10.

Рис 4.10.
Динамика
закупок крупного рогатого скота в одном
из регионов РФ в хозяйствах всех
категорий (в весе живого скота)
за
1999-2001 гг.

Для таких диаграмм
необходимы сопроводительные числовые
надписи, так как зрительное сопоставление
таких фигур довольно затруднительно.

Для оценки
географического размещения явлений,
сравнительного анализа по территориям
применяются статистические карты.
Статистические карты включают картограммы
и картодиаграммы.

Картограмма
показывает территориальное распределение
изучаемого признака по отдельным районам
и используется для выявления закономерностей
этого распределения. Картограммы бывают
фоновые и точечные.Фоновые картограммыразной густотой цветовой окраски
характеризуют распределение изучаемого
признака на различных территориях.
Например, данные об урожайности зерновых
по нескольким районам наиболее наглядно
могут быть представлены в виде фоновой
картограммы, когда бледно-желтым цветом
будут раскрашены районы с урожайностью
до 20 ц с 1 га; ярко-желтым цветом —
соответственно с 20 -30 ц с 1 га; и желто-красным
— выше 30 ц с 1 га.

На точечной
картограмме
каждой точке соответствует
одно и то же принятое числовое значение,
например, равное 100 т. Нанося на контур
каждого района соответствующее количество
точек, мы получаем точечную картограмму,
характеризующую распределение изучаемого
признака по районам. Как правило, фоновые
картограммы используются при анализе
статистических показателей в виде
относительных и средних величин, в то
время как точечные — для характеристики
размещения абсолютных величин.

Картодиаграмма
представляет собой сочетание
диаграммы с географической картой. Она
позволяет отразить специфику каждого
района в распределении изучаемого
явления, его структурные особенности.

Глоссарий:
статистическая таблица, остов и макет
таблицы, сказуемое и подлежащее таблицы,
статистический график, экспликация
графика, диаграмма, картограмма,
картодиаграмма.

Контрольные
вопросы.

  1. Что такое
    статистическая таблица?

  2. Что такое подлежащее
    и сказуемое статистической таблицы?
    Как проводится разработка сказуемого
    таблицы.

  3. Назовите основные
    правила составления таблиц.

  4. Что такое
    статистический график?

  5. Что такое графический
    образ?

  6. Как можно
    классифицировать статистические
    графики?

  7. В каких целях
    используются секторные и столбиковые
    диаграммы? Приведите примеры.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

to continue to Google Sites

Not your computer? Use Guest mode to sign in privately. Learn more

4.2. Графическое представление статистических данных

Важное место в современном статистическом анализе социально-экономических явлений и процессов занимает графический метод. Без графиков не обходится ни одно статистическое исследование — они позволяют с наименьшими временными затратами выявить закономерности в развитии явления и его структуру, а также наглядно представить взаимосвязи показателей. Графический образ часто более нагляден и понятен, чем многие страницы текста. Арсенал используемых в статистике графиков обширен. Более того, с появлением новых программных средств он непрерывно увеличивается: на замену плоскостным графикам приходят объемные, матричные, категоризованные графики и пиктографики.

График — это схематичное изображение статистической информации с помощью различных геометрических образов, которыми могут быть линии, точки, плоскостные либо объемные фигуры (круги, прямоугольники и т.д.), символы со многими элементами (звезды, лучи, многоугольники, «лица Чернова», «японские свечи», «ящики с усами» и т.д.).

Любой статистический график содержит графический образ и вспомогательные элементы. Под графическим образом понимают совокупность выбранных для изображения конкретной статистической информации линий, фигур, точек или символов, имеющих определенный формат изображения. Вспомогательные элементы графика — это, во-первых, поле графика (пространство, на котором располагается геометрический образ, при этом длина и ширина поля графика, как правило, имеют между собой определенное соотношение), во-вторых, система координат и масштабные ориентиры (декартовы, полярные координаты, контурные линии или сетки с нанесенной на них масштабной шкалой), и, в-третьих, экспликация графика, которая представляет собой необходимый разъяснительный текст, прилагаемый к графику: его название, подписи масштабных шкал, смысловое содержание применяемых символов и знаков (легенда графика).

Статистические графики можно классифицировать по следующим признакам:

  1. аналитическое предназначение;
  2. способ построения;
  3. символы геометрического образа.

По аналитическому предназначению различают графики сравнения, структуры, динамики, изображения вариационных рядов, графики взаимосвязи показателей.

По способу построения графики делятся на диаграммы и статистические карты.

Согласно используемым символам геометрического образа графики бывают точечные, линейные, фигурные (плоскостные или объемные) и пиктографики.

Для сравнения одноименных показателей, относящихся к различным временным периодам, объектам или территориям, применяют линейные графики и различные виды диаграмм: столбиковую, ленточную, фигурную; а также пиктографики.

У линейного графика по оси абсцисс отмечаются временные периоды, объекты или территории, а по оси ординат — соответствующие им значения рассматриваемого показателя. Например, по данным табл. 4.10 построим линейный график изменения удельного веса убыточных организаций за период 2002-2006 гг. для экономики в целом (рис. 4.1).

Таблица
4.10.
Удельный вес убыточных организаций по отраслям экономики от общего числа организаций, % (данные условные)

Отрасль экономики Год
2002 2003 2004 2005 2006
Всего в экономике, в том числе: 53,2 40,8 39,8 37,9 43,5
промышленность 48,8 39,1 39,7 39,3 45,1
сельское хозяйство 84,4 52,7 50,7 46,3 55,6
строительство 40,6 37,7 37,2 35,4 38,6
транспорт 53,4 47,9 44,1 40,9 45,6
связь 44,3 28,4 26,1 25,4 35,1
торговля и общественное питание 45,3 32,7 31,4 27,7 31,2

Линейный график

Рис.
4.1.
Линейный график

Столбиковая диаграмма несет тот же аналитический смысл, что и линейный график. При ее построении на оси X располагаются элементы, подлежащие сравнению, которыми могут быть временные периоды, территории, либо объекты. Они находятся на одинаковом расстоянии друг от друга. Затем рисуются прямоугольники (столбики): сторона, являющаяся шириной, одинакова для всех сравниваемых элементов и располагается на оси X, высота прямоугольников откладывается по оси Y пропорционально значению сравниваемого показателя. Таким образом, ось Y должна иметь определенную масштабную шкалу, обязательно начинающуюся с нуля. Так, используя данные табл. 4.10, построим столбиковую диаграмму изменения удельного веса убыточных предприятий и организаций по всей экономике в целом (рис. 4.2).

Прямоугольники столбиковой диаграммы могут располагаться и вплотную друг к другу — расстояние между ними определяется произвольно, масштаб имеет лишь высота прямоугольников.

Столбиковая диаграмма

Рис.
4.2.
Столбиковая диаграмма

Столбиковые диаграммы могут одновременно демонстрировать изменение нескольких показателей. Для примера изобразим динамику удельного веса убыточных предприятий и организаций по отраслям экономики за несколько временных периодов (рис. 4.3).

Столбиковые диаграммы для нескольких объектов

Рис.
4.3.
Столбиковые диаграммы для нескольких объектов

Для четырех отраслей построим линейный график (рис. 4.4).

Линейные графики для нескольких объектов

Рис.
4.4.
Линейные графики для нескольких объектов

Ленточная (полосовая) диаграмма строится по тем же правилам, что и столбиковая, но прямоугольники, изображающие размеры показателя, располагаются не вертикально, а горизонтально. Данный вид диаграммы удобно применять в тех случаях, когда сравниваемые показатели могут принимать отрицательные значения. Например, магазин детской одежды «Сашенька» в течение года имел не только прибыль (+), но и нес убытки (рис. 4.5).

Ленточная диаграмма

Рис.
4.5.
Ленточная диаграмма

Для получения диаграмм сравнения могут использоваться и различные геометрические фигуры. Предположим, что количество заключенных договоров личного страхования, заключенных страховой компанией, составляло в 2003 г. 23 тыс., в 2004 г. — 64 тыс. Изобразим эти данные графически, для чего выберем в качестве фигурного знака квадрат. Чтобы найти стороны квадратов нужно извлечь квадратные корни из значений показателей: Выберем масштаб изображения, например, примем 1 см равным 3 тыс. Тогда сторона первого квадрата будет равна (4,8 : 3) 1,6 см; второго (8 : 3) 2,7 см. Итак, получим следующую диаграмму сравнения (рис. 4.6).

Количество договоров личного страхования, заключенных страховой компанией в 2003-2004 гг., тыс.: а - 2003 г.; б - 2004 г.

Рис.
4.6.
Количество договоров личного страхования, заключенных страховой компанией в 2003-2004 гг., тыс.: а — 2003 г.; б — 2004 г.

Вместо квадратов часто используются круги. Тогда изображаемые величины должны быть пропорциональны площади круга. Наглядность данного вида диаграмм тем больше, чем сильнее различаются между собой сравниваемые показатели. Действительно, если различия небольшие, то подобный график теряет свой смысл.

В динамических сравнениях, особенно если приводятся данные по месяцам года и в них присутствуют так называемые сезонные колебания, используются радиальные диаграммы. Для этого вычерчивается круг такого радиуса, чтобы при нанесении на него масштабной шкалы верхнее значение шкалы соответствовало наибольшему значению показателя. Затем весь круг делится на 12 частей (если мы рассматриваем помесячные данные) и проставляются номера либо названия месяцев около каждого радиуса. После этого на них откладываются в принятом масштабе значения показателей соответствующих месяцев, и полученные точки соединяются отрезками — образуется замкнутая ломаная линия. Пример построения радиальной диаграммы приведен на рис. 4.7.

Радиальная диаграмма

Рис.
4.7.
Радиальная диаграмма

Для изображения структуры явления используются прямоугольные или секторные диаграммы.

Продемонстрируем построение круговой секторной диаграммы на данных табл. 4.11.

Таблица
4.11.
Структура инвестиций в основной капитал по видам основных фондов в 2006 г. (данные условные)

Вид основных фондов Удельный вес инвестиций в их общем объеме, %
Жилища 12,8
Здания (кроме жилых) и сооружения 41,9
Машины, оборудование, транспортные средства 38,9
Прочие виды основных фондов 6,4

Для того чтобы построить секторную диаграмму, необходимо определить величину углов секторов: 100% соответствует 360°, тогда 1% равен 3,6°. Пересчитаем наши данные:

  • жилища: 12,8 * 3,6 = 46°;
  • здания (кроме жилых) и сооружения: 41,9 * 3,6 = 151°;
  • машины, оборудование, транспортные средства: 38,9 * 3,6 = 140°;
  • прочие виды основных фондов: 6,4 * 3,6 = 23°.

Начертим круг произвольного радиуса и разделим его на четыре соответствующих сектора (рис. 4.8).

Круговая секторная диаграмма

Рис.
4.8.
Круговая секторная диаграмма

Изобразить графически структуру явления можно также с помощью ленточных (полосовых) диаграмм. В этом случае вычерчивается прямоугольник произвольной длины и ширины. Значение его длины принимается за 100%. Затем прямоугольник делится на части, соответствующие значениям долей тех компонент, из которых состоит явление. Так, по данным табл. 4.10 получим полосовую диаграмму, представленную на рис. 4.9.

Ленточная (полосовая) диаграмма

Рис.
4.9.
Ленточная (полосовая) диаграмма

Для одновременного изображения трех величин, одна из которых является произведением двух других, применяется особый график, называемый знаком Варзара. Поясним процедуру его построения на условном примере.

Знак Варзара имеет вид прямоугольника, длина и ширина которого соответствуют двум множителям произведения, а площадь — значению произведения, т.д. третьей величине. Так, в табл. 4.12 показатель «Капитализация» рассчитан как произведение рыночной стоимости акции на количество акций данного вида:

Таблица
4.12.

Тип акции Количество акций, находящихся в обращении, тыс. шт. Рыночная стоимость акции, ден. ед. Капитализация, тыс. ден. ед.
А 70 18 12 492
Б 23 25 575

Основание прямоугольников примем за показатель количества, а высоту — за цену. Тогда площадь полученных прямоугольников будет изображать капитализацию. При построении знаков Варзара следует помнить, что основание и высота прямоугольников откладываются в своем масштабе независимо друг от друга (рис. 4.10).

Знаки Варзара

Рис.
4.10.
Знаки Варзара

Особое место в графическом анализе финансовой информации занимают биржевые статистические графики.

Для анализа данных фондовых, товарных и фьючерсных рынков чаще всего используют столбиковые биржевые графики (табл. 4.13).

Таблица
4.13.
Котировки и объемы торгов акциями компании А в апреле 2006 г., дол.

Дата торгов Цена открытия Максимальная цена дня Минимальная цена дня Цена закрытия Объем торгов
26 14,3 14,9 14,3 14,7 102 548
27 14,7 15,2 14,6 14,9 112 054
28 14,9 15,5 14,5 15,3 136 250
29 15,3 16,1 14,9 15,1 108 914
30 15,1 15,8 14,7 15,6 103 145

По данным табл. 4.13 построим столбиковый биржевой график (рис. 4.11).

На столбиковом биржевом графике для каждого дня строится вертикальная черта (столбик): начало столбика соответствует значению минимальной в течение дня цены на акцию, вершина — максимальной цене, горизонтальная черта на столбике — цена в момент закрытия торгов.

Столбиковый биржевой график

Рис.
4.11.
Столбиковый биржевой график

Для одновременного изображения цен открытия и закрытия торгов, а также минимального и максимального значений цены служит график, часто называемый в литературе «ящики с усами». Для данных табл. 4.13 он выглядит так, как показано на рис. 4.12.

"Ящики с усами"

Рис.
4.12.
«Ящики с усами»

Здесь, в отличие от графика, приведенного на рис. 4.11, у каждого столбика имеется еще и «ящик» (отсюда и название — «ящики с усами»). Основание белого «ящика» соответствует цене открытия торгов, высота — цене закрытия; черный цвет «ящика» означает, что цена закрытия была ниже цены открытия торгов — в этом случае на графике они меняются местами.

Столбиковый график можно дополнить диаграммами показателя объема торгов. Для данных табл. 4.13 получим графический образ, представленный на рис. 4.13.

Столбиковый биржевой график с диаграммой объемов торгов

Рис.
4.13.
Столбиковый биржевой график с диаграммой объемов торгов

Поскольку график дополняется диаграммами, показывающими объемы торгов, то он имеет две вертикальные масштабные шкалы: слева находится шкала для показателя объема торгов, справа — для котировок акций.

График «ящики с усами» также можно дополнить диаграммами показателя объема торгов (рис. 4.14).

Биржевой график "ящики с усами" с диаграммой объемов торгов

Рис.
4.14.
Биржевой график «ящики с усами» с диаграммой объемов торгов

В современных статистических пакетах прикладных программ для графического представления статистической информации предлагается особый вид графиков — пиктографики.

Пиктографики составляются для каждого наблюдения, они имеют вид графических объектов (определенных символов) со многими элементами. Значения показателей соответствуют свойствам или размерам элементов пиктографика. С изменением значений показателей при переходе от одной единицы наблюдения к другой внешний вид пиктограммы меняется. Таким образом возникает возможность визуально классифицировать наблюдения по однородным группам.

Предположим, что имеется совокупность 10 промышленных предприятий, характеризующихся следующими показателями (табл. 4.14).

Таблица
4.14.
Экономические показатели деятельности промышленных предприятий (данные условные)

Номер предприятия Рентабельность, % Удельный вес рабочих в составе промышленного производственного персонала, % Коэффициент сменности оборудования Удельный вес потерь от брака, % Фондоотдача на 1 руб. фондов Среднегодовая численность промышленного производственного персонала, чел. Среднегодовая стоимость основных производственных фондов, млн. руб. Оборачиваемость нормируемых оборотных средств, дн. Оборачиваемость ненормируемых оборотных средств, дн. Непроизводственные расходы, млн. руб.
1 13,28 0,80 1,14 0,27 1,07 1 257 50,79 80,12 22,46 18,20
2 22,31 0,80 1,85 0,38 2,45 1 687 58,12 80,12 22,37 38,45
3 15,27 0,78 1,14 0,26 1,14 1 588 44,20 80,45 21,74 22,13
4 12,99 0,79 1,33 0,28 1,05 1 696 44,57 68,17 20,11 24,56
5 25,78 0,78 1,74 0,29 2,12 1 804 51,43 70,82 20,37 46,75
6 28,47 0,79 1,90 0,30 2,09 1 512 53,96 73,47 21,38 38,16
7 12,97 0,80 1,16 0,35 1,03 1 499 57,58 76,12 21,52 24,58
8 23,47 0,81 1,86 0,32 2,11 1 403 65,34 78,77 23,58 41,78
9 10,47 0,81 1,17 0,33 0,87 1 451 59,34 81,42 22,47 22,79
10 13,58 0,82 1,23 0,32 0,97 1 327 57,83 84,07 23,17 22,47

Проанализируем имеющуюся информацию графически с помощью пиктографиков.

Пиктографики «лучи» имеют вид «велосипедного колеса», в котором количество «спиц» соответствует количеству переменных. Каждая спица — числовая ось, на которой откладывается значение показателя в своем масштабе независимо от масштаба других показателей, причем шкалы начинаются не с нулевого значения, а с наименьшего в данном числовом массиве. Цель пиктографика — продемонстрировать различия в значениях аналогичных показателей у разных единиц наблюдения.

По данным табл. 4.14 построим пиктографики «лучи» (рис. 4.14а).

Пиктографики "лучи"

Рис.
4.14а.
Пиктографики «лучи»

Как видим, на рис. 4.14а пиктографиков столько, сколько имеется наблюдений. Число лучей каждого пиктографика равно количеству показателей, которые располагаются друг за другом по часовой стрелке, начиная с первого, который находится на верхнем луче, соответствующем 12 часам, если проводить аналогию с часовым механизмом.

Итак, визуальный анализ данных показывает, что сходными по своим экономическим показателям являются предприятия 2 и 8; 5 и 6; 7 и 9.

Преимущество данного способа анализа возрастает с увеличением числа наблюдений, так как при большом их количестве все труднее становится систематизировать полученную информацию, изучая цифры табличным методом.

Другой вид часто применяющихся пиктографиков — «звезды» (рис. 4.14б). Их построение и анализ абсолютно аналогичен пиктографикам «лучи» (у «звезд» лучи не продолжаются за отметками показателей на осях).

Пиктографики "звезды"

Рис.
4.14б.
Пиктографики «звезды»

Отметим, что в каждом конкретном случае выбор «звезд» или «лучей» — сугубо индивидуальный процесс: кому-то удобнее работать со «звездами», чем с «лучами», а кому-то наоборот.

Следующий, наиболее экзотичный, вид пиктографиков — «лица Чернова» (рис. 4.14в). Здесь для каждого наблюдения рисуется отдельное лицо. Черты лица соответствуют значениям показателей: овал лица — показатель первый, размер ушей — показатель второй, длина носа — показатель третий, форма ушей — показатель четвертый, тип улыбки — показатель пятый, угол наклона бровей — показатель шестой и т.д. Конечно, по данному графику нельзя определить конкретные значения показателей — преследуется вовсе не эта цель, но для классификации наблюдений по однородным группам, выявления взаимосвязей между показателями (если скажем, длина носа меняется с изменением овала лица) «лица Чернова» могут быть полезны.

Пиктографики "лица Чернова"

Рис.
4.14в.
Пиктографики «лица Чернова»

Как не врать с помощью статистики: основы визуализации данных

Время на прочтение
6 мин

Количество просмотров 21K

Не раз слышал мнение, что задача аналитиков — показать откровенно «грустные» цифры таким образом, будто всё идет по плану. Возможно, где-то так и происходит, но в геймдеве всё наоборот. Нам надо представить максимально объективные данные, чтобы в проекте принимались правильные решения. И сделать так, чтобы эти данные были поняты.

Часто это сложнее, чем привирать с помощью красивых графиков.

Поэтому я собрал несколько базовых принципов визуализации, которые применяю в работе (список источников в конце). Пригодится, если вы пишете отчеты, готовитесь к презентации или просто хотите донести смысл каких-то цифр. Главное: чтобы сделать хороший график, не нужно быть талантливым художником или виртуозно владеть matplotlib/ggplot2. Поехали.

Почему для хорошего графика достаточно обычного Excel (а иногда карандаша и бумаги)?

Это вытекает из единственной цели визуализации — донести вашу идею. Поэтому сразу: не бывает «красивых» или «правильных» графиков — либо они помогают донести идею, либо нет. И если нет, то каким бы красивым ни был график — он не нужен.

Процесс создания графика, который будет достигать своей цели, можно условно поделить на 4 шага [1]:

Все начинается с идеи. Что вы хотите, чтобы читатели или зрители поняли? Исходя из этого, выбирается тип диаграмм, потом к важным местам привлекается внимание и, убирается все, что мешает донести мысль.

Теперь подробнее по каждому пункту.

Идея

Начнем с формулирования идеи и того, как это влияет на графики. Посмотрите на каноничный пример: табличку «Объем продаж по регионам» с очень простым набором данных (8 цифр, 2 компании) [2].

В таком виде она сложна для восприятия и никакая идея из нее напрямую не следует:

Чтобы показать важные связи проще и нагляднее — нам понадобится диаграмма. И в зависимости от выбранного типа графика на первый план выйдет совершенно разная мысль.

Например, единственное, что мы можем считать при первом взгляде на график выше — то, что структура продаж у двух компаний различна. Чтобы считать любую другую информацию, придется разбираться глубже, а это никак не помогает донести мысль.

Другой график, те же данные:

Здесь, помимо разницы в структуре, мы уже показываем, как у компаний соотносятся доли продаж в разных регионах. Если читать его слева направо (так будет делать большая часть людей), то мысль будет следующей: у компании Б (слева) наименьшая доля продаж на юге, а у компании А (справа) — наибольшая. И наоборот на севере.

Еще график:

Если мы используем гистограмму этого вида, то внимание, в первую очередь, будет привлечено к сравнению компаний между собой: по доле выручки на севере компания Б опережает компанию А, на востоке и западе они конкурируют, а на юге компания Б отстает от компании А.

Одни и те же данные, всего 8 цифр, но в зависимости от подачи, они выражают разные идеи.

Поэтому — сначала формулируем мысль, а потом выбираем подходящий тип диаграммы.

Типы диаграмм

Пройдемся по самым часто встречающимся видам диаграмм (которые вы можете найти в Excel, любом BI или других аналитических инструментах) и посмотрим, для какого типа сравнений (и каких идей) их лучше всего использовать [2].

Pie Chart

Начнем с «любимой» круговой диаграммы и вариациях (кольцевые диаграммы). В классической трактовке ее основная цель — сравнение долей при показе статичной структуры.


Составляющие хорошей игры

Но также есть мнение, что главная цель этой диаграммы — реклама и красивые картинки.

Во многом именно Pie Charts уже который год позволяют бизнес-консультантам продавать 30-страничные презентации за несколько миллионов. Нет? Вот первые картинки по запросам «консалтинг», «аналитика», «BI»:


Pie Charts, они везде

Практически ни одно рекламное изображение не обходится без круговых диаграмм (или их разновидностей). Это уже не столько инструмент, сколько символ.

И для реальной визуализации данных он плохо подходит.

Во-первых, область применения этой диаграммы очень узкая. Статичную структуру нужно показывать не так часто — маленькое количество кейсов. А во-вторых, многие люди плохо считывают доли в круговых диаграммах, особенно, если кто-то делает их объемными (сумасшествие). И в-третьих, такой же тип сравнения можно выразить другими диаграммами и будет только лучше.

Поэтому — лучше забыть о круговых диаграммах. Ну, если вы делаете рекламу или хотите добавить солидности вашей презентации, то вариант не такой уж и плохой.

Bar Chart (horizontal)

Она же — линейчатая диаграмма и служит для позиционного сравнения. Она наглядно показывает, какая из альтернатив лучше, кто какое место занимает и как они соотносятся по рангу.


Позиционное сравнение

Линейчатая диаграмма идеально подходит для рейтингов. И что очень удобно — в легенду легко помещаются длинные названия. В других видах графиков это может мешать.

Line Chart

Следующий тип — классика. Line Chart в русском часто называют просто «графиком».

Он используется для временного сравнения, когда нужно отобразить, как показатель менялся с течением времени, отличалась ли динамика для разных показателей и так далее.


Сравнение динамики показателей

На что обращать внимание при создании Line Chart:

  1. Адекватность временного периода. Иначе диаграмма превратится в нечитаемую кашу.
  2. Количество линий. Больше пяти-семи линий — табу, никто не будет в них разбираться.

    Слева слишком большой временной период, справа — «лапша» из линий
  3. Масштаб. Осторожнее, Line Chart любят те, кто собирается приврать с помощью данных [3].

    Классика лжи — игры с масштабом

    Например, если график слева показать на презентации совета директоров и назвать ретеншеном — проект, наверное, закроют. На самом деле все не так плохо: справа тот же график, но с разумным масштабом, становится ясно, что «падение» показателя — просто флуктуация. В обратную сторону это тоже работает, увеличив масштаб, можно скрыть очевидное ухудшение показателя.

В итоге, Line Chart очень полезный тип диаграмм. Особенно в геймдеве, где необходимо на постоянной основе мониторить показатели, показывать изменения в динамике и следить за развитием проектов.

Area Chart

Следующий тип, Area Chart, служит для показа структуры в динамике. На что здесь нужно обращать внимание? Опять же — если делаем обилие слоев, то график становится нечитаемым. Убирайте лишние слои и оставляйте только самое важное (как это сделать, еще поговорим чуть дальше):

Histogram

Гистограммы — это «универсальный молоток». У этого типа диаграмм множество вариаций, которые могут использоваться в самых разных ситуациях:

  1. временное сравнение;
  2. распределение частот;
  3. сравнение долей (привет круговым диаграммам);
  4. вклад в общую динамику;
  5. сравнение альтернатив и многое другое.

За эту универсальность гистограмма платит ограничением — на ней можно отобразить лишь небольшое количество периодов или сравнений. В противном случае график становится нечитаемым и перестает выполнять свою задачу.

Промежуточный итог: гистограммы, Area Chart и Line Chart могут закрыть 90% потребностей в визуализации данных. Достаточно изучить эти три инструмента и соблюдать те самые 4 шага, чтобы делать отличные диаграммы, которые помогут доносить ваши мысли до аудитории.

Scatter Chart

На десерт рассмотрим точечные диаграммы или «карту». Преимущество данного типа в том, что он вмещает в себя много показателей. В нем есть две оси, размер точки, цвет и символ — все это потенциально может отображать дополнительное измерение. Но чем больше запихать измерений, тем сложнее она будет читаться. В печатных документах, когда люди могут посидеть и разобраться, это допустимо, но при выступлении лучше использовать не более 2-3 измерений.


Доступные параметры: положение точки, цвет, размер и символ

Акценты и управление вниманием

Сформулированная идея и правильно выбранный тип диаграммы — половина успеха. Но кроме этого, мы хотим, чтобы читатель или зритель сразу смотрел в нужное место. Как расставить акценты?

Стрелка

Простейший способ, которым часто пренебрегают — стрелка. Дешево и сердито, но полностью выполняет свою задачу. Почти любой инструмент для создания скриншотов умеет ставить стрелку. С ней всегда можно обратить внимание зрителя на нужный элемент графика.

Рамка

Другой вариант из «дешевых» — выделение рамкой. Его используют, когда рассказывают про какой-то временной период и хотят выделить динамику показателя.

Хорошим примером будет график из начала статьи, когда я говорил про игры с масштабом — можно рассказать как о маленьких изменениях, так и о картине в целом.

Разделители

По сути, линии-разделители — это вариация выделения рамкой. Они полезны, когда мы хотим выделить периоды «до/после» при показе динамики. Или, например, «коридор» интересных значений на точечной диаграмме.

Цвет

Чуть больших усилий требует цветовое выделение. Зато оно выглядит «опрятнее».


Динамика показателей в конкретный период

Еще одна вариация цветового выделения — когда мы выделяем интересующие нас части графика более ярким оттенком:

Убираем лишнее

Последний шаг — убрать лишние элементы. Всё, что будет отвлекать и мешать донести основную мысль.

Вернемся к примеру с Area Chart. В этом типе убираем ненужные слои. Если нужно выделить, что доходы показывают прирост только по одной категории, то все прочие слои можно скрыть.


Схлопываем слои

Многие аналитические инструменты по умолчанию делают графики с линиями и шкалу. Вместо того, чтобы заставлять зрителя соотносить высоту столбцов и шкалу, мы можем указать цифры на каждом столбце отдельно и убрать ненужные уже линии. Будет выглядеть опрятнее.

Всегда сокращайте единицы измерения и округляйте до значимых цифр. Если речь о миллионах, то сотни и десятки точно не нужны. Во-первых, это будет меньше отвлекать зрителя, а во-вторых, будет проще уместить цифры на графике.

Ну и наконец, если вдруг получившийся график все еще не помогает вам донести мысль — то уберите его совсем. Зачем перегружать презентацию или отчет бесполезным балластом?

Источники

Пока что получилось кратко пройтись по самым базовым принципам, но тема визуализации данных намного шире. Если она заинтересовала, то рекомендую ознакомиться с источниками, без которых этой статьи не было бы:

[1] Александр Богачев, «Графики, которые убеждают всех». Книга еще в процессе, главы постепенно выкладываются автором на сайте, но то что есть, уже очень полезно.

[2] Джин Желязны, «Говори на языке диаграмм». Классик визуализации данных, который написал эту книгу тогда, когда графики еще рисовались от руки и надо было сразу думать, как сделать ее правильно.

[3] Даррел Хафф, «Как врать с помощью статистики». Не менее классический труд про манипуляцию данными.

Понравилась статья? Поделить с друзьями:
  • Как найти картины ван гога
  • Как найти новую карточку
  • Как найти модель телефона huawei
  • Как найти вид треугольника имея точки
  • Как найти индификационный номер паспорта