Как найти полиномиальный тренд

3 способа расчета полинома в Excel.

Автор: Алексей Батурин.

Есть 3 способа расчета значений полинома в Excel:

  • 1-й способ с помощью графика;
  • 2-й способ с помощью функции Excel =ЛИНЕЙН();
  • 3-й способ с помощью Forecast4AC PRO;

Подробнее о полиноме и способе его расчета в Excel далее в нашей статье.

Полиномиальный тренд применяется для описания значений временных рядов, попеременно возрастающих и убывающих. Полином отлично подходит для анализа большого набора данных нестабильной величины (например, продажи сезонных товаров).

Что такое полином? Полином — это степенная функция y=ax 2 +bx+c (полином второй степени) и y=ax 3 +bx 2 +cx+d (полином третей степени) и т.д. Степень полинома определяет количество экстремумов (пиков), т.е. максимальных и минимальных значений на анализируемом промежутке времени.

У полинома второй степени y=ax 2 +bx+c один экстремум (на графике ниже 1 максимум).

У Полинома третьей степени y=ax 3 +bx 2 +cx+d может быть один или два экстремума.

Один экстремум

Два экстремума

У Полинома четвертой степени не более трех экстремумов и т.д.

Как рассчитать значения полинома в Excel?

Есть 3 способа расчета значений полинома в Excel:

  • 1-й способ с помощью графика;
  • 2-й способ с помощью функции Excel =ЛИНЕЙН;
  • 3-й способ с помощью Forecast4AC PRO;

1-й способ расчета полинома — с помощью графика

Выделяем ряд со значениями и строим график временного ряда.

На график добавляем полином 6-й степени.

Затем в формате линии тренда ставим галочку «показать уравнение на диаграмме»

После этого уравнение выводится на график y = 3,7066x 6 — 234,94x 5 + 4973,6x 4 — 35930x 3 — 7576,8x 2 + 645515x + 5E+06 . Для того чтобы последний коэффициент сделать читаемым, мы зажимаем левую кнопку мыши и выделяем уравнение полинома

Нажимаем правой кнопкой и выбираем «формат подписи линии тренда»

В настройках подписи линии тренда выбираем число и в числовых форматах выбираем «Числовой».

Получаем уравнение полинома в читаемом формате:

y = 3,71x 6 — 234,94x 5 + 4 973,59x 4 — 35 929,91x 3 — 7 576,79x 2 + 645 514,77x + 4 693 169,35

Из этого уравнения берем коэффициенты a, b, c, d, g, m, v, и вводим в соответствующие ячейки Excel

Каждому периоду во временном ряду присваиваем порядковый номер, который будем подставлять в уравнение вместо X.

Рассчитаем значения полинома для каждого периода. Для этого вводим формулу полинома y = 3,71x 6 — 234,94x 5 + 4 973,59x 4 — 35 929,91x 3 — 7 576,79x 2 + 645 514,77x + 4 693 169,35 в первую ячейку и фиксируем ссылки на коэффициенты тренда (см. статью как зафиксировать ссылки)

Получаем формулу следующего вида:

= R2C8 *RC[-3]^6+ R3C8 *RC[-3]^5+ R4C8 *RC[-3]^4+ R5C8 *RC[-3]^3+ R6C8 *RC[-3]^2+ R7C8 *RC[-3]+ R8C8

в которой коэффициенты тренда зафиксированы и вместо «x» мы подставляем ссылку на номер текущего временного ряда (для первого значение 1, для второго 2 и т.д.)

Также «X» возводим в соответствующую степень (значок в Excel «^» означает возведение в степень)

=R2C8*RC[-3] ^6 +R3C8*RC[-3] ^5 +R4C8*RC[-3] ^4 +R5C8*RC[-3] ^3 +R6C8*RC[-3] ^2 +R7C8*RC[-3]+R8C8

Теперь протягиваем формулу до конца временного ряда и получаем рассчитанные значения полиномиального тренда для каждого периода.

2-й способ расчета полинома в Excel — функция ЛИНЕЙН()

Рассчитаем коэффициенты линейного тренда с помощью стандартной функции Excel =ЛИНЕЙН()

Для расчета коэффициентов в формулу =ЛИНЕЙН(известные значения y, известные значения x, константа, статистика) вводим:

  • «известные значения y» (объёмы продаж за периоды),
  • «известные значения x» (порядковый номер временного ряда),
  • в константу ставим «1»,
  • в статистику «0»

Получаем следующего вида формулу:

Теперь, чтобы формула Линейн() рассчитала коэффициенты полинома, нам в неё надо дописать степень полинома, коэффициенты которого мы хотим рассчитать.

Для этого в часть формулы с «известными значениями x» вписываем степень полинома:

  • ^ <1:2:3:4:5:6>— для расчета коэффициентов полинома 6-й степени
  • ^ <1:2:3:4:5>— для расчета коэффициентов полинома 5-й степени
  • ^ <1:2>— для расчета коэффициентов полинома 2-й степени

Получаем формулу следующего вида:

Вводим формулу в ячейку, получаем 3,71 —- значение (a) для полинома 6-й степени y=ax^6+bx^5+cx^4+dx^3+gx^2+mx+v

Для того, чтобы Excel рассчитал все 7 коэффициентов полинома 6-й степени y=ax^6+bx^5+cx^4+dx^3+gx^2+mx+v, необходимо:

1. Установить курсор в ячейку с формулой и выделить 7 соседних ячеек справа, как на рисунке:

2. Нажать на клавишу F2

3. Затем одновременно — клавиши CTRL + SHIFT + ВВОД (т.е. ввести формулу массива, как это сделать читайте подробно в статье «Как ввести формулу массива»)

Получаем 7 коэффициентов полиномиального тренда 6-й степени.

Рассчитаем значения полиномиального тренда с помощью полученных коэффициентов. Подставляем в уравнение y=3,7* x ^ 6 -234,9* x ^ 5 +4973,5* x ^ 4 -35929,9 * x^3 -7576,7 * x^2 +645514,7* x +4693169,3 номера периодов X, для которых хотим рассчитать значения полинома.

Каждому периоду во временном ряду присваиваем порядковый номер, который будем подставлять в уравнение полинома вместо X.

Рассчитаем значения полиномиального тренда для каждого периода. Для этого вводим формулу полинома в первую ячейку и фиксируем ссылки на коэффициенты тренда (см. статью как зафиксировать ссылки)

Получаем формулу следующего вида:

= R2C8 *RC[-3]^6+ R3C8 *RC[-3]^5+ R4C8 *RC[-3]^4+ R5C8 *RC[-3]^3+ R6C8 *RC[-3]^2+ R7C8 *RC[-3]+ R8C8

в которой коэффициенты тренда зафиксированы и вместо «x» мы подставляем ссылку на номер текущего временного ряда (для первого значение 1, для второго 2 и т.д.)

Также «X» возводим в соответствующую степень (значок в Excel «^» означает возведение в степень)

=R2C8*RC[-3] ^6 +R3C8*RC[-3] ^5 +R4C8*RC[-3] ^4 +R5C8*RC[-3] ^3 +R6C8*RC[-3] ^2 +R7C8*RC[-3]+R8C8

Теперь протягиваем формулу до конца временного ряда и получаем рассчитанные значения полиномиального тренда для каждого периода.

2-й способ точнее, чем первый, т.к. коэффициенты тренда мы получаем без округления, а также этот расчет быстрее.

3-й способ расчета значений полиномиальных трендов — Forecast4AC PRO

Устанавливаем курсор в начало временного ряда

Заходим в настройки Forecast4AC PRO, выбираем «Прогноз с ростом и сезонностью», «Полином 6-й степени», нажимаем кнопку «Рассчитать».

Заходим в лист с пошаговым расчетом «ForPol6», находим строку «Сложившийся тренд»:

Копируем значения в наш лист.

Получаем значения полинома 6-й степени, рассчитанные 3 способами с помощью:

  1. Коэффициентов полиномиального тренда выведенных на график;
  2. Коэффициентов полинома рассчитанных с помощью функцию Excel =ЛИНЕЙН
  3. и с помощью Forecast4AC PRO одним нажатием клавиши, легко и быстро.

Присоединяйтесь к нам!

Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа:

  • Novo Forecast Lite — автоматический расчет прогноза в Excel .
  • 4analytics — ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition — BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

  • Novo Forecast PRO — прогнозирование в Excel для больших массивов данных.

Получите 10 рекомендаций по повышению точности прогнозов до 90% и выше.

Линия тренда в Excel на разных графиках

Для наглядной иллюстрации тенденций изменения цены применяется линия тренда. Элемент технического анализа представляет собой геометрическое изображение средних значений анализируемого показателя.

Рассмотрим, как добавить линию тренда на график в Excel.

Добавление линии тренда на график

Для примера возьмем средние цены на нефть с 2000 года из открытых источников. Данные для анализа внесем в таблицу:

  1. Построим на основе таблицы график. Выделим диапазон – перейдем на вкладку «Вставка». Из предложенных типов диаграмм выберем простой график. По горизонтали – год, по вертикали – цена.
  2. Щелкаем правой кнопкой мыши по самому графику. Нажимаем «Добавить линию тренда».
  3. Открывается окно для настройки параметров линии. Выберем линейный тип и поместим на график величину достоверности аппроксимации.
  4. На графике появляется косая линия.

Линия тренда в Excel – это график аппроксимирующей функции. Для чего он нужен – для составления прогнозов на основе статистических данных. С этой целью необходимо продлить линию и определить ее значения.

Если R2 = 1, то ошибка аппроксимации равняется нулю. В нашем примере выбор линейной аппроксимации дал низкую достоверность и плохой результат. Прогноз будет неточным.

Внимание. Линию тренда нельзя добавить следующим типам графиков и диаграмм:

  • лепестковый;
  • круговой;
  • поверхностный;
  • кольцевой;
  • объемный;
  • с накоплением.

Уравнение линии тренда в Excel

В предложенном выше примере была выбрана линейная аппроксимация только для иллюстрации алгоритма. Как показала величина достоверности, выбор был не совсем удачным.

Следует выбирать тот тип отображения, который наиболее точно проиллюстрирует тенденцию изменений вводимых пользователем данных. Разберемся с вариантами.

Линейная аппроксимация

Ее геометрическое изображение – прямая. Следовательно, линейная аппроксимация применяется для иллюстрации показателя, который растет или уменьшается с постоянной скоростью.

Рассмотрим условное количество заключенных менеджером контрактов на протяжении 10 месяцев:

На основании данных в таблице Excel построим точечную диаграмму (она поможет проиллюстрировать линейный тип):

Выделяем диаграмму – «добавить линию тренда». В параметрах выбираем линейный тип. Добавляем величину достоверности аппроксимации и уравнение линии тренда в Excel (достаточно просто поставить галочки внизу окна «Параметры»).

Обратите внимание! При линейном типе аппроксимации точки данных расположены максимально близко к прямой. Данный вид использует следующее уравнение:

y = 4,503x + 6,1333

  • где 4,503 – показатель наклона;
  • 6,1333 – смещения;
  • y – последовательность значений,
  • х – номер периода.

Прямая линия на графике отображает стабильный рост качества работы менеджера. Величина достоверности аппроксимации равняется 0,9929, что указывает на хорошее совпадение расчетной прямой с исходными данными. Прогнозы должны получиться точными.

Чтобы спрогнозировать количество заключенных контрактов, например, в 11 периоде, нужно подставить в уравнение число 11 вместо х. В ходе расчетов узнаем, что в 11 периоде этот менеджер заключит 55-56 контрактов.

Экспоненциальная линия тренда

Данный тип будет полезен, если вводимые значения меняются с непрерывно возрастающей скоростью. Экспоненциальная аппроксимация не применяется при наличии нулевых или отрицательных характеристик.

Построим экспоненциальную линию тренда в Excel. Возьмем для примера условные значения полезного отпуска электроэнергии в регионе Х:

Строим график. Добавляем экспоненциальную линию.

Уравнение имеет следующий вид:

  • где 7,6403 и -0,084 – константы;
  • е – основание натурального логарифма.

Показатель величины достоверности аппроксимации составил 0,938 – кривая соответствует данным, ошибка минимальна, прогнозы будут точными.

Логарифмическая линия тренда в Excel

Используется при следующих изменениях показателя: сначала быстрый рост или убывание, потом – относительная стабильность. Оптимизированная кривая хорошо адаптируется к подобному «поведению» величины. Логарифмический тренд подходит для прогнозирования продаж нового товара, который только вводится на рынок.

На начальном этапе задача производителя – увеличение клиентской базы. Когда у товара будет свой покупатель, его нужно удержать, обслужить.

Построим график и добавим логарифмическую линию тренда для прогноза продаж условного продукта:

R2 близок по значению к 1 (0,9633), что указывает на минимальную ошибку аппроксимации. Спрогнозируем объемы продаж в последующие периоды. Для этого нужно в уравнение вместо х подставлять номер периода.

Период 14 15 16 17 18 19 20
Прогноз 1005,4 1024,18 1041,74 1058,24 1073,8 1088,51 1102,47

Для расчета прогнозных цифр использовалась формула вида: =272,14*LN(B18)+287,21. Где В18 – номер периода.

Полиномиальная линия тренда в Excel

Данной кривой свойственны переменные возрастание и убывание. Для полиномов (многочленов) определяется степень (по количеству максимальных и минимальных величин). К примеру, один экстремум (минимум и максимум) – это вторая степень, два экстремума – третья степень, три – четвертая.

Полиномиальный тренд в Excel применяется для анализа большого набора данных о нестабильной величине. Посмотрим на примере первого набора значений (цены на нефть).

Чтобы получить такую величину достоверности аппроксимации (0,9256), пришлось поставить 6 степень.

Зато такой тренд позволяет составлять более-менее точные прогнозы.

Линия тренда в Excel (эксель): как построить, как добавить в диаграмму и что показывает, основные виды

Графики финансового анализа часто содержат много разносторонней информации. Из-за этого появляются шумы (наложения, колебания), которые усложняют восприятие и обработку данных. Линия тренда в Excel является инструментом статистического анализа и позволяет выделить показатели цены, которые имеют наибольшее влияние на сложившуюся ситуацию. Они помогают отфильтровать помехи и колебания, после чего остается четкий и более понятный график.

Добавление трендовой линии на график

Данный элемент технического анализа позволяет визуально увидеть изменение цены за указанный период времени . Это может быть месяц, год или несколько лет. Информация будет отображать значение средних показателей в виде геометрических фигур. Добавить линию тренда в Excel 2010 можно с помощью встроенных стандартных инструментов.

Построение графика

Чтобы правильно строить трендовые линии, нужно соблюдать функциональную зависимость y=f(x) . Для получения корректного прогноза в столбец А вносится информация о временном периоде, а в столбец В — цена в указанный промежуток.

Построение графика выполняется по следующему алгоритму:

  1. Первым действием нужно выделить диапазон данных , например это А1:В9, затем активировать инструмент: «Вставка»-«Диаграммы»-«Точечная»-«Точечная с гладкими кривыми и маркерами».
  2. После открытия графика пользователю станет доступна еще одна панель управления данными , на которой нужно выбрать следующее: «Работа с диаграммами»-«Макет»-«Линия тренда»-«Линейное приближение».
  3. Следующим шагом требуется выполнить двойной клик по образовавшейся линии тенденции в Excel . Когда появиться вспомогательное окно, отметить птичкой опцию «показывать уравнение на диаграмме».

Важно помнить, что если на графике имеется 2 или более линий , отображающих анализ данных, то перед выполнением 3 пункта нужно будет выбрать одну из них и включить в тенденцию. Эта короткая инструкция поможет начинающим специалистам разобраться, как строится линия тренда в Экселе.

Создание линии

Дальнейшая работа будет происходить непосредственно с трендовой линией.

Добавление тренда на диаграмму происходит следующим образом:

  1. Перейти во вкладку «Работа с диаграммами» , затем выбрать раздел «Макет»-«Анализ» и после подпункт «Линия тенденции» . Появится выпадающий список, в котором необходимо активировать строку «Линейное приближение».
  2. Если все выполнено правильно, в области построения диаграмм появится кривая линия черного цвета . По желанию цветовую гамму можно будет изменить на любую другую.

Этот способ поможет создать и построить тренд в Excel 2016 или более ранних версиях.

Однако важно помнить, что вставить линию нельзя для диаграмм и графиков следующего типа:

  • лепесткового;
  • кругового;
  • поверхностного;
  • кольцевого;
  • объемного;
  • с накоплением.

Настройка линии

Построение линий тренда имеет ряд вспомогательных настроек , которые помогут придать графику законченный и презентабельный вид.

Необходимо запомнить следующее:

  1. Чтобы добавить название диаграмме , нужно дважды кликнуть по ней и в появившемся окне ввести заголовок. Для выбора расположения имени графика необходимо перейти во вкладку «Работа с диаграммами», затем выбрать «Макет» и «Название диаграммы». После этого появится список с возможным расположением заглавия.
  2. Дополнительно в этом же разделе можно найти пункт, отвечающий за названия осей и их расположение относительно графика. Интересно, что для вертикальной оси разработчики программы продумали возможность повернутого расположения наименования, чтобы диаграмма читалась удобно и выглядела гармонично.
  3. Чтобы внести изменения непосредственно в построение линий , нужно в разделе «Макет» найти «Анализ», затем «Прямая тренда» и в самом низу списка нажать «Дополнительные параметры…». Здесь можно изменить цвет и формат линии , выбрать один из параметров сглаживания и аппроксимации (степенный, полиноминальный, логарифмический и т.д.).
  4. Еще есть функция определения достоверности построенной модели . Для этого в дополнительных настройках требуется активировать пункт «Разместить на график величину достоверности аппроксимации» и после этого закрыть окно. Наилучшим значением является 1. Чем сильнее полученный показатель отличается от нее, тем ниже достоверность модели.

Прогнозирование

Для получения наиболее точного прогноза необходимо сменить построенный график на гистограмму . Это поможет сравнить уравнения.

Для этого выполняем последовательность действий:

  1. Вызвать для графика контекстное меню и выбрать «Изменить тип диаграммы» .
  2. Появится новое окно с настройками , в котором требуется найти опцию «Гистограмма» и после выбрать подвид с группировкой.

Теперь пользователю должны быть видны оба графика . Они визуализируют одни и те же данные, но имеют разные уравнения для образования тенденции.

Следующим шагом необходимо сравнить уравнения точки пересечения с осями на разных диаграммах .

Для визуального отображения нужно сделать следующее:

  1. Перевести гистограмму в простой точечный график с гладкими кривыми и маркерами . Процесс выполняется через пункт контекстного меню «Изменить тип диаграммы…».
  2. Выполнить двойной клик по прямой образовавшейся тенденции , задать ей параметр прогноза назад на 12,0 и сохранить изменения.

Такая настройка поможет увидеть, что угол наклона тенденции меняется в зависимости от вида графика , но общее направление движения остается неизменным. Это свидетельствует о том, что построить линию тренда в Эксель можно лишь в качестве дополнительного инструмента анализа и брать его в расчет следует только как приближающий параметр. Строить аналитические прогнозы, основываясь лишь на этой прямой, не рекомендуется.

Уравнение линии тренда в Excel

Если пользователь разобрался с проблемой, как добавить линию тенденции на график в Эксель, следует научиться подбирать правильные уравнения для отображения информации . О том, что они не подходят под заданную ситуацию, сообщает число достоверности. При грамотной настройке диаграммы величина должна быть равна 1 или находиться в ближайшем от нее диапазоне. Она показывает, насколько визуализация соответствует действительной ситуации.

Линейная аппроксимация

Геометрическое отображение формулы — прямая, которая показывает рост или снижение показателя с одинаковой неизменной скоростью. В качестве примера можно взять ситуацию по заключению сделок одним сотрудником на протяжении 10 месяцев.

Введем в таблицу следующие данные:

Исходя из этих данных строится диаграмма , которая покажет рост заключенных сделок.

Затем выполняется ряд действий , нужно:

  1. Активировать график и добавить на него прямую тренда. В дополнительных настройках установить линейный вид.
  2. Добавить величину достоверности аппроксимации и уравнение тенденции . Такое построение использует уравнение: y = 4,503x + 6,1333, где 4,503 — показатель наклона, 6,1333 — смещения, y — последовательность значений, а х — номер периода. Формула размещает точки наиболее близко к прямой.

Прямая на диаграмме показывает стабильный рост работы сотрудника. Величина достоверности при этом равна 0,9929, что показывает наивысшую точность построения прогноза. Благодаря графику и уравнению можно просчитать количество сделок в будущем периоде . Для этого в формулу вместе х нужно подставить 11 (порядковый номер периода). По прогнозу в 11 месяце будет заключено 55-56 сделок.

Экспоненциальная

Данный вид расчетов применяется в случае, когда вводимые данные меняются с непрерывно возрастающей скоростью . Экспоненциальное приближение не применяется, если присутствуют нулевые или отрицательные значения.

Формула приобретает следующий вид: y = 7,6403е^- 0,084x, где 7,6403 и 0,084 — константы, а е соответствует основанию натурального логарифма. Значение величины достоверности получилось 0,938, что говорит о минимальной погрешности при расчетах и о высокой точности будущих прогнозов.

Логарифмическая

Логарифмическая формула применяется, если сначала наблюдался быстрый рост или снижение показателя, а после наступил период стабильности . На графике получится оптимизированная кривая, которая хорошо подстраивается под подобное изменение величины. Данный тренд часто применяют для прогнозирования продаж созданного товара или разработанной услуги, которые будут выпускаться на рынок в первый раз.

Для того чтобы узнать, как сделать грамотный расчет с определением линии тренда и как построить ее, нужна такая формула:

размер продаж = 272,14*LN(B18)+287,21 , где В18 соответствует порядковому номеру периода.

Полиномиальная

Полиноминальной кривой присущи попеременные возрастания и убывания исследуемого показателя . Для многочленов выводится степень, которая соответствует числу максимальных и минимальных показателей. Например, 1 — это 2 степень, 2 экстремума — 3 степень, 3 — 4 степень и т.д. Текущая тенденция используется для анализа большого объема данных , которые постоянно меняют свою величину.

Данные формулы подскажут аналитикам, как правильно рассчитывать прямую тренда в различных ситуациях.


КУРС

EXCEL ACADEMY

Научитесь использовать все прикладные инструменты из функционала MS Excel.

Любому бизнесу интересно заглянуть в будущее и правильно ответить на вопрос: «А сколько денег мы заработаем за следующий период?» Ответить на такого рода вопросы позволяют различные методики прогнозирования. В данной статье мы с вами рассмотрим несколько таких методик и произведем все необходимые расчеты в Excel. Еще больше про анализ данных в Excel мы рассказываем на нашем открытом курсе «Аналитика в Excel».

Постановка задачи

Исходные данные

Для начала, давайте определимся, какие у нас есть исходные данные и что нам нужно получить на выходе. Фактически, все что у нас есть, это некоторые исторические данные. Если мы говорим о прогнозировании продаж, то историческими данными будут продажи за предыдущие периоды.

Примечание. Собранные в разные моменты времени значения одной и той же величины образуют временной ряд. Каждое значение такого временного ряда называется измерением. Например: данные о продажах за последние 5 лет по месяцам — временной ряд; продажи за январь прошлого года — измерение.

Составляющие прогноза

Следующий шаг: давайте определимся, что нам нужно учесть при построении прогноза. Когда мы исследуем наши данные, нам необходимо учесть следующие факторы:

  • Изменение нашей пронозируемой величины (например, продаж) подчиняется некоторому закону. Другими словами, в временном ряде можно проследить некую тенденцию. В математике такая тенденция называется трендом.
  • Изменение значений в временном ряде может зависить от промежутка времени. Другими словами, при построении модели необходимо будет учесть коэффициент сезонности. Например, продажи арбузов в январе и августе не могут быть одинаковыми, т.к. это сезонный продукт и летом продажи значительно выше.
  • Изменение значений в временном ряде периодически повторяется, т.е. наблюдается некоторая цикличность.

Эти три пункта в совокупность образуют регулярную составляющую временного ряда.

Примечание. Не обязательно все три элемента регулярной составляющей должны присутствовать в временном ряде.

Однако, помимо регулярной составляющей, в временном ряде присутствует еще некоторое случайное отклонение. Интуитивно это понятно – продажи могут зависеть от многих факторов, некоторые из которых могут быть случайными.

Вывод. Чтобы комплексно описать временной ряд, необходимо учесть 2 главных компонента: регулярную составляющую (тренд + сезонность + цикличность) и случайную составляющую.

Виды моделей

Следующий вопрос, на который нужно ответить при построении прогноза: “А какие модели временного ряда бывают?”

Обычно выделяют два основных вида:

  • Аддитивная модель: Уровень временного ряда = Тренд + Сезонность + Случайные отклонения
  • Мультипликативная модель: Уровень временного ряда = Тренд X Сезонность X Случайные отклонения

Иногда также выделают смешанную модель в отдельную группу:

  • Смешанная модель: Уровень временного ряда = Тренд X Сезонность + Случайные отклонения

С моделями мы определились, но теперь возникает еще один вопрос: «А когда какую модель лучше использовать?»

Классический вариант такой:
— Аддитивная модель используется, если амплитуда колебаний более-менее постоянная;
— Мультипликативная – если амплитуда колебаний зависит от значения сезонной компоненты.

Пример:

график пример адаптивной и мультипликативной модели

Решение задачи с помощью Excel

Итак, необходимые теоретические знания мы с вами получили, пришло время применить их на практике. Мы будем с вами использовать классическую аддитивную модель для построения прогноза. Однако, мы построим с вами два прогноза:

  1. с использованием линейного тренда
  2. с использованием полиномиального тренда

Во всех руководствах, как правило, разбирается только линейный тренд, поэтому полиномиальная модель будет крайне полезна для вас и вашей работы!


КУРС

EXCEL ACADEMY

Научитесь использовать все прикладные инструменты из функционала MS Excel.

Модель с линейным трендом

Пусть у нас есть исходная информация по продажам за 2 года:

таблица с информацией о продажах для прогнозирования

Учитывая, что мы используем линейный тренд, то нам необходимо найти коэффициенты уравнения

y = ax + b

где:

  • y – значения продаж
  • x – номер периода
  • a – коэффициент наклона прямой тренда
  • b – свободный член тренда

Рассчитать коэффициенты данного уравнения можно с помощью формулы массива и функции ЛИНЕЙН. Нам необходимо будет сделать следующую последовательность действий:

  1. Выделяем две ячейки рядом
  2. Ставим курсор в поле формул и вводим формулу =ЛИНЕЙН(C4:C27;B4:B27)
  3. Нажимаем Ctrl+Shift+Enter, чтобы активировать формулу массива

На выходе мы получили 2 числа: первое — коэффициент a, второе – свободный член b.

таблица с информацией о продажах для прогнозирования 2

Теперь нам нужно рассчитать для каждого периода значение линейного тренда. Сделать это крайне просто — достаточно в полученное уравнение подставить известные номера периодов. Например, в нашем случае, мы прописываем формулу =B4*$F$4+$G$4 в ячейке I4 и протягиваем ее вниз по всем периодам.

расчет значения линейного тренда

Нам осталось рассчитать коэффициент сезонности для каждого периода. Учитывая, что у нас есть исторические данные за два года, разумно будет учесть это при расчете. Можем сделать следующим образом: в ячейке J4 прописываем формулу =(C4+C16)/СРЗНАЧ($C$4:$C$27)/2 и протягиваем вниз на 12 месяцев (т.е. до J15).

расчет коэффициента сезонности

Что нам это дало? Мы посчитали, сколько суммарно продавалось каждый январь/каждый февраль и так далее, а потом разделили это на среднее значение продаж за все два периода.

То есть мы выяснили, как продажи двух январей отклонялись от средних продаж за два года, как продажи двух февралей отклонялись и так далее. Это и дает нам коэффициент сезонности. В конце формулы делим на 2, т.к. в расчете фигурировало 2 периода.

Примечание. Рассчитали только 12 коэффициентов, т.к. один коэффициент учитывает продажи сразу за 2 аналогичных периода.

Итак, теперь мы на финишной прямой. Нам осталось рассчитать тренд для будущих периодов и учесть коэффициент сезонности для них. Давайте амбициозно построим прогноз на год вперед.

Сначала создаем столбец, в котором прописываем номера будущих периодов. В нашем случае нумерация начинается с 25 периода.

Далее, для расчета значения тренда просто прописываем уже известную нам формулу =L4*$F$4+$G$4 и протягиваем вниз на все 12 прогнозируемых периодов.

И последний штрих — умножаем полученное значение на коэффициент сезонности. Вуаля, это и есть итоговый ответ в данной модели!

финальная таблица с прогнозом

Модель с полиномиальным трендом

Конструкция, которую мы только что с вами построили, достаточно проста. Но у нее есть один большой минус — далеко не всегда она дает достоверные результаты.

Посмотрите сами, какая модель более точно аппроксимирует наши точки — линейный тренд (прямая зеленая линия) или полиномиальный тренд (красная кривая)? Ответ очевиден. Поэтому сейчас мы с вами и разберем, как построить полиномиальную модель в Excel.

Модель прогнозирования с полиномиальным трендом

Пусть все исходные данные у нас будут такими же. Для простоты модели будем учитывать только тренд, без сезонной составляющей.

Для начала давайте определимся, чем полиномиальный тренд отличается от обычного линейного. Правильно — формой уравнения. У линейного тренда мы разбирали обычный график прямой:

У полиномиального тренда же уравнение выглядит иначе:

формула полиномиального тренда

где конечная степень определяется степенью полинома.

Т.е. для полинома 4 степени необходимо найти коэффициенты уравнения:

Согласитесь, выглядит немного страшно. Однако, ничего страшного нет, и мы с легкостью можем решить эту задачку с помощью уже известных нам методов.

  1. Ставим в ячейку F4 курсор и вводим формулу =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4});1;1). Функция ЛИНЕЙН позволяет произвести расчет коэффициентов, а с помощью функции ИНДЕКС мы вытаскиваем нужный нам коэффициент. В данном случае за выбор коэффициента отвечает самый последний аргумент. У нас стоит 1 — это коэффициент при самой высокой степени (т.е. при 4 степени, коэффициент). Кстати, узнать о самых полезных математических формулах Excel можно в нашем бесплатном гайде «Математические функции Excel».
  2. Аналогично прописываем формулу =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4});1;2) в ячейке ниже.
  3. Делаем такие же действия, пока не найдем все коэффициенты.

Кстати говоря, мы можем легко сами себя проверить. Давайте построим график наших продаж и добавим к нему полиномиальный тренд.

  1. Выделяем столбец с продажами
  2. Выбираем «Вставка» → «График» → «Точечный» → «Точечная диаграмма»
  3. Нажимаем на любую точку графика правой кнопкой мыши и выбираем «Добавить линию тренда»
  4. В открывшемся справа меню выбираем «Полиномиальная модель», меняем степень на 4 и ставим галочку на «Показывать уравнение на диаграмме»

Теперь вы наглядно можете видеть, как рассчитанный тренд аппроксимирует исходные данные и как выглядит само уравнение. Можно сравнить уравнение на графике с вашими коэффициентами. Сходится? Значит сделали все верно!

Помимо всего прочего, вы можете сразу оценить точность аппроксимации (не полностью, но хотя бы первично). Это делается с помощью коэффициента R^2. Тут у вас снова есть два пути:

  1. Вы можете вывести коэффициент на график, поставив галочку «Поместить на диаграмму величину достоверности аппроксимации»
  2. Вы можете рассчитать коэффициент R^2 самостоятельно по формуле =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4};;1);3;1)

Заключение

Мы с вами подробно разобрали вопрос прогнозирования — изучили необходимые термины и виды моделей, построили аддитивную модель в Excel с использованием линейного и полиномиального тренда, а также научились отображать результаты своих вычислений на графиках. Все это позволит вам эффективно внедрять полученные знания на работе, усложнять существующие модели и уточнять прогнозы. Чем большим количеством методов и инструментов вы будете владеть, тем выше будет ваш профессиональный уровень и статус на рынке труда.

Если вас интересуют еще какие-то модели прогнозирования — напишите нам об этом, и мы постараемся осветить эти темы в дальнейших своих статьях! Или запишитесь на курс «Excel Academy» от SF Education, где мы рассказываем про возможности Excel, необходимые для анализа.

Автор: Алексанян Андрон, эксперт SF Education


КУРС

EXCEL ACADEMY

Научитесь использовать все прикладные инструменты из функционала MS Excel.

Блог SF Education

Data Science

5 примеров экономии времени в Excel

Что для работодателя главное в сотруднике? Добросовестность, ответственность, профессионализм и, конечно же, умение пользоваться отведенным временем! Предлагаем познакомиться с очень нужными, на наш взгляд,…

Модель полиномиальной регрессии

Время на прочтение
3 мин

Количество просмотров 45K

Выражаясь простым языком, модель регрессии в математической статистике строится на основе известных данных, в роли которых выступают пары чисел. Количество таких пар заранее определено. Если представить себе, что первое число в паре – это значение координаты $x$, а второе – $y$, то множество таких пар чисел можно представить на плоскости в декартовой системе координат в виде множества точек. Данные пары чисел берутся не случайно. На практике, как правило, второе число зависит от первого. Построить регрессию – это значит подобрать такую линию (точнее, функцию), которая как можно точнее приближает к себе (аппроксимирует) множество вышесказанных точек.

Для чего это всё нужно? Прежде всего, это нужно для составления т.н. прогнозов. Часто нужно узнать

$y$, зная только

$x$, если он отличается от тех иксов, на основе которых строилась регрессия. Приведу простой пример. Имеется статистика зависимости роста человека от его возраста на основе 100 исследованных разных человек. Таким образом, мы имеем 100 пар чисел {возраст; рост}. При этом «рост» – зависимая величина, а «возраст» — независимая. Грамотно построив модель регрессии, мы можем с определённой достоверностью «предсказать» рост по любому значению возраста.

На практике, в зависимости от ситуации, в построении моделей регрессии используют линейные, параболические, степенные и другие типы функций. В курсе математической статистики чаще всего рассматривается линейная модель регрессии. Иногда затрагивают случай посложнее – параболическую модель. Делая обобщение, несложно догадаться, что линейная и параболическая модели являются частными случаями более сложной модели – полиномиальной. Построить модель регрессии – это значит найти параметры той функции, которая будет в ней фигурировать. Для линейной регрессии – два параметра: коэффициент и свободный член.

Полиномиальная регрессия может применяться в математической статистике при моделировании трендовых составляющих временных рядов. Временной ряд — это, по сути, ряд чисел, которые зависят от времени. Например, средние значения температуры воздуха по дням за прошедший год, или доход предприятия по месяцам. Порядок моделируемого полинома оценивается специальными методами, например, критерием серий. Цель построения модели полиномиальной регрессии в области временных рядов всё та же – прогнозирование.

Для начала рассмотрим задачу полиномиальной регрессии в общем виде. Все рассуждения основаны на обобщении рассуждений в задачах линейной и параболической регрессии. После этих рассуждений я перейду к частному случаю — рассмотрению данной модели для временных рядов.

Пусть даны два ряда наблюдений $x_i$ (независимая переменная) и $y_i$ (зависимая переменная), $i=overline{1,n}$. Уравнение полинома имеет вид

$y=sumlimits_{j=0}^k b_jx^j,     (1)$

где

$b_j$ — параметры данного полинома,

$j=overline{0,k}$. Среди них

$b_0$ — свободный член. Найдём по методу наименьших квадратов (МНК) параметры

$b_j$ данной регрессии.

По аналогии с линейной регрессией, МНК также основан на минимизации следующего выражения:

$S=sumlimits_{i=1}^nleft(hat y_i-y_iright)^2tomin     (2)$

Здесь $hat y_i$ — теоретические значения, являющиеся значениями полинома (1) в точках $x_i$. Подставляя (1) в (2), получаем

$S=sumlimits_{i=1}^nleft(sum_{j=0}^kb_jx_i^j-y_iright)^2tomin.$

На основании необходимого условия экстремума функции $(k+1)$ переменных $S=S(b_0, b_1,dots,b_k)$ приравняем к нулю её частные производные, т.е.

$S'_{b_p}=2sumlimits_{i=1}^nx_i^pleft(sumlimits_{j=0}^kb_jx_i^j-y_iright)=0,   p=overline{0,k}.$

Поделив левую и правую часть каждого равенства на 2, раскроем вторую сумму:

$sumlimits_{i=1}^nx_i^pleft(b_0+b_1x_i+b_2x_i^2+dots+b_kx_i^kright)-sumlimits_{i=1}^nx_i^py_i=0,   p=overline{0,k}.$

Раскрывая скобки, перенесём в каждом

$p$-ом выражении последнее слагаемое с

$y_i$ вправо и поделим обе части на

$n$. В результате у нас получилось

$(k+1)$ выражений, образующие систему линейных нормальных уравнений относительно

$b_p$. Она имеет следующий вид:

$left{ begin{array}{l} b_0+b_1overline x+b_2overline{x^2}+dots+b_koverline{x^k}=overline y\ b_0overline x+b_1overline{x^2}+b_2overline{x^3}+dots+b_koverline{x^{k+1}}=overline{xy}\ b_0overline{x^2}+b_1overline{x^3}+b_2overline{x^4}+dots+b_koverline{x^{k+2}}=overline{x^2y}\ ldotsldotsldotsldotsldotsldotsldotsldotsldotsldotsldotsldotsldots\ b_0overline{x^k}+b_1overline{x^{k+1}}+b_2overline{x^{k+2}}+dots+b_koverline{x^{2k}}=overline{x^ky} end{array} right.     (3)$

Можно переписать систему (3) в матричном виде: $AB=C$, где

$A=left( begin{array}{ccccc} 1 & overline x & overline{x^2} & ldots & overline{x^k}\ overline x & overline{x^2} & overline{x^3} & ldots & overline{x^{k+1}}\ overline{x^2} & overline{x^3} & overline{x^4} & ldots & overline{x^{k+2}}\ vdots & vdots & vdots & ddots & vdots\ overline{x^k} & overline{x^{k+1}} & overline{x^{k+2}} & ldots & overline{x^{2k}} end{array} right),  B=left(begin{array}{c} b_0\b_1\b_2\vdots\b_k end{array} right),  C=left(begin{array}{c} overline y\overline{xy}\overline{x^2y}\vdots\overline{x^ky} end{array} right).$

Теперь перейдём к применению вышеизложенных фактов в случае с временными рядами. Пусть дан временной ряд $x_t$, где $t=overline{1,n}$. Требуется построить полиномиальный тренд порядка $k$, который аппроксимирует данный временной ряд как можно точнее. В качестве независимой переменной $x$ будем брать $t$, исходя из определения временного ряда. Эти иксы представляют собой ряд натуральных чисел, обозначающие период времени. В качестве $y$ берутся значения временного ряда $x_t$. При этом видно, что значения элементов $a_{ij}$ матрицы системы $A$ не зависят от $x_t$. Так как в общем случае, очевидно,

$a_{ij}=overline{x^{i+j-2}}=frac1nsumlimits_{r=1}^nx_r^{i+j-2},$

то в случае с временными рядами

$a_{ij}=frac1nsumlimits_{r=1}^nr^{i+j-2},$

где

$i,j=overline{1,(k+1)}.$

Элементы $c_j$ матрицы-вектора свободных членов $C$ в общем случае получаются, как

$c_j=overline{x^{j-1}y}=frac1nsumlimits_{r=1}^nx_r^{j-1}y_r.$

А в случае с временными рядами

$c_j=frac1nsumlimits_{r=1}^nr^{j-1}x_r,$

где

$j=overline{1,(k+1)}.$

Таким образом, решив систему (3), мы сможем найти искомые параметры полиномиального тренда $b_0,dots,b_k.$

Для заполнения матриц системы и для её решения можно применять один из численных методов при моделировании тренда на компьютере. При этом результат вычисления будет достаточно точным.

В результате трендовая составляющая примет вид:

$T_t=sumlimits_{i=0}^kb_it^i,   t=0,1,2,dots.$

Стоит также отметить, что смоделированная трендовая составляющая

$T_t$, определена не только на текущие периоды

$[1;n]$, но и на будущие периоды

$t>n$.

Сразу отмечу, что полиномиальная регрессия моделирует только трендовую составляющую временного ряда. Полная модель временного ряда подразумевает ещё и другие составляющие, что выходит за рамки данной статьи.

На практике мне лично не встречались временные ряды с порядком полиномиального тренда более, чем 2. Этим и объясняется распространённость моделей линейной и праболической регрессии, как частных случаев полиномиальной.

What Is Polynomial Trending?

Polynomial trending describes a pattern in data that is curved or breaks from a straight linear trend. It often occurs in a large set of data that contains many fluctuations. As more data becomes available, the trends often become less linear, and a polynomial trend takes its place. Graphs with curved trend lines are generally used to show a polynomial trend.

Data that is polynomial in nature is described generally by:



y

=

a

+

x

n

where:

a

=

the intercept

x

=

the explanatory variable

n

=

the nature of the polynomial (e.g. squared, cubed, etc.)

begin{aligned} &y = a + x^n \ &textbf{where:}\ &a = text{the intercept}\ &x = text{the explanatory variable}\ &n = text{the nature of the polynomial (e.g. squared, cubed, etc.)}\ end{aligned}

y=a+xnwhere:a=the interceptx=the explanatory variablen=the nature of the polynomial (e.g. squared, cubed, etc.)

Understanding Polynomial Trending

Big data and statistical analytics are becoming more commonplace and easy to use; many statistical packages now regularly include polynomial trend lines as part of their analysis. When graphing variables, analysts these days generally use one of six common trend lines or regressions to describe their data. These graphs include:

  • linear
  • logarithmic
  • polynomial
  • power
  • exponential
  • moving averages

Each of these parameters has different benefits based on the properties of the underlying data. In mathematics, a polynomial is an expression consisting of variables (also called indeterminates) and coefficients that involves only the operations of addition, subtraction, multiplication, and non-negative integer exponents of variables.

Polynomials appear in a wide variety of areas of mathematics and science. For example, they are used to form polynomial equations, which encode a wide range of problems, from elementary word problems to complicated problems in the sciences. They are used to define polynomial functions, which appear in settings ranging from basic chemistry and physics to economics and social science.

They are also used in calculus and numerical analysis to approximate other functions. In advanced mathematics, polynomials are used to construct polynomial rings and algebraic varieties, central concepts in algebra and algebraic geometry.

Real-World Example of Polynomial Trending Data

For example, polynomial trending would be apparent on the graph that shows the relationship between the profit of a new product and the number of years the product has been available. The trend would likely rise near the beginning of the graph, peak in the middle and then trend downward near the end. If the company revamps the product late in its life cycle, we’d expect to see this trend repeat itself.

This type of chart, which would have several waves on the graph, would be deemed to be a polynomial trend. An example of such polynomial trending can be seen in the example chart below:

Image by Sabrina Jiang © Investopedia 2020

Представим, что в нашем городе недавно открылась кофейня. Руководство кофейни заметило, что с каждым днем количество проданных чашек кофе только растет. Нам нужно понять, на какой день чашек будет продано столько, что придется докупать зерно:

eyJpZCI6Ijk2ZTU5OWExZDA1OTE4MjRhMDhiYTY2YWViMGI5OTBhLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=6562e6ed45dc79cbd7f73789784e5c51075a351168245c94f0db6c04d671eae6

Если посмотреть на график количества проданных чашек от времени, то зависимость наглядна. Ее можно описать таким уравнением:

, где

— количество проданных чашек, а

— номер дня с момента открытия

Мы видим, что на третий день было продано 17 чашек, а на четвертый — 18. По этому уравнению можно построить линию и понять, сколько чашек кофе будет продано в каждый конкретный день, если зависимость сохранится.

Другими словами, используя исторические данные, мы нашли зависимость и на ее основе сделаем прогноз:

eyJpZCI6IjZiZjRmMWIzODExNjI4OWMyZjkxOTY0MWIzMDJkZWMyLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=6d8938ad05eed953cc92370f3ccb4d9b49f811fc6dc7d4abc4d2fe3ab7022f80

Ориентируясь на этот график, мы можем сделать вывод: если кофе будет продаваться с той же скоростью, то на десятый день после открытия будет продано 24 чашки, что в 1,6 раз больше, чем в первый день. Такой прогноз поможет понять не только, когда может закончиться имеющееся зерно, но и сколько зерна необходимо на следующие периоды в принципе.

Уравнение, которое мы нашли для описания зависимости наших данных, и называется трендом. Это уравнение, выражающее зависимость показателя от времени. Другими словами, тренд — это тенденция изменения временного ряда.

Понравилась статья? Поделить с друзьями:
  • Как найти тропический биом в майнкрафте
  • Как я нашел работу в словакии
  • Как найти корень зная дискриминант
  • Как найти своих соседей по дому
  • Как найти среднее арифметическое матрицы питон