Время на прочтение
6 мин
Количество просмотров 45K
О чём могут «рассказать» законы распределения случайных величин, если научиться их «слушать»
Законы распределения случайных величин наиболее «красноречивы» при статистической обработке результатов измерений. Адекватная оценка результатов измерений возможна лишь в том случае, когда известны правила, определяющие поведение погрешностей измерения. Основу этих правил и составляют законы распределения погрешностей, которые могут быть представлены представлены в дифференциальной (pdf) или интегральной (cdf) формах.
К основным характеристикам законов распределения относятся: наиболее вероятное значение измеряемой величины под названием математическое ожидание (mean); мера рассеивания случайной величины вокруг математического ожидания под названием среднеквадратическое отклонение (std).
Дополнительными характеристиками являются – мера скученности дифференциальной формы закона распределения относительно оси симметрии под названием асимметрия (skew) и мера крутости, огибающей дифференциальной формы под названием эксцесс (kurt). Читатель уже догадался, что приведенные сокращения взяты из библиотек scipy. stats, numpy, которые мы и будем использовать.
Рассказ о законах распределения погрешности измерений был бы неполным, если не упомянуть об связи между энтропийным и среднеквадратичным значением погрешности. Не утомляя читателей длинными выкладками из информационной теории измерений [1], сразу сформулирую результат.
С точки зрения информации, нормальное распределение приводит к получению точно такого же количества информации, как и равномерное. Запишем выражение для погрешности delta0 с использованием функций приведённых выше библиотек для распределения случайной величины x.
Это позволяет заменить любой закон распределения погрешности равномерным с тем же значением delta0.
Введём ещё один показатель – энтропийный коэффициент k, который для нормального распределения равен:
Следует отметить, что любое распределение отличное от нормального, будет иметь меньший энтропийный коэффициент.
Лучше один раз увидеть, чем семь раз прочитать. Для дальнейшего сравнительного анализа интегральных распределений: равномерного, нормального и логистического модернизируем примеры, приведённые в документации [2].
Программа для нормального распределения:
from scipy.stats import norm
import matplotlib.pyplot as plt
import numpy as np
fig, ax = plt.subplots(1, 1)
# Calculate a few first moments:
mean, var, skew, kurt = norm.stats(moments='mvsk')
# Display the probability density function (``pdf``):
x = np.linspace(norm.ppf(0.01), norm.ppf(0.99), 100)
ax.plot(x, norm.pdf(x),
'r-', lw=5, alpha=0.6, label='norm pdf')
ax.plot(x, norm.cdf(x),
'b-', lw=5, alpha=0.6, label='norm cdf')
# Check accuracy of ``cdf`` and ``ppf``:
vals = norm.ppf([0.001, 0.5, 0.999])
np.allclose([0.001, 0.5, 0.999], norm.cdf(vals))
# True
# Generate random numbers:
r = norm.rvs(size=1000)
# And compare the histogram:
ax.hist(r, normed=True, histtype='stepfilled', alpha=0.2)
ax.legend(loc='best', frameon=False)
plt.show()
Программа для равномерного распределения:
from scipy.stats import uniform
import matplotlib.pyplot as plt
import numpy as np
fig, ax = plt.subplots(1, 1)
# Calculate a few first moments:
#mean, var, skew, kurt = uniform.stats(moments='mvsk')
# Display the probability density function (``pdf``):
x = np.linspace(uniform.ppf(0.01), uniform.ppf(0.99), 100)
ax.plot(x, uniform.pdf(x),'r-', lw=5, alpha=0.6, label='uniform pdf')
ax.plot(x, uniform.cdf(x),'b-', lw=5, alpha=0.6, label='uniform cdf')
# Check accuracy of ``cdf`` and ``ppf``:
vals = uniform.ppf([0.001, 0.5, 0.999])
np.allclose([0.001, 0.5, 0.999], uniform.cdf(vals))
# True
# Generate random numbers:
r = uniform.rvs(size=1000)
# And compare the histogram:
ax.hist(r, normed=True, histtype='stepfilled', alpha=0.2)
ax.legend(loc='best', frameon=False)
plt.show()
Программа для логистического распределения.
from scipy.stats import logistic
import matplotlib.pyplot as plt
import numpy as np
fig, ax = plt.subplots(1, 1)
# Calculate a few first moments:
mean, var, skew, kurt = logistic.stats(moments='mvsk')
# Display the probability density function (``pdf``):
x = np.linspace(logistic.ppf(0.01),
logistic.ppf(0.99), 100)
ax.plot(x, logistic.pdf(x),
'g-', lw=5, alpha=0.6, label='logistic pdf')
ax.plot(x, logistic.cdf(x),
'r-', lw=5, alpha=0.6, label='logistic cdf')
vals = logistic.ppf([0.001, 0.5, 0.999])
np.allclose([0.001, 0.5, 0.999], logistic.cdf(vals))
# True
# Generate random numbers:
r = logistic.rvs(size=1000)
# And compare the histogram:
ax.hist(r, normed=True, histtype='stepfilled', alpha=0.2)
ax.legend(loc='best', frameon=False)
plt.show()
Теперь мы знаем, как выглядят интегральные формы нормального, равномерного и логистического законов и можем приступить к их сравнению с тестовым распределением поставив более общий вопрос — подбора закона распределения случайной величины по данным статистической выборки.
Как подобрать закон распределения, имея интегральное распределения вероятности тестовой выборки
Подготовим первую часть программы, которая будет осуществлять сравнение перечисленных интегральных распределений с тестовой выборкой. Для этого зададим общие для законов распределения основные параметры — математическое ожидание и среднеквадратичное отклонение, используя равномерное распределение.
Первая часть программы предназначена для подготовки к сравнению трёх законов распределения в интегральной форме.
from scipy.stats import logistic,uniform,norm,pearsonr
from numpy import sqrt,pi,e
import numpy as np
import matplotlib.pyplot as plt
fig, ax = plt.subplots(1, 1)
n=1000# объём выборки
x=uniform.rvs(loc=0, scale=150, size=n)#равномерное распределение
x.sort()#сортировка
print("Математическое ожидание по выборке(общее для сравниваемых распределений) -%s"%str(round(np.mean(x),3)))
print("СКО по выборке(общее для сравниваемых распределений) -%s"%str(round(np.std(x),3)))
print("Энтропийное значение погрешности-%s"%str(round(np.std(x)*sqrt(np.pi*np.e*0.5),3)))
pu=uniform.cdf(x/(np.max(x)))#равномерное интегральное распределение
ax.plot(x,pu, lw=5, alpha=0.6, label='uniform cdf')
pn=norm.cdf(x, np.mean(x), np.std(x))#нормальное интегральное распределение
ax.plot(x,pn, lw=5, alpha=0.6, label='norm cdf')
pl=logistic.cdf(x, np.mean(x), np.std(x))# логистическое интегральное распределение
ax.plot(x,pl, lw=5, alpha=0.6, label='logistic cdf')
Здесь и далее результаты для сравнения введены в функцию print для контроля за ходом вычислений.
Тестовое интегральное распределение и результаты сравнения приведены во второй части программы. В ней определяются коэффициенты корреляции между тестовым и каждым из трёх интегральных законов распределения.
Поскольку коэффициенты корреляции могут отличатся незначительно, введено дополнительное определение возвещённых квадратов отклонения.
Вторая часть программы
p=np.arange(0,n,1)/n
ax.plot(x,p, lw=5, alpha=0.6, label='test')
ax.legend(loc='best', frameon=False)
plt.show()
print("Корреляция между нормальным распределением и тестовым - %s"%str(round(pearsonr(pn,p)[0],3)))
print("Корреляция между логистическим распределением и тестовым - %s"%str(round(pearsonr(pl,p)[0],3)))
print("Корреляция между равномерным распределением и тестовым - %s"%str(round(pearsonr(pu,p)[0],3)))
print('Взвешенная сумма квадратов отклонения нормального распределения от теста -%i'%round(n*sum(((pn-p)/pn)**2)))
print('Взвешенная сумма квадратов отклонения логистического распределения от теста -%i'%round(n*sum(((pl-p)/pl)**2)))
print('Взвешенная сумма квадратов отклонения равномерного распределения от теста -%i'%round(n*sum(((pu-p)/pu)**2)))
Тестовая функция интегральной формы закона распределения построена в виде ступенчатого накопления –0+ 1/n +2/n+……+1
График и результат роботы программы.
Математическое ожидание по выборке (общее для сравниваемых распределений) —77.3
СКО по выборке (общее для сравниваемых распределений) —43.318
Энтропийное значение погрешности-89.511
Корреляция между нормальным распределением и тестовым — 0.994
Корреляция между логистическим распределением и тестовым — 0.998
Корреляция между равномерным распределением и тестовым — 1.0
Взвешенная сумма квадратов отклонения нормального распределения от теста —37082
Взвешенная сумма квадратов отклонения логистического распределения от теста —75458
Взвешенная сумма квадратов отклонения равномерного распределения от теста —6622
Тестовое распределение вероятностей в интегральной форме является равномерным. При минимальном отличии по коэффициенту корреляции для равномерного распределения взвешенное отклонение от тестового в 5,6 раза меньше, чем у нормального и в 11 раз меньше, чем у логистического.
Вывод
Приведенная реализация подбора закона распределения случайной величины по данным статистической выборки возможно будет полезной при решении аналогичных задач.
1. Элементы информационной теории измерений.
2. Statistical functions.
Случайной называют величину, которая в результате испытания примет одно и только одно
возможное значение, наперед не известное и зависящее от случайных причин,
которые заранее не могут быть учтены.
Случайные
величины обозначаются прописными буквами
, а их возможные значения – соответствующими строчными буквами
. Например, если случайная величина
имеет три возможных
значения, то они будут обозначены так:
.
Дискретной называют случайную
величину, которая принимает отдельные, изолированные возможные значения с
определенными вероятностями. Число возможных значений дискретной случайной
величины может быть конечным или бесконечным.
Законом распределения дискретной
случайной величины называют соответствие между возможными значениями и их
вероятностями; его можно задать таблично, аналитически (в виде формулы) и
графически.
При табличном задании закона
распределения дискретной случайной величины первая строка таблицы содержит
возможные значения, а вторая – их вероятности:
|
|
|
… |
|
|
|
|
… |
|
Приняв во внимание, что в одном
испытании случайная величина принимает одно и только одно возможное значение,
заключаем, что события
образуют полную
группу; следовательно, сумма вероятностей этих событий, то есть сумма
вероятностей второй строки таблицы, равна единице:
Если множество возможных значений
бесконечно
(счетно), то ряд
сходится и его
сумма равна единице.
Для наглядности закон распределения
дискретной случайной величины можно изобразить и графически. Для этого в
прямоугольной системе координат строят точки
, а затем соединяют их отрезками прямых. Полученную
фигуру называют многоугольником распределения.
Смежные темы решебника:
- Непрерывная случайная величина
- Функция распределения вероятностей
- Математическое ожидание
- Дисперсия и среднее квадратическое отклонение
Задача 1
В партии
из 25 кожаных курток 5 имеют скрытый дефект. Покупают 3 куртки. Найти закон
распределения числа дефектных курток среди купленных. Построить многоугольник
распределения.
Задача 2
Устройство
состоит из пяти независимых элементов. Вероятность безотказной работы каждого
элемента в одном опыте равна p=0,7. Для случайной
величины X элементов, безотказно работавших в одном опыте,
построить закон распределения, их графики, найти ее числовые характеристики.
Задача 3
С
вероятностью попадания при явном выстреле p=0.88 охотник стреляет по
дичи до первого попадания, но успевает сделать не более n=6
выстрелов.
ДСВ X — число
промахов:
а) Найти
закон распределения X.
б)
Построить многоугольник распределения.
в) Найти
вероятность событий: X<2, X<3,
1<X<3.
Задача 4
Составьте
закон распределения дискретной случайной величины ξ, вычислите ее
математическое ожидание, медиану, дисперсию, среднее квадратическое отклонение,
коэффициенты асимметрии и эксцесса, все моменты, а также начертите ее
многоугольник распределения и график функции распределения. Сделайте выводы по
результатам расчетов.
Производятся
последовательные испытания 5 приборов, причем испытания прекращаются сразу
после того, как проверяемый прибор окажется надежным. Вероятность выдержать
испытание для каждого прибора равна 0,8.
ξ – число испытаний, после которых закончится проверка.
Задача 5
В первой урне
6 шаров – 3 белых и 3 черных. Во второй 5 шаров –3 белых и 2 черных. Из первой
урны наудачу переложили во вторую 2 шара, после чего, из второй в первую
переложили 1 шар. Найти закон распределения случайной величины Х – числа белых
шаров в первой урне, после всех перекладываний шаров. Какова вероятность того,
что число белых шаров не больше, чем первоначально. Построить многоугольник
распределения.
Задача 6
В коробке
N=9 карандашей, из которых M=6 красных. Из этой коробки
наудачу извлекается n=5 карандашей.
а) Найти
закон распределения случайной величины X равной числу красных
карандашей в выборке.
б)
Построить многоугольник распределения.
в) Найти
вероятность события: 0<X<4.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 7
Производятся
последовательные испытания 5 приборов, причем испытания прекращаются сразу
после того, как проверяемый прибор оказался надежным. Вероятность выдержать
испытание для каждого прибора равна 0,8. X – число испытаний, после
которых закончится проверка. Составьте закон распределения случайной величины X,
вычислите ее математическое ожидание, дисперсию, среднее квадратическое
отклонение, а также начертите ее многоугольник распределения и график функции
распределения.
Задача 8
Проведено
n=5 независимых опытов. Вероятность взрыва в каждом опыте равна p=2/7.
Составить закон распределения числа взрывов, вычислить математическое ожидание,
дисперсию, среднеквадратическое отклонение и построить многоугольник
распределения.
Задача 9
Найти закон
распределения указанной дискретной СВ X и ее функции. распределения
F(x). Вычислить математическое ожидание М(Х), дисперсию D(X) и
среднее квадратичное отклонение σ(Х). Построить график
функции распределения F(x).
Вероятность отказа прибора за время испытания
на надежность равна 0,2; СВ Х — число приборов, отказавших в работе, среди 5
испытываемых.
Задача 10
В интернет-магазине
приобретается смартфон. Курьер приносит на дом покупателю 5 одинаковых
смартфонов, среди которых три (заранее неизвестно какие) бракованные.
Покупатель проверяет один за другим, пока не найдет хороший прибор, но делает
не более трех попыток.
Составить
закон распределения случайной величины – числа произведенных попыток.
Найти ее
математическое ожидание, дисперсию, среднее квадратическое отклонение.
Построить
функцию распределения.
Задача 11
В команде
9 спортсменов, из них 4 — первого разряда и 5 — второго. Наудачу отобраны 3
спортсмена. Найти ряд распределения дискретной случайной величины Х — числа
спортсменов второго разряда среди отобранных.
Задача 12
К контролеру с конвейера поступили 4 детали.
Вероятность брака для каждой детали равна 0,1. Детали проверяют одну за другой,
пока не наберут 2 доброкачественные.
Найти закон распределения вероятностей для числа проверенных деталей.
Задача 13
Двое рабочих,
выпускающих однотипную продукцию, допускают производство изделий второго сорта
с вероятностями соответственно равными 0,4 и 0,3. У каждого рабочего взято по 2
изделия. Для случайной величины Х —
числа изделий второго сорта среди отобранных для проверки четырех найти закон
распределения, математическое ожидание и дисперсию.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 14
На викторине
задаются 3 вопроса. Вероятность правильно ответить на первый – p, на
второй – r, на третий – s. После неправильного
ответа игрок выбывает из игры. Найти распределение числа правильных ответов.
Вычислить математическое ожидание. Решить задачу, если:
а) p=0.7; r=0.6; s=0.3;
б)
p=0.8; r=0.4; s=0.1.
Задача 15
На
некоторой остановке автобус останавливается только по требованию. Вероятность
остановки равна 0,2. За смену автобус проходит мимо этой остановки 5 раз.
Составить закон распределения числа остановки за смену, найти математическое
ожидание и дисперсию этой случайной величины.
Задача 16
Вероятность
того, что при составлении бухгалтерского баланса допущена ошибка, равна 0,3.
Аудитору на заключение представлено 3 баланса предприятия. Составить закон
распределения числа положительных заключений на проверяемые балансы.
Задача 17
Два товароведа
проверяют партию изделий. Производительность их труда соотносится как 5:4.
Вероятность определения брака первым товароведом составляет 85%, вторым – 90%.
Из проверенных изделий отбирают четыре. Найти а) математическое ожидание и б)
дисперсию числа годных изделий среди отобранных.
Задача 18
Два
станка выпускают детали с вероятностями брака 0,01 и 0,05 соответственно. В
выборке одна деталь выпущена первым станком и две – вторым. Найти распределение числа бракованных деталей
в выборке.
Задача 19
Монета
подбрасывается до тех пор, пока герб не выпадет 2 раза, но при этом делается не
более 4 бросаний. Найти распределение числа подбрасываний.
Задача 20
Вероятность
сдачи данного экзамена для каждого из n=5 студентов равна p=0.6.
Случайная величина X (СВ X) — число студентов, сдавших экзамен. Найти закон
распределения указанной дискретной СВ X и ее функцию распределения F(x).
Вычислить математическое ожидание M(X), дисперсию D(X) и
среднее квадратическое отклонение σ(x). Построить график функции распределения F(x).
Содержание:
Величина называется случайной, если она принимает свои значения в зависимости от исходов некоторого испытания (опыта), причем для каждого элементарного исхода она имеет единственное значение. Случайная величина называется дискретной (в узком смысле), если множество всех возможных значений ее конечно.
Геометрически множество всех возможных значений дискретной случайной величины представляет конечную систему точек числовой оси.
Пусть X — дискретная случайная величина, возможными и единственно возможными значениями которой являются числа
Обозначим через
вероятности этих значений (т. е. есть вероятность события, состоящего в том, что X принимает значение ).
События , очевидно, образуют полную группу событий, поэтому
Определение: Соответствие между всеми возможными значениями дискретной случайной величины и их вероятностями называется законом распределения данной случайной величины.
В простейших случаях закон распределения дискретной случайной величины X удобно задавать таблицей:
Здесь первая строка таблицы содержит все возможные значения случайной величины, а вторая — их вероятности.
Заметим, что таблицу значений дискретной случайной величины X, если это целесообразно, формально всегда можно пополнить конечным набором любых чисел, считая их значениями X с вероятностями, равными нулю.
Пример:
В денежной лотерее разыгрывается 1 выигрыш в 1000 руб., 10 выигрышей по 100 руб. и 100 выигрышей по 1 руб. при общем числе билетов 10 000. Найти закон распределения случайного выигрыша X для владельца одного лотерейного билета.
Решение:
Здесь возможные значения для X есть
Вероятности их соответственно будут
Закон распределения для выигрыша X может быть задан таблицей:
Число появлений т события А при независимых испытаниях можно рассматривать как случайную величину X со значениями Закон распределения этой величины дается биномиальной формулой
где {биномиальное распределение).
В частности, если р мало и п велико, причем — ограниченная величина, заключенная между двумя фиксированными положительными числами, то приближенно справедливо распределение Пуассона
Определение случайной величины
Определение 29. Случайной величиной называется величина, которая в результате опыта может принять то или иное значение, причем неизвестно заранее, какое именно.
Случайные величины (СВ) обозначаются большими буквами X, Y…
Примеры СВ: X — число попаданий при трех выстрелах, Y — абсцисса точки попадания при выстреле.
Случайные величины характеризуются своими возможными значениями, которые обозначаются маленькими буквами, соответствующими случайной величине: х,у…
Например, случайная величина X — число попаданий при трех выстрелах характеризуется следующими возможными значениями: .
Определение 30. Случайные величины, принимающие только отдаленные друг от друга возможные значения, которые можно заранее перечислить, называются дискретными случайными величинами (ДСВ).
Примеры ДСВ. 1) В приведенном выше примере СВ X. 2) Случайная величина Z- число вызовов скорой помощи за сутки. Ее возможные значения .
Определение 31. Случайные величины, возможные значения которых непрерывно заполняют некоторый промежуток (который иногда имеет резко выраженные границы, а чаще — расплывчатые, неопределенные), называются непрерывными случайными величинами (НСВ).
Примеры НСВ. 1) В приведенном выше примере СНВ Y — абсцисса точки попадания при выстреле. Ее возможные значения заполняют некоторый промежуток . 2) СНВ В — ошибка взвешивания тела на весах. Ее возможные значения заполняют некоторый промежуток .
Замечание. В классической теории вероятностей рассматриваются события, в современной теории вероятностей — случайные величины.
Определение 32. Случайная величина X называется характеристической случайной величиной события А.
Примеры перехода от событий к случайным величинам
1). Рассмотрим событие А, которое в результате опыта происходит или нет. Введем в рассмотрение случайную величину X такую, что если А происходит, то Х= 1, если А не происходит, то Х=0. Следовательно, Х — дискретная случайная величина с возможными значениями .
Если происходит ряд таких опытов, то общее число появлений события А равно сумме характеристических случайных величин X события А во всех опытах.
2). Пусть в действительности точка М совпадает с началом координат — точкой О. При измерении координат точки М были допущены ошибки. Событие А = {Ошибка в положении точки М не превзойдет заданного значения r}. Пусть X, Y — случайные ошибки при измерении координат точки. Это непрерывные случайные величины, так как их возможные значения непрерывно заполняют некоторые промежутки. Событие А равносильно попаданию точки M(X,Y) в пределы круга радиуса r с центром в точке О. Т.е. для выполнения события А случайные величины должны удовлетворять неравенству: . Вероятность события А равна вероятности выполнения неравенства, которая может быть определена, если известны свойства X, Y.
Законы распределения случайных величин
Для описания случайной величины (т.е. для возможности сказать, как часто следует ожидать появления тех или других возможных значений случайной величины в результате повторения опыта в одних и тех же условиях) необходимо знать закон распределения вероятностей случайной величины.
Определение 33. Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Рассмотрим дискретную случайную величину (ДСВ) Xс возможными значениями . Каждое из этих значений возможно, но не достоверно, и X может принять каждое из них с некоторой вероятностью.
В результате опыта величина X примет одно из этих значений, т.е. произойдет одно из полной группы несовместных событий: X = или X = или … X = .
Обозначим . Т.к. несовместные события образуют полную группу, то
— сумма вероятностей всех возможных значений ДСВ.
Эта суммарная вероятность каким-то образом распределена между отдельными значениями ДСВ. Задать это распределение, т.е. указать, какой вероятностью обладает каждое из событий, значит установить закон распределения СВ.
Говорят, что СВ подчинена данному закону распределения.
Формы закона распределения ДСВ
1. Простейшей формой задания закона распределения является таблица, называемая рядом распределения ДСВ.
Для элементов нижней строки должно выполняться условие: .
2. Формой задания закона распределения является многоугольник распределения — фигура, получаемая при графическом изображении ряда распределения.
Возможные значения откладываются по оси {Ох). Вероятности возможных значений откладываются по оси (Оу).
Механическая интерпретация ряда распределения ДСВ: Распределение единичной массы в нескольких изолированных точках по оси (Ох). (В отдельных точках сосредоточены соответственно массы , сумма которых равна 1.)
Пример №1
Рассмотрим опыт, в котором может появиться или не появиться событие А. Р(А) = 0,3. Рассмотрим случайную величину X — число появлений события А в данном опыте, т.е. возможные значения данной величины: = 0 (А не появится), = 1 (А появится). Построить ряд распределения и многоугольник распределения случайной величины X.
Решение.
Проверка: .
Пример №2
Стрелок производит 3 выстрела по мишени. Вероятность попадания в мишень при каждом выстреле равна 0,4. За каждое попадание стрелку засчитывастся 5 очков. Построить ряд и многоугольник распределения числа выбитых очков.
Решение.
ДСВ X — число выбитых очков. Вероятность попадания (успеха) равна р = 0,4, вероятность промаха (неудачи) равна q = 1 — 0,4 = 0,6. Количество испытаний n = 3.
Возможные значения X: = 0 (0 очков), = 1 (5 очков), = 2 (10 очков), = 3 (15 очков).
По формуле Бернулли найдем вероятности этих возможных значений:
Ряд распределения имеет вид:
Проверка: .
Многоугольник распределения:
Замечание. Ряд распределения является удобной формой представления закона распределения для ДСВ с конечным числом возможных значений. Однако эта характеристика не универсальна, так как ряд или многоугольник нельзя построить для непрерывной случайной величины (НСВ). Действительно, НСВ имеет бесчисленное множество возможных значений, которые сплошь заполняют некоторый промежуток, и перечислить их в какой-нибудь таблице нельзя.
Кроме того (это будет доказано позднее) каждое отдельное значение НСВ обычно не обладает никакой отличной от нуля вероятностью. Следовательно, для НСВ не существует ряда распределения в том смысле, в каком он существует для ДСВ.
Однако различные области возможных значений НСВ все же не являются одинаково вероятными, и для НСВ существует «распределение вероятностей», хотя и не в том смысле, как для ДСВ.
В силу этого, желательно иметь такую характеристику распределения вероятностей, которая была бы применима для самых разнообразных случайных величин.
Пример №3
Вероятности того, что студент сдаст экзамены в сессию по математическому анализу и органической химии соответственно равны 0,7 и 0,8. Составить закон распределения случайной величины Х − числа экзаменов, которые сдаст студент.
Решение. Рассматриваемая случайная величина X в результате экзамена может принять одно из следующих значений:
Найдем вероятности этих значений. Обозначим события:
– студент сдаст экзамен по математическому анализу;
– студент не сдаст экзамен по математическому анализу;
– студент сдаст экзамен по органической химии;
– студент не сдаст экзамен по органической химии.
По условию:
Тогда:
Итак, закон распределения случайной величины Х задается таблицей:
Контроль: 0,06+0,38+0,56=1.
Пример №4
Дискретная случайная величина Х задана законом распределения:
Найти функцию распределения F(x) и построить её график, а также
Решение: Так как сумма вероятностей возможных значений случайной величины Х равна 1, то
Найдем функцию распределения
Геометрически это равенство можно истолковать так: F(х) есть вероятность того, что случайная величина примет значение, которое изображается на числовой оси точкой, лежащей левее точки х.
Если то F(х)=0, так как на промежутке (− ∞; х) нет ни одного значения данной случайной величины;
Если то F(х) = Р(Х = −1) = 0,1, так как в промежуток (−∞; х) попадает только одно значение = −1;
Если так как в промежуток (−∞; х) попадают два значения
Если то так как в промежуток (−∞; х) попадают три значения
1=−1, x2=0 и x3=1;
Если то
=0,1+0,1+0,3+0,2=0,7, так как в промежуток (−∞; х) попадают четыре значения
Если то F(х)=Р(Х = −1)+Р(Х = 0)+Р(Х = 1)+Р(Х = 2)+Р(Х = 3) =
=0,1+0,1+0,3+0,2+0,3=1, так как в промежуток (−∞; х) попадают пять значений
Итак,
Изобразим функцию F(x) графически (рис. 4.3):
Найдем числовые характеристики случайной величины:
Пример №5
Составить закон распределения случайной величины Х − числа выпадений пятерки при трех бросаниях игральной кости. Вычислить этой величины.
Решение: Испытание состоит в одном бросании игральной кости. Так как кость бросается 3 раза, то число испытаний n = 3.
Вероятность события А − «выпадение пятёрки» в каждом испытании одна и та же и равна 1/6, т.е. где − «выпадения не пятёрки».
Случайная величина Х может принимать значения: 0;1;2;3.
Вероятность каждого из возможных значений Х найдём по формуле Бернулли:
Таким образом закон распределения случайной величины Х имеет вид:
Контроль: 125/216+75/216+15/216+1/216=1.
Найдем числовые характеристики случайной величины Х:
Пример №6
Станок-автомат штампует детали. Вероятность того, что изготовленная деталь окажется бракованной равна 0,002. Найти вероятность того, что среди 1000 отобранных деталей окажется:
а) 5 бракованных;
б) хотя бы одна бракованная.
Решение: Число n = 1000 велико, вероятность изготовления бракованной детали р = 0,002 мала, и рассматриваемые события (деталь окажется бракованной) независимы, поэтому имеет место формула Пуассона:
Найдем =np=1000·0,002=2.
а) Найдем вероятность того, что будет 5 бракованных деталей среди отобранных (m = 5):
б) Найдем вероятность того, что будет хотя бы одна бракованная деталь среди отобранных.
Событие А − «хотя бы одна из отобранных деталей бракованная» является противоположным событию— «все отобранные детали не бракованные». Следовательно, Отсюда искомая вероятность равна:
Математическое ожидание
Определение: Математическим ожиданием дискретной случайной величины называется сумма парных произведений всех возможных ее значений на их вероятности.
Если есть (полный) набор всех значений дискретной случайной величины — соответствующие им вероятности, то, обозначая буквой М математическое ожидание, будем иметь
где
Очевидно, математическое ожидание случайной величины X не изменится, если таблицу значений ее пополнить конечным числом любых чисел, считая, что вероятности этих чисел равны нулю.
Математическое ожидание М (X) случайной величины есть величина постоянная и поэтому представляет числовую характеристику случайной величины X.
Пример №7
Найти математическое ожидание выигрыша X.
Решение:
Пользуясь помещенной там таблицей, имеем
Как нетрудно сообразить, М(Х) = 21 коп. есть «справедливая» цена билета.
Замечание 1. Отдельные слагаемые суммы (1) представляют собой математические ожидания случайных величин , возможными значениями которых являются с вероятностями соответственно .
Замечание 2. Пусть —соответственно наименьшие и наибольшие возможные значения случайной величины X. Имеем
Таким образом,
Таким образом, математическое ожидание случайной величины является некоторым ее средним значением.
Замечание 3. Математическое ожидание числа появлений события А при одном испытании совпадает с вероятностью этого события Р(А) = р.
Действительно, пусть X — число появлений события А в данном испытании. Случайная величина X может принимать два значения: (событие А наступило) с вероятностью и (событие А не наступило) с вероятностью
Поэтому
Основные свойства математического ожидания
Укажем важнейшие свойства математического ожидания. Доказательства будут проведены для дискретных случайных величин. Однако соответствующие теоремы справедливы также и для непрерывных случайных величин, поэтому при формулировках этих теорем мы не будем упоминать, что рассматриваемые случайные величины дискретны.
Нам понадобится выяснить смысл арифметических операций и т. п., где X и У — дискретные случайные величины. Нетрудно дать соответствующие определения.
Например, под суммой X + У понимается случайная величина Z, значениями которой являются допустимые суммы — все возможные значения соответственно случайных величин X и У, причем соответствующие вероятности равны
Если какая-нибудь из комбинаций невозможна, то условно полагают ; это не отразится на математическом ожидании суммы.
Аналогично определяются остальные выражения.
Различают также независимые и зависимые случайные величины. Две случайные величины считаются независимыми, если возможные значения и закон распределения каждой из них один и тот же при любом выборе допустимых значений другой. В противном случае они называются зависимыми. Несколько случайных величин называются взаимно независимыми, если возможные значения и законы распределения любой из них не зависят от того, какие возможные значения приняли остальные случайные величины.
Теорема: Математическое ожидание постоянной величины равно этой постоянной, т. е. если С — постоянная величина, то
Доказательство: Постоянную величину С можно рассматривать как случайную дискретную величину, принимающую лишь одно возможное значение С с вероятностью р = 1. Поэтому
Теорема: Математическое ожидание суммы двух (или нескольких) случайных величин равно сумме математических ожиданий этих величин, т. е. если X и У — случайные величины, то
и т. п.
Доказательство: 1) Пусть случайная величина X принимает значения с вероятностями а случайная величина У принимает значения с вероятностями 1, 2, …, m). Тогда возможными значениями случайной величины X + У будут суммы вероятности которых равны
Как было отмечено выше, все комбинации можно считать допустимыми, причем если сумма невозможна, то полагаем .
Имеем
Воспользовавшись очевидными свойствами суммы: 1) сумма не зависит от порядка слагаемых и 2) множитель, не зависящий от индекса суммирования, можно выносить за знак суммы, из (4) получим
Сумма представляет собой вероятность события, состоящего в том, что случайная величина X принимает значение xt при условии, что случайная величина У принимает одно из своих возможных значений (что достоверно); это сложное событие, очевидно, эквивалентно тому, что X принимает значение xt и поэтому
Аналогично,
Тогда из формулы (5) получаем
что и требовалось доказать.
2) Для нескольких случайных величин, например для трех X, У и Z, имеем
и т. д.
Следствие. Если С — постоянная величина, то
Теорема: Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий, т. е.
где X и У — независимые случайные величины.
Доказательство: Пусть — законы распределения соответственно случайных величин X и У. Так как X и У независимы, то полный набор значений случайной величины XY состоит из всех произведений вида , причем вероятности этих значений по теореме умножения для независимых событий равны .
Имеем
что и требовалось доказать.
Следствие 1. Математическое ожидание произведения нескольких взаимно независимых случайных величин равно произведению математических ожиданий этих величин.
Действительно, например, для трех взаимно независимых случайных величин X, У, Z имеем
и т. п.
Следствие 2. Постоянный множитель можно выносить за знак математического ожидания.
Если С — постоянная величина, а X — любая случайная величина, то, учитывая, что С и X независимы, на основании теоремы 1 получим
Следствие 3. Математическое ожидание разности любых двух случайных величин X и Y равно разности математических ожиданий этих величину т. е.
Действительно, используя теорему о сумме математических ожиданий и следствие 2, получим
Дисперсия
Пусть X — случайная величина, М(Х) — ее математическое ожидание (среднее значение). Случайную величину X — М(Х) называют отклонением.
Теорема: Для любой случайной величины X математическое ожидание ее отклонения равно нулю, т. е.
Локазательство. Действительно, учитывая, что М(Х) — постоянная величина, имеем
Определение: Дисперсией (рассеянием) случайной величины называют математическое ожидание квадрата отклонения этой величины от ее математического ожидания.
Отсюда, обозначая дисперсию буквой D, для случайной величины X будем иметь
Очевидно, что дисперсия случайной величины постоянна, т. е. является числовой характеристикой этой величины.
Если случайная величина X имеет закон распределения , то, обозначая для краткости , из формулы (1) будем иметь
Корень квадратный из дисперсии D{X) называется средним квадратичным отклонением а (иначе— стандартом) этой величины:
Пример №8
Пусть закон распределения случайной величины задан таблицей:
Определить математическое ожидание М(Х), дисперсию D(X) и среднее квадратичное отклонение . Имеем
отсюда
Дисперсия D{X)служит мерой рассеяния (разброса)значений дискретной случайной величины X. Действительно, пусть D(X) мала. Тогда из формулы (2) получаем, что все слагаемые также малы. Отсюда следует, что если не обращать внимания на значения, имеющие малую вероятность (такие значения практически невозможны), то все остальные значения мало отклоняются от . Таким образом, при малой дисперсии D(X) почти достоверно, что значения случайной величины концентрируются около ее математического ожидания (за исключением, быть может, сравнительно малого числа отдельных значений). В частности, если D(X) = 0, то, очевидно, X = и случайная величина представляет собой точку на числовой оси. Если D(X) велика, то концентрация значений случайной величины X около какого-нибудь центра исключается.
Теорема: Дисперсия случайной величины равна разности между математическим ожиданием квадрата этой величины и квадратом ее математического ожидания, т. е.
Доказательство: Используя основные теоремы о математических ожиданиях случайных величин, имеем
Теорема: Дисперсия постоянной величины равна нулю. Действительно, если С — постоянная величина, то М(С) = С и, следовательно,
Результат этот очевиден, так как постоянная величина изображается одной точкой на числовой оси Ох и не имеет рассеяния.
Теорема: Дисперсия суммы двух независимых случайных величин X и Y равна сумме дисперсий этих величин, т. е.
Доказательство: Так как
то имеем
где
— так называемый корреляционный момент величин X и У. Если случайные величины X и У независимы, то случайные величины X — М(Х) и У — М(У), отличающиеся от X и У на постоянные величины, очевидно, также независимы. Поэтому в силу теорем 3 имеем
и, следовательно, справедлива формула (5).
Следствие 1. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме дисперсий этих величин.
Следствие 2. Если С — постоянная величина, то
Таким образом, случайные величины X и X + С имеют одинаковую меру рассеяния.
Теорема: Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат, т. е.
Доказательство: Если С — постоянный множитель, то в силу теоремы 2 имеем
Таким образом, рассеяние величины СХ в С2 раз больше рассеяния величины X.
Следствие. Дисперсия разности двух независимых случайных величин равна сумме дисперсий этих величин, т. е. если случайные величины X и У независимы, то
Действительно, на основании теорем 4 и 5 имеем
Математическое ожидание и дисперсия случайной величины являются ее основными числовыми характеристиками.
Пример №9
Определить математическое ожидание и дисперсию для числа X появления события А при п независимых испытаниях, в каждом из которых вероятность события Р(А) = р постоянна.
Случайная величина X принимает значения и распределена по биномиальному закону
где
Величину X можно рассматривать как сумму независимых случайных величин
где — число появлений события А в -м испытании. Случайная величина X, принимает лишь два значения: 1, если событие А появилось в i-м испытании, и 0, если событие А не произошло в i-м испытании. Вероятности этих значений . Отсюда
. Отсюда, используя теорему о математическом ожидании суммы, будем иметь
Таким образом, математическое ожидание числа появлений события А в условиях схемы Бернулли совпадает со «средним числом» появления этого события в данной серии испытаний. Для дисперсии случайной величины X, получаем
Отсюда по свойству дисперсии суммы независимых случайных величин (теорема) будем иметь
Поэтому среднее квадратичное отклонение (стандарт)
Формулы (8) и (9) дают математическое ожидание и дисперсию для биномиального закона распределения.
Замечание. Теперь становится понятным смысл случайной величины
в приближенных формулах Лапласа, а именно, t представляет собой отклонение числа появлений события А от его математического ожидания, измеренное в стандартах (так называемое нормированное отклонение).
Рассмотрим п дискретных попарно независимых случайных величин , дисперсии которых равномерно ограничены:
Эти величины, возможно, имеют значительный разброс, однако их среднее арифметическое
ведет себя достаточно «кучно».
А именно, при указанных выше условиях имеет место замечательная теорема:
Теорема Чебышева: Для любого положительного > 0 вероятность неравенства
сколь угодно близка к 1, если число случайных величин п достаточно велико, т. е.
(закон .больших чисел в форме Чебышева).
Теорема Чебышева находит применение в теории ошибок, статистике и т. п.
Непрерывные случайные величины. Функция распределения
Случайную величину X будем называть непрерывной, если все ее возможные значения целиком заполняют некоторый конечный или бесконечный промежуток числовой оси. Предполагается, что при каждом испытании случайная величина X принимает одно и только одно значение . Заметим, что дискретные и непрерывные случайные величины не исчерпывают все типы случайных величин.
Для характеристики непрерывной случайной величины X вводят функцию распределения
называемую интегральным законом распределения.
Если значения случайной величины X рассматривать как точки числовой оси Ох, то Ф(х) представляет собой вероятность события, состоящего в том, что наблюдаемое значение случайной величины X принадлежит интервалу , т. е. находится левее точки х. Этот интервал зависит от правого конца его х, и поэтому естественно вероятность является функцией от х, определенной на всей оси .
Заметим, что функция распределения имеет смысл также для дискретных случайных величин.
Функция распределения Ф(х) обладает следующими свойствами:
I.Функция Ф(х) есть неубывающая функция аргумента х, т. е. если то .
Действительно, если х’ > х, то из события очевидно, следует событие . Но тогда вероятность Ф(х’) второго события не меньше вероятности Ф(х) первого.
II.Так как Ф(х) — вероятность, то справедливо неравенство
III.
Действительно, событие очевидно, невозможно, а событие достоверно.
Зная функцию распределения Ф(х), можно для любого промежутка определить — вероятность попадания случайной величины X в этот промежуток (здесь принято левый конец а промежутка включать, а правый не включать в этот промежуток).
В самом деле, пусть А есть событие , В — событие и С — событие .
Тогда, очевидно, имеем
Так как события А и С несовместны, то по теореме сложения вероятностей получаем Р(Б) = Р(А) + Р(С), отсюда
причем в силу свойства I.
Таким образом, вероятность того, что случайная величина X примет значение, принадлежащее промежутку [a, b), равна приращению ее функции распределения на этом промежутке.
В дальнейшем случайную величину X будем называть непрерывной лишь в том случае, когда ее функция распределения Ф(х) непрерывна на оси .
Теорема: Вероятность (до опыта) того, что непрерывная случайная величина X примет заранее указанное строго определенное значение а, равна нулю.
В самом деле, в силу формулы (2) имеем
Положим, что ; тогда в пределе промежуток [а, х) будет содержать единственную точку а. Кроме того, в силу непрерывности функции Ф(х) в точке а имеем
Переход я к пределу при в равенстве (3), получим
Таким образом, при непрерывной функции распределения вероятность «попадания в точку» равна нулю.
Следствие. Для непрерывной случайной величины X справедливы равенства
где — ее функция распределения. Действительно,
Аналогично доказывается второе равенство.
Замечание. В общем случае невозможные события и события с нулевой вероятностью могут оказаться неэквивалентными.
Предположим теперь, что для непрерывной случайной величины X ее функция распределения Ф(х) имеет непрерывную производную
Функцию ф(х) называют плотностью вероятности (для данного распределения) или дифференциальным законом распределения случайной величины X.
Термин плотность вероятности имеет следующий смысл. Пусть — бесконечно малый промежуток. Тогда в силу формулы (2′) имеем
Заменяя бесконечно малое приращение функции ее дифференциалом , получаем приближенное равенство
Таким образом, плотность вероятности представляет собой отношение вероятности попадания точки в бесконечно малый промежуток к длине этого промежутка.
Так как плотность вероятности ф(х) является производной неубывающей функции Ф(х), то она неотрицательна: . В отличие от вероятности, плотность вероятности может принимать сколь угодно большие значения.
Так как Ф(х) является первообразной для ф(х), то на основании формулы Ньютона—Лейбница имеем
Отсюда в силу (3′) получаем
Геометрически (рис. 271) эта вероятность представляет собой площадь S криволинейной трапеции, ограниченной — графиком плотности вероятности у = ф(х), осью Ох и двумя ординатами
Полагая получаем достоверное событие , вероятность которого равна единице. Следовательно,
Полагая в формуле (6) и обозначая для ясности переменную интегрирования х другой буквой, например t (это законно для определенного интеграла), получаем функцию распределения
Числовые характеристики непрерывной случайной величины
Будем рассматривать бесконечно малый промежуток как «жирную точку» х оси Ох. Тогда вероятность того, что случайная величина X принимает значение, совпадающее с этой «жирной точкой» х, равна y(x)dx и математическое ожидание этого события есть
Представляя прямую как бесконечное множество таких жирных точек, по аналогии с определением математического ожидания дискретной случайной величины, получаем естественное определение математического ожидания непрерывной случайной величины (только здесь суммирование заменяется интегрированием).
Определение: Под математическим о жид а ни ем непрерывной случайной величины X понимается число
(конечно, это определение имеет смысл лишь для таких случайных величин X, для которых интеграл (1) сходится).
Для дисперсии непрерывной случайной величины X сохраним прежнее определение
Из формулы (1) вытекает
(конечно, в предположении, что интеграл (2) сходится). Можно также пользоваться формулой
Можно доказать, что основные свойства математического ожидания и дисперсии дискретных случайных величин сохраняются также и для непрерывных случайных величин.
Пусть теперь все возможные значения непрерывной случайной величины X целиком заполняют конечный отрезок . Тогда ф(х) = 0 при и при и, следовательно,
Аналогично,
Равномерное распределение
Непрерывная случайная величина X, все возможные значения которой заполняют конечный промежуток , называется равномерно распределенной, если ее плотность вероятности ф(х) постоянна на этом промежутке.
Иными словами, для равномерно распределенной случайной величины все ее возможные значения являются равновозможными.
Пусть, например, . Так как в этом случае ф(х) = const при , то
отсюда
Пусть (рис. 272). Тогда
т. е.
где L — длина (линейная мера) всего отрезка и — длина частичного отрезка .
Значения случайной величины X, т. е. точки х отрезка , можно рассматривать как всевозможные элементарные исходы некоторого испытания. Пусть событие А состоит в том, что результат испытания принадлежит отрезку . Тогда точки отрезка есть благоприятные элементарные исходы события А.
Согласно формуле (1) имеем геометрическое определение вероятности: под вероятностью события А понимается отношение меры множества элементарных исходов, благоприятствующих событию А, к мере L множества всех возможных элементарных исходов в предположении, что они равновозможны:
Это определение естественно переносит классическое определение вероятности на случай бесконечного числа элементарных исходов.
Аналогичное определение можно ввести также тогда, когда элементарные исходы испытания представляют собой точки плоскости или пространства.
Пример №10
В течение часа (t —- время в часах) на остановку прибывает один и только один автобус. Какова вероятность того, что пассажиру, пришедшему на эту остановку в момент времени t = 0, придется ожидать автобус не более 10 мин?
Решение:
Здесь множество всех элементарных исходов образует отрезок [0, 1], временная длина которого L = 1, а множество благоприятных элементарных исходов составляет отрезок [0,1/6] временной длины = 1/6.
Поэтому искомая вероятность есть
Пример №11
В квадрат К со стороной а с вписанным в него кругом S (рис. 273) случайно бросается материальная точка М. Какова вероятность того, что эта точка попадает в круг S?
Решение:
Здесь площадь квадрата есть К = а2, а площадь круга
За искомую вероятность естественно принять отношение
Эта вероятность, а следовательно, и число л, очевидно, могут быть определены экспериментально.
Нормальное распределение
Распределение вероятностей случайной величины X называется нормальным, если плотность вероятности подчиняется закону Гаусса
где — некоторые постоянные, причем а > 0 и b > 0. В этом случае график плотности вероятности представляет собой смещенную кривую Гаусса (рис. 274), симметричную относительно прямой и с максимальной ординатой
Для удобства выкладок эту кривую центрируем, введя новые координаты и . Тогда закон Гаусса примет вид
и будет представлять собой дифференциальный закон распределения случайной величины
Постоянные а и b в формуле (2) не являются произвольными, так как для плотности вероятностей должно быть выполнено условие
Делая замену переменной , будем иметь
Отсюда на основании формулы (3) находим
т. е.
Таким образом,
Для математического ожидания случайной величины будем иметь
(ввиду нечетности подынтегральной функции). Отсюда
Таким образом, при нормальном распределении случайной величины X ее математическое ожидание х0 совпадает с точкой пересечения оси симметрии графика соответствующей кривой Гаусса с осью Ох (центр рассеивания).
Для дисперсии случайной величины X получаем
Полагая и интегрируя по частям, с учетом формулы (4) будем иметь
Таким образом, из формулы (9) получаем
и, следовательно,
Отсюда для среднего квадратичного отклонения величины X получим
Введя обозначение , будем иметь
Подставляя эти значения в формулу (1), получим стандартный вид нормального закона распределения случайной величины X в дифференциальной форме:
где
Таким образом, нормальный закон распределения зависит только от двух параметров: математического ожидания и среднего квадратичного отклонения.
Нормальный закон распределения случайной величины в интегральной форме имеет вид
Формулы (11) и (12) упрощаются, если ввести нормированное отклонение
тогда
. Полагая в интеграле (12) , получаем
где t определяется формулой (13) и — стандартный интеграл вероятностей.
Отсюда получаем, что для случайной величины X, подчиняющейся нормальному закону, вероятность попадания ее на отрезок есть
В частности, вероятность того, что отклонение величины X от ее математического ожидания х0 по абсолютной величине будет меньше а, равна
Полагая , получаем
т. е. такое отклонение является почти достоверным (правило трех сигм).
Нормальный закон распределения вероятностей находит многочисленные применения в теории ошибок, теории стрельбы, физике и т. д.
Пример №12
Задана плотность распределения
Определить коэффициент к и функцию распределения
Решение.
Отсюда
Построим график (рис. 2.12).
Найдем функцию распределения, используя (2.7):
Построим график (рис. 2.13).
Функция распределения — универсальный закон распределения (для ДСВ и НСВ)
Для количественной характеристики распределения вероятностей любой случайной величины удобнее пользоваться не вероятностью события X = х, а вероятностью X < х, где х — некоторая текущая переменная.
Определение 34. Задание вероятности выполнения неравенства X < х , рассматриваемой как функции аргумента х, называется функцией распределения (или интегральным законом распределения, или интегральной функцией распределения) случайной величины X:
.
F(x) — универсальная характеристика: существует как для ДСВ, так и для НСВ. Она полностью характеризует СВ с вероятностной точки зрения, т.е. является одной из форм закона распределения.
Геометрическая интерпретация F(x): если рассматривать СВ как случайную точку X оси (Ох), которая в результате опыта может занять то или иное положение, то функция распределения F(x) есть вероятность того, что эта случайная точка X в результате опыта попадет левее точки х.
Для ДСВ X, которая может принимать возможные значения функция распределения будет иметь вид:
,
где символ < х под знаком суммы обозначает, что суммирование распространяется на все возможные значения СВ, которые по своей величине меньше аргумента х.
Свойства F(x).
1. F(x) — неотрицательная функция, заключенная между 0 и 1: .
Пояснение: справедливость свойства вытекает из того, что F(x) определена как вероятность события X < х.
2. F(x) — неубывающая функция своего аргумента, т.е. при .
Пояснение (см. рис. выше): будем увеличивать х, т.е. перемещать точку х вправо по оси (Ох). Очевидно, что при этом вероятность того, что точка X попадет левее точки х не может уменьшаться, следовательно, функция F(x) с возрастанием х убывать не может.
3. .
Пояснение (см. рис. выше): будем неограниченно перемещать точку х влево по оси (Ох). При этом попадание случайной точки X левее точки х в пределе становится невозможным событием. Поэтому естественно полагать, что вероятность этого события стремится к нулю.
4. .
Пояснение (см. рис. выше): будем неограниченно перемещать точку х вправо по оси (Ох). При этом попадание случайной точки X левее точки х в пределе становится достоверным событием. Вероятность достоверного события по определению равна 1.
5. F(x) — непрерывна слева, т.е. .
6. Вероятность появления случайной величины в интервале равна разности значений функции распределения в концах интервала:
.
Доказательство.
Рассмотрим три события: , причем события В и С -несовместные.
Очевидно, что А = В + С. По теореме сложения вероятностей несовместных событий имеем:
.
Перепишем данное равенство, воспользовавшись определением функции распределения:
, отсюда:
. (что и требовалось доказать)
Замечание. Если F(x) возрастает в каждой точке интервала (а; b), то возможные значения случайной величины непрерывно заполняют этот интервал, т.к. согласно свойству № 6, вероятность того, что СВ примет значение, заключенное в сколь угодно малой части этого интервала отлична от нуля. Таким образом, монотонно возрастающей функции F(x) на интервале (а; b) соответствует непрерывная случайная величина, возможные значения которой непрерывно заполняют этот интервал. Отсюда следует другое определение НСВ:
Определение 35. Непрерывной случайной величиной называется случайная величина, функция распределения которой непрерывна.
Будем неограниченно уменьшать участок , полагая, что . В пределе вместо вероятности попадания случайной величины X в интервал получим вероятность того, что эта величина примет отдельно взятое значение :
(из свойства 6)
Значение этого предела зависит от того, непрерывна ли функция F(x) в точке или же терпит разрыв.
Если в точке функция F(x) имеет разрыв, то — значению скачка в точке в .
Если в точке функция F(x) непрерывна, то .
Вывод: т.к. непрерывная случайная величина X имеет непрерывную функцию распределения F(x), то из равенства нулю предела для непрерывной функции в точке следует, что и вероятность любого отдельного значения непрерывной случайной величины равна нулю:
.
Таким образом, нулевой вероятностью могут обладать не только невозможные, но и возможные события, т.е. событие — возможно, а Р(А) = 0. Р() = 1, но — не достоверно. Говорят, что А происходит почти всегда.
Вывод парадоксален, но он вполне согласуется со статистическим определением вероятности. Равенство нулю вероятности события характеризует тенденцию частоты этого события неограниченно убывать при увеличении числа опытов, т.е. частота только приближается к вероятности, и ни в коей мере не означает, что данное событие равно нулю.
Например: 1.) Тело имеет определенную массу, а ни одна из точек внутри тела определенной массой не обладает. Сколь угодно малый объем, выделенный из тела, обладает конечной массой, но она стремится к нулю по мере его уменьшения и равна нулю для точки. 2.) При непрерывном
распределении вероятностей вероятность попадания на сколь угодно малый участок может быть отлична от нуля, тогда как вероятность попадания в строго определенную точку равна нулю.
Механическая интерпретация непрерывной случайной величины: распределение единичной массы непрерывно по оси абсцисс, причем ни одна точка не обладает конечной массой.
Следствия из свойства 6:
1. Если все возможные значения X принимает интервал (a; b), F(x) = 0 при ; F(x) = 1 при .
2. , т.е для НСВ граничные точки могут как включаться, так и не включаться в промежуток (a; b).
Графики функции распределения
1. Для ДСВ функция распределения .
Когда текущая переменная х проходит через какое-нибудь из возможных значений ДСВ X, функция распределения F(x) меняется скачкообразно, причем величина скачка равна вероятности этого значения. Таким образом, F(x) любой ДСВ — разрывная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям СВ и равны вероятностям этих значений. Сумма всех скачков равна 1.
2. Для НСВ функция распределения — непрерывная функция во всех точках и заключенная между нулем и единицей (следует из свойств).
Замечание.
Если для ДСВ увеличить число возможных значений и уменьшить интервалы между ними, то число скачков будет больше, а сами скачки меньше, следовательно, ступенчатая кривая становится более плавной, ДСВ постепенно приближается к НСВ, а ее функция распределения — к непрерывной функции распределения.
3. Можно построить примеры СВ, возможные значения которых непрерывно заполняют некоторый промежуток, но для которых F(x) не везде является непрерывной, а в отдельных точках терпит разрыв. Такие СВ называются смешанными.
График F(x) в общем случае представляет собой график неубывающей функции, значения которой начинаются от 0 и доходят до 1, причем в отдельных точках функция может иметь скачки.
Пример №13
Стрелок производит 3 выстрела по мишени. Вероятность попадания в мишень при каждом выстреле равна 0,4. Построить функцию распределения числа попаданий. Найти вероятность того, что будет а) меньше 2 попаданий, b) не больше двух попаданий, с) больше одного попадания, d) число попаданий будет либо 1, либо 2.
Решение.
Ранее мы построили ряд распределения числа попаданий. Ряд распределения имеет вид:
Это ДСВ, следовательно, функция распределения находится по формуле: .
1) при , .
2) при , .
3) при , .
4) при , .
5) при , .
Найдем вероятность того, что будет а) меньше 2 попаданий, b) не больше двух попаданий, с) больше одного попадания, d) число попаданий будет либо 1, либо 2.
a) = (по определению функции распределения) = F(2) = 0,648
b) = Р(Х < 2) + Р(Х = 2) = F(2) + Р(Х = 2) = 0,648 + 0,288 = 0,936
c) Р(Х > 1) = = 1 — [Р(Х < 1) + Р(Х = 1)] = 1 — [F(l) + Р(Х = 1)] = 1 — [0,216 + 0,432] = 0,352
d) + Р(Х = 2) = F(2) — F( 1) + Р(Х = 2) = 0,648 — 0,216 + 0,288 = 0,72
Пример №14
Функция распределения непрерывной случайной величины задана выражением:
Найти коэффициент а. Определить вероятность того, что СВ X в результате опыта примет значение на участке а) (1; 2), b)[1; 2].
Решение.
Т. к. X — НСВ, то F(x) — непрерывная функция, следовательно, при х = 3 должно выполняться равенство, что F(x) = 1, т. е.
.
Найдем вероятность того, что Х в результате опыта примет значение на участке (1; 2):
.
Найдем вероятность того, что Х в результате опыта примет значение на участке [1; 2]:
= (т.к. СВ — непрерывная, то) = .
Замечание. Функция распределения F(x) случайной величины является ее исчерпывающей вероятностной характеристикой. Но она имеет недостаток, заключающийся в том, что по ней трудно судить о характере распределения СВ в в небольшой окрестности той или другой точки числовой оси. Более наглядное представление о характере распределения НСВ в окрестностях различных точек дастся другой функцией — плотностью распределения вероятности.
Плотность распределения вероятностей НСВ
Пусть X — непрерывная случайная величина, ее функция распределения F{x) — непрерывная и дифференцируемая функция. Рассмотрим участок , где — длина участка. Тогда вероятность попадания СВ Х на данный участок можно найти по формуле (по свойству 6):
.
Рассмотрим предел отношения приращения функции F(x) на участке к длине этого участка (или среднюю вероятность, приходящуюся на единицу длины участка) при условии, что длина стягивается в точку:
— по определению производной.
Определение 36. Предел отношения вероятности попадания НСВ на элементарный участок от х до к длине этого участка, когда стремится к нулю или производная функции распределения F'(x) НСВ называется плотностью распределения НСВ Х в точке х и обозначается :
.
Другие названия плотности: плотность вероятности, дифференциальная функция распределения, дифференциальный закон распределения.
существует только для непрерывных СВ. Она является одной из форм закона распределения.
характеризует плотность, с которой распределяются значения СВ в данной точке.
Механическая интерпретация: характеризует плотность распределения масс по оси абсцисс.
Определение 37. Кривая, изображающая плотность распределения СВ, называется кривой распределения.
Замечание. Если возможные значения СВ заполняют некоторый конечный промежуток, то = 0 вне этого промежутка.
Геометрическая интерпретация .
Перепишем определение: .
Из данного равенства следует, что , т.к. х — независимая переменная, то .
Отсюда следует, что , где S — площадь элементарного прямоугольника, опирающегося на участок dx. (см. рис.)
При площадь прямоугольника приближается к площади криволинейной трапеции, которую можно найти с помощью определенного интеграла: .
Величина называется элементом вероятности.
Рассмотрим большой участок , тогда:
Вероятность того, что НСВ примет значение, х принадлежащее интервалу , равна площади криволинейной трапеции, опирающейся на интервал оси (Ох) :
.
Замечание. Для НСВ непринципиально, какие знаки в неравенстве брать < или : , т. е. включать или не включать крайние точки интервала, потому что в них вероятность все равно равна нулю.
Связь F(x) и .
Нам известно, что
Выразим функцию распределения F(x) через плотность. По определению .
Из формулы (1) следует, что
Геометрически, это площадь кривой распределения, лежащая левее точки х.
Замечания.
1. Формулу (3) можно доказать по-другому: по определению дифференциала функции имеем, что , следовательно,
.
2. Формулу (1) можно доказать на основании свойства функции распределения: ,
Но согласно равенству (3) , поэтому
.
3. Функция распределения F(x)- безразмерная величина, размерность плотности обратна размерности случайной величины.
Свойства плотности распределения
1. — неотрицательная функция, т. е. .
Пояснение: это следует из того, плотность распределения есть производная от неубывающей функции F(х). Геометрически: вся кривая распределения лежит не ниже оси абсцисс.
2. Условие нормировки: интеграл в бесконечных пределах от плотности распределения равен 1:
—со
Доказательство
Подставим в равенство (3) , учитывая, что .
Геометрически данное свойство означает следующее: полная площадь, ограниченная кривой распределения и осью абсцисс равна единице.
Пример №15
Дана функция распределения НСВ X:
.
Найти 1) коэффициент а, 2) плотность распределения , 3) P(0,25 < X < 0,5), построить графики функций F(x) и .
Решение.
1) Т. к. F(x) — непрерывная функция, то при х = 1 должно выполняться равенство, что . То есть . Отсюда, а = 1.
2) = F(x), тогда = .
3) 1 способ: (0,25; 0,5) входит в интервал (0; 1). По свойству 6 функции распределения: .
2 способ. Можно было найти по формуле (1) с помощью плотности распределения:
.
Пример №16
Пусть НСВ X подчинена закону распределения с плотностью
,
Найти 1) коэффициент а, 2) функцию распределения F(x), 3) , 4) построить графики функций F(x) и .
Решение.
1) Для нахождения коэффициента а воспользуемся условием нормировки (4):
.
2) Найдем функцию распределения по формуле (3): .
Если , то = 0, следовательно .
Если , то .
Если , то .
Итак, F(x) = ,
3) можно найти двумя способами,. .
1 способ: По свойству 6 функции распределения:
.
2 способ. Можно было найти по формуле (1) с помощью плотности распределения:
.
Вывод:
Законы распределения
ДСВ
1. Ряд распределения (графически -многоугольник распределения).
2. Функция распределения F(x).
НСВ
1. Функция распределения F(x).
2. Плотность распределения (графически -кривая распределения).
Числовые характеристики случайных величин, их роль и назначение
Определение 38. Характеристики, назначение которых — выразить в сжатой форме наиболее существенные особенности распределения, называются числовыми характеристиками СВ.
Они не характеризуют СВ полностью, а указывают только отдельные числовые параметры, например, какое-то среднее значение, около которого группируются возможные значения СВ; какое-либо число, характеризующее степень разбросанности этих значений относительно среднего и т. д.
Характеристики положения (математическое ожидание, мода, медиана)
Данные характеристики характеризуют положение СВ на числовой оси, т. е. указывают некоторое среднее, ориентировочное значение, около которого группируются все возможные значения случайной величины.
Например, 1) среднее время работы, 2) средняя точка попадания смещена относительно цели на 0,3 м вправо…
Разберем эти характеристики подробнее.
1. Математическое ожидание или среднее значение случайной величины
a) Для дискретных случайных величин.
Рассмотрим ДСВ X, имеющую возможные значения с вероятностями . Охарактеризуем каким-нибудь числом положение значений СВ на оси абсцисс с учетом того, что эти значения имеют различные вероятности, т. е. рассмотрим «среднее взвешенное» из , причем каждое , при осреднении учитывается с «весом», пропорциональным вероятности :
.
Определение 39. Сумма произведений всех возможных значений случайной величины на вероятности этих значений называется математическим ожиданием случайной величины
Замечания.
1. М[Х] существует тогда и только тогда, когда ряд сходится.
2. Когда М[Х] входит в формулы как определенное число, то ее обозначают М[Х] = .
Механическая интерпретация М[Х] для ДСВ: пусть на оси (Ох) расположены точки с абсциссами , в которых сосредоточены соответственно массы , причем сумма всех масс равна 1 , тогда М[Х] — абсцисса центра тяжести данной системы материальных точек.
Связь между М[Х] и средним арифметическим числа наблюдаемых значений СВ при большом числе опытов: при увеличении числа опытов среднее арифметическое наблюдаемых значений СВ будет приближаться (сходиться по вероятности) к ее математическому ожиданию. Эта связь — одна из форм закона больших чисел.
b) Для непрерывных случайных величин.
Рассмотрим НСВ. Заменим в формуле (1) отдельные значения непрерывно изменяющимся параметром х, соответствующие вероятности — элементом вероятности , конечную сумму -интегралом, тогда
Механическая интерпретация М[Х] для НСВ: М[Х] — абсцисса центра тяжести в случае, когда единичная масса распределена по оси (Ох) непрерывно с плотностью .
Свойства М[Х].
1. М[С] = С , где С — постоянная.
2. .
3. .
4. .
5. M[aX+b] = аМ[Х] + b, а, b- постоянные.
с) Для смешанных случайных величин.
М[Х] = , причем сумма распространяется на те точки , где функция терпит разрыв, а интеграл берется по тем участкам, где функция непрерывна.
2. Мода случайной величины
Определение 40. Мода — наиболее вероятное значение случайной величины.
Иначе, мода — точка максимума многоугольника распределения для ДСВ или кривой распределения для НСВ.
Мода обознается М; когда мода входит в формулы как определенное число, то ее обозначают .
а) Для дискретных случайных величин.
Мода М — такое значение , что .
b) Для непрерывных случайных величин.
Мода — действительное число , определяемое, как точка максимума плотности распределения .
Замечание. Мода может не существовать, может иметь единственное значение или иметь бесконечное множество значений.
Определение 41. Распределения, обладающие посередине не максимумом, а минимумом называются антимодальными.
Замечание. Мода и математическое ожидание СВ не совпадают, но если распределение является симметричным и модальным и существует мат. ожидание, то оно совпадает с модой и центром симметрии распределения.
3. Медиана случайной величины
Вводится лишь для НСВ, хотя формально ее можно определить и для ДСВ.
Определение 42. Медианой непрерывной случайной величины называется такое ее значение х = Me, относительно которого равновероятно получение большего или меньшего значения случайной величины, т. е. для которого справедливо равенство:
,
( для НСВ безразлично > или )
(по определению функции распределения).
Таким образом, медиана — это корень уравнения . (3)
Геометрически: медиана — это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.
Замечание. В случае симметричного модального распределения медиана совпадает с мат. ожиданием и модой.
Когда медиана входит в формулы как определенное число, то ее обозначают .
Моменты:
Данные характеристики описывают некоторые свойства распределения СВ. В механике, например, для описания распределения масс существуют статические моменты, моменты инерции…
Определение 43. Начальным моментом s — того порядка для ДСВ и НСВ называется математическое ожидание s — той степени этой случайной величины:
.
Замечание. При s = 1 , т. е. математическое ожидание — это первый начальный момент.
a) Для дискретных случайных величин: . (4)
Замечание. Определение совпадает с определением начального момента порядка s в механике, если на оси (Ох) в точках сосредоточены соответственно массы .
b) Для непрерывных случайных величин: . (5)
Определение 44. Центрированной случайной величиной, соответствующей величине X, называется отклонение случайной величины Х от ее математического ожидания:
.
Рассмотрим математическое ожидание центрированной ДСВ:
.
Аналогично, для НСВ .
Центрирование СВ равносильно переносу начала координат в среднюю, центральную точку, абсцисса которой равна математическому ожиданию.
Определение 45. Моменты центрированной случайной величины называются центральными моментами.
Определение 46. Центральным моментом s — того порядка для ДСВ и НСВ называется математическое ожидание s — той степени соответствующей центрированной случайной величины:
.
a) Для дискретных случайных величин: . (6)
b) Для непрерывных случайных величин: . (7)
Замечание. Для любой СВ центральный момент 1-го порядка равен 0: , так как мат. ожидание центрированной СВ равно 0.
Рассмотрим подробнее центральные моменты 2, 3, 4 порядков и выведем соотношения, связывающие начальные и центральные моменты.
— дисперсия
Определение 47. Дисперсией случайной величины X D[X] называется мат ожидание квадрата соответствующей центрированной случайной величины:
a) Для дискретных случайных величин: . (8)
b) Для непрерывных случайных величин: .(9)
Дисперсия случайной величины — характеристика рассеивания, разбросанности значений случайной величины около ее мат. ожидания.
Когда дисперсия входит в формулы как определенное число, то ее обозначают
Механическая интерпретация D[X]: Дисперсия — момент инерции заданного распределения масс относительно центра тяжести (мат. ожидания).
Рассмотрим ДСВ. (Для НСВ получаем аналогично)
.
— связь между начальным и центральным моментом 2-го порядка. (10)
Свойства D[X].
1. D[C] = 0 , где С — постоянная.
2. .
3. .
4. для независимых СВ.
5. — постоянные.
Замечание. D[X] имеет размерность квадрата случайной величины. Для более наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случайной величины. Для этого из D[X] извлекают корень:
где — среднее квадратическое отклонение или стандарт случайной величины X.
Когда среднее квадратическое входит в формулы как определенное число, то его обозначают .
Замечание. Математическое ожидание и дисперсия характеризуют наиболее важные черты распределения: его положение и степень разбросанности. Для более подробного описания применяются моменты высших порядков.
— асимметрия
Асимметрия случайной величины — характеристика асимметрии или скошенности распределения значений случайной величины.
Теорема. Если распределение симметрично относительно мат. ожидания (т. е. масса распределена симметрично относительно центра тяжести), то все моменты нечетного порядка (если они существуют) равны нулю.
Доказательство.
Действительно, для ДСВ в сумме при симметричном относительно законе распределения и нечетном s каждому положительному слагаемому соответствует равное ему по абсолютной величине отрицательное слагаемое так, что вся сумма равна 0. Аналогично. Для НСВ как интеграл в симметричных пределах от нечетной функции. (что и требовалось доказать).
В связи с этим, в качестве характеристики асимметрии и выбирают простейший нечетный момент — третий . Он имеет размерность куба СВ, для получения безразмерной характеристики рассматривают отношение к среднему квадратическому в третьей степени:
Определение 48. Коэффициентом асимметрии Sk случайной величины X называется величина
.
связь между начальными и центральным моментом 3-го порядка.
и эксцесс
Четвертый центральный момент служит для характеристики «крутости», т. е. островершинности или плосковсршинности распределения.
Это свойство описывается с помощью эксцесса.
Определение 49. Эксцессом случайной величины X называется величина
Число 3 вычитается из соотношения потому, что для наиболее распространенного нормального закона распределения НСВ (с которым познакомимся позднее).
Кривая нормального распределения, для которого эксцесс равен нулю, принята как бы за эталон, с которым сравниваются другие распределения. Кривые более островершинные имеют положительный эксцесс, более плосковершинные — отрицательный.
Абсолютные моменты:
— начальный абсолютный момент.
— центральный абсолютный момент.
Абсолютные моменты четных порядков совпадают с обычными моментами. Из абсолютных моментов нечетного порядка чаще всего применяется первый абсолютный центральный момент:
— среднее арифметическое отклонение.
a) Для дискретных случайных величин: , (14)
b) Для непрерывных случайных величин: (15)
применяется как характеристика рассеивания (как и ).
Замечания.
1. Моменты могут рассматриваться не только относительно начала координат (начальные) или математического ожидания (центральные), но и относительно произвольной точки а:
.
2. Во многих задачах полная характеристика случайной величины (закон распределения) не нужна или не может быть получена, поэтому ограничиваются приблизительным описанием СВ с помощью числовых характеристик, каждая из которых выражает какое-либо характерное свойство распределения. Иногда характеристиками пользуются для приближенной замены одного распределения другим.
Пример №17
Дан ряд распределения ДСВ:
Найти: 1) величину а, 2) математическое ожидание и дисперсию М[Х] и D[X] , 3) М[3Х + 2], D[2X + 3].
Решение.
1) Величину а найдем из условия: , отсюда а = 0,4.
2) Найдем математическое ожидание и дисперсию:
По формуле (1) ,
По формуле (8) .
Дисперсию можно было найти, используя формулу (10) и (4):
3) М[ЗХ + 2] = (по 5 свойству мат. ожидания) = ,
D[2X + 3] = (по 5 свойству дисперсии) =
Пример №18
Стрелок производит 3 выстрела по мишени. Вероятность попадания в мишень при каждом выстреле равна 0,4. СВ Х — число попаданий. Определить: 1) математическое ожидание, 2) дисперсию, 3) среднее квадратическое отклонение, 4) моду, 5) асимметрию, 6) среднее арифметическое отклонение.
Решение.
Ранее мы построили ряд распределения числа попаданий. Ряд распределения имеет вид:
1) . (по формуле 1).
2)
(по формуле 8. Можно было по формуле (4): ).
3) (по формуле 11).
4) Найдем моду М: , следовательно, М = 1.
5) По формуле (6)
Тогда коэффициент асимметрии по формуле (12) .
6) По формуле (14) найдем среднее арифметическое отклонение:.
Пример №19
Непрерывная случайная величина подчинена закону распределения с плотностью . Найти: 1) коэффициент А, 2) математическое ожидание, 3) дисперсию, 4) среднее квадратическос отклонение, 5) моду, 6) медиану, 7) асимметрию, эксцесс.
Решение.
1) Если х < 0 , если .
Воспользуемся свойством плотности распределения для определения А:
.
2) , т.к. функция нечетная.
3) , следовательно,
= (решаем методом интегрирования по частям, 2 раза) = 2
4) .
5) M = 0.
6) , следовательно, ,
, следовательно, x=0, т.е. Me=0.
7) , как интеграл в симметричных пределах от нечетной функции.
Следовательно, асимметрия Sk=0.
, следовательно, эксцесс .
Пример №20
Случайная величина X подчинена закону распределения, плотность которого задана графически. Найти: 1)выражение для плотности, 2) найти мат. ожидание, 3) дисперсию.
Решение.
1) .
2) , следовательно, .
3) Дисперсию найдем двумя способами.
1 способ (по определению): .
2 способ (через начальные моменты):
.
Биномиальное распределение
Постановка задачи: пусть СВ X выражает число появления события А ( m раз) при n независимых испытаниях, проводимых в одинаковых условиях. Вероятность появления события А — р — постоянна. Вероятности возможных значений данной СВ определяются по формуле Бернулли:
.
Определение 50. Распределение дискретной случайной величины, для которой ряд распределения задастся формулой Бернулли, называется биномиальным.
Примеры типовых задач: 1) число бракованных изделий в выборке из n деталей, 2) число попаданий или промахов при выстрелах в мишень.
Найдем математическое ожидание и дисперсию СВ, имеющей биномиальное распределение.
1) . (*)
Вычислим данную сумму. Ранее записали следствие из теоремы Бернулли, что . Следовательно, .
Продифференцируем данное равенство по переменной р:
.
, умножим обе части полученного равенства на р:
, следовательно, из (*):
.
Вывод: математическое ожидание числа наступления события А в серии независимых и одинаковых испытаний равно произведению числа испытаний на вероятность появления события при одном испытании
.
2) Можно вывести, что дисперсия СВ X, распределенной по биномиальному закону, находится по формуле:
.
Тогда среднее квадратическое: .
Пример №21
Случайная величина X представляет число бракованных деталей из выборки в 50 штук. Вероятность брака одной детали р = 0,06. Найти М[Х], D[X], числа бракованных деталей в выборке.
Решение.
СВ X имеет биномиальное распределение, следовательно, сразу по формулам имеем:
(детали в среднем бракованы).
.
(детали) — разброс бракованных деталей относительно среднего числа.
Распределение Пуассона
Постановка задачи: пусть СВ X выражает число появления события А ( m раз) при n независимых испытаниях, проводимых в одинаковых условиях, причем n очень велико (). Вероятность появления события А — р — очень мала. Вероятности возможных значений данной СВ можно вычислить, пользуясь асимптотической формулой Пуассона:
,
где — среднее число появления события в n испытаниях: = np.
Определение 51. Распределение дискретной случайной величины, для которой ряд распределения задастся формулой Пуассона, называется распределением Пуассона.
Примеры типовых задач: 1) число вызовов на телефонной станции за некоторое время t, 2) число отказов сложной аппаратуры за некоторое время t, 3) распределение изюма в булочках, 4) число кавалеристов, убитых за год копытом лошади.
Распределение Пуассона зависит только от одного параметра . Так как это среднее число появления события в n испытаниях, то это ни что иное как математическое ожидание, следовательно,
.
Можно вывести, что дисперсия СВ X, распределенной по закону Пуассона, находится по формуле:
.
Замечание. Мы использовали распределение Пуассона как приближенное в тех случаях, когда точным распределением СВ является биномиальное распределение, и когда математическое ожидание мало отличается от дисперсии, т. е. .
Можно было получить распределение Пуассона, рассматривая задачу о числе случайных точек на оси абсцисс, попадающих на заданный отрезок, причем — среднее число точек, приходящихся на единицу длины.
Пример №22
На телефонную станцию в течение определенного часа дня поступает в среднем 30 вызовов. Найти вероятность того, что в течение минуты поступает не более двух вызовов.
Решение.
— среднее число появления события в n испытаниях, т. е. .
СВ Х- число вызовов, ее возможные значения: .
По условию, в течение минуты поступает не более двух вызовов, т. е. , тогда,
Пример №23
Завод отправил на базу 500 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,002. Найти вероятность того, что на базу прибудет 3 негодных изделия.
Решение.
Дано: р = 0,002; q = 1 — р = 0,998; n = 500. Проверим, можно ли воспользоваться формулой Пуассона, т. е. проверим истинность равенства: .
, , отсюда, , т. е. можно пользоваться формулой Пуассона.
, следовательно.
.
Гипергеометрическое распределение
Постановка задачи: производится ряд n независимых испытаний, в каждом из которых с вероятностью p наступает событие А. Опыты продолжаются до первого появления события А. Случайная величина Х- число проведенных опытов, — возможные значения данной СВ.
Определение 52. X с возможными значениями , а имеет гипергеометрическое распределение с параметрами n, а, b, если .
Можно вывести, что ,
.
Определение 53. X имеет гипергеометричское распределение, если
.
Пример типовой задачи: из урны, содержащей 5 красных и 7 синих шаров, случайным образом и без возвращения извлекается 3 шара. Случайная величина X— число синих шаров в выборке. Описать закон распределения Х и найти математическое ожидание.
Решение.
Шары синие, следовательно, n = 3, а + b = 12, а = 7.
Данная случайная величина имеет возможные значения .
,
.
Следовательно, ряд распределения имеет вид:
Мат. ожидание найдем по формуле: .
или по определению: .
Равномерное распределение или закон равномерной плотности
Пусть известно, что все возможные значения х непрерывной случайной величины X лежат в пределах определенного интервала (а, b), в некоторых источниках рассматривается [а, b].
Определение 54. Равномерным называют распределение вероятностей НСВ X, если на каждом интервале (а, b) ее плотность распределения сохраняет постоянное значение, равное (т.е. все х одинаково вероятны), а вне этого интервала плотность равна нулю:
Примеры типовых задач: равномерное распределение реализуется 1) в экспериментах, в которых наудачу ставится точка на промежутке (а, b) или [а, b], причем Х — координата поставленной точки; 2) в экспериментах по измерению тех или иных физических величин с округлением, причем X — ошибка округления.
Выведем формулы для вычисления мат. ожидания и дисперсии.
,
.
Итак, , тогда среднее квадратическое .
Вероятность попадания случайной величины на участок находится по формуле:
.
Найдем функцию распределения F(x):
.
.
Итак,
Пример №24
Цена деления шкалы амперметра равна 0,1 ампера. Показания амперметра округляют до ближайшего целого деления. Найти вероятность того, что при отсчете будет сделана ошибка, превышающая 0,02 ампера.
Решение.
СВ X — ошибка округления отсчета. X распределена равномерно в интервале между двумя соседними целыми делениями:
Ошибка отсчета превысит 0,02, если она будет заключена в интервале (0,02; 0,08). Найдем вероятность попадания Х в этот интервал:
.
Можно было найти эту вероятность, сразу подставив в формулу , следовательно, .
Показательное или экспоненциальное распределение
Определение 55. НСВ X распределена по показательному или экспоненциальному закону, если ее плотность распределения имеет вид:
— коэффициент распределения.
Выведем формулы для вычисления мат. ожидания и дисперсии.
.
Итак, тогда среднее квадратическое:
Найдем функцию распределения F(x):
Если следовательно .
Если .
Итак,
Пример №25
Случайная величина Т — время работы радиолампы имеет показательное распределение. Определить вероятность того, что время работы лампы будет не меньше 600 часов, если среднее время работы лампы 400 часов.
Решение.
По условию
Нормальный закон распределения
Определение 56. НСВ X распределена по нормальному закону, если ее плотность распределения имеет вид:
Нормальный закон называют еще законом распределения Гаусса.
Говорят, что случайная величина X подчинена нормальному закону и пишут .
Примеры типовых задач: случайные величины в них характеризуют ошибки при измерениях, боковые отклонения и отклонения по дальности при стрельбе, величина износа деталей…
График плотности или кривая распределения называется гауссовской кривой. Она имеет симметричный холмообразный вид. При Ветви кривой быстро приближаются к оси (Ох): площадь под кривой на участке [m — 3;m + 3] равна 90% площади под всей кривой.
Главная особенность нормального закона состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях.
Кривые распределения по всем другим законам распределения получаются из одной единственной кривой — гауссовской.
Для наглядной демонстрации нормального закона распределения иногда используют специальное устройство — доску Гальтона. В нем падающие сверху шарики распределяются между правильными шестиугольниками и в результате падают на горизонтальную поверхность, образуя картинку, похожую на подграфик гауссовой кривой.
Распределение пассажиров по вагонам метро — гауссово распределение. Покажем это. Пассажиры метро бегут по переходу, выходящему на середину станции, на поезд, стоящий напротив выхода из перехода. Платформа, у которой стоит поезд, равномерно разделена колоннами. Ясно, что большинство пассажиров войдет в средние вагоны, а по мере удаления вагонов от центра, количество садящихся в них людей будет уменьшаться.
Замечание. С гауссовской плотностью мы встречались при рассмотрении локальной теоремы Муавра- Лапласа.
1. Убедимся, что действительно плотность НСВ, для чего проверим равенство (условие нормировки). Известно, что (интеграл Пуассона).
Что и требовалось доказать
2. Докажем, что численные параметры m и совпадают с основными характеристиками распределения: m = М[Х] — мат. ожидание, — среднеквадратическое отклонение. Для этого вычислим М[Х] и [Х].
Таким образом, m = M[X]. Этот параметр, особенно в задачах стрельбы, называют центром рассеивания.
Доказать самостоятельно, что (Сначала вычислить дисперсию).
Смысл параметров m и
m — центр симметрии распределения (т.к. при изменении знака разности (х — m) в формуле плотности на противоположный, выражение не меняется). Если изменять центр рассеивания m, то кривая распределения будет смещаться вдоль оси (Ох), не изменяя своей формы. Следовательно, m характеризует положение распределения на оси (Ох).
Размерность m та же, что и размерность случайной величины X.
В задачах m означает систематические ошибки.
характеризует форму кривой распределения, т.к. это характеристика рассеивания. Площадь под кривой распределения всегда должна быть равна 1. Наибольшая ордината кривой распределения обратно пропорциональна , следовательно, при увеличении максимальная ордината уменьшается.
Размерность о совпадает размерностью СВ. В задачах означает стандартные ошибки.
Замечания.
1. В некоторых курсах теории вероятностей вводят понятие меры точности , тогда нормальный закон запишется в виде:
2. .
3. Если НСВ X распределяется по закону N(0, 1), то она называется стандартизованной случайной величиной.
Формула для центральных моментов любого порядка имеет вид:
Т.к. = 0, то все нечетные моменты равны 0 (это следует из симметричности нормального закона).
Для четных моментов: Асимметрия нормального закона эксцесс (назначение эксцесса характеризовать крутость законов по сравнению с нормальным законом), мода М = m, медиана Me — m.
Найдем вероятность попадания НСВ X, подчиненной нормальному закону с параметрами m и , на участок от до .
тогда
(интеграл вычисляется с помощью специальной функции — функции Лапласа Ф(х) [смотри предельную интегральную теорему Муавра-Лапласа §6 п. 3])
Итак,
Вероятность попадания НСВ X левее находится по формуле:
Свойства функции Лапласа
1. Ф(х) определена для всех действительных х.
2.
3. Ф(х) неубывающая, т. е. возрастает на R.
4. Ф(-х) = 1 — Ф(х) (это следует из симметричности нормального распределения с параметрами m = 0, =1 относительно начала координат).
5.
6.
7. — формула для нахождения вероятности того, что абсолютная величина отклонения СВ X от числа m меньше положительного числа , где — ошибка.
Если m = 0, то
Вывод 7 свойства.
Из 4 свойства и формулы для вычисления интервальных вероятностей имеем, что:
Функция Лапласа затабулирована. Для тех значений х, которых нет в таблице:
Свойства функции Лапласа
1. Ф(x) определена для всех действительных x.
2. Ф(0) = 0.
3. Ф(x) неубывающая, т.е. возрастает на R.
4. Ф(-x) = -Ф(x).
5.
6.
7.
Функция Лапласа затабулирована. Для тех значений х, которых нет в таблице:
Пример №26
Длина изготовленной автоматом детали представляет собой случайную величину, распределенную по нормальному закону с параметрами Найти вероятность брака, если допустимые размеры детали
Решение.
Вероятность брака:
Случайные величины в теории вероятностей
С каждым случайным экспериментом связано множество его возможных исходов Это множество обычно называют пространством элементарных исходов или элементарных событий. Экспериментатор обычно не просто наблюдает, а измеряет, и в результате эксперимента получается число. Тем самым каждому исходу эксперимента ставится в соответствие определенное число а это означает, что на множестве исходов эксперимента определена некоторая числовая функция.
Определение. Случайной величиной называется функция определенная на множестве элементарных исходов эксперимента и принимающая действительные или комплексные значения. Если множество исходов эксперимента конечно, то приведенное определение является точным. В общем случае функция полагается измеримой. Случайная величина считается заданной, если указано, какие значения она может принимать и каковы вероятности этих значений.
Определение. Всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями, называется законом распределения случайной величины. Фактически для задания закона распределения нужно перечислить все возможные значения случайной величины и указать вероятности этих значений.
Закон распределения является исчерпывающей характеристикой случайной величины. Если он задан, то с вероятностной точки зрения случайная величина описана полностью. Поэтому часто говорят о том или ином законе распределения, имея в виду случайную величину, которая распределена по этому закону.
Случайные величины будем обозначать большими латинскими буквами а отдельные возможные значения этих величин соответствующими малыми буквами
Определение. Случайную величину называют дискретной, если она может принимать отделенные друг от друга значения с определенными вероятностями. Множество возможных значений дискретной случайной величины конечно или счетно, т.е. их можно занумеровать с помощью ряда натуральных чисел.
Определение. Случайная величина называется непрерывной, если ее возможные значения составляет некоторый интервал (конечный или бесконечный).
Отметим способы задания законов распределения дискретных случайных величин. Соответствие между возможными значениями 68 дискретной случайной величины и вероятностями этих значений можно задать в виде формулы. Если это затруднительно, то можно просто перечислить то и другое в виде таблицы, называемой рядом распределения:
где – вероятность того, что примет значение Из соображений наглядности принято возможные значения перечислять в порядке возрастания. События несовместимы, и в результате опыта одно из них непременно происходит, т.е. эти события образуют полную группу. Поэтому
Ряд распределения можно изобразить графически. Для этого в каждой точке на горизонтальной оси откладывают вдоль вертикальной оси отрезок, равный Полученную в результате фигуру называют многоугольником распределения (рис. 2.8.1).
Функция распределения
Определение. Функцией распределения случайной величины называют функцию
определяющую для каждого значения вероятность того, что случайная величина X в результате опыта примет значение меньшее .
Непосредственно из определения функции распределения можно вывести ряд ее свойств
1. Это следует из того, что равна вероятности, а вероятность любого события заключена между нулем и единицей.
Отметим также, что так как события являются соответственно невозможным и достоверным.
2. Функция распределения является неубывающей, т.е. при В самом деле, при появление события эквивалентно появлению одного из несовместимых событий и Поэтому или
В правой части равенства (2.8.1) находится неотрицательная величина, поэтому Равенство (2.8.1) означает, что вероятность попадания случайной величины Х в полуинтервал равна приращению функции распределения на этом полуинтервале.
3. непрерывна слева, т.е. при
4. Для любого согласно формуле (2.8.1),
Предел в правой части равен нулю, если – точка непрерывности функции . Если же х – точка разрыва функции, то предел в правой части равенства равен скачку этой функции в точке . Следовательно, если и точки непрерывности функции , то
Впредь будем называть непрерывными только случайные величины с непрерывной функцией распределения. Для непрерывной случайной величины вероятность любого отдельно взятого значения равна нулю. Сходная ситуация в геометрии. Геометрическая точка не имеет размера, а состоящий из точек интервал имеет отличную от нуля длину. Так и для непрерывной случайной величины: одно отдельно взятое значение имеет нулевую вероятность, хотя и является возможным значением, и только интервалы значений имеют отличную от нуля вероятность.
График функции распределения одной из непрерывных случайных величин изображен на рис. 2.8.2.
Функцию распределения можно задать и для непрерывной и для дискретной случайной величины. Для дискретной случайной величины функция распределения представляет собой, как это следует из определения, функцию накопленных вероятностей:
где суммирование распространяется на все значения индекса для которых
Если дискретная случайная величина Х имеет закон распределения:
то ее функция распределения имеет вид ступенчатой функции, причем скачки функции равны вероятностям соответствующих значений Х (рис. 2.8.3).
Функция распределения непрерывной случайной величины непрерывна, для дискретной случайной величины она представляет собой ступенчатую функцию. Можно привести примеры таких случайных величин, функция распределения которых вместе с участками непрерывного роста в некоторых точках имеет разрывы. Такие величины называют смешанными случайными величинами. Примером смешанной случайной величины может служить время ожидания у светофора. Пусть, например, равновозможно прибытие автомобиля к перекрестку в любой момент цикла работы светофора (рис. 2.8.4). Найдем функцию распределения времени ожидания автомобиля.
Обозначим время ожидания у светофора через Это неотрицательная случайная величина. Вероятность того, что время ожидания будет меньше равна вероятности прибыть к светофору в момент времени из интервала (А,В). Поэтому при и при Функция распределения времени ожидания изображена на рис. 2.8.5. Из графика функции распределения видно, что нулевое время ожидания, имея вероятность 3/7, соответствует точке скачка функции, равного этой величине.
Функция плотности вероятности
Если функция распределения представима в виде где функция то подынтегральную функцию называют функцией плотности вероятности. Если функция распределения дифференцируема, то функцией плотности вероятности называется первая производная от функции распределения т.е.
Заметим, что
Геометрически это означает, что вероятность попадания случайной величины в интервал численно равна площади криволинейной трапеции, которая опирается на этот интервал и ограничена сверху кривой (рис. 2.8.6).
Свойства функции плотности вероятности.
1.
2.
Последнее условие называется условием нормировки. Геометрически это условие означает, что площадь, заключенная между осью абсцисс и графиком функции плотности вероятности, равна единице.
По функции плотности вероятности можно найти функцию распределения случайной величины:
Числовые характеристики случайных величин
Числа, назначение которых указывать основные особенности случайных величин, называются числовыми характеристиками.
Определение. Математическим ожиданием (или средним значением) дискретной случайной величины Х называется число
равное сумме произведений возможных значений на соответствующие им вероятности Если дискретная случайная величина имеет бесконечно много значений, то требуется абсолютная сходимость ряда (2.8.2). Если ряд (2.8.2) не сходится абсолютно, то математическое ожидание такой случайной величины не существует.
Математическим ожиданием непрерывной случайной величины, имеющей функцию плотности вероятности , называется число
если интеграл абсолютно сходится. Если интеграл (2.8.3) не сходится абсолютно, то говорят, что математическое ожидание не существует.
Свойства математического ожидания.
- Математическое ожидание постоянной равно самой этой постоянной, т.е.
- Математическое ожидание суммы любого конечного числа случайных величин равно сумме их математических ожиданий.
- Математическое ожидание произведения любого конечного числа взаимно независимых случайных величин равно произведению их математических ожиданий.
Следствие. Постоянный множитель можно выносить за знак математического ожидания.
Определение. Дисперсией случайной величины X называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
Для вычисления дисперсии иногда удобно использовать другую формулу:
т.е. дисперсия равна математическому ожиданию квадрата случайной величины минус квадрат ее математического ожидания:
Свойства дисперсии.
- Дисперсия постоянной величины равна нулю:
- Постоянный множитель можно выносить за знак дисперсии с возведением в квадрат, т.е. где C –– постоянная величина.
Определение. Центрированной случайной величиной называется отклонение случайной величины от ее математического ожидания:
Центрированные случайные величины удобно использовать в преобразованиях, так как
3. Если случайные величины Х и Y независимы, то
4. Если случайные величины Х и Y независимы, то
Дисперсия имеет размерность квадрата случайной величины. Это лишает наглядности дисперсию как числовую характеристику. Поэтому для характеристики разброса значений случайной величины используют среднее квадратическое отклонение, которое равно положительному значению корня квадратного из дисперсии: Среднее квадратическое отклонение имеет ту же размерность, что и сама случайная величина.
Пример №27
Некто носит на связке пять ключей. При отмыкании замка он последовательно испытывает ключи, пока не подберет нужный. Полагая выбор ключей бесповторным, написать закон распределения числа испытанных ключей. Вычислите математическое ожидание этой случайной величины.
Решение. Обозначим через X – число испытанных ключей. Так как выбор ключей бесповторный, то X может принимать значения: 1, 2, 3, 4, 5. Случайная величина X примет значение если с первой попытки будет выбран нужный ключ, вероятность чего равна 1/5 в силу равновозможности выбора любого из ключей. Значение случайная величина примет, если при первой попытке ключ будет выбран ошибочно (вероятность чего равна 4/5) и при второй попытке будет выбран нужный ключ из оставшихся четырех(вероятность этого равна 1/4). Поэтому:
Случайная величина X имеет закон распределения
Среднее число попыток равно
Ответ. 3.
Пример №28
В ящике в полном беспорядке лежат пять пар туфель. Туфли по одной (без возвращения) вынимают из ящика, пока среди выбранных не обнаружится какая-либо пара. Сколько в среднем туфель придется извлечь из ящика?
Решение. Обозначим через X – число извлеченных туфель. Случайна величина X принимает только значения 2, 3, 4, 5, 6. (Чтобы сформировать пару, нужно извлечь минимум две туфли, а среди шести туфель хотя бы одна пара непременно найдется.) Найдем вероятности этих значений:
так как после выбора первой туфли в пару к ней годится только одна из девяти оставшихся;
так как вторая должна быть не парной к первой, вероятность чего равна 8/9, а третья должна быть парной либо к первой, либо ко второй, вероятность чего равна 2/8;
так как вторая должна быть не парной к первой, вероятность чего 8/9, третья – не парной к первым двум, вероятность чего 6/8, а четвертая должна быть одной туфлей из трех уже разукомплектованных пар, вероятность чего 3/7;
так как вторая должна быть не парной к первой, вероятность чего 8/9, третья – не парной к первым двум, вероятность чего 6/8, четвертая – не парной к первым трем, вероятность чего равна 4/7, а пятая должна быть одной туфлей из четырех уже разукомплектованных пар, вероятность чего 4/6;
так как для этого необходимо, чтобы каждая из пяти первых туфель выбиралась из еще не тронутой пары.
Итак, случайная величина имеет закон распределения:
Ответ.
Пример №29
Цена лотерейного билета равна 50 рублей. В данной лотерее каждый пятый билет выигрывает. Величина выигрыша на один билет X имеет распределение:
Некто приобрел пять билетов. Необходимо вычислить его средний выигрыш от участия в этом тираже лотереи.
Решение. Обозначим через выигрыш, приходящийся на й билет. Тогда общий выигрыш По свойствам математического ожидания
где
Поэтому средний выигрыш на пять билетов составит 5 • 36 = 180 руб., но за билеты было заплачено 250 руб. В итоге, средний «выигрыш» (фактически, проигрыш) равен 180 – 250 = –70 руб.
Ответ. –70 руб.
Пример №30
Монету подбрасывают до тех пор, пока не выпадет герб, или пять раз подряд не выпадет цифра. Пусть X – число бросков монеты. Напишите закон распределения случайной величины X и найдите ее математическое ожидание.
Решение. Если при первом же броске выпадет герб, то X =1, вероятность чего равна 1/2.
Бросков понадобится два, если сначала выпадет цифра, а при втором броске – герб. Вероятность такого исхода равна (1/ 2)(1/ 2) = 1/ 4.
Монету придется бросать трижды, если сначала дважды выпадет цифра и при третьем броске – герб. Вероятность этого равна (1/ 2)(1/ 2)(1/ 2) = 1/ 8.
Аналогично
Если четыре раза подряд выпадет цифра, то необходим пятый бросок, который независимо от результата (с вероятностью один) будет последним. Поэтому
Закон распределения числа бросков имеет вид:
Среднее число бросков равно
Ответ.
Пример №31
Вероятность попадания в цель при каждом выстреле равна 1/3. Имеется семь патронов. Стрельба производится до тех пор, пока не будет трех попаданий или пока не кончатся патроны. Пусть X – число выстрелов. Найдите математическое ожидание случайной величины X.
Решение. Найдем сначала закон распределения случайной величины X. Для трех попаданий необходимо минимум три выстрела. Вероятность трех попаданий подряд равна Поэтому Выстрелов понадобится четыре, если в первых трех выстрелах будет только два попадания (вероятность чего равна ) и при четвертом выстреле будет попадание. Поэтому Придется произвести пять выстрелов, если в первых четырех выстрелах будет два попадания (вероятность чего равна ) и попадание будет при пятом выстреле. Поэтому Аналогично
Выстрелов будет семь, если к моменту седьмого выстрела будет два или меньше двух попаданий.
Поэтому
Заметим, что проще эту вероятность было посчитать, отняв от единицы вычисленные уже вероятности остальных значений. Итак, случайная величина X имеет закон распределения:
Ответ.
Пример №32
Из 12 изделий три имеют скрытые дефекты. Наугад выбраны четыре изделия. Напишите закон распределения числа изделий со скрытыми дефектами среди выбранных.
Решение. Пусть X – число деталей со скрытыми дефектами среди выбранных четырех. Это дискретная случайная величина с возможными значениями Четыре детали из 12 можно выбрать способами.
Значению X = 0 благоприятствуют способов выбора изделия. Поэтому Значению X =1 благоприятствуют Значению X = 2 благоприятствуют способов, Наконец, значению X = 3 благоприятствуют способов, Случайная величина X имеет закон распределения
Среднее число деталей со скрытыми дефектами в выборке равно
Ответ. 1.
Пример №33
Случайная величина X принимает значения 1, 3, 5, 7, 9 с вероятностями где – некоторая постоянная величина. Найти математическое ожидание X.
Решение. Так как сумма вероятностей всех возможных значений случайной величины равна единице, то и Поэтому
Ответ.
Пример №34
Из чисел 1, 2, 3, …, 20 наугад без возвращения выбирают восемь чисел. Найти математическое ожидание их суммы.
Решение. Обозначим через число, выбранное м по порядку. Тогда для любого имеем
Например, вероятность того, что пятое по порядку число будет равно равна
Это означает, что для го по порядку числа равновозможны все значения от 1 до 20. Поэтому математическое ожидание го числа равно
Сумма выбранных чисел имеет математическое ожидание
Ответ. 84.
Пример №35
Из чисел 1, 2, 3, 4, 5, 6, 7 наугад без возвращения выбирают четыре числа. Пусть X – наибольшее из этих чисел. Требуется найти закон распределения случайной величины X и ее математическое ожидание.
Решение. Случайная величина X может принимать значения 4, 5, 6, 7. Вычислим вероятности этих значений. Всего имеется способов выбрать любых четыре числа из семи. Реализуется значение X = 4, если будут выбраны первые четыре числа 1, 2, 3, 4. Это можно сделать единственным способом. Поэтому Значение X = 5 получится, если будет выбрано число пять и в добавление к этому три числа из первых четырех. Это можно сделать способами. Поэтому Величина X = 6 , если будет выбрана цифра шесть и в дополнение к ней любых три числа из первых пяти. Это можно сделать Следовательно, Если будет выбрана цифра семь и в дополнение к ней любые три из первых шести, то реализуется значение X = 7. Вероятность этого В итоге имеем закон распределения:
Поэтому
Ответ.
Пример №36
Пусть в урне находится M белых шаров и R черных. Из урны наугад выбирают один шар. После установления его цвета в урну добавляют шар того же цвета (т.е. выбранный шар возвращают в урну и к нему добавляют еще шаров того же цвета). Затем выбирают из урны второй шар и в урну возвращают шар такого же цвета, что и второй 82 шар. Потом выбирают очередной шар и т.д. Всего производят выбор и добавление шаров раз.
Обозначим через X число белых шаров, выбранных из урны в процессе этих испытаний. Требуется найти закон распределения случайной величины X и ее математическое ожидание.
Решение. Заметим, что X принимает значения 0, 1, 2, 3, …, . Вычислим
Рассудим следующим образом. После каждого опыта число шаров в урне возрастает на . Первый шар выбирается из шаров, выбор второго возможен из шаров, третий шар можно выбрать из шаров и т.д., для -го шара имеется возможностей выбора. Поэтому число всех возможных исходов этих опытов по комбинаторному принципу равно
Если белый шар был выбран раз, то первый их них выбирался из M шаров, второй – из шаров, третий – из и т.д., -й белый шар можно было выбрать из шаров. По комбинаторному принципу белых шаров можно было выбрать способами.
Аналогично черный шар можно было выбрать способами. Тогда выбрать белых и черных шаров в любой последовательности можно было
способами.
Различимых последовательностей в чередовании белых и черных шаров существует именно таким числом способов можно из опытов выбрать различных и в них получить белые шары. Поэтому
Закон распределения случайной величины X со значениями 0, 1, 2, 3, …, и вероятностями этих значений определяемыми по формуле (2.8.6), называют законом распределения Полиа.
Замечание. Если в распределении Полиа то получим независимые опыты и формула (2.8.5) переходит в формулу Бернулли (2.6.1). Если же то это означает, что выбранный шар в урну не возвращается и новых шаров в урну не добавляется. Мы попадаем в условия бесповторного выбора. В этом случае формула (2.8.5) переходит в формулу (2.1.1).
Рассмотрим серию опытов, которые производятся в неодинаковых условиях и поэтому вероятность появления события меняется от опыта к опыту. Например, во время боя из-за сближения или удаления противника вероятность поражения цели при выстреле меняется от выстрела к выстрелу. Обозначим через – вероятность появления события в м опыте, а вероятность непоявления события через Требуется найти вероятность того, что в результате опытов событие появится раз.
Можно, как и при выводе формулы Бернулли (2.6.1), моделировать результаты опытов с помощью букв A и букв . Различимых перестановок таких букв будет Именно таким числом способов можно из мест выбрать и поставить на них буквы , а на остальные – буквы .
Каждая перестановка этих букв соответствует определенной последовательности появлений и непоявлений события . К сожалению, в нашем случае перестановки не равновозможны и суммировать их вероятности трудоемко. Вместо утомительного перебора возможных комбинаций букв поступим следующим образом. Составим функцию
где – некоторая действительная переменная.
Если перемножить скобки, привести подобные и упорядочить их по степеням , то получим многочлен по степеням . Легко понять, что при каждой степени будет коэффициент в виде произведения букв и букв с какими-то индексами, а после приведения подобных получится коэффициент, который будет равен сумме всех подобных произведений, т.е. равный
Пример №37
С разных расстояний производится четыре независимых выстрела по одной и той же цели. Вероятности попадания в цель при этих выстрелах равны соответственно 0,1; 0,2; 0,4; 0,8. Найти распределения числа попаданий и математическое ожидание этого числа.
Решение. Обозначим число попаданий в цель через X . Запишем производящую функцию
Итак, случайная величина X имеет распределение:
Заметим, что можно вычислить непосредственно (не находя предварительно закона распределения). Представим число попаданий в виде где – число попаданий при м выстреле. Тогда
Но Поэтому
Ответ.
Пример №38
На круговом экране локатора равновозможно появление пятна в каждой точке экрана. Радиус экрана равен R. Найти закон распределения расстояния от центра экрана до пятна. Найти математическое ожидание и дисперсию этого расстояния.
Решение. Обозначим через Х расстояние от центра экрана до пятна. Это расстояние будет меньше если пятно попадет внутрь круга радиуса Вероятность этого по геометрическому определению вероятности равна отношению площади круга радиуса к площади всего экрана локатора. Поэтому функция распределения случайной величины Х имеет вид при при и при Тогда функция плотности вероятности при а
Ответ.
Пример №39
Случайная величина X имеет функцию распределения
Найти
Решение. Найдем сначала функцию плотности вероятности
Тогда Поэтому
С учетом определения и свойств функции распределения имеем
В последнем случае учтено, что в силу непрерывности случайной величины X.
Ответ.
Случайные величины и их характеристики
Если классическая теория вероятностей изучала, в основном, события и вероятность их появления (наступления), то современная теория вероятностей изучает случайные явления и их закономерности с помощью случайных величин. Понятие случайной величины, таким образом, является основополагающим в теории вероятностей. Ещё ранее проводились события, состоящие в появлении того или иного числа. Например, при бросании игральной кости могли появиться числа 1, 2, 3, 4, 5, 6. Наперёд определить число появившихся очков невозможно, поскольку оно зависит от многих случайных причин, которые полностью не могут быть учтены. В этом смысле число очков есть величина случайная, а числа 1, 2, 3, 4, 5 и 6 есть возможные значения этой величины. Случайной величиной называется величина, которая в результате опыта принимает то или иное (причём, одно и только одно) возможное числовое значение, наперёд неизвестное и зависящее от случайных причин, которые заранее не могут быть учтены.
Случайны величины принято, обычно, обозначать прописными буквами X ,Y ,Z ,…, а их возможное значения — соответствующими строчными буквами x, y,z,… Например, если случайная величина X имеет три возможных значения, то они, соответственно, обозначаются так: Для удобства будем писать:
Пример 1. Число родившихся мальчиков среди ста новорожденных есть величина случайная, которая имеет следующие возможные значения: 0, 1, 2, …, 100.
Пример 2. Расстояние, которое пролетит снаряд при выстреле из орудия, есть также величина случайная. Действительно, расстояние зависит не только от установки прицела, но и от многих других причин (силы и направления ветра, температуры и т. п.), которые не могут быть полностью учтены. Возможные значения этой величины, очевидно, принадлежат некоторому промежутку (интервалу) Заметим, что с каждым случайным событием можно связать какую-либо случайную величину, принимающую значения из R.
Например, опыт — выстрел по
мишени; событие — попадание в мишень; случайная величина — число попаданий в мишень. Вернёмся к примерам, приведённым выше. В первом из них случайная величина X могла принять одно из следующих возможных значений: 0, 1, 2,…, 100. Эти значения отделены одно от другого промежутками, в которых нет возможных значений X . Таким образом, в этом примере случайная величина принимает отдельные, изолированные, возможные значения.
Во втором примере случайная величина могла принять любое из значений промежутка a,b. Здесь нельзя отделить одно возможное значение от другого промежутком, не содержащим возможных значений случайной величины. Уже из сказанного можно заключить о целесообразности различать случайные величины, принимающие лишь отдельные, изолированные значения и случайные величины, возможные значения которых сплошь заполняют некоторый промежуток.
Дискретной (прерывной) случайной величиной называется такая случайная величина, которая принимает конечное или счётное множество4 различных значений. Другими словами — это такая случайная величина, которая принимает отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть конечным или бесконечным. Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка действительной числовой оси.
Очевидно, во-первых, число возможных значений непрерывной случайной величины – бесконечно. Во-вторых, дискретная случайная величина является частным случаем непрерывной случайной величины.
Закон распределения вероятностей
Закон распределения вероятностей дискретной случайной величины:
На первый взгляд может показаться, что для задания дискретной случайной величины достаточно перечислить все её возможные значения. В действительности это не так: различные случайные величины иногда могут иметь одинаковые перечни возможных значений, а соответствующие вероятности этих значений – различные. Поэтому для полной характеристики мало знать значения случайной величины, нужно ещё знать, как часто эти значения встречаются в опыте при его повторении, т.е. нужно ещё указать вероятности их появления.
Рассмотрим случайную величину Появление каждого их возможных значений свидетельствует о том, что произошло соответственно одно из событий, которые образуют полную группу5. Допустим, что вероятности этих событий известны:
4 Напомню, что счётным является множество, элементы которого можно пронумеровать числами натурального ряда.
5 Ai — событие, состоящее в том, что случайная величина X приняла в опыте значение причём в одном испытании, как уже отмечалось, случайная величина X принимает одно и только одно возможное значение.
Тогда: соответствие, устанавливающее связь между возможными значениями случайной величины и их вероятностями, называется законом распределения вероятностей случайной величины, или просто – законом распределения случайной величины. Закон распределения вероятностей данной случайной величины можно задать таблично (ряд распределения), аналитически (в виде формулы) и графически. При табличном задании закона распределения дискретной случайной
величины первая строка таблицы содержит возможные значения, а вторая — их вероятности, т.е.
В целях наглядности закон распределения дискретной случайной величины
можно изобразить и графически, для чего в прямоугольной системе координат строят точки , а затем соединяют их отрезками прямых. Полученную фигуру называют многоугольником распределения. При этом, сумма ординат построенного многоугольника равна единице.
Аналитически закон распределения дискретной случайной величины можно записать, например, используя формулу Бернулли для схемы повторения независимых опытов. Так, если обозначить случайную величину, которой является число бракованных деталей в выборке, через X , то возможные её значения будут 0, 1, 2, . . . , n. Тогда, очевидно, формула Бернулли будет устанавливать зависимость между значениями и вероятностью их появления, где
что о определяет закон распределения данной случайной величины.
Закон распределения вероятностей непрерывной случайной величины:
Вспомним, что дискретная случайная величина задаётся перечнем всех её возможных значений и их вероятностей. Такой способ задания не является общим: он не применим, например, для непрерывных случайных величин. Действительно, рассмотрим случайную величину X , возможные значения которой сплошь заполняют интервал Можно ли составить перечень всех возможных значений X ? Очевидно, что этого сделать нельзя. Этот пример указывает на целесообразность дать общий способ задания любых типов случайных величин (как уже отмечалось, дискретная случайная величина является частным случаем непрерывной случайной величины). С этой целью вводят интегральную функцию распределения.
Пусть x – переменная, принимающая произвольные действительные значения (на оси . Рассмотрим событие A, состоящее в том, что случайная величина X примет значение меньшее x . Тогда, вероятность события A зависит от x , т.е. является функцией от x . Эту функцию принято обозначать через и называть функцией распределения случайной величины или, ещё – интегральной функцией распределения. Другими словами: интегральной функцией распределения называют функцию определяющую для каждого значения вероятность того, что случайная величина X примет значение, меньшее x , т.е.
Геометрически это равенство можно истолковывать так: есть вероятность того, что случайная величина примет значение, которое изображается на числовой оси точкой, лежащей левее точки x .
Свойства интегральной функции
1. Значения интегральной функции принадлежат отрезку
Доказательство этого свойства вытекает из определения интегральной функции как вероятности: вероятность всегда есть неотрицательное число, не превышающее единицы.
Действительно, пусть A– событие, состоящее в том, что случайная величина X примет значение меньшее аналогично, B – событие, состоящее в том, что случайная величина X примет значение меньшее Другими словами:
3. Если возможные значения непрерывной случайной величины расположены на всей числовой оси Ox , то справедливо следующее предельное соотношение:
Это свойство вполне очевидно. Так, если — достоверное событие, а – невозможное событие, то
4. Вероятность того, что случайная величина примет значение, заключенное в интервале равна приращению интегральной функции на этом интервале:
Рассмотрим следующие события:Видим, чтот.е. события A и B несовместны. Тогдано В результате можем записать что и требовалось показать.
Мы будем в основном изучать такие непрерывные случайные величины, функции распределения которых непрерывны.
График функция распределения дискретной случайной величины представляет собой ступенчатую ломаную линию (см. рис.). Величина
скачка в точках разрыва равна вероятности значения случайной величины в этой точке. Зная ряд распределения случайной величины, можно построить график её функции распределения:
Для непрерывной случайной величины более наглядной является не интегральная, а дифференциальная функция распределения или, так называемая, плотность распределения случайной величины:
плотностью распределения случайной величины X называется производная от её интегральной функции распределения т.е.
Свойства дифференциальной функции
Доказательство этого свойства непосредственно следует из определения.
Действительно:
(самостоятельно — объяснить, почему. Рассмотреть различные случаи
Доказательство:что и требовалось доказать.
Доказательство: по четвёртому свойству для интегральной функции распределения случайной величины можем записать:
6 Воспользоваться вторым свойством для функции
Но, по рассмотренному выше второму свойству для справедливо:Тогда
Доказательство. Это свойство, как впрочем и предыдущие, можно доказать различными способами. В частности:
Замечу, что график дифференциальной функции распределения случайной величины лежит выше (или – на) оси Ox (см. первое свойство) – это, во-первых. Во-вторых, учитывая четвёртое свойство, т.е. условие нормировки, можем также сказать, что площадь области, ограниченной кривой плотности распределения, равна единице.
Пример №40
Плотность распределения случайной величины X задана формулой
Требуется:
1. найти величину постоянной A;
2. найти функцию
3. определить вероятность попадания случайной величины X в интервал
Решение.
1. величину постоянной A найдём из условия нормировки: В нашем случае, получаем
Числовые характеристики случайных величин
Закон распределения случайной величины отвечает на вопрос, где расположены возможные значения случайной величины и какова вероятность их появления в том или ином интервале значений. Часто на практике достаточно знать только некоторые характеристики
случайной величины, то есть иногда выгоднее пользоваться числами, которые описывают случайную величину суммарно. В теории вероятностей для общей характеристики случайной величины используют параметры, называемые числовыми характеристиками случайной величины. Наиболее часто используют такие из них: математическое ожидание, дисперсия, мода, медиана, моменты распределения.
Математическое ожидание
Математическим ожиданием дискретной случайной величины X называется число, равное сумме произведений всех возможных значений данной случайной величины на вероятность появления этих значений, т.е.
( или для случайной величины, имеющей счётное множество различных значений).
Математическим ожиданием непрерывной случайной величины X называется число, равное
Из определения следует, что математическое ожидание случайной величины есть величина неслучайная, а постоянная. Кроме того, существуют случайные величины, у которых не существует. В дальнейшем будет показано, что математическое ожидание приближённо равно среднему арифметическому всех возможных значений случайной величины,получаемых в результате опыта. Поэтому ещё называют средним значением случайной величины 7.
Легко сообразить, что математическое ожидание больше наименьшего и меньше наибольшего возможных значений случайной величины. Другими словами, на числовой оси возможные значения случайной величины расположены слева и справа от математического ожидания. В этом смысле математическое ожидание характеризует расположение распределения случайной величины и поэтому его часто называют центром распределения (последний термин заимствован из механики).
Свойства математического ожидания
— постоянный множитель можно выносить за знак математического ожидания;
независимые случайные величины (если закон распределения одной из них не зависит от того, какие возможные значения приняла другая случайная величина).
Модой дискретной случайной величины называется её наибольшее вероятное значение . Модой непрерывной случайной величины называется такое её значение , при котором плотность распределения имеет максимум, т.е.
Геометрически, мода – это абсцисса точки максимума кривой распределения случайной величины.
Медианой случайной величины называется такое её значение e M , относительно которого равновероятно, что данная случайная величина
окажется больше или меньше медианы, т.е.
Геометрически, медиана – это абсцисса точки, в которой площадь области, ограниченная кривой распределения и осью Ox , делится
пополам. Если распределение симметрично и имеет один максимум, то все три указанные характеристики совпадают. На рисунке
изображён случай несимметричного распределения случайной величины.
7 Происхождение термина «математическое ожидание» связано с начальным периодом возникновения теории вероятностей (XVI-XVII вв.), когда область её применения ограничивалась азартными играми. Игрока интересовало среднее значение ожидаемого выигрыша или, иными
словами, математическое ожидание выигрыша.
Дисперсия
Легко указать такие случайные величины, которые имеют одинаковые математические ожидания, но различные возможные значения.
Рассмотрим, например, две дискретные случайные величины X и Y, заданные следующими законами распределения:
Нетрудно видеть, что M(X)=M(Y)=0. Здесь математические ожидания обеих случайных величин одинаковы, а возможные значения различны, причём Х имеет возможные значения, близкие к математическому ожиданию, а Y – далёкие от своего математического ожидания. Таким образом, зная лишь математическое ожидание случайной величины, ещё нельзя судить ни о том, какие возможные значения она может принимать, ни о том, как они рассеяны вокруг математического ожидания. Другими словами, математическое ожидание полностью случайную величину не характеризует. По этой причине, наряду с математическим ожиданием, вводят и другие числовые характеристики. Так, например, для того, чтобы оценить, как рассеяны возможные значения случайной величины вокруг её математического ожидания,
пользуются, в частности, числовой характеристикой, которую называют дисперсией. Дисперсией случайной величины называется математическое ожидание квадрата отклонения данной случайной величины от её математического ожидания, т.е.
1). Для дискретной случайной величины для случайной величины, имеющей конечное число значений);
2). Для непрерывной случайной величины если значения случайной величины принадлежат промежутку
Свойства дисперсии:
Доказательства, приведённых выше свойств, вполне очевидны и проводятся по определению. Давайте докажем, например, третье свойство:
Пример №41
Найти дисперсию случайной величины X , имеющей следующее распределение
Решение:
Вычислим, прежде всего, математическое ожидание данной случайной величины:
Среднее квадратическое отклонение
Для оценки рассеяния возможных значений случайной величины вокруг её среднего значения кроме дисперсии служат и некоторые другие характеристики. К их числу относится среднее квадратическое отклонение.
Средним квадратическим отклонением ) случайной величины Х называют квадратный корень из дисперсии этой случайной величины, то есть:
Легко показать, что дисперсия имеет размерность равную квадрату размерности случайной величины. Так как среднее квадратическое отклонение, по определению, равно квадратному корню из дисперсии, то размерность совпадает с размерностью Х. Поэтому в тех случаях, когда желательно, чтобы оценка рассеяния имела размерность случайной величины, вычисляют среднее
квадратическое отклонение, а не дисперсию. Например, если Х выражается в линейных метрах, то будет выражаться также в линейных метрах, а D(X) – в квадратных метрах.
Дисперсия и среднее квадратическое отклонение являются мерой рассеяния случайной величины относительно центра распределения – чем больше рассеяние, тем больше
Моменты распределения случайной величины
Рассмотрим дискретную случайную величину Х, Заданную законом распределения:
Видимо,что значительно больше М(Х). Это объясняется тем, что после возведения в квадрат возможное значение величины 2 X , соответствующее значению х=100 величины Х, стало равным 10 000, то есть значительно увеличилось; вероятность же этого значения мала 0,01. Таким образом, переход от позволил лучше учесть влияние на математическое ожидание того возможного значения, которое велико и имеет малую вероятность. Разумеется, если бы величина Х имела несколько больших и маловероятных значений, то переход к величине а тем более к величинам и т.д., позволил бы ещё больше «усилить роль» этих больших, но маловероятных, возможных значений. Вот почему оказывается целесообразным рассматривать математическое ожидание целой положительной степени случайной величины (не только дискретной, но и непрерывной).
Обобщением основных числовых характеристик случайной величины являются её моменты. В теории вероятностей используют начальные и центральные моменты случайной величины.
Начальным моментом k -ого порядка (обозначают через ) случайной величины X называют число, равное математическому ожиданию случайной величины ,
Центральным моментом k -ого порядка (обозначают через ) случайной величины X называют число, равное математическому ожиданию случайной величины
Нетрудно видеть, что для дискретной случайной величины моменты будут выражаться через сумму, а для непрерывной – через интеграл.
Справедливо, в частности:
- Условие нормировки
- Первый начальный момент равен
- Второй центральный момент равен
- Нормированный третий центральный момент называется коэффициентом асимметрии и служит характеристикой асимметрии или скошенности распределения случайной величины.
Асимметрия положительна, если «длинная часть» кривой распределения
расположена справа от математического ожидания; асимметрия отрицательна, если «длинная часть» кривой расположена слева от математического ожидания. На практике определяют знак асимметрии по расположению кривой распределения относительно моды (точки
максимума дифференциальной функции): если длинная часть кривой расположена правее моды, то асимметрия положительна, если слева – отрицательна (см. рис.).
Если A = 0, то можно сказать, что значения случайнойвеличины распределены симметрично относительно математического ожидания, т.е. случайная величина имеет нормальное распределение.
5. С четвёртым центральным моментом связана величина, называемая эксцессом:
Эксцесс характеризует островершинность или плосковершинность распределения случайной величины (другими
словами, эксцесс служит для оценки «крутости», то есть большего или меньшего подъёма кривой теоретического распределения по сравнению с нормальной кривой). Забегая немного вперёд, скажем, если эксцесс некоторого распределения отличен от нуля, то кривая этого распределения отличается от нормальной кривой: если эксцесс положительный, то кривая имеет более высокую и «острую» вершину, чем нормальная кривая; если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая (см. рис.). Для нормального распределения E = 0.
Замечания.
1. Для начальных и центральных моментов справедливы следующие соотношения:
2. Моменты непрерывной случайной величины аналогичны моментам твёрдого тела в механике. Так, если рассматривать бесконечный твёрдый стержень расположенный вдоль оси Ox , то можем записать:
момент инерции стержня относительно оси перпендикулярной Ox и проходящей через центр масс стержня.
3. Распределение вероятностей случайной величины можно интерпретировать как распределение массы стержня на прямой Ox .
Основные законы распределения случайной величины
Равномерное распределение дискретной случайной величины.
Пусть случайная величина Х принимает n значений с вероятностями Данная случайная величина называется равномерно распределённой случайной величиной, если
В этом случае:
— ряд распределения
— функция распределения
— математическое ожидание
— дисперсия
Пример №42
Случайная величина Х – выпадение числа очков на верхней грани игрального кубика при одном броске. Найти математическое ожидание случайной величины Х.
Решение. Очевидно, что
то, согласно определению, случайная величина Х распределена по равномерному закону. Следовательно, в этом случае, можем записать:
1.2. Равномерное распределение непрерывной случайной величины.
Непрерывная случайная величина подчиняется равномерному закону распределения, если её возможные значения лежат в некотором определённом интервале, в пределах которого все значения равновероятны, то есть обладают одной и той же плотностью вероятности. Другими словами, распределение вероятностей называют равномерным, если на интервале, которому принадлежат все возможные значения случайной величины, дифференциальная функция имеет постоянное значение. Случайные величины, имеющие равномерное распределение вероятностей, часто встречаются на практике. Например, при снятии показаний измерительных приборов. Ошибка при округлении отсчёта до ближайшего целого деления шкалы является случайной величиной, которая может с постоянной плотностью вероятности принимать любые значения между двумя соседними делениями. Таким образом, данная случайная величина имеет равномерное распределение.
Найдём дифференциальную функцию (плотность) равномерного распределения, считая, что все возможные значения случайной величины Х
заключены в промежутке на котором дифференциальная функция сохраняет постоянное значение, то есть
По условию Х не принимает значений вне промежутка поэтому Найдём значение постоянной С. Так как все возможные значения случайной величины принадлежат промежутку то справедливо:
Итак, закон равномерного распределения случайной величины на отрезке аналитически можно записать так:
Найдём теперь интегральную функцию равномерного распределения непрерывной случайной величины. Для этого воспользуемся формулой
Итак, искомая интегральная функция распределения аналитически может быть записана так:
Свойства равномерного непрерывного распределения:
Пример №43
Троллейбусы идут строго по расписанию и с интервалом в 6 мин. Найти вероятность того, что пассажир, подошедший к остановке, будет ожидать троллейбус менее двух минут.
Решение. Время ожидания троллейбуса есть непрерывная случайная величина Х, имеющая равномерное распределение на промежутке [0,6], так как с равной вероятностью время ожидания может быть любым в этом промежутке. Тогда
Гипергеометрическое распределение
Гипергеометрическое распределение играет важную роль в области статистического контроля качества. Будем говорить, что дискретная случайная величина Х, принимающая целочисленные значения распределена по гипергеометрическому закону, если вероятности этих значений определяются выражением
3. при гипергеометрическое распределение приближается к биномиальному распределению (о котором поговорим немного позднее).
Пример №44
Партия из 100 изделий содержит 10% брака. Для контроля выбрано 5 изделий. Необходимо определить вероятность того, что в выборке меньше двух бракованных изделий. Найти для случайной величины Х – числа дефектных изделий в данной выборке изделий.
Решение. Данная дискретная случайная величина Х={0,1,2,3,4,5}очевидно подчиняется гипергеометрическому закону распределения вероятностей. В нашем случае N = 100, D = 10, n = 5. Вероятность того, что в выборке ровно d бракованных изделий равна
Заметим, что То есть вероятность того, что в выборке меньше двух бракованных изделий равна 0,923.
Далее, найдём
Замечание: Сравним полученные значения математического ожидания и дисперсии с соответствующими значениями (см. свойства гипергеометрического распределения):
Биномиальное распределение
Биномиальное распределение вероятностей является самым распространённым распределением для дискретных случайных величин.
Итак, пусть производится n независимых испытаний, в каждом из которых событие А может появиться, либо не появиться. И пусть, вероятность наступления события во всех испытаниях постоянна и равна р (следовательно, вероятность непоявления Рассмотрим в качестве дискретной случайной величины Х – число появлений события А в этих испытаниях. Поставим перед собой задачу: найти закон распределения величины Х. Для её решения требуется определить возможные значения случайной величины Х и их вероятности.
Очевидно, событие А в n испытаниях может либо не появиться, либо появиться 1 раз, либо 2 раза, . . . , либо n раз. Таким образом, нетрудно записать возможные значения случайной величины Остаётся найти вероятности этих возможных значений, для чего достаточно воспользоваться формулой Бернулли (см. Лекцию 5):
Формула Бернулли и является аналитическим выражением искомого закона распределения.
Биномиальным называют распределение вероятностей дискретной случайной величины, определяемое формулой Бернулли.
Запишем биномиальный закон в виде таблицы:
Свойства биномиального распределения:
Действительно:
Пример №45
Имеется три станка, коэффициент использования по времени которых составляет 0,8. Определить вероятность того, что в середине рабочей смены при нормальных условиях производства из данных трёх станков будет работать не более двух.
Решение. Работа каждого станка – события независимые. Вероятность того, что станок будет работать равна р=0,8 (следовательно q=1-0,8=0,2). Пусть случайная величина Х — число одновременно работающих станков, то есть Очевидно, что вероятности значений случайной величины Х подчиняются биномиальному закону распределения с параметрами р=0,8; q=0,2; n=3. Значит
Требуется определить вероятность По определению
Распределение Пуассона (закон редких событий)
Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р. Для определения вероятности k – появлений события А в этих испытаниях используют, как вам уже известно, формулу Бернулли. Однако, как быть если n велико, а вероятность р события А достаточно мала В таких случаях прибегают к асимптотической формуле Пуассона.
Итак, поставим своей задачей найти вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно k раз. Сделаем важное допущение: пусть произведение np сохраняет постоянное значение, а именно . Это означает, что среднее число появлений события в различных сериях испытаний, то есть при различных значениях n, остаётся
неизменным. Воспользуемся формулой Бернулли для вычисления интересующей нас
вероятности:
Приняв во внимание, что n имеет очень большое значение, вместо найдём При этом будет найдено лишь приближённое значение отыскиваемой вероятности: n хотя и велико, но всё же конечно, а при отыскании предела мы устремим n к бесконечности.
Итак
В результате (для простоты записи знак приближённого равенства опущен) запишем закон распределения.
Эта формула выражает закон распределения Пуассона вероятностей массовых (n велико) редких (р мало) событий.
Таким образом, будем говорить, что дискретная случайная величина принимающая счётное множество значений, подчиняется закону распределения Пуассона, если вероятности её возможных значений задаются выражением:
Свойства распределения Пуассона:
Действительно:
3. если то из биномиального распределения следует закон распределения Пуассона.
Пример №46
Завод отправил на базу 5000 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,0002. Найти вероятность того, что на базу прибудут: а) три негодных изделия; б) не более трёх повреждённых изделия.
Решение: по условию n=5000, p=0,0002. Найдём
а) k = 3. Искомая вероятность по формуле Пуассона приближённо равна
б) Пусть случайная величина Х – число изделий, повреждённых в пути, то есть Очевидно, что данная случайная величина распределена по биномиальному закону. Следовательно, искомую вероятность можно вычислить по формуле
Но, так как , то по свойству можем воспользоваться законом распределения Пуассона, то есть, можем записать:
Замечание. По формуле Пуассона можно вычислить вероятность того, что
число событий, происшедших за время t равно k , если события образуют пуассоновский поток, причём– интенсивность потока, то есть среднее число событий, которые появляются в единицу времени:
Пример №47
В течение часа коммутатор получает в среднем 60 вызовов. Какова вероятность того, что за время 30 сек, в течении которых телефонистка отлучилась, не будет ни одного вызова?
Решение: Найдём, прежде всего, – среднее число вызовов за 1 секунду:
Распределение Гаусса (нормальное распределение)
Наиболее известным и часто применяемым в теории вероятностей законом является нормальный закон распределения или закон Гаусса9.
Главная особенность нормального закона распределения заключается в том, что он является предельным законом для других законов распределения. Будем говорить, что непрерывная случайная величина Х, принимающая значения , подчиняется нормальному
закону, если её плотность распределения (дифференциальная функция) имеет вид
Нетрудно видеть, что нормальное распределение определяется двумя параметрами: Достаточно задать эти параметры, чтобы задать нормальное распределение. Заметим, что для нормального распределения интегральная функция имеет вид:
Нормальное распределение было найдено впервые Муавром в 1733 г. в связи с исследованием предела биномиального распределения. Открытие прошло незамеченным; только в 1809 г. Гауссом и в 1812 г. Лапласом оно было снова открыто в связи с теорией ошибок наблюдений.
Существует известное замечание Липмана, гласящее, «каждый уверен в справедливости закона ошибок: экспериментаторы – потому, что они думают, что это математическая теорема, математики – потому, что они думают, что это экспериментальный факт». Отметим, что обе стороны совершенно правы, если только это их убеждение не слишком безусловно: при математическом доказательстве (см.центральную предельную теорему) утверждается, что при некоторых ограничениях вправе ожидать нормальное распределение, а статистический опыт показывает, что в действительности распределения являются часто приближённо нормальными. Поэтому, нормальному распределению уделяется большое внимание.
Покажем теперь, что вероятностный смысл параметров таков: а есть математическое ожидание, – среднее квадратическое отклонение (то есть нормального распределения:
а) по определению математического ожидания непрерывной случайной величины
имеем
значит
Действительно, так как под знаком интеграла стоит нечётная функция, и пределы интегрирования
симметричны относительно начала координат;интеграл Пуассона.
Итак, математическое ожидание нормального распределения равно параметру а.
б) по определению дисперсии непрерывной случайной величины и, учитывая, что , можем записать
Интегрируя по частям, положивнайдём
Следовательно
Итак, среднее квадратическое отклонение нормального распределения равно параметру
В случае если нормальное распределение называют нормированным (или, стандартным нормальным) распределением. Тогда, очевидно, нормированная плотность (дифференциальная) и нормированная интегральная функция распределения запишутся соответственно в виде:
(Функция как вам известно, называется функцией Лапласа (см. ЛЕКЦИЮ5) или интегралом вероятностей. Обе функции, то есть табулированы и их значения записаны в соответствующих таблицах).
Свойства нормального распределения (свойства нормальной кривой):
- Очевидно, функция на всей числовой прямой.
- то есть нормальная кривая расположена над осью Ох.
- то есть ось Ох служит горизонтальной асимптотой графика.
- Нормальная кривая симметрично относительно прямой х = а (соответственно график функции симметричен относительно оси Оу). Следовательно, можем записать:
5.
6. Легко показать, что точки являются точками перегиба нормальной кривой (доказать самостоятельно).
7. Очевидно, что
Но так как
Кроме того , следовательно, все нечётные моменты равны нулю. Для чётных же моментов можем записать:
8.
9.
10.
11. При отрицательных значениях случайной величины
12.
13. Вероятность попадания случайной величины на участок, симметричный относительно центра распределения, равна:
Пример №48
Показать, что нормально распределённая случайная величина Х отклоняется от математического ожидания М(Х) не более чем на
Решение. Для нормального распределения: . Далее, запишем:
Другими словами, вероятность того, что абсолютная величина отклонения превысит утроенное среднее квадратическое отклонение, очень мала, а именно равна 0, 0027. Это означает, что лишь в 0,27% случаев так может произойти. Такие события, исходя из принципа невозможности маловероятных событий, можно считать практически невозможными. Итак, событие с вероятностью 0,9973 можно считать практически
достоверным, то есть случайная величина отклоняется от математического ожидания не более чем на.
Пример №49
Зная характеристики нормального распределения случайной величины Х – предела прочности стали: найти вероятность получения стали с пределом прочности от
Решение.
В этом состоит сущность так называемого правила трёх сигм: если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения. На практике правило трёх сигм применяется так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведённом правиле, выполняется, то имеются все основания предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально.
Показательное распределение (экспоненциальный закон распределения)
Показательным (экспоненциальным) называют распределение вероятностей непрерывной случайной величины Х, которое описывается дифференциальной функцией (плотность распределения)
где — постоянная положительная величина.
Показательное распределение определяется одним параметром . Эта особенность показательного распределения указывает на его преимущество, по сравнению с распределениями, зависящими от большего числа параметров. Обычно параметры неизвестны и приходится находить их оценки (приближённые значения); разумеется, проще оценить один параметр, чем два, или три и т.д.
Нетрудно записать интегральную функцию показательного распределения:
Мы определили показательное распределение при помощи дифференциальной функции; ясно, что его можно определить, пользуясь интегральной функцией.
Замечание: Рассмотрим непрерывную случайную величину Т – длительность времени безотказной работы изделия. Обозначим принимаемые её значения через t, . Интегральная функция распределения определяет вероятность отказа изделия за время длительностью t. Следовательно, вероятность безотказной работы за это же время, длительностью t, то есть вероятность противоположного события , равна
Применяется в теории надёжности для описания времени безотказной работы невосстанавливаемых изделий.
Функцией надёжности называют функцию, определяющую вероятность безотказной работы изделия (элемента) за время длительностью t. Если длительность времени безотказной работы изделия (элемента) имеет показательное распределение, то функция надёжности, в этом случае, запишется в видеТаким образом, показательным законом надёжности называют функцию надёжности, определяемую последним равенством, где — интенсивность отказов.
Свойства показательного распределения:
1. Математическое ожидание показательного распределения равно обратной
величине параметра Действительно,
2.Следовательно Таким образом, математическое ожидание и среднее квадратическое отклонение показательного распределения равны между собой.
Пример №50
Пусть время, необходимое для ремонта станков, распределено по показательному (экспоненциальному) закону с параметром Определить вероятность того, что время ремонта одного станка меньше 6-и часов. Найти среднее время ремонта одного станка.
Решение. Т – время ремонта станка Тогда можем записать
Далее, так как среднее время ремонта – это М( Т ), то
Среднее арифметическое, мода и медиана. Среднее квадратическое отклонение
Вероятно, Вы отлично знаете, что такое среднее арифметическое. Если мы имеем набор каких-то величин, и все они одной природы (усреднять килограммы с километрами мы, конечно, не можем), надо посчитать сумму, а затем, поделив ее на количество слагаемых, найти среднее арифметическое. Казалось бы, простое и хорошо знакомое действие, но и тут имеется несколько проблем для обсуждения. При знакомстве с некоторыми «показателями» поневоле вспоминается известная шутка о «средней температуре по больнице».
Пример №51
Допустим, фирма имеет две палатки, торгующие горячей выпечкой, которую они пекут на месте из полуфабрикатов. В таблице приводится примерная сводка ежедневной выручки каждой из палаток за неделю (в руб.).
Различие в ежедневной выручке в основном связано с расположением палаток. Палатка 1 находится в парке отдыха, в то время как Палатка 2 расположена напротив школы и вблизи проходной крупного НИИ.
Владелец фирмы решил выплачивать ежемесячную премию продавцам той палатки, которая даст в этом месяце большую выручку. При распределении премии выяснилась удивительная вещь: выигрыш в этом «соревновании» зависел только от количества выходных в месяце.
Не хотелось бы приводить большое количество цифр за весь месяц в целом, но и без этого видно, что если бы владельцу фирмы пришла в голову идея ежедневного премирования победителя какой-то фиксированной суммой, «Палатка выходного дня» могла бы рассчитывать на премии в два с половиной раза реже, хотя недельная выручка от нее больше.
В таких условиях более разумное соревнование могло бы быть основано на осреднении показателей за неделю. Допустим, недельные показатели практически совпали. Как оценить, какая из палаток полезнее для фирмы, если по каким-то причинам фирме необходимо продать одну из них?
Если выручка практически совпадает, владелец, по-видимому, поинтересуется стабильностью работы торговой точки. Вины продавцов в этом нет, но если оборудование работает два дня в неделю на износ, а в остальное время больше простоев, выход из строя такого оборудования более вероятен. Пусть в один (случайным образом выпавший) день в неделю идет сильный дождь, и на улицах мало прохожих, падение выручки особенно резко заметно, когда такой дождливый день совпадает с одним из выходных. Для сравнения можно представить спортсменов, которые имеют равные шансы выиграть, но один из них выступает ровнее. Скорее всего, именно он и будет принят в состав сборной.
Но вот еще один вопрос: а не делает ли эта самая нестабильная палатка работу фирмы в целом более стабильной, прекрасно дополняя работу палатки 2? Давайте выдвинем это утверждение в качестве гипотезы и попробуем его доказать или опровергнуть. Чтобы оценить эту проблему количественно, надо прежде всего просуммировать дневную выручку обеих палаток.
То, что мы описали общими словами как «нестабильность работы», в статистике называется характеристикой рассеивания. К ним относятся такие показатели как дисперсия и среднее квадратическое отклонение. Покажем на предыдущем примере, как определяются эти понятия. Посчитаем сначала среднее арифметическое выручки для каждой палатки отдельно, и для обеих палаток вместе (осреднение проводим за семь дней):
Чтобы сравнить разброс значений, посчитаем для обеих палаток дневные отклонения выручки от их собственного среднего значения.
Чтобы измерить, насколько одна палатка «нестабильнее» другой, хочется сложить всю строку за неделю и получить общее отклонение за весь отчетный период. Но этого делать нельзя, мы сами так построили эти показатели, что, сложив, получим ноль (с точностью до погрешности округления — среднее арифметическое величина не обязательно целая). Чтобы избежать этого обнуления, нам надо, чтобы каждое отклонение от среднего арифметического «лишилось» своего знака. Для этого возводят каждую величину в квадрат, и лишь затем суммируют весь ряд значений.
Чтобы не зависеть от периода осреднения делят полученную сумму квадратов на число слагаемых (в нашем случае, по-прежнему на семь). Такая величина называется дисперсией.
Мы видим, что дисперсия действительно очень показательная величина. У «Палатки выходного дня» она выше более, чем в десять раз.
Дисперсию можно посчитать в Excel автоматически, даже не считая предварительно среднее арифметическое, программа сделает это сама. Для этого, находясь в файле Excel, нажмите в верхнем меню кнопку Затем, выберите среди функций тип «СТАТИСТИЧЕСКИЕ», и из предложенного перечня в окошке — ДИСПРА.
Затем, по подсказке, поставив курсор в поле «Число 1» проведите мышью вдоль строки с набранными значениями. Этот вид подсчета называется «вычисление смещенной дисперсии по генеральной совокупности». Дисперсией часто пользуются, но более удобная характеристика носит название среднее квадратическое отклонение (обычно обозначается греческой буквой омега.
Среднее квадратическое отклонение — это квадратный корень из дисперсии, он удобен тем, что имеет ту же размерность, что и исходные величины. Так, в нашем случае, дисперсия имела бы размерность «рубли в квадрате», в то время как среднее квадратическое отклонение получается просто и привычно, в рублях.
В нашем примере, видно, что суммарная дисперсия и среднее квадратическое отклонение у двух палаток вместе все-таки выше, чем у одной первой палатки, причем среднее квадратическое отклонение выше более, чем в два раза. Значит, наша гипотеза о «повышенной стабильности суммы» за счет присутствия второй палатки несостоятельна.
Иногда, вместо среднего арифметического употребляют другие характерные величины, если это по каким-то причинам лучше описывает выборку. Так если расставить выборку по возрастанию (или убыванию) той величины, которой мы интересуемся, то медиана — это то, что будет ровно посередине «строя». Например, если мы расположим по порядку длительности интервалы времени: секунда, минута, час, сутки и неделя — то медианой будет час. Еще одно понятие для замены среднего — мода. Само название позволяет легко запомнить это определение. Если мы выстроим по порядку все пары обуви на складе по размеру, то самый ходовой размер будет модой. Мода — это то, что непременно должны учитывать производители упаковок и фасовщики. Если бы большинство людей покупало за один раз стакан молока, молочные пакеты не были бы литровыми. В следующем параграфе мы начнем работать со случайными величинами, имеющими нормальное распределение, и эти понятия нам снова встретятся.
Случайные величины и их законы распределения
Понятие случайной величины. Функция распределения
Определение: Случайной величиной называется такая переменная величина, которая в результате проведения опыта может принять то или иное значение, неизвестное до проведения эксперимента.
Случайные величины принято обозначать заглавными, последними буквами латинского алфавита а значения, которые они могут принять обозначают аналогичными, но прописными буквами
Пример:
Являются ли случайными величинами следующие переменные величины: а) число вызовов, поступивших от абонентов на телефонную станцию в течение определенного промежутка времени; б) число электронов, вылетевших из нагретого катода за определенный промежуток времени; в) длина некоторой детали при массовом производстве (самостоятельно).
Решение:
Все случайные величины делятся на три группы: дискретные, смешанные и непрерывные. В Примере случаи а) и б) указывают на случайные дискретные величины, а случай в) — на случайную непрерывную величину.
Определение: Законом распределения случайной величины называется любое соотношение, с помощью которого устанавливается соответствие между возможными значениями случайной величины и вероятностями некоторых событий, связанных определенным образом с этими возможными значениями. Закон распределения случайной величины может быть представлен аналитической формулой F(x); графиком, связывающим значения вероятности со значениями случайной величины; таблицей, которая устанавливает соответствие между значениями случайной величины и их вероятностями.
Замечание: В определение закона распределения случайной величины входят слова «любое соотношение» — это означает, что таких соотношений может быть очень много. К числу универсальных форм закона распределения случайной величины относится функция распределения.
Определение: Функцией распределения F(х) случайной величины X называется вероятность события X<х, которое состоит в том, что случайная величина X обязательно примет значение заведомо меньшее, чем заданное значение х, т. е.
Пример:
Найти функцию распределения F(х) случайной величины X, которая представляет собой значение определенной грани кубика.
Решение:
Рассмотрим события, определяющие случайную дискретную величину X, и вероятности этих событий:
1) — данное событие является , так как на гранях кубика нет числа, которое было бы меньше единицы, а вероятность невозможного события равна нулю (см. Лекцию №7); отметим, что любое событие Х<В (при ) является невозможным событием, поэтому вероятность такого события равна нулю;
-данное событие является достоверным, так как в этом случае обязательно выпадет одно из чисел от 1 до 6, а вероятность достоверного события равна 1 (см. Лекцию №7);
для любого другого числа А (при ) событие X < А будет достоверным событием, следовательно, вероятность такого события будет равна единице.
Итак, функция распределения имеет вид
Построим график функции распределения (Рис. 6):
Рис. 6. График функции распределения для случайной дискретной величины.
Замечание: Случайная дискретная величина характеризуется функцией распределения, график которой имеет “ступенчатый» вид. Случайная непрерывная величина характеризуется функцией распределения, график которой имеет “непрерывный” вид.
Свойства функции распределения
Вышеприведенный Примере иллюстрирует основные свойства функции распределения случайной величины произвольной природы:
Действительно, если то событие включает в себя как событие так и событие (Рис. 7). Поэтому по теореме сложения вероятностей событий получаем: или
В силу положительности всех слагаемых получаем, что причем знак равенства имеет место только в том случае, когда
Рис. 7. Неубывание функции распределения.
Дифференциальная функция распределения и ее свойства
Для случайных непрерывных величин помимо функции распределения используется дифференциальная функция распределения.
Определение: Дифференциальной функцией распределения (плотностью вероятности) случайной непрерывной величины X называется первая производная от функции распределения, т.е.
Замечание: Из определения плотности вероятности следует, что функция распределения F(x) является первообразной для дифференциальной функции распределения f(х).
Рассмотрим свойства плотности вероятности:
Пример №52
Дифференциальная функция распределения случайной непрерывной величины X имеет вид Найти коэффициент А и вероятность того, что случайная величина X попадает в интервал (-1; 1).
Решение:
Для нахождения коэффициента А воспользуемся свойством 4 для плотности вероятности: Отсюда находим, что Воспользовавшись свойством 2, найдем интегральную функцию распределения:
Следовательно, вероятность того, что случайная величина X попадает в интервал (-1; 1), по свойству 6 для интегральной функции распределения, равна:
Законы распределения случайных величин
Для задания закона распределения случайной непрерывной величины определяют плотность вероятности:
1. Нормальный закон распределения — параметры распределения.
2. Закон Рэлея — параметр распределения.
3. Закон Максвелла — параметр распределения.
4. Закон Коши — параметры распределения.
5. Экспоненциальный закон распределения — параметр распределения.
6. Распределение “хи-квадрат — параметр распределения, — гамма-функция.
7. Закон Стьюдента — параметр распределения.
8. Закон равномерной плотности
В заключение этого пункта приведем некоторые законы распределения для случайной дискретной величины:
1. Гипергеометрическое распределение возникает, когда из некоторого множества, содержащего N элементов, из которых m благоприятствуют появлению дискретной величины, извлекают наудачу n элементов без возвращения их в множество. В этом случае вероятность того, что дискретная величина появится x раз, определяется по формуле .
2. Закон Бернулли
3. Закон Пуассона
4. Дифференциальный и интегральный законы распределения Муавра-Лапласа.
Числовые характеристики случайной величины
Полную характеристику случайной величины дает ее закон распределения (или функция распределения). Однако на практике зачастую требуется знать лишь некоторые ее параметры, которые определяют характер поведения изучаемой случайной величины. Такими числовыми характеристиками являются, например, математическое ожидание (параметр расположения центра тяжести распределения), дисперсия и средне-квадратичное отклонение (параметры рассеивания случайной величины относительно математического ожидания).
Математическое ожидание или среднее значение случайной величины
Термин «математическое ожидание» применяется в теории вероятностей, а термин ‘»среднее значение случайной величины» — в практических приложениях математической статистики.
Определение: Математическим ожиданием случайной величины называется центр тяжести распределения, который определяется по формуле:
-для случайной дискретной величины; -для случайной непрерывной величины.
Пример №53
Пусть в беспроигрышной лотереи участвует 100 билетов. Из них 40 дают выигрыш по 1 грн., 30 — по 2 грн., 20 — по 5 грн. и 10 — по 10 грн. Стоимость одного билета 5 грн. Определить математическое ожидание случайной дискретной величины X, которая определяет выигрыш на 1 билет.
Решение:
Составим таблицу распределения случайной дискретной величины X, которая определяет выигрыш на один билет:
По определению математическое ожидание будет равно:
(грн.) Лотерея выпущена на сумму грн., выплаты на выигрыш составляют грн., следовательно, чистая прибыль равна 500-300 = 200 грн.
Свойства математического ожидания
Рассмотрим свойства математического ожидания:
1.Математическое ожидание постоянной величины равно самой этой константе, т.е. .
Доказательство: Для случайной непрерывной величины
2. Постоянный множитель можно выносить за знак математического ожидания, т.е. .
Доказательство: Для случайной дискретной величины:
3. Математическое ожидание от суммы двух случайных величин X и У равно сумме их математических ожиданий, т.е.
4. Объединяя свойства 2 и 3 математического ожидания, получаем
.
5. Математическое ожидание от произведения двух независимых случайных величин равно произведению их математических ожиданий, т.е.
Определение: Центрированной случайной величиной называется разность между случайной величиной X и ее математическим ожиданием: .
6. Математическое ожидание центрированной случайной величины Хо равно нулю, т.е.
Доказательство: Используя свойства математического ожидания, получим:
Пример №54
Вычислить математическое ожидание от непрерывной случайной величины X, распределенной по экспоненциальному закону.
Решение:
Согласно определению математического ожидания имеем:
(первое выражение равно нулю, поэтому имеем) =
Дисперсия или рассеивание случайной величины
Рассеивание случайной величины относительно математического ожидания определяется дисперсией и средним квадратичным отклонением.
Определение: Дисперсией случайной величины X называется математическое ожидание квадрата центрированной случайной величины
Замечание: Дисперсия случайной величины X является неотрицательной величиной.
Определение: Средне-квадратичным отклонением случайной величины X называется положительное число
Основные свойства дисперсии
1. Дисперсия постоянной (неслучайной) величины равна 0, т.е.
Доказательство: В силу того, что
2. Постоянный множитель можно выносить за знак дисперсии, возводя этот множитель в квадрат, т.е.
Доказательство: По определению дисперсии имеем:
3. Дисперсия суммы двух случайных величин X и У равно сумме их дисперсий, т.е. .
4. Объединяя свойства 2 и 3 дисперсии, получаем
5. Дисперсия случайной величины X равна разности между математическим ожиданием квадрата этой величины и квадратом ее математического ожидания, т.е.
Доказательство: Используя определение дисперсии и свойства математического ожидания, получим:
Пример №55
Распределение случайной величины X определяется плотностью вероятности Найти коэффициент а, математическое ожидание М[Х], дисперсию D[X] и среднее квадратичное отклонение
Решение:
Для нахождения коэффициента а воспользуемся свойством 4. для плотности вероятности: Отсюда находим, что Остальные параметры найдем согласно их определению:
Другие характеристики случайной величины
Иногда для практических расчетов требуется вычисление других числовых характеристик случайной величины. Определим эти параметры.
Определение: Начальным моментом порядка k случайной величины X называется математическое ожидание k-ой степени этой величины, т.е.
Замечание: Из определения начального момента порядка k видно, что математическое ожидание случайной величины X является ее первым начальным моментом.
Определение: Центральным моментом порядка k случайной величины X называется математическое ожидание k-ой степени центрированной случайной величины
Замечание: Из определения начального момента порядка k видно, что первый центральный момент любой случайной величины равен нулю, второй центральный момент равен дисперсии. Отметим также, что третий центральный момент используется в теории вероятностей для характеристики симметричности кривой плотности вероятности. Если то кривая плотности распределения симметрична относительно математического ожидания.
Замечание: Центральные и начальные моменты случайной величины X связаны между собой определенными соотношениями. В качестве примера рассмотрим случай, когда Отсюда получаем, что
Как решать случайные величины
Наряду со случайным событием одним из основных понятий теории вероятностей является понятие случайной величины.
Понятие случайной величины
Случайной называют величину, которая в результате испытания может принять одно и только одно возможное значение, заранее неизвестное и зависящее от случайных причин, которые заранее учесть невозможно. Примеры случайной величины:
- Число появлений герба при двукратном бросании монеты;
- Время безотказной работы некоторого устройства. Нетрудно заметить, что в первом случае все возможные значения случайной величины могут быть перечислены заранее. Такими значениями являются 0, 1, 2.
Отметим, что эти значения отделены друг от друга промежутками, в которых нет других возможных значений этой случайной величины. Во втором случае перечислить все возможные значения случайной величины не представляется возможным, так как эти значения не отделены друг от друга и заполняют собой некоторый промежуток. Очевидно, что число возможных значений непрерывной случайной величины – бесконечно.
В связи с этим принято различать дискретные и непрерывные случайные величины. Случайная величина называется дискретной (прерывной), если множество ее значений является конечным, или бесконечным, но счетным. Под непрерывной случайной величиной будем понимать величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка.
Случайные величины принято обозначать прописными буквами латинского алфавита – X, Y, Z, а их значения – соответствующими строчными буквами x, y, z. Например, случайная величина Х – число появлений герба при двукратном бросании монеты – может принять значения
Закон распределения случайной величины
Наиболее полным, исчерпывающим описанием случайной величины является ее закон распределения.
Определение: Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Про случайную величину говорят, что она «распределена» по данному закону распределения или «подчинена» этому закону.
Для дискретной случайной величины закон распределения может быть задан в виде таблицы, аналитически или графически. Простейшей формой задания закона распределения дискретной случайной величины X является таблица, в которой перечислены в порядке возрастания все возможные значения случайной величины и соответствующие им вероятности, т.е.
Такая таблица называется рядом распределения дискретной случайной величины.
Отметим, что события состоящие в том, что в результате испытания случайная величина Х примет соответственно значения являются несовместными и единственно возможными, т.е. образуют полную группу. Следовательно, сумма их вероятностей равна единице, т.е. Ряд распределения может быть изображен графически, если по оси абсцисс откладывать значения случайной величины, а оси ординат – соответствующие им вероятности. Соединение полученных точек образует ломаную линию, которую называют многоугольником или полигоном распределения вероятностей.
Пример №56
Два стрелка делают по одному выстрелу в мишень. Составить закон распределения случайной величины Х – общего числа попаданий в мишень, если вероятность поражения мишени в одном выстреле для первого стрелка равна 0,8, а для второго – 0,6.
Решение:
Очевидно, что возможные значения Х – 0, 1, 2. Пусть А1 – событие состоящее в том, что первый стрелок попадет в мишень, А2 – второй стрелок попадет в мишень. Тогда Записываем ряд распределения случайной величины Х. На рис. 4.1 полученный ряд распределения представлен графически в виде многоугольника (полигона) распределения вероятностей случайной величины Х. ◄
Две случайные величины называются независимыми, если закон распределения одной из них не меняется от того, какие возможные значения приняла другая величина. Так если случайная величина Х может принимать значения а случайная величина Y – значениято независимость случайных величин X и Y означает независимость событий В противном случае случайные величины называются зависимыми.
Функция распределения случайной величины
Мы установили, что ряд распределения полностью характеризует дискретную случайную величину. Однако эта характеристика не является универсальной. Она существует только для дискретных величин. Для непрерывной величины ряд распределения построить нельзя. Действительно, непрерывная случайная величина имеет бесчисленное множество возможных значений, которые сплошь заполняют некоторый промежуток. Составить таблицу, в которой были бы перечислены все возможные значения этой величины, невозможно. Следовательно, для непрерывной случайной величины не существует ряда распределения в том смысле, в каком он существует для дискретной величины. Однако различные области возможных значений случайной величины не являются одинаково вероятными, и для непрерывной величины все-таки существует «распределение вероятностей», хотя и не в том смысле, как для дискретной.
Для количественной характеристики этого распределения вероятностей удобно воспользоваться не вероятностью события Р(Х = х), состоящего в том, что случайная величина примет определенное значение х, а вероятностью события Р(Х <х), состоящего в том, что случайная величина примет значение меньшее х. Очевидно, что вероятность этого события зависит от х, т.е. является некоторой функцией от х.
Определение: Функцией распределения случайной величины Х называется функция F(x), выражающая для каждого значения х вероятность того, что случайная величина Х примет значение, меньшее х: Функцию распределения называют также интегральной функцией распределения или интегральным законом распределения.
Функция распределения – самая универсальная характеристика случайной величины. Она существует для всех случайных величин: как дискретных, так и непрерывных. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения, т.е. является одной из форм закона распределения. Функция распределения допускает простую геометрическую интерпретацию. Рассмотрим случайную величину Х на оси Ох (рис. 4.2), которая в результате опыта может занять то или иное положение.
Пусть на оси выбрана точка, имеющая значение х. Тогда в результате опыта случайная величина Х может оказаться левее или правее точки х. Очевидно, вероятность того, что случайная величина Х окажется левее точки х, будет зависеть от положения точки х, т.е. являться функцией аргумента х. Для дискретной случайной величины Х, которая может принимать значения функция распределения имеет вид где неравенство под знаком суммы означает, что суммирование касается всех тех значений xi, величина которых меньше х.
Пример №57
Дан ряд распределения случайной величины Х. Найти и изобразить графически ее функцию распределения.
Решение:
Будем задавать различные значения х и находить для них F(x) = = P(X < x). Запишем функцию распределения.
Изобразим функцию распределения графически (рис. 4.3). Заметим, что при подходе слева к точкам разрыва функция сохраняет свое значение (про такую функцию говорят, что она непрерывна слева). Эти точки на графике выделены. ◄
Этот пример позволяет прийти к утверждению, что функция распределения любой дискретной случайной величины есть разрывная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям случайной величины и равны вероятностям этих значений.
Рассмотрим общие свойства функции распределения:
1. Функция распределения случайной величины есть неотрицательная функция, заключенная между нулем и единицей: 2. Функция распределения случайной величины есть неубывающая функция на всей числовой оси, т.е. 3. На минус бесконечности функция распределения равна нулю, на плюс бесконечности равна единице, т.е. 4. Вероятность попадания случайной величины в интервалвключая равна приращению ее функции распределения на этом интервале, т.е.
Пример №58
Функция распределения случайной величины Х имеет вид: Найти вероятность того, что случайная величина X примет значение в интервале [1; 3).
Решение:
Для непрерывных случайных величин справедливо следующее свойство: Вероятность любого отдельно взятого значения непрерывной случайной величины равна нулю.
Поясним это свойство. До сих пор мы рассматривали испытания, сводившиеся к схеме случаев, и нулевой вероятностью обладали лишь невозможные события. Из приведенного свойства следует, что нулевой вероятностью могут обладать и возможные события. На первый взгляд этот вывод может показаться парадоксальным. Действительно, если, например, событие α ≤ Х ≤ β имеет отличную от нуля вероятность, то оказывается, что оно представляет собой сумму событий, состоящих в принятии случайной величиной Х любых конкретных значений на отрезке [α, β] и имеющих нулевую вероятность. Однако представления о событии, имеющем отличную от нуля вероятность, но складывающемся из событий с нулевой вероятностью, не более парадоксально, чем представление об отрезке, имеющем определенную длину, тогда как ни одна точка отрезка отличной от нуля длиной не обладает. Отрезок состоит из таких точек, но его длина не равна сумме их длин. Из этого свойства вытекает следующее следствие.
Следствие. Если Х – непрерывная случайная величина, то вероятность попадания этой величины в интервал не зависит от того, является ли этот интервал открытым или закрытым:
Плотность вероятности
Непрерывная случайная величина может быть задана не только с помощью функции распределения. Введем понятие п л о т н о с т и в е р о я т н о с т и непрерывной случайной величины. Рассмотрим вероятность попадания непрерывной случайной величины наинтервал Вероятность такого события т.е. равна приращению функции распределения F(х) на этом участке. Тогда вероятность, приходящаяся на единицу длины, т.е. средняя плотность вероятности на участке равна Переходя к пределу Δх → 0, получим плотность вероятности в точке х:
представляющую производную функции распределения F(х). Напомним, что для непрерывной случайной величины F(х) – дифференцируемая функция.
Определение: Плотностью вероятности (плотностью распределения) f(x) непрерывной случайной величины Х называется производная ее функции распределения
Про случайную величину Х говорят, что она имеет распределение с плотностью f(x) на определенном участке оси абсцисс.
Плотность вероятности f(x), как и функция распределения F(x) является одной из форм закона распределения. Но в отличие от функции распределения она существует только для н е п р е р ы в н ы х случайных величин.
Плотность вероятности иногда называют дифференциальной функцией или дифференциальным законом распределения. График плотности вероятности называется кривой распределения.
Пример №59
По данным примера 4.3 найти плотность вероятности случайной величины Х.
Решение:
Будем находить плотность вероятности случайной величины как производную от ее функции распределения f(x) = F'(x). Отметим свойство плотности вероятности непрерывной случайной величины.
1. Плотность вероятности – неотрицательная функция, т.е. f(x) ≥ 0, (4.9) как производная монотонно неубывающей функции F(x).
2. Вероятность попадания непрерывной случайной величины Х в интервал равна определенному интегралу от ее плотности вероятности в пределах от
Геометрически вероятность попадания в интервал [α, β,] равна площади фигуры, ограниченной сверху кривой распределения и опирающейся на отрезок [α, β,] (рис.4.4).
3. Функция распределения непрерывной случайной величины может быть выражен через плотность вероятности по формуле: Геометрически функция распределения равна площади фигуры, ограниченной сверху кривой распределения и лежащей левее точки х (рис. 4.5).
4. Несобственный интеграл в бесконечных пределах от плотности вероятности непрерывной случайной величины равен единице: Геометрически свойства 1 и 4 плотности вероятности означают, что ее график – кривая распределения – лежит не ниже оси абсцисс, а полная площадь фигуры, ограниченной кривой распределения и осью абсцисс, равна единице.
Пример №60
Функция f(x) задана в виде:
Найти: а) значение А; б) выражение функции распределения F(х); в) вероятность того, что случайная величина Х примет значение на отрезке [0; 1].
Решение:
а) Для того, чтобы f(x) была плотностью вероятности некоторой случайной величины Х, она должна быть неотрицательна, следовательно, неотрицательным должно быть и значение А. С учетом свойства 4 находим: б) Функцию распределения находим, используя свойство 3: Если x ≤ 0, то f(x) = 0 и, следовательно, F(x) = 0. Если 0 < x ≤ 2, то f(x) = х/2 и, следовательно, Если х > 2, то f(x) = 0 и, следовательно в) Вероятность того, что случайная величина Х примет значение на отрезке [0; 1] находим, используя свойство 2:
Пример №61
Методом произведений вычислить выборочную среднюю и выборочную дисперсию по данным выборки (табл. 3.1).
Решение. В качестве «ложного нуля» возьмем варианту 16.
Следовательно
Результаты вычислений сведем в табл. 3.2.
Контроль: 273 = 100 + 46 + 127.
Равенство выполнено, следовательно, таблица заполнена верно.
Вычислим условные начальные моменты:
Вычислим выборочную среднюю и выборочную дисперсию:
Определим исправленную выборочную дисперсию:
и исправленное среднее квадратическое отклонение:
Получим несмещенные оценки для математического ожидания, дисперсии и среднего квадратического отклонения.
- Числовые характеристики случайных величин
- Нормальный закон распределения
- Основные законы распределения вероятностей
- Асимптотика схемы независимых испытаний
- Теоремы сложения и умножения вероятностей
- Формула полной вероятности
- Повторные независимые испытания
- Простейший (пуассоновский) поток событий
2.2.1. Закон распределения дискретной случайной величины
Закон распределения дискретной случайной величины – это соответствие между возможными значениями этой величины и их вероятностями. Чаще всего закон
записывают таблицей:
Довольно часто встречается термин ряд распределения, но в некоторых контекстах он звучит двусмысленно, и поэтому я буду
использовать слово закон.
И сразу очень важный момент: поскольку случайная величина обязательно примет одно из
значений , то
соответствующие события образуют полную группу и сумма вероятностей их наступления равна
единице:
или, если записать свёрнуто:
Справка: – это значок
суммирования, а –
переменная-«счётчик», которая «пробегает» все значения от 1 до .
Так, например, закон распределения выпавших на кубике очков имеет следующий вид:
…как говорится, без комментариев.
Возможно, у вас сложилось впечатление, что дискретная случайная величина может принимать только «хорошие» целые значения. Развеем
иллюзию – они могут быть любыми:
Задача 82
Пусть некая игра имеет следующий закон распределения выигрыша:
(в 1-й строке размер выигрыша в условных единицах, а во 2-й – его вероятность)
Найти .
Решение: так как случайная величина может принять только одно из трёх значений, то соответствующие события
образуют полную группу, а значит, сумма их вероятностей равна единице:
Разоблачаем «партизана»:
– таким образом,
вероятность выигрыша условных
единиц составляет 0,4.
Контроль: , в чём и
требовалось убедиться.
Ответ:
Не редкость, когда закон распределения требуется составить самостоятельно. Для этого используют классическое определение вероятности, теоремы сложения / умножения вероятностей и другие фишки:
Задача 83
В коробке находятся 50 лотерейных билетов, среди которых 12 выигрышных, причём 2 из них выигрывают по 1000 рублей, а остальные – по
100 рублей. Составить закон распределения случайной величины – размера выигрыша, если из коробки наугад извлекается один билет.
Решение: как вы заметили, значения случайной величины принято располагать в порядке их возрастания. Поэтому мы
начинаем с самого маленького выигрыша, и именно рублей. Всего таковых билетов 50 – 12 = 38, и по классическому определению:
– вероятность того, что
наудачу извлечённый билет окажется безвыигрышным.
С остальными случаями всё просто. Вероятность выигрыша рублей составляет:
И для :
Проверка: – и это особенно
приятный момент таких заданий.
Ответ: искомый закон распределения выигрыша:
Следующее задание для самостоятельного решения:
Задача 84
Вероятность того, что стрелок поразит в мишень, равна . Составить закон распределения случайной величины – количества попаданий после 2 выстрелов.
Вспоминаем теоремы умножения и сложения! Решение и ответ в конце книги.
Закон распределения полностью описывает случайную величину, однако на практике бывает полезно (а иногда и полезнее) знать лишь
некоторые её числовые характеристики:
2.2.2. Математическое ожидание дискретной случайной величины
2.1. Случайные величины
| Оглавление |
Полную и свежую версию этой книги в pdf-формате,
а также курсы по другим темам можно найти здесь.
Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!
С наилучшими пожеланиями, Александр Емелин