Распределение Дирихле
Материал из Википедии — свободной энциклопедии
На эту статью не ссылаются другие статьи Википедии.
Пожалуйста, воспользуйтесь подсказкой и установите ссылки в соответствии с принятыми рекомендациями.
|
В теории вероятностей и математической статистике распределение Дирихле (по имени Иогaнна Пeтера Гyстава Лежён-Дирихлe) часто обозначаемое Dir(α) — это семейство непрерывных многомерных вероятностных распределений параметризованных вектором α неотрицательных вещественных чисел. Распределение Дирихле является обобщением Бета-распределения на многомерный случай. То есть, его функция плотности вероятности возвращает доверительную вероятность того, что вероятность каждого из K взаимноисключающих событий равна xi при условии, что каждое событие наблюдалось αi − 1 раз.
Содержание |
[править] Функция плотности вероятности
Функция плотности вероятности для распределения Дирихле порядка K есть:
где , , и .
[править] Свойства
Пусть и тогда
Модой распределения является вектор x (x1, …,xK) с
Рапределение Дирихле есть пара к мультиномиальному распределению в следующем смысле: если
где βi — число вхождений i в выборку из n точек дискретного распределения на {1, …, K} определенного через X, то
Эта связь используется в Байесовской статистике для того, чтобы оценить скрытые параметры, X, дискретного вероятностного распределения имея набор из n выборок. Очевидно, если априорное распределение обозначено как Dir(α), то Dir(α + β) есть апостериорное распределение после серии наблюдений с гистограммой β.
[править] Связи с другими распределениями
Если для
- независимо, то
и
Несмотря на то, что Xi не являются независимыми друг от друга, они могут быть сгенерированны из набора из K независимых гамма случайных величин. К несчастью, так как сумма V теряется в процессе формирования X = (X1, …, XK), становится невозможно восстановить начальные значения гамма случайных величин только по этим значениям. Тем не менее, благодаря тому, что работать с независимыми случайными величинами проще, это преобразование параметров может быть полезно при доказательстве свойств распределения Дирихле.
[править] Генерация случайных чисел
Метод построения случайного вектора для распределения Дирихле размерности K с параметрами следует непосредственно из этой связи. Сначала получим K независимых случайных выборок из гамма-распределений, каждое из которых имеет плотность
а затем положим
[править] Наглядная трактовка параметров
В качестве примера использования распределения Дирихле можно предложить задачу, в которой требуется разрезать нитки (каждая начальной длины 1.0) на K частей с разными длинами так, чтобы все части имели заданную среднюю длину, но с возможностью некоторой вариации относительных длин частей. Значения α/α0 определяют средние длины частей нитки, получившиеся из распределения. Дисперсия вокруг среднего значения обратно пропорциональна α0.