Помощь - Поиск - Пользователи - Календарь
Полная версия: Распределение для входящего потока в теории массового обслуживания > Теория вероятностей
Образовательный студенческий форум > Высшая математика > Теория вероятностей
h7net
Итак, решаю свои задачки дальше, смысл такой у меня есть нагрузка на мою систему. Например количество запускаемых программ в час. Я собираюсь с помощью теории массового обслуживания расчитать время обслуживания, а также в дальнейшем расчитывать необходимое количество обслуживающих устройств и прочее. Это теория, теперь практика, почитав про теорию массового обслуживания я посмотрел что в мне нужно определить закон распределения входящего потока, в примерах сказано, что он может быть 4-х видов - пуасоновский поток(M), фиксированный(D), распределение Эрланга(Ek) и распределение произвольного вида(GI). Начинаю анализировать свой входящий поток и смотрю, что он подчиняется больше нормальному распределению, нежели пуасоновскому потоку, строю частоты, расчитываю значение, строю теоретические частоты, но критерий наблюдаемый выше критичного, и я логично подхожу к выводу, что это не пусановский поток, вопрос - может ли входящий поток для теории массового обслуживания подчинятся нормальному закону распределения? или только Пуасона? Или я напутал что-то с теорией опять? Критерий пирсона и теоретические частоты для пуасоновского потока считал вот по этому образцу: http://statmetkach.com/lab11.html
malkolm
Входящий поток может быть совершенно любым. Потом образован интервалами между моментами поступление вызовов в систему, эти интервалы есть случайные велчины. Соответственно и зависимость между ними может быть какая угодно, и распределения их какие угодно. В том числе GI - General distribution, Independent increments. Куда вполне укаладывается поток с нормальными интервалами между событиями потока. Или у Вас что-то другое получилось с нормальным распределением?
На практике весьма редко встречаются серьёзные отклонения случайного входного потока от пуассоновского или эрланговского. Да и точные формулы для расчёта всевозможных числовых характеристик систем существуют обычно лишь в этих двух случаях.

Всё-таки, частоты чего Вы измеряли, и с чем сравнивали?
h7net
Цитата(malkolm @ 19.5.2009, 21:27) *

Входящий поток может быть совершенно любым. Потом образован интервалами между моментами поступление вызовов в систему, эти интервалы есть случайные велчины. Соответственно и зависимость между ними может быть какая угодно, и распределения их какие угодно. В том числе GI - General distribution, Independent increments. Куда вполне укаладывается поток с нормальными интервалами между событиями потока. Или у Вас что-то другое получилось с нормальным распределением?
На практике весьма редко встречаются серьёзные отклонения случайного входного потока от пуассоновского или эрланговского. Да и точные формулы для расчёта всевозможных числовых характеристик систем существуют обычно лишь в этих двух случаях.

Всё-таки, частоты чего Вы измеряли, и с чем сравнивали?

Я получаю частоты запуска приложений. То есть каждый день в пиковый час(с утра) у меня запускают какое-то количество приложений(или создают количество подключений). Я получаю частоту запусков этих приложений в течении нескольких месяцев. То есть в 1 день месяца с 9 до 10 часов утра запустили приложение 40 человек, во второй день - 34 человека и так далее. Соответственно я получаю следующие частоты:
33 34 35 36 37 38 39 40 41 42 43 44 46
7 7 7 8 7 8 7 7 8 8 8 6 5
Соответственно для этого ряда я нахожу среднее значение, затем строю теоретические частоты. В итоге этот ряд проходит проверку и подтверждается, что это пуасоновский поток.

Затем я хочу проверить аналогичным образом количество терминальных подключений. Но там пока не получается.



malkolm
Ну, единственное, что могу сказать: если гипотеза о нормальности распределения не противоречит данным, то и с пуассоновским распределением в этом случае согласие тоже должно быть: у Вас довольно большие средние (около 38 с лишним, а распределение Пуассона с таким параметром не очень отличается от нормального: если X ~ П(a), то (X - a)/sqrt(a) с ростом a имеет распределение, близкое к стандартному нормальному).

Смотрю на приведённую выборку - если это реальные полные данные, то она, по-моему, совсем не согласуется с предположением о пуассоновском распределении. Слишком большой кусок вероятности (около 0,3) отвечает числам, которые не наблюдаются ни разу: меньше 33 и больше 46. Тогда как таких наблюдений должно быть порядка 17 и 8 соответственно (теоретические частоты). Статистика критерия хи-квадрат будет больше (только за счёт этих двух крайних интервалов, не учитывая частоты попадания в остальные точки), чем (0-17)^2/17 + (0-8)^2/8 = 17+8 = 25, а квантиль уровня 0,95 у хи-квадрат распределения даже с 13+2-1=14 степенями свободы всего-то 23,68.

Если это полные данные, и Вы получили по ним согласие с Пуассоном, то что-то не так с применением критерия. Скорее всего, вот что: обратите внимание - в файле по ссылке сумма теоретических частот равна объёму выборки. Так должно быть.
h7net
Цитата(malkolm @ 20.5.2009, 22:35) *

Ну, единственное, что могу сказать: если гипотеза о нормальности распределения не противоречит данным, то и с пуассоновским распределением в этом случае согласие тоже должно быть: у Вас довольно большие средние (около 38 с лишним, а распределение Пуассона с таким параметром не очень отличается от нормального: если X ~ П(a), то (X - a)/sqrt(a) с ростом a имеет распределение, близкое к стандартному нормальному).

Смотрю на приведённую выборку - если это реальные полные данные, то она, по-моему, совсем не согласуется с предположением о пуассоновском распределении. Слишком большой кусок вероятности (около 0,3) отвечает числам, которые не наблюдаются ни разу: меньше 33 и больше 46. Тогда как таких наблюдений должно быть порядка 17 и 8 соответственно (теоретические частоты). Статистика критерия хи-квадрат будет больше (только за счёт этих двух крайних интервалов, не учитывая частоты попадания в остальные точки), чем (0-17)^2/17 + (0-8)^2/8 = 17+8 = 25, а квантиль уровня 0,95 у хи-квадрат распределения даже с 13+2-1=14 степенями свободы всего-то 23,68.

Если это полные данные, и Вы получили по ним согласие с Пуассоном, то что-то не так с применением критерия. Скорее всего, вот что: обратите внимание - в файле по ссылке сумма теоретических частот равна объёму выборки. Так должно быть.

Прошу прощения - не все скопировал, вот полная картина:
33 -7
34 -7
35 -7
36 -8
37 -7
38 - 8
39 - 7
40 - 7
41 - 8
42 -8
43 - 8
44 - 6
46 - 7
46 - 5

Для этих частот я делю на интервалы и сравниванию с теоретическими частотами:
диапазон - наблюдаемая частота - теоретическая частота
0-33 - 7 - 20
34 - 7 - 5
35 - 7 -5
36 - 8 - 6
37 - 7 -6
38 - 8 -6
39 - 7 -6
40 - 7 -6
41 - 8 -6
42 - 8 -6
43 - 8 -5
44-53 - 18 - 23

Для этих частот наблюдаемый хи(квадрат) - 16,1, а критичное - 18,3070
На основании этих данных сделал вывод о пуасоновском потоке
malkolm
Понятно, но согласие всё же не очень хорошее - 16 недалеко от 18. Поэтому если есть такого же порядка согласие во втором случае с нормальным распределением, то, из-за похожести пуассона с большим параметром на нормальное, должно быть (может быть, чуть худшее) согласие и с пуассоновской гипотезой. Выборки надо бы объёмом побольше, маловато 100 для уверенных выводов.
h7net
Цитата(malkolm @ 21.5.2009, 20:17) *

Понятно, но согласие всё же не очень хорошее - 16 недалеко от 18. Поэтому если есть такого же порядка согласие во втором случае с нормальным распределением, то, из-за похожести пуассона с большим параметром на нормальное, должно быть (может быть, чуть худшее) согласие и с пуассоновской гипотезой. Выборки надо бы объёмом побольше, маловато 100 для уверенных выводов.

Понял, спасибо - со вторым случаем я разобрался, ввиду критичности подключений второго случая, а также высокой нагрузки - я отказался от расчетов показателей с использованием теории массового обслуживания и на этом остановился.
Вопрос с первым случаем. У меня получается система вида: M/M/c:/GD/N/бесконечность
где N - это количество моих пользователей, своей главной задачей я вижу расчет такого количества c(осблуживающих устройств), чтобы время ожидания в очереди было минимальным(в идеале, чтобы пользователь вообще не ждал). Я прочитал, что для системы M/M/c:/GD/N/Бесконечность нужно построить одноканальную обобщенную модель( M/M/1:/GD/N/бесконечность). И вот тут возникла проблема, дело в том, что конкретные формулы я нашел только в одном месте - и мало того, что они запутаны, так мне даже не получается проверить верны ли они. Если кто-нибудь знает ссылки - дайте пожалуйста, а то я даже не могу проверить верно ли я делаю все

malkolm
Не очень стандартные обозначения для систем: все эти продолжения Кендалловской символики X/X/n не стали, и ещё не скоро станут общепринятыми.
Вы имеете в виду систему с пуассоновским входом, в которой есть n=с серверов с независимыми и одинаково показательно распределёнными временами обслуживания, с общей вместимостью системы в N вызовов (т.е. если N уже есть, поступающие далее вызовы получают отказ)?

В книжке Г.И.Ивченко, В.А.Каштанов, И.Н.Коваленко "Теория массового обслуживания" (1982 г.) есть некоторые формулы (стр. 91) для характеристик многоканальной системы с ограниченной очередью (описание модели - стр.72) в стационарном режиме. В частности, там выписаны стационарные вероятности обнаружить k требований в системе. Но книжка, к сожалению, не находится по сети.

h7net
Искал материал по СМО и нашел несколько иное описание, а именно:
Многоканальная система с отказами(задача Эрланга) - полностью подходит под описание моей задачи. Единственное - я не нашел требований к поступающему входящему потоку, подскажите можно ли будет решить мою задачу используя этот тип СМО? А также хотелось бы узнать верны ли добытые мной формулы:
P0 = (1+ро+ро^2/2!+...+ро^2/n!)^-1
Где ро = лямбда/мю(то есть интенсивность поступления заявок/интенсивность обслуживания)
n = количество узлов обслуживания
при это P(вероятность отказа) = ро^n/n!*P0
Q(относительная пропускная способность, т.е вероятность, что заявка будет обслужена) = 1-P(отказа)
A(абсолютная пропускная способность) = лямбда*Q
k(среднее число занятых каналов) = ро*(1-ро^n/n!*P0)
malkolm
А, так у Вас просто с отказами - т.е. без очереди? Да, конечно, это верные формулы (опечатка в последнем слагаемом для P0 - там ро^n/n!). Эти формулы верны для простейшего входного потока и любого процесса обслуживания, если времена обслуживания независимы, одинаково распределены и не зависят от входного потока (древние результаты Vaulot A.E., F.Pollaczek, C.Palm, L.Kosten, R.Fortet, Б.А.Севастьянова. В частности, наиболее полное док-во см. в Б.А.Севастьянов "Формулы Эрланга в телефонии при произвольном законе распределения длительности разговоров". Труды III Всесоюзного математического съезда 1956 г., т.4, АН СССР, 1959, с.68-70).
Т.е. всё работает в ситуации M/GI/n/0 (0 - c отказами, если все приборы заняты).
Это текстовая версия — только основной контент. Для просмотра полной версии этой страницы, пожалуйста, нажмите сюда.
Русская версия Invision Power Board © 2001-2024 Invision Power Services, Inc.