О РОБАСТНОМ УПРАВЛЕНИИ В СЛУЧАЙНОЙ СРЕДЕ, ХАРАКТЕРИЗУЕМОЙ НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ ДОХОДОВ С РАЗЛИЧНЫМИ ДИСПЕРСИЯМИ

Алексей Николаевич Лазутченко, Aleksey Lazutchenko

Аннотация


Рассмотрена задача об оптимальном управлении в случайной среде (задача о двуруком бандите). Получены уравнения для вычисления байесовских рисков и потерь для доходов с различными дисперсиями. Представлены результаты вычислений.РезультатыпровереныспомощьюмоделированияметодомМонте- Карло.

Ключевые слова


робастное управление; случайная среда; задача о двуруком бандите

Полный текст:

PDF

Литература


Бусленко Н. П. и др. Метод статистических испытаний (Метод Монте-Карло) М.: Физматгиз, 1962. 331 c.

Колногоров А. В. Нахождение минимаксных стратегии и риска в случайной среде (задача о двуруком бандите) // АиТ. 2011. № 5. С.~127--138.

Колногоров А. В. Робастное параллельное управление в случайной среде (задача о двуруком бандите) // АиТ. 2012. № 4. C.~114--130.

Лазутченко А. Н. Использование двухпороговой стратегии управления в случайной среде с нормально распределенными доходами // Современные проблемы науки и образования. 2014. № 2. URL: www.science-education.ru/116-12590 (дата обращения: 05.12.2014)

Berry D. A., Fristedt B. Bandit problems. London; New York: Chapman and Hall, 1985. P. 275.

Robbins H. Some aspects of the sequential design of experiments // Bulletin AMS. 1952. Vol. 58, N 5. P. 527–535.

Vogel W. An asymptotic minimax theorem for the two-armed bandit problem // Ann. Math. Statist. 1960. Vol. 31. P. 444–451.

References

Buslenko N. P. [i dr.] Metod statisticheskikh

ispytanii (Metod Monte-Karlo) [The method of

statistical tests (Monte Carlo method)]. Moscow:

Fizmatgiz, 1962. 331 p.

Kolnogorov A. V. Nakhozhdenie minimaksnykh

strategii i riska v sluchainoi srede (zadacha o

dvurukom bandite) [Finding minimax strategies

and minimax risk in a random environment (the

two-armed bandit problem)]. AiT. 2011. N 5.

P. 127–138.

Kolnogorov A. V. Robastnoe parallel’noe

upravlenie v sluchainoi srede (zadacha o dvurukom

bandite) [Robust parallel control in a random

environment (the two-armed bandit problem)].

AiT. 2012. N 4. P. 114–130.

Lazutchenko A. N. Ispol’zovanie dvukhporogovoi

strategii upravleniya v sluchainoi srede s normal’no

raspredelennymi dokhodami [Using the two

threshold management strategy in a stochastic

environment with normally distributed incomes].

Sovremennye problemy nauki i obrazovaniya

[Modern problems of science and education]. 2014.

N 2. URL: www.science-education.ru/116-12590

(accessed: 05.12.2014)

Berry D. A., Fristedt B. Bandit problems.

London; New York: Chapman and Hall, 1985.

P. 275.

Robbins H. Some aspects of the sequential

design of experiments. Bulletin AMS. 1952. Vol. 58,

N 5. P. 527–535.

Vogel W. An asymptotic minimax theorem for

the two-armed bandit problem. Ann. Math. Statist.

Vol. 31. P. 444–451.




DOI: http://dx.doi.org/10.17076/mat156

Ссылки

  • На текущий момент ссылки отсутствуют.


© Труды КарНЦ РАН, 2014-2019