Образец цитирования:
А. А. Юшкевич, Р. Я. Читашвили, “Управляемые случайные последовательности и цепи Маркова”, УМН, 37:6(228) (1982), 213–242; Russian Math. Surveys, 37:6 (1982), 239–274
Alexey Piunovskiy, Yi Zhang, “On the Continuity of the Projection Mapping from Strategic Measures to Occupation Measures in Absorbing Markov Decision Processes”, Appl Math Optim, 89:3 (2024)
Joseph Frédéric Bonnans, Justina Gianatti, Francisco J. Silva, “On the time discretization of stochastic optimal control problems: The dynamic programming approach”, ESAIM: COCV, 25 (2019), 63
Т. А. Белкина, В. И. Ротарь, “Об оптимальности по вероятности и почти наверное для процессов со свойством связности. I. Случай дискретного времени”, Теория вероятн. и ее примен., 50:1 (2005), 3–26; T. A. Belkina, V. I. Rotar', “On optimality in probability and almost surely for processes with a communication property. I. The discrete time case”, Theory Probab. Appl., 50:1 (2006), 16–33
Eugene A. Feinberg, International Series in Operations Research & Management Science, 40, Handbook of Markov Decision Processes, 2002, 173
Arie Hordijk, Alexander A. Yushkevich, International Series in Operations Research & Management Science, 40, Handbook of Markov Decision Processes, 2002, 231
А. Б. Пиуновский, “Управляемые случайные последовательности: методы выпуклого анализа и задачи с функциональными ограничениями”, УМН, 53:6(324) (1998), 129–192; A. B. Piunovskiy, “Controlled random sequences: methods of convex analysis and problems with functional constraints”, Russian Math. Surveys, 53:6 (1998), 1233–1293
A. A. Yushkevich, “Blackwell optimal policies in a Markov decision process with a Borel state space”, ZOR - Mathematical Methods of Operations Research, 40:3 (1994), 253
Aristotle Arapostathis, Vivek S. Borkar, Emmanuel Fernández-Gaucherand, Mrinal K. Ghosh, Steven I. Marcus, “Discrete-Time Controlled Markov Processes with Average Cost Criterion: A Survey”, SIAM J Control Optim, 31:2 (1993), 282
A. B. Piunovskii, “Control of Random Sequences in Problems with Constraints”, Theory Probab Appl, 38:4 (1993), 751
Eugene A. Feinberg, “Non-randomized strategies in stochastic decision processes”, Ann Oper Res, 29:1 (1991), 315
В. В. Баранов, “Вычислительные методы оптимального стохастического управления. Принцип оптимальности и оптимизационная схема последовательных приближений”, Ж. вычисл. матем. и матем. физ., 31:5 (1991), 663–680; V. V. Baranov, “Computational methods of optimal stochastic control. Optimality principle and successive-approximation optimization scheme”, U.S.S.R. Comput. Math. Math. Phys., 31:5 (1991), 16–28
E.A. Feinberg, 29th IEEE Conference on Decision and Control, 1990, 2149
И. В. Евстигнеев, “Теоремы измеримого выбора и вероятностные модели управления в общих топологических пространствах”, Матем. сб., 131(173):1(9) (1986), 27–39; I. V. Evstigneev, “Measurable selection theorems and probabilistic control models in general topological spaces”, Math. USSR-Sb., 59:1 (1988), 25–37