Аннотация:
Работа посвящена прогнозированию развития эпидемии COVID-19 с помощью нового метода рандомизированного машинного обучения. Основу метода составляет идея оценивания распределений вероятностей параметров модели по реальным данным вместе с распределением вероятностей измерительных шумов. Энтропийно-оптимальные распределения соответствуют состоянию максимальной неопределенности, что позволяет использовать получаемые в итоге прогнозы, как прогнозы наиболее “негативного” сценария исследуемого процесса. Полученные оценки параметров и шумов, которые представляют собой распределения вероятностей, необходимо генерировать, получая таким образом ансамбль траекторий, который требуется анализировать статистическими методами. Для целей такого анализа проводится вычисление средней и медианной по ансамблю траектории, а также траектории, соответствующей средним по распределению значениям параметров модели. Предлагаемый подход используется для прогнозирования общего количества инфицированных с помощью трехпараметрической логистической модели роста. Проведенный эксперимент основан на реальных данных о распространении COVID-19 в нескольких странах Европейского союза. Основной целью эксперимента является демонстрация энтропийно-рандомизированного подхода для прогнозирования эпидемического процесса на основе реальных данных вблизи пика. Существенная неопределенность, содержащаяся в доступных реальных данных моделируется аддитивным шумом в пределах 30%, который используется как на этапе обучения модели, так и при прогнозировании. Для настройки гиперпараметров модели используется схема их настройки по тестовой выборке с последующим переобучением. Показано, что при одинаковых наборах данных, предлагаемый подход позволяет более эффективно прогнозировать развитие эпидемии по сравнению со стандартным подходом, основанным на методе наименьших квадратов.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 20-04-60119).
Поступила в редакцию: 01.04.2021
Тип публикации:
Статья
УДК:
004.942
Образец цитирования:
Ю. С. Попков, Ю. А. Дубнов, А. Ю. Попков, “Прогнозирование развития эпидемии COVID-19 в странах Европейского союза с использованием энтропийно-рандомизированного подхода”, Информатика и автоматизация, 20:5 (2021), 1010–1033
\RBibitem{PopDubPop21}
\by Ю.~С.~Попков, Ю.~А.~Дубнов, А.~Ю.~Попков
\paper Прогнозирование развития эпидемии COVID-19 в странах Европейского союза с использованием энтропийно-рандомизированного подхода
\jour Информатика и автоматизация
\yr 2021
\vol 20
\issue 5
\pages 1010--1033
\mathnet{http://mi.mathnet.ru/trspy1159}
\crossref{https://doi.org/10.15622/20.5.1}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy1159
https://www.mathnet.ru/rus/trspy/v20/i5/p1010
Эта публикация цитируется в следующих 3 статьяx:
Sokolov Alexander, Royzenson Gregory, Komendantova Nadejda, Ekenberg Love, Lecture Notes in Networks and Systems, 718, 12th World Conference “Intelligent System for Industrial Automation” (WCIS-2022), 2024, 202
Yuri Dubnov, Alexey Popkov, Yuri Popkov, Matvey Kuprianov, Vladimir Polyschuk, Andrey Melnikov, Yuri Polyschuk, “Spatiotemporal analysis of the termokarst lakes evolution using remote sensing and randomized machine learning and forecasting”, Russian Journal of Earth Sciences, 2024, 1
А. Ю. Попков, Ю. А. Дубнов, Ю. С. Попков, “Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR”, Информатика и автоматизация, 21:4 (2022), 659–677 [A. Popkov, Yu. Dubnov, Yu. Popkov, “Randomized machine learning and forecasting of nonlinear dynamic models applied to SIR epidemiological model”, Informatics and Automation, 21:4 (2022), 659–677]