Аннотация:
Статья посвящена проблеме восстановления про́пусков в коллекциях данных для задач машинного обучения. Предложен новый рандомизированный метод восстановления пропущенных данных, основанный на технологии энтропийно-робастного оценивания и генерации ансамблей случайных величин. Предложенный метод схож с использованием вспомогательной регрессии для восстановления пропущенных значений, но в отличие от последней в случае энтропийного оценивания не накладываются дополнительные ограничения на функцию правдоподобия ошибок в выборке и допустимы малые объемы данных, что становится крайне актуальным в задачах, когда объем данных для обучения ограничен, а пропуски встречаются не систематически. Предложенный метод применяется для восстановления пропущенных данных о площадях термокарстовых озер арктической зоны РФ, измеряемых по спутниковым снимкам.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проекты №№ 19-07-00282, 20-07-00223). Работа выполнена в рамках госбюджетной темы.
Статья представлена к публикации членом редколлегии:А. И. Михальский
Поступила в редакцию: 24.07.2020 После доработки: 27.10.2020 Принята к публикации: 08.12.2020
Образец цитирования:
Ю. А. Дубнов, Ю. А. Дубнов, В. Ю. Полищук, Ю. С. Попков, Ю. М. Полищук, А. В. Мельников, Е. С. Сокол, “Метод энтропийно-рандомизированного восстановления пропущенных данных”, Автомат. и телемех., 2021, № 4, 140–160; Autom. Remote Control, 82:4 (2021), 670–686
\RBibitem{DubPolPop21}
\by Ю.~А.~Дубнов, Ю.~А.~Дубнов, В.~Ю.~Полищук, Ю.~С.~Попков, Ю.~М.~Полищук, А.~В.~Мельников, Е.~С.~Сокол
\paper Метод энтропийно-рандомизированного восстановления пропущенных данных
\jour Автомат. и телемех.
\yr 2021
\issue 4
\pages 140--160
\mathnet{http://mi.mathnet.ru/at15527}
\crossref{https://doi.org/10.31857/S0005231021040061}
\elib{https://elibrary.ru/item.asp?id=46770506}
\transl
\jour Autom. Remote Control
\yr 2021
\vol 82
\issue 4
\pages 670--686
\crossref{https://doi.org/10.1134/S0005117921040056}
\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=000639882600005}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-85104293226}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/at15527
https://www.mathnet.ru/rus/at/y2021/i4/p140
Эта публикация цитируется в следующих 2 статьяx:
Yury M. Polishchuk, Eugeniy S. Sokol, Aleksandr A. Togachev, Vladimir Y. Polishchuk, Matvey A. Kupriyanov, Andrey V. Melnikov, “System for forecasting the lake dynamics in Russian Arctic using satellite images based on NextGIS Web”, Geoinformatika, 2024, no. 4, 29
Yuri Dubnov, Alexey Popkov, Yuri Popkov, Matvey Kuprianov, Vladimir Polyschuk, Andrey Melnikov, Yuri Polyschuk, “Spatiotemporal analysis of the termokarst lakes evolution using remote sensing and randomized machine learning and forecasting”, Russian Journal of Earth Sciences, 2024, 1