Аннотация:
Классический EM-алгоритм восстановления смеси нормальных распределений не позволяет определять количество компонент смеси. В данной работе предлагается алгоритм автоматического определения числа компонент ARD EM, основанный на методе релевантных векторов. Идея алгоритма состоит в использовании на начальном этапе заведомо избыточного количества компонент смеси с дальнейшим определением релевантных компонент с помощью максимизации обоснованности. Эксперименты на модельных задачах показывают, что количество найденных кластеров либо совпадает с истинным, либо немного превосходит его. Кроме того, кластеризация с помощью ARD EM оказывается ближе к истинной, чем у аналогов, основанных на скользящем контроле и принципе минимальной длины описания. Библ. 14. Фиг. 1. Табл. 4.
Ключевые слова:
распознавание образов, восстановление плотностей, кластерный анализ, определение числа кластеров, EM-алгоритм, байесовское обучение, автоматическое определение релевантности.
Поступила в редакцию: 24.07.2009 Исправленный вариант: 11.11.2009
Образец цитирования:
Д. П. Ветров, Д. А. Кропотов, А. А. Осокин, “Автоматическое определение количества компонент в EM-алгоритме восстановления смеси нормальных распределений”, Ж. вычисл. матем. и матем. физ., 50:4 (2010), 770–783; Comput. Math. Math. Phys., 50:4 (2010), 733–746
\RBibitem{VetKroOso10}
\by Д.~П.~Ветров, Д.~А.~Кропотов, А.~А.~Осокин
\paper Автоматическое определение количества компонент в EM-алгоритме восстановления смеси нормальных распределений
\jour Ж. вычисл. матем. и матем. физ.
\yr 2010
\vol 50
\issue 4
\pages 770--783
\mathnet{http://mi.mathnet.ru/zvmmf4868}
\mathscinet{http://mathscinet.ams.org/mathscinet-getitem?mr=2761711}
\adsnasa{https://adsabs.harvard.edu/cgi-bin/bib_query?2010CMMPh..50..733V}
\transl
\jour Comput. Math. Math. Phys.
\yr 2010
\vol 50
\issue 4
\pages 733--746
\crossref{https://doi.org/10.1134/S0965542510040147}
\isi{https://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=Publons&SrcAuth=Publons_CEL&DestLinkType=FullRecord&DestApp=WOS_CPL&KeyUT=000277337600014}
\scopus{https://www.scopus.com/record/display.url?origin=inward&eid=2-s2.0-77952182030}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/zvmmf4868
https://www.mathnet.ru/rus/zvmmf/v50/i4/p770
Эта публикация цитируется в следующих 5 статьяx:
Computer Vision, 2018, 801
Angelov P., Gu X., Kangin D., “Empirical Data Analytics”, Int. J. Intell. Syst., 32:12 (2017), 1261–1284
Андреев А.М., Усовик С.В., “Модель трафика корпоративной телекоммуникационной сети с пакетной коммутацией в задаче кластеризации при условии ограниченного наблюдения”, Вестник Московского государственного технического университета им. Н.Э. Баумана. Серия: Приборостроение, 2012, 133–152
Thararin Lerddararadsamee, Yuttapong Jiraraksopakun, 2012 9th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, 2012, 1
Д. А. Кропотов, “Вариационный метод релевантных векторов для задач классификации и регрессии с многомерными массивами признаков”, Ж. вычисл. матем. и матем. физ., 51:8 (2011), 1541–1560; D. A. Kropotov, “Variational relevance vector machine for classification and regression problems with multidimensional feature arrays”, Comput. Math. Math. Phys., 51:8 (2011), 1441–1459