Аннотация:
Рассматриваются две родственные дискретные экстремальные задачи выбора (поиска) подмножества в конечном множестве точек евклидова пространства. Обе задачи индуцируются вариантами фундаментальной проблемы анализа данных — выбором в совокупности объектов подмножества похожих элементов. В обеих задачах требуется в заданном множестве точек найти кластер (подмножество) наибольшей мощности при ограничении на значение квадратичной кластеризационной функции. Совокупность точек входного множества вне искомого кластера соответствует второму (дополняющему) кластеру. В первой задаче кластеризационной функцией (из ограничения) является сумма по обоим кластерам внутрикластерных сумм квадратов расстояний между элементами кластеров и их центрами. Центр одного из кластеров неизвестен и определяется как центроид (геометрический центр), а центр другого фиксирован в заданной точке пространства (без ограничения общности в начале координат). Во второй задаче кластеризационной функцией является сумма по обоим кластерам мощностно-взвешенных внутрикластерных сумм квадратов расстояний между элементами кластеров и их центрами. Как и в первой задаче, центр одного из кластеров неизвестен и определяется как центроид, а центр другого фиксирован в начале координат. В настоящей работе установлено, что обе задачи NP-трудны в сильном смысле. Для вариантов задач, в которых точки входного множества имеют целочисленные координаты, предложены точные алгоритмы. Время работы алгоритмов псевдополиномиально, если размерность пространства ограничена константой.
Исследование задачи 1 поддержано грантом РНФ (проект № 16-11-10041). Исследование задачи 2
поддержано грантами РФФИ (проекты № 19-01-00308, 18-31-00398-мол-а), а также грантом РАН по
программе фундаментальных научных исследований (проект № 0314-2016-0015) и Министерством образования и науки РФ в рамках программы 5-10.
Статья поступила: 15.05.2018 Переработанный вариант: 26.06.2018
Образец цитирования:
А. В. Кельманов, А. В. Панасенко, В. И. Хандеев, “Точные алгоритмы поиска кластера наибольшего размера для двух целочисленных задач 2-кластеризации”, Сиб. журн. вычисл. матем., 22:2 (2019), 121–136; Num. Anal. Appl., 12:2 (2019), 105–115
V. Khandeev, S. Neshchadim, “Fast approximation algorithms for some maximin clustering problems”, Yugosl J Oper Rres, 34:2 (2024), 337
Vladimir Khandeev, Sergey Neshchadim, Communications in Computer and Information Science, 2239, Mathematical Optimization Theory and Operations Research: Recent Trends, 2024, 319
Vladimir Khandeev, Sergey Neshchadim, Lecture Notes in Computer Science, 13930, Mathematical Optimization Theory and Operations Research, 2023, 85
Vladimir Khandeev, Sergey Neshchadim, Communications in Computer and Information Science, 1661, Mathematical Optimization Theory and Operations Research: Recent Trends, 2022, 89