Аннотация:
Изучается величина ошибки идентификации выборочного распределения многомерной дискретной случайной величины среди библиотеки эталонных генеральных совокупностей в зависимости от размерности случайного вектора, длины выборки и расстояния между двумя эталонными распределениями в нормах C и L1. Показано, что ошибка распознавания в норме L1 существенно ниже, чем в C. В качестве практического применения рассмотрены эталонные распределения n-грамм для текстов художественной литературы. Выяснилось, что точность идентификации в основном определяется индивидуальными особенностями эталонов, а не расстояниями между ними. Разработан алгоритм для тестирования системы эталонов на точность распознавания.
Образец цитирования:
А. А. Кислицын, М. Ю. Кислицына, “Распознавание выборочных распределений среди системы эталонов: метод ближайшего соседа”, Препринты ИПМ им. М. В. Келдыша, 2023, 029, 21 с.