|
Метод поиска оптимальных значений параметров алгоритма разрешения сущностей для конкретно-исторических данных
И. М. Адамович, О. И. Волков Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Аннотация:
Статья посвящена использованию метода коллективного разрешения сущностей, основанного на новом алгоритме реляционной кластеризации, представляющем собой модификацию жадного алгоритма агломеративной кластеризации, в конкретно-историческом исследовании при обработке номинативных источников. Предложен метод поиска оптимальных значений параметров алгоритма коллективного разрешения сущностей для задач, связанных с конкретно-историческими исследованиями. Метод основан на анализе специфики конкретно-исторических данных, их сравнении с тестовыми данными, для которых имеются оценки эффективности алгоритма, и процедуре нахождения оптимальных параметров процессов по схеме Гаусса–Зайделя, заключающемся в последовательном поиске оптимума функции поочередно по каждой переменной. Применение предложенного метода делает возможным использование рассматриваемого алгоритма разрешения сущностей в реальных конкретно-исторических исследованиях в задачах автоматизированного связывания записей в номинативных источниках.
Ключевые слова:
конкретно-историческое исследование, распределенная технология, разрешение сущностей, параметры алгоритма, мера реляционного сходства.
Поступила в редакцию: 15.03.2024
Образец цитирования:
И. М. Адамович, О. И. Волков, “Метод поиска оптимальных значений параметров алгоритма разрешения сущностей для конкретно-исторических данных”, Системы и средства информ., 34:2 (2024), 123–133
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi940 https://www.mathnet.ru/rus/ssi/v34/i2/p123
|
Статистика просмотров: |
Страница аннотации: | 43 | PDF полного текста: | 36 | Список литературы: | 19 |
|