Loading [MathJax]/jax/output/SVG/config.js
Моделирование и анализ информационных систем
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Моделирование и анализ информационных систем, 2018, том 25, номер 6, страницы 726–733
DOI: https://doi.org/10.18255/1818-1015-726-733
(Mi mais659)
 

Тезаурусы

Векторное представление слов с семантическими отношениями: экспериментальные наблюдения

М. С. Каряеваa, П. И. Браславскийb, В. А. Соколовa

a Ярославский государственный университет им. П.Г. Демидова, ул. Советская, 14, г. Ярославль, 150003 Россия
b Уральский федеральный университет, г. Екатеринбург, ул. Мира, 19, 620002 Россия
Список литературы:
Аннотация: Возможность идентификации семантической близости между словами сделала модель word2vec широко используемой в NLP-задачах. Идея word2vec основана на контекстной близости слов. Каждое слово может быть представлено в виде вектора, близкие координаты векторов могут быть интерпретированы как близкие по смыслу слова. Таким образом, извлечение семантических отношений (отношение синонимии, родо-видовые отношения и другие) может быть автоматизировано. Установление семантических отношений вручную считается трудоемкой и необъективной задачей, требующей большого количества времени и привлечения экспертов. Но среди ассоциативных слов, сформированных с использованием модели word2vec, встречаются слова, не представляющие никаких отношений с главным словом, для которого был представлен ассоциативный ряд. В работе рассматриваются дополнительные критерии, которые могут быть применимы для решения данной проблемы. Наблюдения и проведенные эксперименты с общеизвестными характеристиками, такими как частота слов, позиция в ассоциативном ряду, могут быть использованы для улучшения результатов при работе с векторным представлением слов в части определения семантических отношений для русского языка. В экспериментах используется обученная на корпусах Флибусты модель word2vec и размеченные данные Викисловаря в качестве образцовых примеров, в которых отражены семантические отношения. Семантически связанные слова (или термины) нашли свое применение в тезаурусах, онтологиях, интеллектуальных системах для обработки естественного языка.
Ключевые слова: векторное представление слов, word2vec, семантические отношения, тезаурус, гипонимы, гиперонимы, синонимы.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 16-07-01180_а
16-06-00497_а
Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов №16-07-01180 и №16-06-00497.
Поступила в редакцию: 01.09.2018
Исправленный вариант: 20.11.2018
Принята в печать: 25.11.2018
Тип публикации: Статья
УДК: 004.912
Образец цитирования: М. С. Каряева, П. И. Браславский, В. А. Соколов, “Векторное представление слов с семантическими отношениями: экспериментальные наблюдения”, Модел. и анализ информ. систем, 25:6 (2018), 726–733
Цитирование в формате AMSBIB
\RBibitem{KarBraSok18}
\by М.~С.~Каряева, П.~И.~Браславский, В.~А.~Соколов
\paper Векторное представление слов с семантическими отношениями: экспериментальные наблюдения
\jour Модел. и анализ информ. систем
\yr 2018
\vol 25
\issue 6
\pages 726--733
\mathnet{http://mi.mathnet.ru/mais659}
\crossref{https://doi.org/10.18255/1818-1015-726-733}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mais659
  • https://www.mathnet.ru/rus/mais/v25/i6/p726
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Моделирование и анализ информационных систем
    Статистика просмотров:
    Страница аннотации:509
    PDF полного текста:468
    Список литературы:34
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025