Loading [MathJax]/jax/output/SVG/config.js
Информатика и автоматизация
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и автоматизация, 2023, выпуск 22, том 2, страницы 393–415
DOI: https://doi.org/10.15622/ia.22.2.6
(Mi trspy1242)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Математическое моделирование и прикладная математика

Optimization of the regression ensemble size
[Оптимизация размера ансамбля регрессоров]

Yu. Zelenkov

HSE University
Аннотация: Алгоритмы обучения ансамблей, такие как bagging, часто генерируют неоправданно большие композиции, которые, помимо потребления вычислительных ресурсов, могут ухудшить обобщающую способность. Обрезка (pruning) потенциально может уменьшить размер ансамбля и повысить точность; однако большинство исследований сегодня сосредоточены на использовании этого подхода при решении задачи классификации, а не регрессии. Это связано с тем, что в общем случае обрезка ансамблей основывается на двух метриках: разнообразии и точности. Многие метрики разнообразия разработаны для задач, связанных с конечным набором классов, определяемых дискретными метками. Поэтому большинство работ по обрезке ансамблей сосредоточено на таких проблемах: классификация, кластеризация и выбор оптимального подмножества признаков. Для проблемы регрессии гораздо сложнее ввести метрику разнообразия. Фактически, единственной известной на сегодняшний день такой метрикой является корреляционная матрица, построенная на предсказаниях регрессоров. Данное исследование направлено на устранение этого пробела. Предложено условие, позволяющее проверить, включает ли регрессионный ансамбль избыточные модели, т. е. модели, удаление которых улучшает производительность. На базе этого условия предложен новый алгоритм обрезки, который основан на декомпозиции ошибки ансамбля регрессоров на сумму индивидуальных ошибок регрессоров и их рассогласованность. Предложенный метод сравнивается с двумя подходами, которые напрямую минимизируют ошибку путем последовательного включения и исключения регрессоров, а также с алгоритмом упорядоченного агрегирования (Ordered Aggregation). Эксперименты подтверждают, что предложенный метод позволяет уменьшить размер ансамбля регрессоров с одновременным улучшением его производительности и превосходит все сравниваемые методы.
Ключевые слова: обрезка ансамбля, ансамбль регрессоров, обучение ансамбля, декомпозиция ошибка-разнообразие, разнообразие регрессоров.
Поступила в редакцию: 27.11.2022
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: Yu. Zelenkov, “Optimization of the regression ensemble size”, Информатика и автоматизация, 22:2 (2023), 393–415
Цитирование в формате AMSBIB
\RBibitem{Zel23}
\by Yu.~Zelenkov
\paper Optimization of the regression ensemble size
\jour Информатика и автоматизация
\yr 2023
\vol 22
\issue 2
\pages 393--415
\mathnet{http://mi.mathnet.ru/trspy1242}
\crossref{https://doi.org/10.15622/ia.22.2.6}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy1242
  • https://www.mathnet.ru/rus/trspy/v22/i2/p393
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:82
    PDF полного текста:52
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025