Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. ЮУрГУ. Сер. Выч. матем. информ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика», 2017, том 6, выпуск 3, страницы 28–59
DOI: https://doi.org/10.14529/cmse170303
(Mi vyurv170)
 

Эта публикация цитируется в 16 научных статьях (всего в 16 статьях)

Информатика, вычислительная техника и управление

Обзор методов обучения глубоких нейронных сетей

А. В. Созыкинab

a Институт математики и механики им. Н.Н. Красовского УрО РАН (620990 Екатеринбург, ул. Софьи Ковалевской, д. 16)
b Уральский федеральный университет (620002 Екатеринбург, ул. Мира, д. 19)
Список литературы:
Аннотация: Глубокие нейронные сети в настоящее время становятся одним из самых популярных подходов к созданию систем искусственного интеллекта, таких как распознавание речи, обработка естественного языка, компьютерное зрение и т.п. В статье представлен обзор истории развития и современного состояния методов обучению глубоких нейронных сетей. Рассматривается модель искусственной нейронной сети, алгоритмы обучения нейронных сетей, в том числе алгоритм обратного распространения ошибки, применяемый для обучения глубоких нейронных сетей. Описывается развитие архитектур нейронных сетей: неокогнитрон, автокодировщики, сверточные нейронные сети, ограниченная машина Больцмана, глубокие сети доверия, сети долго-краткосрочной памяти, управляемые рекуррентные нейронные сети и сети остаточного обучения. Глубокие нейронные сети с большим количеством скрытых слоев трудно обучать из-за проблемы исчезающего градиента. В статье рассматриваются методы решения этой проблемы, которые позволяют успешно обучать глубокие нейронные сети с более чем ста слоями. Приводится обзор популярных библиотек глубокого обучения нейронных сетей, которые сделали возможным широкое практическое применение данной технологии. В настоящее время для задач компьютерного зрения используются сверточные нейронные сети, а для обработки последовательностей, в том числе естественного языка, — рекуррентные нейронные сети, прежде всего сети долго-краткосрочной памяти и управляемые рекуррентные нейронные сети.
Ключевые слова: глубокое обучение, нейронные сети, машинное обучение.
Финансовая поддержка Номер гранта
Уральское отделение Российской академии наук 15-7-1-8
Работа поддержана проектом УрО РАН № 15-7-1-8.
Поступила в редакцию: 12.04.2017
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.85
Образец цитирования: А. В. Созыкин, “Обзор методов обучения глубоких нейронных сетей”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 6:3 (2017), 28–59
Цитирование в формате AMSBIB
\RBibitem{Soz17}
\by А.~В.~Созыкин
\paper Обзор методов обучения глубоких нейронных сетей
\jour Вестн. ЮУрГУ. Сер. Выч. матем. информ.
\yr 2017
\vol 6
\issue 3
\pages 28--59
\mathnet{http://mi.mathnet.ru/vyurv170}
\crossref{https://doi.org/10.14529/cmse170303}
\elib{https://elibrary.ru/item.asp?id=30016527}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vyurv170
  • https://www.mathnet.ru/rus/vyurv/v6/i3/p28
  • Эта публикация цитируется в следующих 16 статьяx:
    1. А. В. Литаврин, Т. В. Моисеенкова, “Об одном группоиде, ассоциированном с композицией многослойных нейронных сетей прямого распространения сигнала”, Журнал СВМО, 26:2 (2024), 111–122  mathnet  crossref [A. V. Litavrin, T. V. Moiseenkova, “About one groupoid associated with the composition of multilayer feedforward neural networks”, Zhurnal SVMO, 26:2 (2024), 111–122  mathnet]
    2. Ergash Yu. Akhmedov, Dmitriy E. Palchunov, Durdona Z. Khaitboeva, Mukhiddin F. Ibragimov, Otojon R. Sultanov, Laylo S. Rakhimova, 2024 IEEE 25th International Conference of Young Professionals in Electron Devices and Materials (EDM), 2024, 2460  crossref
    3. V. A. Mishchuk, “The Relationship between the Concepts of “Artificial Intelligence” and “Artificial Neural Networks” in Forensic Expertology”, Teor. prakt. sud. èkspert., 19:3 (2024), 33  crossref
    4. A. N. Sunami, A. I. Musaev, “«The Trouble with Bias» in Neural Networks: Conflict and Ethical Challenges”, Upravlencheskoe konsul'tirovanie, 2024, no. 5, 150  crossref
    5. Ergash Yu. Akhmedov, Dmitriy E. Palchunov, 2024 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON), 2024, 282  crossref
    6. Aleksey Rogachev, Ilya Belousov, Dmitry Rogachev, Lecture Notes in Networks and Systems, 798, Fourth International Conference on Image Processing and Capsule Networks, 2023, 449  crossref
    7. A. F. Rogachev, I. S. Belousov, “Simulation of the of the DeepLabv3 neural network learning process for the agricultural fields segmentation”, Vestn. Dagest. gos. teh. univ., Teh. nauki, 50:3 (2023), 142  crossref
    8. V. S. Velikanov, N. V. Dyorina, E. A. Gasanenko, E. A. Pikalova, Lecture Notes in Mechanical Engineering, Proceedings of the 9th International Conference on Industrial Engineering, 2023, 650  crossref
    9. I. F. Kupryashkin, A. S. Mazin, “Classification of military equipment targets on radar images generated in noise interference conditions using a convolutional neural network”, Journal of «Almaz – Antey» Air and Space Defence Corporation, 2022, no. 1, 71  crossref
    10. Jingjing Si, Gengchen Fu, Yinbo Cheng, Rui Zhang, Godwin Enemali, Chang Liu, “A Quality-Hierarchical Temperature Imaging Network for TDLAS Tomography”, IEEE Trans. Instrum. Meas., 71 (2022), 1  crossref
    11. Belykh M. Vladimirovna, Belov A. Vladimirovich, 2022 Interdisciplinary Research in Technology and Management (IRTM), 2022, 1  crossref
    12. E.I. Kaznacheeva, A.M. Nazarov, “Malaria case detection using an AI-enabled system in the routine practice of performing clinical blood tests in a centralized laboratory”, Lab. sluzh., 11:2 (2022), 50  crossref
    13. Yu. N. Kulchin, A.Yu. Kim, “Convolutional neural networks for solving problems of signal processing from segmental distributed fiber optic measuring networks”, J. Phys.: Conf. Ser., 1864:1 (2021), 012136  crossref
    14. N. E. Gotman, G. P. Shumilova, “Identification of line status changes using phasor measurements through deep learning networks”, «Izvestiya vysshikh uchebnykh zavedenii. PROBLEMY ENERGETIKI», 22:6 (2021), 55  crossref
    15. R Dyachenko, D Gura, N Kiryunikova, E Lesovaya, N Khusht, G Akopyan, “On the methods of recognition and classification of laser reflection points based on the Terrasolid software module on the Bentley Microstation platform”, J. Phys.: Conf. Ser., 2131:5 (2021), 052100  crossref
    16. V Shatravin, D V Shashev, “Designing high performance, power-efficient, reconfigurable compute structures for specialized applications”, J. Phys.: Conf. Ser., 1611:1 (2020), 012071  crossref
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»
    Статистика просмотров:
    Страница аннотации:1951
    PDF полного текста:1845
    Список литературы:113
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025