Аннотация:
Начиная с 2019 года все страны мира столкнулись со стремительным распространением пандемии, вызванной коронавирусной инфекцией COVID-19, борьба с которой продолжается мировым сообществом и по настоящее время. Несмотря на очевидную эффективность средств индивидуальной защиты органов дыхания от заражения коронавирусной инфекцией, многие люди пренебрегают использованием защитных масок для лица в общественных местах. Поэтому для контроля и своевременного выявления нарушителей общественных правил здравоохранения необходимо применять современные информационные технологии, которые будут детектировать защитные маски на лицах людей по видео- и аудиоинформации. В статье приведен аналитический обзор существующих и разрабатываемых интеллектуальных информационных технологий бимодального анализа голосовых и лицевых характеристик человека в маске. Существует много исследований на тему обнаружения масок по видеоизображениям, также в открытом доступе можно найти значительное количество корпусов, содержащих изображения лиц как без масок, так и в масках, полученных различными способами. Исследований и разработок, направленных на детектирование средств индивидуальной защиты органов дыхания по акустическим характеристикам речи человека пока достаточно мало, так как это направление начало развиваться только в период пандемии, вызванной коронавирусной инфекцией COVID-19. Существующие системы позволяют предотвратить распространение коронавирусной инфекции с помощью распознавания наличия/отсутствия масок на лице, также данные системы помогают в дистанционном диагностировании COVID-19 с помощью обнаружения первых симптомов вирусной инфекции по акустическим характеристикам. Однако, на сегодняшний день существует ряд нерешенных проблем в области автоматического диагностирования симптомов COVID-19 и наличия/отсутствия масок на лицах людей. В первую очередь это низкая точность обнаружения масок и коронавирусной инфекции, что не позволяет осуществлять автоматическую диагностику без присутствия экспертов (медицинского персонала). Многие системы не способны работать в режиме реального времени, из-за чего невозможно производить контроль и мониторинг ношения защитных масок в общественных местах. Также большинство существующих систем невозможно встроить в смартфон, чтобы пользователи могли в любом месте произвести диагностирование наличия коронавирусной инфекции. Еще одной основной проблемой является сбор данных пациентов, зараженных COVID-19, так как многие люди не согласны распространять конфиденциальную информацию.
Ключевые слова:
определение защитных масок, голосовые характеристики дикторов, COVID-19, средства индивидуальной защиты, обнаружение кашля, лицевые характеристики.
Исследование выполнено при поддержке Российского Фонда Фундаментальных Исследований № 20-04-60529, а также частично в рамках бюджетной темы № 0073-2019-0005.
Поступила в редакцию: 28.06.2021
Реферативные базы данных:
Тип публикации:
Статья
УДК:
004.93
Образец цитирования:
А. А. Двойникова, М. В. Маркитантов, Е. В. Рюмина, Д. А. Рюмин, А. А. Карпов, “Аналитический обзор аудиовизуальных систем для определения средств индивидуальной защиты на лице человека”, Информатика и автоматизация, 20:5 (2021), 1116–1152
\RBibitem{DvoMarRyu21}
\by А.~А.~Двойникова, М.~В.~Маркитантов, Е.~В.~Рюмина, Д.~А.~Рюмин, А.~А.~Карпов
\paper Аналитический обзор аудиовизуальных систем для определения средств индивидуальной защиты на лице человека
\jour Информатика и автоматизация
\yr 2021
\vol 20
\issue 5
\pages 1116--1152
\mathnet{http://mi.mathnet.ru/trspy1163}
\crossref{https://doi.org/10.15622/20.5.5}
\elib{https://elibrary.ru/item.asp?id=46618792}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/trspy1163
https://www.mathnet.ru/rus/trspy/v20/i5/p1116
Эта публикация цитируется в следующих 2 статьяx:
Denis Dresvyanskiy, Elena Ryumina, Heysem Kaya, Maxim Markitantov, Alexey Karpov, Wolfgang Minker, “End-to-End Modeling and Transfer Learning for Audiovisual Emotion Recognition in-the-Wild”, MTI, 6:2 (2022), 11
E.V. Ryumina, D.A. Ryumin, M.V. Markitantov, A.A. Karpov, “A method for generating training data for a protective face mask detection system”, Computer Optics, 46:4 (2022)