|
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Русско-ориентированная культурная адаптация набора данных для специализированной генерации изображений по текстовым описаниям
В. А. Васильевab, В. С. Архипкинa, Ю. Д. Агафоноваac, Т. В. Никулинаa, Э. О. Мироноваa, А. А. Шичанинаa, Н. А. Герасименкоa, М. А. Шойтовa, Д. В. Димитровad a Sber AI, Mocква, Россия
b Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
c Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербург, Россия
d Институт искусственного интеллекта (AIRI), Mocква, Россия
Аннотация:
Несмотря на то что популярные модели генерации изображений по тексту хорошо справляются с интернациональными и общекультурными запросами, они имеют значительный пробел в знаниях относительно отдельных культур. Это связано с содержанием существующих больших наборов обучающих данных, собранных в Интернете, которые преимущественно основаны на западноевропейской или американской популярной культуре. Между тем отсутствие культурной адаптации модели может привести к некорректным результатам, снижению качества генерации, а также распространению стереотипов и оскорбительного контента. Стремясь решить эту проблему, мы анализируем понятие культурного кода и приходим к осознанию критической важности его понимания современными моделями генерации изображений – проблеме, которая до сих пор не была достаточно освещена в исследовательском сообществе. Мы предлагаем методологию сбора и обработки данных, необходимых для формирования датасета на основе культурного кода, в частности российского. Мы исследуем, как собранные данные влияют на качество генераций в национальном домене и анализируем эффективность нашего подхода на примере модели генерации изображений Kandinsky 3.1. Результаты оценки людьми демонстрируют возрастание уровня осведомленности модели о русской культуре.
Ключевые слова:
культурный код, русская культура, адаптация набора данных, генерация изображений по тексту, создание описаний, диффузионные модели, сбор данных, обработка данных.
Поступило: 20.09.2024 Принято к публикации: 02.10.2024
Образец цитирования:
В. А. Васильев, В. С. Архипкин, Ю. Д. Агафонова, Т. В. Никулина, Э. О. Миронова, А. А. Шичанина, Н. А. Герасименко, М. А. Шойтов, Д. В. Димитров, “Русско-ориентированная культурная адаптация набора данных для специализированной генерации изображений по текстовым описаниям”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 154–168; Dokl. Math., 110:suppl. 1 (2024), S137–S150
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma597 https://www.mathnet.ru/rus/danma/v520/i2/p154
|
Статистика просмотров: |
Страница аннотации: | 22 |
|