Artificial Intelligence
Использование мультимодальных данных в системах распознавания эмоций имеет огромный потенциал для приложений в различных областях: здравоохранение, человеко-машинные интерфейсы, контроль состояния операторов, маркетинг. До недавнего времени развитие систем распознавания эмоций на основе мультимодальных данных сдерживалось недостаточной мощностью вычислительной техники. Однако с появлением высокопроизводительных систем на основе графических процессоров и разработкой эффективных архитектур глубоких нейронных сетей произошел всплеск исследований, направленных на использование нескольких модальностей, таких как аудио, видео и физиологические сигналы, для точного определения человеческих эмоций. Помимо этого, немаловажную роль стали играть физиологические данные, полученные с помощью носимых устройств, благодаря относительной простоте их сбора и точности, которую они позволяют достигать. В данной статье рассмотрены архитектуры и методы применения глубоких нейронных сетей для анализа мультимодальных данных с целью повышения точности и надежности систем распознавания эмоций, представлены современные подходы к реализации таких алгоритмов и существующие открытые наборы мультимодальных данных.
Статья посвящена разработке методологии иерархического многозадачного обучения нейронных сетей, основанной на принципах архитектуры ERNIE 3, и экспериментальной апробации данной методологии на базе модели FRED-T5 для задач анализа и генерации текстов на русском языке. Иерархическое многозадачное обучение является перспективным подходом к созданию универсальных языковых моделей, способных эффективно решать разнообразные задачи обработки естественного языка (NLP). Предложенная методология объединяет преимущества специализированных энкодерных блоков для задач понимания текста (NLU) и общего декодера для генеративных задач (NLG), что позволяет повысить производительность модели и снизить вычислительные затраты. В работе проведён сравнительный анализ эффективности разработанной методологии на открытом бенчмарке Russian SuperGLUE с использованием предварительно обученной русскоязычной модели FRED-T5-1.7B. Экспериментальные результаты подтвердили существенное улучшение качества модели в режимах zero-shot и few-shot по сравнению с базовой конфигурацией. Дополнительно рассмотрены возможности практического применения разработанного подхода в решении реальных NLP-задач, а также даны рекомендации по дальнейшему развитию методологии и её интеграции в прикладные системы обработки русскоязычных текстов.
Разработка качественных инструментов автоматического определения уровней текстов по шкале CEFR позволяет создавать учебные и проверочные материалы более быстро и объективно. В данной работе авторы исследуют два типа современных моделей текста: лингвистические характеристики и эмбеддинги больших языковых моделей для задачи классификации русскоязычных текстов по шести уровням CEFR: A1—C2 и трём укрупнённым категориям A, B, C. Два вида моделей явным образом представляет текст в виде вектора числовых характеристик. При этом разделение текста на уровни рассматривается как обычная задача классификации в области компьютерной лингвистики. Эксперименты проводились с собственным корпусом из 1904 текстов. Лучшее качество достигается rubert-base-cased-conversational без дополнительной адаптации при определении как шести, так и трёх категорий текста. Максимальное значение F-меры для уровней A, B, C равно 0,77. Максимальное значение F-меры для прогнозирования шести категорий текста равно 0,67. Качество определения уровня текста больше зависит от модели, чем от алгоритма классификации машинного обучения. Результаты отличаются друг от друга не более чем на 0,01-0,02, особенно это касается ансамблевых методов.
Computing Methodologies and Applications
Исследование различных процессов приводит к необходимости уточнения (расширения) границ применимости вычислительных конструкций и инструментов моделирования. Целью данной статьи является развитие разложения Тейлора для функций нескольких переменных на основе понятия $S$-дифференцируемости. Функцию $f$ из $L_1[Q_0]$, где $Q_0$ — $m$-мерный куб, назовём $S$-дифференцируемой во внутренней точке $x_0$ этого куба, если существует алгебраический многочлен $P(x)$ степени не выше первой, для которого равномерно по всем векторам $v$ единичной сферы ${\mathbb R}^m$ интеграл по $t$ с пределами $0$ и $h$ от выражения $f(x_0 + t \cdot v)-P(t \cdot v)$ есть $o(h^2)$ при $h \to 0{+}$. Показано, что при таком определении справедливо дифференцирование сложной функции с линейной внутренней компонентой, имеет место принцип вектора-градиента. Доказан следующий результат. Пусть функция $f$ имеет в некоторой окрестности внутренней точки $x_0 \in Q_0$ непрерывные частные производные до порядка $n$ включительно, которые $S$-дифференцируемы в точке $x_0$, тогда в этой окрестности справедливо разложение Тейлора функции $f$ с точностью $o\big(\Vert x — x_0\Vert^{n + 1}\big)$.
Рассматривается важное в математической экологии логистическое уравнение с запаздыванием и диффузией. Предполагается, что граничные условия на одном из концов отрезка [0,1] содержат параметр. Исследован вопрос о локальной — в окрестности состояния равновесия — динамике соответствующей краевой задачи при всех значениях параметров граничных условий. Выделены критические случаи в задаче об устойчивости состояния равновесия и построены нормальные формы — скалярные комплексные обыкновенные дифференциальные уравнения первого порядка. Их нелокальная динамика определят поведение решений исходной задачи в малой окрестности состояния равновесия.
ISSN 2313-5417 (Online)