Preview

Моделирование и анализ информационных систем

Расширенный поиск
Том 33, № 1 (2026)

Artificial Intelligence

6-29 120
Аннотация

Представлен анализ 133 лингвистических признаков для автоматической классификации уровня владения языком по шкале Common European Framework of Reference (CEFR) в двухуровневой архитектуре: детерминированные признаки Tier 1 (лексические, морфологические и синтаксические показатели) и признаки Tier 2, основанные на методах машинного обучения (семантическая связность, тематическая структура, когезия и сигналы ошибок). Эксперименты выполнены на корпусе из 3,205 текстов обучающихся из разнородных источников; валидация проводилась с триангуляцией по экспертно верифицированным подмножествам экзаменационных данных Cambridge. Материалы были собраны в 2022--2025 годах и включают существенный институциональный корпус из более чем 3,000 эссе и других письменных работ студентов Московского физико-технического института (МФТИ), изучающих английский язык как иностранный; уровень владения языком у них регулярно оценивается нашей интеллектуальной системой тестирования ISTOK (Intelligent System for Testing General Language Competencies). Признаковые матрицы стандартизировались после обработки пропусков (медианная импутация внутри фолда для кросс-валидации и заполнение нулями для отчётных экспериментов на отложенной выборке). В задаче контролируемой классификации лучшая модель Tier 1+2 достигает 66.72% точности (макро F1 = 0.69) и 94.53% смежной точности (ошибка не более чем на один уровень CEFR) на эталонном разбиении для 3,198 текстов с метками CEFR; расширенное сравнение с предварительными признаками Tier 3 достигает 67.50%. Неконтролируемый анализ выявляет структуру пространства признаков: для крайних уровней наблюдаются кластеры высокой чистоты (A1 99.5%; C2 82.4%), а на экспертных данных Cambridge получено умеренное согласование с профессиональными оценками (Adjusted Rand Index = 0.303). Приведены результаты блочных абляций и поиска компактных подмножеств; наибольшую информативность обеспечивают морфологическая сложность и лексическая продвинутость, а признаки ошибок дают устойчивый дополнительный выигрыш.

30-47 111
Аннотация

В статье рассматривается применение методов глубокого обучения с подкреплением для решения задачи автоматизированного составления графиков водительских смен городского пассажирского транспорта. Задача составления графиков смен (Crew Scheduling Problem) относится к классу NP-трудных задач комбинаторной оптимизации и характеризуется множеством сложных ограничений, связанных с трудовым законодательством и операционными особенностями транспортной сети. Описана постановка задачи с учётом смены маршрутов. Предложена формализация задачи в виде марковского процесса принятия решений с учётом специфических ограничений транспортной отрасли: максимального рабочего времени, обеденных перерывов и минимального времени отдыха между рейсами. Сформулировано пространство состояний, включающее признаки контрольных остановок, текущего рейса и смен-кандидатов. Описан механизм приоритетного отбора смен-кандидатов для снижения размерности пространства действий. Описана многокомпонентная функция награды, учитывающая число задействованных смен, время холостых поездок и утилизацию водителей. Архитектура агента реализована на основе метода Actor-Critic с алгоритмом Proximal Policy Optimization. Экспериментальное исследование проведено на реальных данных транспортной сети города Ярославль, включающей 6 маршрутов и 974 рейса. Проведён сравнительный анализ с альтернативными методами: DQN, REINFORCE и эвристическим подходом, представленного жадным алгоритмом. Сравнительный анализ результатов показал превосходство алгоритма PPO над другими подходами. В результате исследования сделан вывод о возможности использования методов обучения с подкреплением для решения задач транспортной оптимизации.

48-61 93
Аннотация

В настоящей статье исследуется задача автоматического пословного выравнивания параллельных текстов, являющаяся фундаментальным этапом для обучения систем машинного перевода, сопоставительного исследования языков и создания лингвистических ресурсов. В условиях дефицита аннотированных данных для многих языковых пар особую актуальность приобретает вопрос применимости больших языковых моделей (LLM), обладающих высокими обобщающими способностями и способных решать многие задачи без длительного обучения на целевой выборке. Работа посвящена сравнительному анализу эффективности современных LLM общего назначения и специализированных алгоритмов выравнивания на материале русско-английской языковой пары. Проведённое исследование включало тестирование десяти передовых моделей (в том числе Gemini 3 Pro, GPT-5.2, Claude Sonnet 4.5) с использованием различных стратегий промптирования (zero-shot, few-shot), а также пяти базовых подходов: от статистических методов (fast-align, eflomal) до нейросетевых архитектур (AwesomeAlign, AccAlign, BinaryAlign). Оценка качества производилась на основе метрик точности, полноты, F-меры и AER с использованием размеченных данных Национального корпуса русского языка. Результаты экспериментов показали, что специализированный алгоритм BinaryAlign сохраняет лидерство по совокупному качеству разметки (F-мера 0.883, AER 0.113). Однако ведущие LLM, в частности Gemini 3 Pro Preview и GPT-5.2, продемонстрировали результаты, превзошедшие большинство классических и ранних нейросетевых решений. Примечательно, что для наиболее эффективных моделей добавление примеров в контекст часто снижало качество по сравнению с режимом zero-shot. Таким образом, современные LLM могут служить надежным инструментом для высокоуровневого выравнивания в условиях отсутствия обучающих выборок, что открывает новые перспективы для обработки малоресурсных языковых пар.

62-77 65
Аннотация

В работе исследуется влияние объёма обучающей выборки на качество автоматического оценивания правильности коротких ответов, представленного в виде задачи классификации. Влияние оценивалось на примере метода, основанного на оценке сходства между оцениваемым ответом и заданным эталонным ответом, рассчитываемого с помощью векторов эмбеддингов, и классификатора на основе логистической регрессии. Эксперименты проводились на корпусах ответов студентов на вопросы по компьютерным наукам, истории и разработке на Qt. Объём корпусов составил 547, 522 и 931 ответ соответственно. В ходе выполнения работы было поставлено два эксперимента. В ходе первого эксперимента оценивалось изменение качества классификации при уменьшении объёма обучающей выборки. Он показал, что при бинарной классификации (когда ответ может быть либо верным, либо неверным) уменьшение объёма обучающей выборки классификатора приводит к меньшему снижению качества, чем при тернарной классификации (когда выделяется класс частично верных ответов). В ходе второго эксперимента изучалась возможность повышения качества классификации за счёт расширения обучающей выборки малого объёма с помощью аугментации. Он показал, что аугментация, выполненная с помощью генеративной модели DeepSeek, позволяет в ряде случаев значительно улучшить результат, что представляется важным для практического применения в условиях дефицита данных. Также в ходе экспериментов было выявлено, что при использовании для генерации эмбеддингов различных языковых моделей величина изменения качества классификации при изменении объёма обучающей выборки может существенно различаться: при использовании некоторых для получения эмбеддингов моделей rubert-tiny2 и MiniLM-L12-v2 результаты оказываются более стабильными, чем при использовании других моделей.

Discrete Mathematics in Relation to Computer Science

78-89 71
Аннотация

Рассматривается задача допустимой раскраски вершин в минимальное число цветов для связных неориентированных графов, не содержащих петель и кратных ребер. При каждом заданном $k \geqslant 3$ задача проверки существования допустимой вершинной раскраски графа в $k$ цветов является NP-полной. В связи с этим представляет интерес изучение процессов масштабирования графов с сохранением или ограничением их хроматических чисел. В работе исследуется характер изменения хроматического числа графов при увеличении числа вершин и ребер с помощью операций склейки графов путем отождествления их изоморфных подграфов. $G = (G_{1} \circ G_{2}) \tilde{G}$ — результирующий граф операции склейки графов $G_1$ и $G_2$, $\tilde{G} \subseteq G$ — подграф, полученный в результате отождествления изоморфных подграфов $G_1' \subseteq G_1$ и $G_2' \subseteq G_2$; $|V(G)| = |V(G_1)| + |V(G_2)| - |V(\tilde{G})|, |E(G)| = |E(G_1)| + |E(G_2)| - |E(\tilde{G})|$. Операции склейки, в которых один из графов $G_1$ или $G_2$ изоморфен другому графу или его подграфу и отождествление подграфов $G_1^{'}\subset G_1$ и $G_2^{'} \subset G_2$, проводится в соответствии с изоморфизмом $G_1' \cong G_2'$, называются операциями клонирования. На основе операций склейки и клонирования получено конструктивное описание класса 2-хроматических графов. Сформулированы ограничения на операции склейки и клонирования, обеспечивающие сохранение хроматического числа масштабируемых графов. Установлено, что при выполнении операций клонирования $\chi(G) =\max{\chi(G_1),\chi(G_2)}$. Приводятся примеры сборки 2-хроматических графов с использованием операций, удовлетворяющих этим ограничениям. Для произвольной операции склейки $\chi(G) \leqslant \max {\chi(G_1),\chi(G_2)} + |V(\tilde{G})| - |V(\tilde{G'})|$, где $\tilde{G'}$ — максимальный полный подграф в $\tilde{G}$. Оценивается возможный рост хроматического числа графов при масштабировании с различными ограничениями на суперпозиции операций склейки.

Theory of Computing

90-116 95
Аннотация

Большое пространство состояний программ затрудняет или делает невозможной их непосредственную верификацию методом проверки модели (model checking). Наличие симметрии в программе достаточно часто позволяет упростить модель и сократить её пространство состояний, что приводит к значительному снижению времени верификации. Классический подход состоит в обнаружении группы симметрии и построении на её основе фактормодели — упрощённой модели для верификации. Однако не все инструменты имеют поддержку симметрии, а инструменты с такой поддержкой не всегда справляются с поставленной задачей, так как поиск подходящей группы симметрии является вычислительно сложной задачей.

В работе предлагается альтернативный классическому подход к разработке программ, основанный на явном выделении симметрии. В программе выделяется ядро — координационный центр, который работает с учётом симметрии и отвечает за выполнимость заданных темпоральных свойств. Ядро координирует вычисления, вынесенные за его пределы — в обвязку ядра. В связи с этим ядро имеет небольшое пространство состояний, заменяет собой фактормодель и может быть верифицировано инструментом проверки модели без поддержки симметрии. Обвязка не может вмешиваться в работу верифицированного ядра и нарушать его свойства. Подход продемонстрирован на примере разработки и верификации арбитра ресурсов марсохода. Арбитр координирует доступ n процессов к m ресурсам, где n и m — натуральные числа. Используются язык программирования C/C++ и инструмент проверки модели Spin. Модель поведения ядра автоматически извлекается верификатором Spin из C-кода. Проверке подлежат темпоральные свойства, выраженные с помощью линейной темпоральной логики LTL.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)