Preview

Моделирование и анализ информационных систем

Расширенный поиск
Том 29, № 2 (2022)
Скачать выпуск PDF

Discrete Mathematics in Relation to Computer Science 

78-91 251
Аннотация
Одной из проблем современной дискретной математики является проблема Р. Дедекинда о числе монотонных булевых функций. Если для прочих предполных классов были найдены общие формулы числа функций этих классов, то для класса монотонных булевых функций этого сделать пока не удалось. В рамках этой проблемы существуют проблемы меньшего уровня, одной из которых является отсутствие общей формулы числа булевых функций пересечения $MS$ двух классов --- класса монотонных функций и класса самодвойственных функций. В данной работе предлагаются новые нижние границы для оценки мощности этого пересечения как для чётного, так и для нечётного количества переменных. Показывается, что функция голосования от нечётного числа переменных является монотонной и самодвойственной. Определяется функция голосования от чётного числа переменных. Вводятся функции свободного голосования --- функции с фиктивными переменными, близкие по свойствам к функциям голосования. Рассматривается объединение множества функций голосования и множества функций свободного голосования. Вычисляется мощность этого объединения. Полученное значение мощности предлагается в качестве нижней границы для $|MS|$. Для класса $MS$ монотонных самодвойственных функций от чётного числа переменных нижняя граница была улучшена по сравнению с границами, предложенными ранее, а для функций от нечётного числа переменных нижняя граница для $|MS|$ представлена впервые.
92-103 205
Аннотация

Пусть $Q_n=[0,1]^n$ - единичный куб в ${\mathbb R}^n$, $C(Q_n)$ - пространство непрерывных функций $f:Q_n\to{\mathbb R}$ с нормой $\|f\|_{C(Q_n)}:=\max_{x\in Q_n}|f(x)|.$ Через $\Pi_1\left({\mathbb R}^n\right)$ обозначим совокупность многочленов от $n$ переменных степени $\leq 1$, т. е. линейных функций на ${\mathbb R}^n$. Интерполяционный проектор $P:C(Q_n)\to \Pi_1({\mathbb R}^n)$ с узлами $x^{(j)}\in Q_n$ определяется равенствами $Pf\left(x^{(j)}\right)= f\left(x^{(j)}\right)$, $j=1,$ $\ldots,$ $ n+1$. Пусть $\|P\|_{Q_n}$ - норма $P$ как оператора из $C(Q_n)$ в $C(Q_n)$. Если $n+1$ - число Адамара, то существует невырожденный правильный симплекс, вершины которого находятся в вершинах куба $Q_n.$ В статье обсуждаются различные подходы к получению оценок вида $||P||_{Q_n}$ $\leq$ $c\sqrt{n}$ для нормы соответствующего интерполяционного проектора.

104-114 170
Аннотация
Термин <<тотальная степень перечислимости>> связан с тем, что е-степень тотальна тогда и только тогда, когда она содержит график некоторой тотальной функции. В ряде работ автора и группы математиков из University of Wisconsin-Madison рассматривались так называемые <<граф-кототальные степени перечислимости>>, т.е. е-степени, содержащие дополнение графика некоторой тотальной функции $f(x)$. В данной статье сделан следующий шаг -- рассмотрены степени перечислимости множеств, ограниченных сверху или снизу графиком тотальной функции. Более точно, множество A ограничено сверху, если $A=\\{\\langle x,y\\rangle:y < f(x)\\}$ для некоторой тотальной функции f(x) и множество A ограничено снизу, если $A=\\{\\langle x,y\\rangle:y > f(x)\\}$ для некоторой тотальной функции $f(x)$. В статье приводится ряд результатов, показывающих существование нетотальных степеней перечислимости, содержащих ограниченные множества, причем построенные е-степени являются квазиминимальными. Важным является результат, утверждающий, что ограниченные множества обладают свойством Фридберга, связанным с~инверсией скачка.

Theory of Data 

116-133 238
Аннотация
Работа посвящена классификации русскоязычных предложений по тональности на четыре класса: положительный, отрицательный, смешанный и нейтральный. В отличие от большинства современных работ в этой области, вводится в рассмотрение класс предложений смешанной тональности. Предложения со смешанной тональностью содержат в себе одновременно и положительно, и отрицательно окрашенную речь. Для решения данной задачи были применены: нейронная сеть LSTM с механизмом внимания, нейронная сеть GRU с двойным механизмом внимания, нейронная сеть BERT с несколькими модификациями выходного слоя для обеспечения классификации на четыре класса. Эксперименты по сравнению эффективности различных нейронных сетей производилось на трёх корпусах русскоязычных предложений. Два корпуса составлены из пользовательских отзывов: один с отзывами на одежду, другой с отзывами на отели. Третий корпус составлен из новостных статей российских изданий. Лучшая средняя взвешенная F-мера в экспериментах, составляющая 0.90, была достигнута моделью BERT на корпусе отзывов на одежду. На этом же корпусе были отмечены лучшие F-меры для положительных и отрицательных предложений, составившие 0.92 и 0.93 соответственно. Наилучшие показатели классификации нейтральных и смешанных предложений достигаются на корпусе новостных статей. Для них F-мера составляет 0.72 и 0.58 соответственно. В результате экспериментов было продемонстрировано значительное превосходство трансферных нейронных сетей BERT над нейронными сетями предыдущего поколения LSTM и GRU, наиболее ярко выражающееся при классификации текстов со слабо выраженной эмоциональной окраской. Анализ ошибок показал, что на «смежные» классы тональности (положительный/отрицательный и смешанный) приходится большая доля ошибок при классификации с помощью BERT, чем в случае «противоположных» классов (положительный и отрицательный, нейтральный и смешанный).
134-147 214
Аннотация

В статье рассматривается задача определения тональности русскоязычных предложений. Тональность понимается как отношение автора к теме предложения. В данном исследовании учитываются три варианта тональности - положительная, отрицательная и нейтральная, т. е. решается задача классификации с тремя классами. В статье предлагается алгоритм определения тональности предложения на русском языке, основанный на семантических правилах. В основе алгоритма лежит предположение о том, что тональность фразы может быть определена на основе тональностей её составляющих с помощью рекурсивного применения семантических правил к составным частям фразы, представленным в виде синтаксического дерева. Набор семантических правил, используемых алгоритмом, был составлен в результате обсуждений с экспертами-филологами. Эксперименты показали, что предложенный рекурсивный алгоритм даёт несколько худший результат на корпусе отзывов на отели по сравнению с подходом, основанным на правилах, ранее адаптированным авторами для русского языка: взвешенная $F_1$-мера составила 0.75 и 0.78 соответственно. Для оценки качества работы алгоритма на сложных предложениях был создан корпус OpenSentimentCorpus, основанный на OpenCorpora - открытом корпусе предложений из новостных статей и публицистики. На корпусе OpenSentimentCorpus рекурсивный алгоритм работает лучше, чем адаптированный подход: $F_1$-мера составила 0.70 и 0.63 соответственно. Таким образом, предложенный в данной работе алгоритм имеет преимущество в случае более сложных предложений с более тонкими способами выражения тональности.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)