Preview

Моделирование и анализ информационных систем

Расширенный поиск

Алгоритм определения тональности предложений публицистического стиля на русском языке на основе семантических правил

https://doi.org/10.18255/1818-1015-2023-4-394-417

EDN: UVOKLC

Аннотация

Статья посвящена задаче определения тональности предложения на русском языке, понимаемой как отношение автора предложения к его теме, выраженное с помощью языковых средств. В настоящий момент большинство исследований по этой теме проводятся на текстах разговорного стиля речи, что ограничивает применимость их результатов для других стилей, в частности, публицистического. Для того, чтобы заполнить этот пробел, авторами был разработан алгоритм определения тональности, ориентированный на применение к предложениям публицистического стиля речи. Алгоритм рекурсивно применяет подходящие правила к составным частям предложения, представленным в виде дерева синтаксических единиц. Большинство правил было построено на основе знаний эксперта-филолога относительно средств выражения тональности, известных русской лингвистике, и выбора тех из них, которые достаточно формализованы для того, чтобы их можно было алгоритмизировать с использованием генерируемых в рамках алгоритма деревьев синтаксических единиц. Также применялись дерево решений и тональный словарь. В статье приведены результаты эксперимента по апробации предложенного алгоритма на корпусе предложений публицистического стиля OpenSentimentCorpus, F-мера составила 0.80, а также результаты анализа ошибок алгоритма.

Об авторах

Анатолий Юрьевич Полетаев
Ярославский государственный университет им. П.Г. Демидова
Россия


Илья Вячеславович Парамонов
Ярославский государственный университет им. П.Г. Демидова
Россия


Елена Игоревна Бойчук
Ярославский государственный университет им. П.Г. Демидова
Россия


Список литературы

1. B. Liu, Sentiment Analysis and Opinion Mining. Springer, 2022.

2. A. Dvoybikova, A. Karpov, and O. Verkholyak, “Analytical Review of Methods for Identifying Emotions in Text Data,” in 3rd International Conference on R. Piotrowski's Readings in Language Engineering and Applied Linguistics, PRLEAL 2019, 2020, pp. 8–21.

3. S. Smetanin and M. Komarov, “Deep Transfer Learning Baselines for Sentiment Analysis in Russian,” Information Processing & Management, vol. 58, no. 3, p. 102484, 2021.

4. K. Nursakitov, A. Bekishev, S. Kumargazhanova, and A. Urkumbaeva, “Review of Methods for Determining the Tonation of Texts in Natural Languages,” Bulletin of Shakarim University. Technical Sciences, no. 1 (9), pp. 59–67, 2023.

5. M. S. Bacsarslan and F. Kayaalp, “Sentiment Analysis on Social Media Reviews Datasets with Deep Learning Approach,” Sakarya University Journal of Computer and Information Sciences, vol. 4, no. 1, pp. 35–49, 2021.

6. M. Wankhade, A. C. S. Rao, and C. Kulkarni, “A Survey on Sentiment Analysis Methods, Applications, and Challenges,” Artificial Intelligence Review, vol. 55, no. 7, pp. 5731–5780, 2022.

7. E. N. Tulupova and E. V. Golovina, “Lexico-Stylistic Percularities of Tourist's Internet Commentary,” Philology. Theory & Practice, vol. 12, no. 5, pp. 257–261, 2019.

8. E. I. Boychuk, “Lexical and Grammatical Features of Internet Reviews in the Russian and English Languages,” Verhnevolzhski Philological Bulletin, no. 3 (26), pp. 107–115, 2021.

9. A. Y. Poletaev and I. V. Paramonov, “Recursive sentiment detection algorithm for Russian sentences,” Automatic Control and Computer Sciences, vol. 57, no. 7, pp. 740–749, 2023.

10. M. A. Eremina, “Rechevoj zhanr otzyva v kommunikativnom prostranstve interneta,” Nauchnyj dialog, no. 5 (53), pp. 34–45, 2016.

11. A. R. Kalashnikova, “Informativnaya Tekstovaya Tonal'nost' Kak Opredelyayushchij Faktor Ritmicheskoj Tekstovoj Organizacii,” Izvestiya Volgogradskogo Gosudarstvennogo Pedagogicheskogo Universiteta, vol. 3 (107), pp. 113–116, 2016.

12. I. V. Paramonov and A. Y. Poletaev, “Annotation of Text Corpora by Sentiment and Presence of Irony within a Project of Citizen Science,” Modelirovanie i Analiz Informatsionnykh Sistem, vol. 30, no. 1, pp. 86–100, 2023.

13. N. Loukachevitch and A. Levchik, “Creating a General Russian Sentiment Lexicon,” in Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16), 2016, pp. 1171–1176.

14. D. Kulagin, “Publicly Available Sentiment Dictionary for the Russian Language KartaSlovSent,” in Computational Linguistics and Intellectual Technologies: Proceesings of the Annual “Dialog” Conference (2021), 2021, pp. 1106–1119.

15. A. Y. Poletaev, I. V. Paramonov, and E. I. Boychuk, “Algorithm of Constituency Tree from Depencency Tree Construction for a Russian-Language Sentence,” Informatics and Automation, vol. 22, no. 6, pp. 1323–1353, 2023.

16. L. Breiman, J. Friedman, R. Olshen, and C. Stone, Classification and Regression Trees. Routledge, 2017.

17. O. Koltsova, S. Alexeeva, S. Pashakhin, and S. Koltsov, “PolSentiLex: Sentiment Detection in Socio-Political Discussions on Russian Social Media,” in Conference on Artificial Intelligence and Natural Language, 2020, pp. 1–16.

18. W. Souma, I. Vodenska, and H. Aoyama, “Enhanced News Sentiment Analysis Using Deep Learning Methods,” Journal of Computational Social Science, vol. 2, no. 1, pp. 33–46, 2019.

19. A. B. Junior, N. F. F. da Silva, T. C. Rosa, and C. G. C. Junior, “Sentiment Analysis with Genetic Programming,” Information Sciences, vol. 562, pp. 116–135, 2021.


Рецензия

Для цитирования:


Полетаев А.Ю., Парамонов И.В., Бойчук Е.И. Алгоритм определения тональности предложений публицистического стиля на русском языке на основе семантических правил. Моделирование и анализ информационных систем. 2023;30(4):394-417. https://doi.org/10.18255/1818-1015-2023-4-394-417. EDN: UVOKLC

For citation:


Poletaev A.Y., Paramonov I.V., Boychuk E.I. Semantic rule-based sentiment detection algorithm for Russian publicism sentences. Modeling and Analysis of Information Systems. 2023;30(4):394-417. (In Russ.) https://doi.org/10.18255/1818-1015-2023-4-394-417. EDN: UVOKLC

Просмотров: 212


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)