Методы определения тональности по отношению к аспектам социально-экономического развития в предложениях на русском языке
https://doi.org/10.18255/1818-1015-2024-4-362-383
Аннотация
Статья посвящена задаче определения тональности по отношению к аспектам социально-экономического развития в предложениях на русском языке. Аспект, отношение к которому определяется, может как упоминаться явно, так и подразумеваться. Авторами были исследованы возможности применения нейросетевых классификаторов, а также предложен алгоритм определения тональности по отношению к аспекту, основанный на семантических правилах, реализованных с использованием деревьев синтаксических единиц. Тональность по отношению к аспекту определяется в два этапа. На первом этапе в предложении отыскиваются аспектные термины — явно упоминаемые события или явления, связанные с аспектом. На втором этапе тональность по отношению к аспекту определяется как тональность по отношению к аспектному термину, который теснее всего связан с аспектом. В работе предлагается несколько методов поиска аспектных терминов. Качество оценивалось на корпусе из 468 предложений, извлечённых из материалов предвыборной агитации. Лучший результат для нейросетевых классификаторов был получен с использованием нейронной сети BERT-SPC, предобученной на задаче определения тональности по отношению к явно упоминаемому аспекту, макро-F-мера составила 0.74. Лучший результат для алгоритма, основанного на семантических правилах, был получен при использовании метода поиска аспектных терминов на основе семантической схожести, макро-F-мера составила 0.63. При объединении BERT-SPC и алгоритма, основанного на правилах, в ансамбль была получена макро-F-мера, равная 0.79, что является лучшим результатом, полученным в рамках работы.
Об авторах
Анатолий Юрьевич ПолетаевРоссия
Илья Вячеславович Парамонов
Россия
Елена Игоревна Бойчук
Россия
Список литературы
1. B. Liu, Sentiment Analysis and Opinion Mining. Springer, 2022.
2. W. Zhang, X. Li, Y. Deng, L. Bing, and W. Lam, “A survey on aspect-based sentiment analysis: Tasks, methods, and challenges,” IEEE Transactions on Knowledge and Data Engineering, vol. 35, no. 11, pp. 11019–11038, 2022, doi: 10.1109/TKDE.2022.3230975.
3. O. Alqaryouti and others, “Aspect-based sentiment analysis using smart government review data,” Applied Computing and Informatics, vol. 20, no. 1/2, pp. 142–161, 2024, doi: 10.1016/j.aci.2019.11.003.
4. A. Nazir, Y. Rao, L. Wu, and L. Sun, “Issues and challenges of aspect-based sentiment analysis: A comprehensive survey,” IEEE Transactions on Affective Computing, vol. 13, no. 2, pp. 845–863, 2020, doi: 10.1109/TAFFC.2020.2970399.
5. A. Poletaev, I. Paramonov, and E. Kolupaev, “Methods of implicit aspect detection in Russian publicism sentences,” Modeling and Analysis of Information Systems, vol. 31, no. 3, pp. 226–239, 2024, doi: 10.18255/1818-1015-2024-3-226-239.
6. A. D. Kazun, “Construction of social problems in the media and agenda-setting theory: the limits of concepts' compatibility,” Monitoring of Public Opinion: Economic and Social Changes, no. 3 (133), pp. 159–172, 2016, doi: 10.14515/monitoring.2016.3.09.
7. A. I. Guseva, I. A. Kuznetsov, P. V. Bochkarev, and D. S. Smirnov, “DIGITAL SHADOW OF Russian INTERNATIONAL MEGAPROJECTSB OF NPP CONSTRUCTION ABROAD: ASSESSMENT OF THE TONE OF UTTERANCES,” Modern High Technologies, no. 12 (1), pp. 26–34, 2022, doi: 10.17513/snt.39432.
8. W. Zhang, X. Li, Y. Deng, L. Bing, and W. Lam, “A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges,” IEEE Transactions on Knowledge and Data Engineering, vol. 35, no. 11, pp. 11019–11038, 2023, doi: 10.1109/TKDE.2022.3230975.
9. E. G. Brunova, Y. V. Bidulya, and A. A. Gorbunov, “Aspect-based sentiment analysis of political discourse,” Tyumen State University Herald. Humanities Research. Humanitates, vol. 7, no. 3 (27), pp. 6–22, 2021, doi: 10.21684/2411-197X-2021-7-3-6-22.
10. Muljono, B. Harjo, and R. Abdullah, “Aspect-Based Sentiment Analysis for Financial Review with Implicit Aspect and Opinion Using Semantic Similarity and Hybrid Approach,” International Journal of Intelligent Engineering & Systems, vol. 17, no. 5, pp. 646–658, 2024, doi: 10.22266/ijies2024.1031.49.
11. K. Ananthajothi, K. Karthikayani, and R. Prabha, “Explicit and implicit oriented Aspect-Based Sentiment Analysis with optimal feature selection and deep learning for demonetization in India,” Data & Knowledge Engineering, vol. 142, p. 102092, 2022, doi: 10.1016/j.datak.2022.102092.
12. C. Hutto and E. Gilbert, “VADER: A parsimonious rule-based model for sentiment analysis of social media text,” in Proceedings of the International AAAI Conference on Web and Social Media, 2014, vol. 8, no. 1, pp. 216–225.
13. N. Chechneva, “Simple and Efficient Approach to the Aspect Extraction from Customers' Product Reviews,” in Proceedings of the 26th Conference of Open Innovations Association FRUCT, 2020, pp. 67–73, doi: 10.23919/fruct48808.2020.9087546.
14. A. Poletaev, I. Paramonov, and E. Boychuk, “Automatic Detection of Sentiment Towards Explicit Aspect in Russian Publicism Sentences Using Syntactic Structure,” in Proceedings of the 36th Conference of Open Innovations Association FRUCT, 2024, pp. 593–602.
15. M. A. Pil'gun, “Rechevye osobennosti politicheskoj kommunikacii,” Proceedings of Kazan University. Humanities Sciences Series, vol. 152, no. 2, pp. 236–246, 2010.
16. Y. Song and others, “Targeted Sentiment Classification with Attentional Encoder Network,” in Artificial Neural Networks and Machine Learning – ICANN 2019: Text and Time Series, 2019, pp. 93–103, doi: 10.1007/978-3-030-30490-4_9.
17. J. Ansel and others, “PyTorch 2: Faster Machine Learning Through Dynamic Python Bytecode Transformation and Graph Compilation,” in ASPLOC'24: Proceedings of the 29th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2, 2024, pp. 929–947, doi: 10.1145/3620665.3640366.
18. A. Naumov and others, “Neural-network method for determining text author’s sentiment to an aspect specified by the named entity,” in CEUR Workshop Proceedings, 2020, vol. 2648, pp. 134–143.
19. Y. Wang, L. Wu, J. Li, X. Liang, and M. Zhang, “Are the BERT family zero-shot learners? A study on their potential and limitations,” Artificial Intelligence, vol. 322, p. 103953, 2023, doi: 10.1016/j.artint.2023.103953.
20. A. Golubev, N. Rusnachenko, and N. Loukachevitch, “RuSentNE-2023: Evaluating Entity-Oriented Sentiment Analysis on Russian News Texts,” in Computational Linguistics and Intellectual Technologies: Papers from the Annual conference “Dialogue” (2023), 2023, vol. 22, pp. 130–141, doi: 10.28995/2075-7182-2023-22-130-141.
21. D. Ma and others, “Interactive attention networks for aspect-level sentiment classification,” in Proceedings of the 26th International Joint Conference on Artificial Intelligence, 2017, pp. 4068–4074, doi: 10.5555/3171837.3171854.
22. A. Y. Poletaev, I. V. Paramonov, and E. I. Boychuk, “Semantic rule-based sentiment detection algorithm for Russian publicism sentences,” Modeling and Analysis of Information Systems, vol. 30, no. 4, pp. 394–417, 2023, doi: 10.18255/1818-1015-2023-4-394-417.
23. A. Y. Poletaev, I. V. Paramonov, and E. I. Boychuk, “Algorithm of constituency tree from dependency tree construction for a Russian-language sentence,” Informatics and Automation, vol. 22, no. 6, pp. 1323–1353, 2023, doi: 10.15622/ia.22.6.3.
24. D. Chandrasekaran and V. Mago, “Evolution of semantic similarity — a survey,” ACM Computing Surveys (CSUR), vol. 54, no. 2, pp. 1–37, 2021, doi: 10.1145/3440755.
25. A. Kutuzov and E. Kuzmenko, “WebVectors: A Toolkit for Building Web Interfaces for Vector Semantic Models,” in Analysis of Images, Social Networks and Texts: 5th International Conference, AIST 2016, Yekaterinburg, Russia, April 7--9, 2016, Revised Selected Papers, Cham: Springer International Publishing, 2017, pp. 155–161.
26. M. Korobov, “Morphological Analyzer and Generator for Russian and Ukrainian Languages,” in Analysis of Images, Social Networks and Texts, vol. 542, Springer International Publishing, 2015, pp. 320–332.
27. P. Qi and others, “Stanza: A Python Natural Language Processing Toolkit for Many Human Languages,” in Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: System Demonstrations, 2020, pp. 101–108, doi: 10.18653/v1/2020.acl-demos.14.
Рецензия
Для цитирования:
Полетаев А.Ю., Парамонов И.В., Бойчук Е.И. Методы определения тональности по отношению к аспектам социально-экономического развития в предложениях на русском языке. Моделирование и анализ информационных систем. 2024;31(4):362-383. https://doi.org/10.18255/1818-1015-2024-4-362-383
For citation:
Poletaev A.Y., Paramonov I.V., Boychuk E.I. Methods of sentiment detection towards aspect of economic and social development in Russian sentences. Modeling and Analysis of Information Systems. 2024;31(4):362-383. (In Russ.) https://doi.org/10.18255/1818-1015-2024-4-362-383