Построение модели для извлечения оценочной лексики в различных предметных областях


https://doi.org/10.18255/1818-1015-2013-2-70-79

Полный текст:


Аннотация

В данной работе предлагается новый подход к извлечению оценочных слов для различных предметных областей. В рамках этого подхода была разработана модель, включающая набор характеристик и комбинацию алгоритмов, которые позволяют извлекать оценочные слова в конкретной предметной области. Данная модель была обучена в предметной области о фильмах и затем применена в четырёх других областях. Качество работы метода оценивалось на основании разметки экспертов и оставалось на высоком уровне при переносе модели на различные предметные области. Кроме того, созданная модель была использована в предметной области о фильмах на английском языке и продемонстрировала высокое качество извлечения оценочных слов.

Об авторах

Наталья Валентиновна Лукашевич
Московский государственный университет
Россия

Научно-исследовательский вычислительный центр, ведущий научный сотрудник,

119991, Москва, ГСП-1, Ленинские горы, д. 1, стр. 4



Илья Игоревич Четвёркин
Московский государственный университет
Россия

Факультет вычислительной математики и кибернетики, аспирант,

119991, Москва, ГСП-1, Ленинские горы, д. 1, стр. 52



Список литературы

1. Ahmad K., Gillam L., Tostevin L. University of Surrey participation in Trec8: Weirdness indexing for logical document extrapolation and retrieval (wilder) // The Eighth Text REtrieval Conference (TREC-8), 1999.

2. Aue A. and Gamon M. Customizing sentiment classifiers to new domains: A case study // Proceedings of recent advances in natural language processing (RANLP). 2005.

3. Blitzer J., Dredze M., Pereira F. Biographies, bollywood, boom-boxes and blenders: Domain adaptation for sentiment classification // Annual Meeting-Association For Computational Linguistics. 2007. V. 45. P. 440–447.

4. Callan J.P. Croft W.B., Harding S.M. The INQUERY retrieval system // Proceedings of the third international conference on database and expert systems applications. 1992.

5. Choi Y., Cardie C. Adapting a polarity lexicon using integer linear programming for domain-specific sentiment classification // Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing. 2009. V. 2. P. 590–598.

6. Ding X., Liu B., Yu P.S. A holistic lexicon-based approach to opinion mining // Proceedings of the international conference on Web search and web data mining. 2008. P. 231–240.

7. Esuli A., Sebastiani F. Determining the semantic orientation of terms through gloss classification // Proceedings of the 14th ACM international conference on Information and knowledge management. 2005. P. 617–624.

8. Hu M., Liu B. Mining and summarizing customer reviews // Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining. 2004. P. 168–177.

9. Jijkoun V., de Rijke M., Weerkamp W. Generating focused topic-specific sentiment lexicons // Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. 2010. P. 585–594.

10. Kanayama H., Nasukawa T. Fully automatic lexicon expansion for domain-oriented sentiment analysis // Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing. 2006. P. 355–363.

11. Lu Y., Castellanos M., Dayal U., Zhai C.X. Automatic construction of a context-aware sentiment lexicon: an optimization approach // Proceedings of the 20th international conference on World wide web. 2011. P. 347–356.

12. Neviarouskaya A., Prendinger H., Ishizuka, M. Sentiful: Generating a reliable lexicon for sentiment analysis // Affective Computing and Intelligent Interaction and Workshops. 2009. P. 1–6.

13. Pan S.J., Ni X., Sun J.T., Yang Q., Chen Z. Cross-domain sentiment classification via spectral feature alignment // Proceedings of the 19th international conference on World wide web. 2010. P. 751–760.

14. Pang B., Lee L. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval. Hanover, Massachusetts: Now Publishers, 2008.

15. Ponomareva N., Thelwall M. Biographies or blenders: which resource is best for crossdomain sentiment analysis? // Computational Linguistics and Intelligent Text Processing. 2012. P. 488–499.

16. Taboada M., Brooke J., Tofiloski M., Voll, K., Stede M. Lexicon-based methods for sentiment analysis // Computational Linguistics. 2011. V. 37(2). P. 267–307.

17. Velikovich L., Blair-Goldensohn S., Hannan K., McDonald R. The viability of web-derived polarity lexicons // Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics. 2010. P. 777–785.

18. Wu Q., Tan S., Cheng X. Graph ranking for sentiment transfer // Proceedings of the ACL-IJCNLP. 2009. P. 317–320


Дополнительные файлы

Для цитирования: Лукашевич Н.В., Четвёркин И.И. Построение модели для извлечения оценочной лексики в различных предметных областях. Моделирование и анализ информационных систем. 2013;20(2):70-79. https://doi.org/10.18255/1818-1015-2013-2-70-79

For citation: Loukachevitch N.V., Chetviorkin I.I. Construction of a Model for the Cross-Domain Opinion Word Extraction. Modeling and Analysis of Information Systems. 2013;20(2):70-79. (In Russ.) https://doi.org/10.18255/1818-1015-2013-2-70-79

Просмотров: 379

Обратные ссылки

  • Обратные ссылки не определены.


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)