Preview

Моделирование и анализ информационных систем

Расширенный поиск

Лингвостатистический анализ терминологии для построения тезауруса предметной области

https://doi.org/10.18255/1818-1015-2015-6-834-851

Аннотация

Работа посвящена анализу корпуса терминов и терминологических источников с целью дальнейшей автоматизации построения тезауруса данной предметной области, в качестве которой рассматривается поэтология. Предварительная систематизация терминологии с использованием лингвостатистического подхода формирует корпус семантически связанных понятий для автоматизации извлечения семантических отношений между терминами, определяющих структуру тезауруса указанной предметной области.

Об авторе

М. С. Каряева
Ярославский государственный университет им. П.Г. Демидова
Россия

аспирант,

ул. Советская, 14, г. Ярославль, 150000 



Список литературы

1. Лингвистическая онтология «Тезаурус Рутез», http://www.labinform.ru/pub/ruthes/.

2. Тезаурус WordNet, http://wordnet.princeton.edu/.

3. Бойков В. Н. и др., “Тезаурус как инструмент поэтологии”, Моделирование и анализ информационных систем, 17:1 (2010), 5–24; [Boikov V. N. et al., “Thesaurus as a poetological tool”, Modeling and Analysis of Information Systems, 17:1 (2010), 5–24, (in Russian).]

4. Бойков В. Н., “Семантическая модель «Тезауруса по поэтологии» в составе информационно-аналитической системы”, Материалы научной конференции «Интернет и современное общество», 2013, 273–279; [Boikov V. N., “Semanticheskaya model «Tezaurusa po poehtologii» v sostave informacionno-analiticheskoj sistemy”, Materialy nauchnoj konferencii «Internet i sovremennoe obshchestvo», 2013, 273–279, (in Russian).]

5. Бойков В. Н., “Предметно-ориентированный тезаурус в открытой информационно-аналитической системе”, RCDL’2013 «Электронные библиотеки: перспективы, методы и технологии, электронные коллекции», 2013, 70–76; [Boikov V. N., "Predmetnoorientirovannyj tezaurus v otkrytoj informacionno-analiticheskoj sisteme”, RCDL’2013 «Ehlektronnye biblioteki: perspektivy, metody i tekhnologii, ehlektronnye kollekcii», 2013, 70–76, (in Russian).]

6. Тезаурус по поэтологии, http://wikipoetics.ru/.

7. Hearst M. A., “Automated discovery of WordNet relations”, WordNet: an electronic lexical database, 1998, 131–153.

8. Панченко А. И., “Извлечение семантических отношений из статей Википедии с помощью алгоритмов ближайших соседей”, Открытые системы, 16 (2012), 18–27; [Panchenko A. I., “Izvlechenie semanticheskih otnoshenij iz statej Vikipedii s pomoshchyu algoritmov blizhajshih sosedej”, Otkrytye sistemy, 16 (2012), 18–27, (in Russian).]

9. Serelex: Поиск семантически связных слов, http://serelex.org/ru.

10. Киселев Ю. А., “Метод извлечения родовидовых отношений между существительными из определений толковых словарей”, Программная инженерия, 10 (2015), 38–48; [Kiselev YU. A., “Metod izvlecheniya rodovidovyh otnoshenij mezhdu sushchestvitelnymi iz opredelenij tolkovyh slovarej”, Programmnaya inzheneriya, 10 (2015), 38–48, (in Russian).]

11. Краткая литературная энциклопедия, Сов. Энцикл., 1962–1978; [ Kratkaya literaturnaya ehnciklopediya, Sov. Ehncikl., 1962–1978, (in Russian).]

12. Литературная энциклопедия, Ком. акад., 1929–1939; [ Literaturnaya ehnciklopediya, Kom. akad., 1929–1939, (in Russian).]

13. Словарь литературных терминов, Изд-во Л. Д. Френкель, 1925; [ Slovar literaturnyh terminov, Izd-vo L. D. Frenkel, 1925, (in Russian).]

14. Квятковский А. П., Поэтический словарь, Сов. Энцикл, 1966; [Kvyatkovskij A. P., Poehticheskij slovar, Sov. Ehncikl, 1966, (in Russian).]

15. Большая советская энциклопедия, Сов. энцикл., 1969–1978; [ Bolshaya sovetskaya ehnciklopediya, Sov. ehncikl, 1969–1978, (in Russian).]

16. Зализняк А. А., Грамматический словарь русского языка, Словоизменение, 1980; [Zaliznyak A. A., Grammaticheskij slovar russkogo yazyka, Slovoizmenenie, 1980, (in Russian).]

17. Mystem, https://tech.yandex.ru/mystem/.

18. Segalovich I., “A Fast Morphological Algorithm with Unknown Word Guessing Induced by a Dictionary for a Web Search Engine”, MLMTA, 2003, 273–280.

19. PyMystem, https://pypi.python.org/pypi/pymystem3/0.1.1.

20. PyMorphy2, https://pymorphy2.readthedocs.org/en/latest/.

21. OpenCorpora, http://opencorpora.org/.

22. FrameWork Django, https://www.djangoproject.com/.

23. Ляшевская О. Н., Частотный словарь современного русского языка (на материалах Национального корпуса русского языка), Азбуковник, 2009; [Lyashevskaya O. N., Chastotnyj slovar sovremennogo russkogo yazyka (na materialah Nacionalnogo korpusa russkogo yazyka), Azbukovnik, 2009, (in Russian).]


Рецензия

Для цитирования:


Каряева М.С. Лингвостатистический анализ терминологии для построения тезауруса предметной области. Моделирование и анализ информационных систем. 2015;22(6):834-851. https://doi.org/10.18255/1818-1015-2015-6-834-851

For citation:


Karyaeva M.S. Linguistic and Statistical Analysis of the Terminology for Constructing the Thesaurus of a Specified Field. Modeling and Analysis of Information Systems. 2015;22(6):834-851. (In Russ.) https://doi.org/10.18255/1818-1015-2015-6-834-851

Просмотров: 1528


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)