Проблеми на устната комуникация
ВЕЛИКОТЪРНОВСКИ УНИВЕРСИТЕТ "СВ. СВ. КИРИЛ И МЕТОДИЙ" - УНИВЕРСИТЕТСКО ИЗДАТЕЛСТВО

Туитовете като предизвикателство пред автоматичната лингвистична обработка


Автори:
Петя Осенова СУ "Св. Климент Охридски", България

Страници: 205-216

Резюме:

Обект на статията са особеностите на писмената раз- говорна реч в туитовете като предизвикателство за автоматичния езиков анализ. Този анализ включва: сегментиране на текста на думи; морфологичен анализ по части на речта и техните гра- матични характеристики; депендентен синтактичен анализ; разпознаване на имена на хора, локации, организации; раз- познаване на абревиатури. Проблемите, които възникват, са свързани предимно: с думи, които не са в речника; със сливане на думи; с разговорни варианти на изрази без нормализация към книжовни съответствия и др. Изследването използва 630 туита на български език, свързани с банковата криза на КТБ и ПИБ през 2014 г.


Ключови думи:

туит, български език, автоматична лингвистична обработка, писмена разговорна реч

Изтегляне


91 изтегляния от 12.10.2020 г.