Американские ученые использовали Твиттер для создания компьютерного алгоритма, обнаруживающего сарказм

Ученые из университета Карнеги — Меллон, который расположен в Питтсбурге, использовали сервис микроблогов Твиттер для того, чтобы научить компьютер распознавать сарказм. Об этом они рассказали в своей научной работе «Контекстное обнаружение сарказма в Твиттере».

tumblr_o14majTcaI1qdkanfo1_500

Обнаружить сарказм в тексте с помощью компьютера не всегда легко, поскольку чаще всего шутки приобретают ироничный смысл только в самом контексте. В своем исследовании ученые учитывали несколько основных факторов, в том числе и ключевые слова. Например, «clearly», «shocked» и «gasp», а также русские аналоги «ага, конечно» и различные хэштеги (#lol и #sarcasm). Они обращали внимание и на местоположение, возраст и пол автора и его связь с другими пользователями, с которыми он общался в своих твитах.

В итоге специалистам удалось создать программу, которая определяет сарказм с вероятностью 85%.

Кроме того, они смогли установить, что больше всего склонны к сарказму мужчины с выдуманным именем в профиле.

— Хэштег #sarcasm чаще всего применялся для пояснения мыслей, которые могут быть неправильно поняты неосведомлённой аудиторией, а не реальным сарказмом, — отмечают ученые.

Ученые считают, что их система поможет автоматически модерировать контент, поскольку бывают случаи, когда шутки в соцсетях воспринимают неправильно.