Леонид Иомдин
Институт проблем передачи информации им. А.А. Харкевича РАН

Фразеология в компьютерной лингвистике

Доклад о том, как при работе с текстом обращаться с идиоматическими выражениями, которые ведут себя не по стандартным правилам, а требуют особых подходов. Обычную структуру предложения можно представить в виде дерева зависимостей, где есть одно слово-вершина, которая ничему не подчиняется, а все остальные слова подчиняются этой вершине прямо или косвенно, так, что у любого невершинного слова есть ровно один хозяин. А во фразеологии может оказаться по-другому. Скажем, в предложении типа «видеть не видел, но…» возникает смысл «имело место что-то более слабое, чем видение» (скажем, «видеть я его не видел, но много слышал о нем»), причем этот смысл выражается не конкретными словами, а конструкцией с повтором. Вот о таких явлениях и пойдет речь, с упором на то, как с ними обращаться в компьютерных задачах.