ABBYY Compreno: новый уровень работы с информацией

✔ Содержание:

Введение



Лингвистическая языковая классификация, как известно, подразумевает существование языков естественных и языков формальных. Первые используется непосредственно людьми для повседневного общения, а вторые – для взаимодействия с какой-либо искусственной системой. Практически все языки программирования – формальные, и искусственный интеллект очень долгое время не мог полноценно анализировать данные на естественном языке. Но у разработанной компанией ABBYY технологии ABBYY Compreno есть шанс это изменить.

ABBYY Compreno: новый уровень работы с информацией


Что такое ABBYY Compreno?



ABBYY Compreno представляет собой высокую технологию, способную сканировать и анализировать информацию, изложенную на естественном языке, а не на формальном, кстати синонимы к слову информация вы можете найти на сайте sinonim.org. В возможности этой технологии входит проведение полноценного, осмысленного анализа массивов текста на естественном языке. Благодаря этой разработке может стать намного легче автоматически извлекать из больших текстов важную информацию.

Процесс работы



Первым делом технология анализирует текст лексически, разделяя его на конкретные предложения. Затем она разбивает предложения на слова и определяет, к какой части речи относится каждое из них. После этого программа начинает воспринимать слова не просто как отдельные элементы, а как часть единого целого, устанавливает связь между ними в предложении. На основе этого организовывается семантическое построение предложения. Наконец, после этого текст анализируется прагматически и представляется в универсальном виде, что обеспечивает возможность для удобного структурирования информации.

Практическое применение



Технология ABBYY Compreno открывает перед пользователем целый ряд уникальных возможностей. Так, она способна выделять омонимы (слова, схожие по написанию, но различные по значению) и определять контекстуальный смысл слов, не путаясь, например, в разных значениях слова «ключ». Это может оказаться очень полезно для поисковых систем. Если же говорить про конкретные частные случаи применения технологии, то стоит упомянуть её использование в проекте ABBYY «Весь Толстой в один клик» - оцифровке полного собрания сочинений Льва Толстого из девяноста томов. Программа оказалась способна установить, сколько раз в тексте упоминаются те или иные персонажи или сколько реплик они говорят. Причем подсчёт шёл независимо от того, как назван персонаж – «Пьер Безухов» или же просто «он». Более «низкие» технологии с таким справиться бы просто не смогли.

Заключение



Хоть ABBYY Compreno по факту и разработана относительно недавно, у этой технологии явно большое будущее. В нашу эпоху обилия информации задача автоматизации процесса анализа текстов на естественном языке актуальна как никогда.
  • Как развивать речь ребёнка так, чтобы она была грамотной
  • Плазменная резка: основные плюсы и минусы технологии
  • Ребенок и иностранные языки
  • Что такое умный дом?
  • Имаджинариум. Настольная игра