Активировать демодоступ

Секретариат

Что дает применение семантического анализа текста?

10 мая 2016
155
Средний балл: 0 из 5

Вопрос

Что полезного может дать применение средств семантического анализа текста для поиска? И на каком этапе развития «умный» поиск сейчас находится в российских разработках СЭД?

Ответ

Семантический анализ текста позволяет извлечь гораздо больше информации из массивов документов, чем простой полнотекстовый поиск. Поскольку обычно в корпоративных системах документооборота накапливаются значительные объемы документов, традиционные полнотекстовые или атрибутивные поиски оказываются малоэффективными, а также требуют дополнительных затрат на анализ результатов. Ручные классификации и раскладки документов по папкам также слишком трудоемки и имеют множество ограничений.


Более подробно о системе электронного документооборота вы можете узнать в статье.


Итак, важно отметить, что семантический анализ текста в первую очередь имеет смысл использовать при реально больших (промышленных) объемах информации, во-вторых, эти объемы информации желательно должны быть регулярными или организованы в корпоративные системы электронного документооборота. Но самое важное заключается в тех задачах, которые вы собираетесь решать с помощью такого поиска.

Семантический анализ текстов используется обычно в специальных целях, например, для выявления неявных связей между документами, внутренних противоречий в документах, а также противоречий между документами.

Например, в большой организации, где имеется большое количество должностных инструкций для совершенно различных категорий персонала, часто бывает важно выявить, имеются ли противоречия в должностных инструкциях. Простыми средствами тут явно не обойтись. В качестве еще одного примера можно привести задачу сканирования почты сотрудников режимных предприятий для предотвращения утечек информации.

На самом деле, основными потребителями такого рода поиска являются разнообразные службы информационной безопасности, включая службы информационной разведки и контрразведки. Другими словами, в практической работе подавляющего большинства служб документационного обеспечения семантический поиск вряд ли будет применяться широко.

Имеется целый ряд российских систем, которые обеспечивают средства семантического анализа и поиска в больших объемах текстов. На фоне некоторого количества узкоспециализированных разработок выгодно выделяются разработки компании ABBYY, которая аккумулировала в них свой огромный опыт и уникальные знания в области прикладной лингвистики.

Видимо, во вполне обозримой перспективе средства семантического поиска будут так же доступны, как автоматические переводчики или средства трехмерного проектирования. Только перед их установкой рекомендуем как следует подумать о том, действительно ли они вам нужны и сможете ли вы самостоятельно, без участия специалистов, правильно их настроить и понять полученные результаты.

×
Простите, что прерываем Вас

Все документы на нашем сайте находятся в закрытом доступе. Зарегистрируйтесь, чтобы получить доступ ко всем материалам и скачивать любые файлы.

У меня есть пароль
напомнить
Пароль отправлен на почту
Ввести
Введите эл. почту или логин
Неверный логин или пароль
Неверный пароль
Введите пароль
Я тут впервые
или войти через соцсети
Зарегистрироваться
Сайт использует файлы cookie. Они позволяют узнавать вас и получать информацию о вашем пользовательском опыте. Это нужно, чтобы улучшать сайт. Посещая страницы сайта и предоставляя свои данные, вы позволяете нам предоставлять их сторонним партнерам. Если согласны, продолжайте пользоваться сайтом. Если нет – установите специальные настройки в браузере или обратитесь в техподдержку.