Microsystems, Ltd/
 Home  | News | Technology | Products | Downloads | Contact Us |   11 December 2017

 

 

Technology

Technology Home Page
Approach

Text analisis

Bibliography
Interim Review by Colleen E. Crangle

Search

© 2001 Microsystems, Ltd.
 All rights reserved.
Terms of use
.

    

Технология автоматического анализа текстов

Наиболее серьезной проблемой, возникающей при работе с текстовым материалом большого объема, пожалуй, является поиск интересующей информации. Большая удача, если тексты уже знакомы и удается вспомнить какие-нибудь ключевые слова, описывающие искомое. В этом случае с возникшей задачей неплохо справятся традиционные информационно-поисковые средства. Но как быть, если вы затрудняетесь подобрать нужные слова? Что делать, если нужно найти что-то новое, о чем ранее вы вообще не имели понятия? К сожалению, в большинстве случаев возникает именно подобная ситуация, когда приходится искать то, “точно не зная, что…”. И именно поиск неожиданной информации всегда представляет наибольший интерес - ведь новые знания не лежат “под фонарем”! 

Функция смыслового поиска позволяет получить ответ на запрос, сформированный в виде фразы естественного языка, словосочетаний или же просто набора ключевых слов. При этом извлекаемая в ответ информация может не только иметь другую грамматическую форму, но и вообще не упоминаться в тексте запроса, однако имеет с ним смысловую связь. Например, в ответ на запрос “финансовые преступления” вы можете фрагменты текста, в которых говорится о подложных чеках. 

Вы можете ввести запрос с клавиатуры, либо задать его участком текста, что реализует гипертекстовые ссылки. 

Результаты ответа на запрос вы увидите на экране в виде двух списков. 

Прежде всего, обратите внимание на список в окне 2. В нем представлены предложения текстов, включающие ключевые слова запроса – те, которые совпали с понятиями семантической сети. Предложения в списке упорядочены по количеству совпавших понятий, которые выделены цветом. Выбрав интересующее предложение, щелкните мышью на нем – в окне 3 вы увидите соответствующий фрагмент текста. 

Если же результаты поиска не совсем устраивают, или же вы хотите получить дополнительную информацию, обратитесь к списку в окне 1. В нем представлены понятия семантической сети, упорядоченные по близости к запросу (степень близости – от 1 до 100 - показана цифрой). Обратите внимание, что большинство понятий списка не были упомянуты в запросе. Однако TextAnalyst показывает, что в текстах имеется информация, связанная по смыслу с искомым. Дальнейшая работа со списком аналогична работе с семантической сетью. Выбрав интересующее понятие, щелкните мышью по значку <+> возле него и раскройте дополнительный список понятий, связанных с ним. Далее, щелкнув мышью по пункту <все> или по выбранному понятию, вы можете просмотреть соответствующие предложения в окне 2. Найдя требуемое предложение, вы увидите соответствующий фрагмент текста в окне 3, щелкнув по нему мышью. 

В случае необходимости вы можете использовать стандартную функцию “формальный поиск” в меню “поиск”, что реализует четкий поиск ключевых слов в исходных текстах. 

Если же вам часто приходится искать информацию определенного вида, воспользуйтесь настройками TextAnalyst, которые позволят всегда находить в текстах заданные понятия и выделять их в семантической сети.

 

 

 

 

Home | News | Technology | Products | Download | Contact Us

 

Яндекс.Метрика