Microsystems, Ltd/
 Home  | News | Technology | Products | Downloads | Contact Us |   11 December 2017

 

 

Technology

Technology Home Page
Approach

Text analisis

Bibliography
Interim Review by Colleen E. Crangle

Search

© 2001 Microsystems, Ltd.
 All rights reserved.
Terms of use
.

    

Технология автоматического анализа текстов

Как уже отмечалось, семантическая сеть дает исчерпывающее наглядное представление о содержании текста - информация сети отражает все потенциально присутствующие смысловые связи, что с точки зрения полноты смыслового портрета, конечно же, превосходно. Однако, следует помнить, что сеть есть сеть - все пары понятий связаны двусторонне и каждый смысловой путь - бесконечен, так как может пересекаться сам с собой. Такая множественность связей вполне понятна с точки зрения формального описания семантики, однако едва ли удобна, когда дело касается более привычных структурированных представлений, когда связи идут от главного к второстепенному. Избежать подобного неудобства, а главное - взглянуть на текст иным образом поможет представление семантической сети в виде так называемой тематической структуры 
Тематическая структура описывает содержание анализируемых текстов в виде иерархии связанных тем и подтем, раскрывающих содержание тем. Все темы и подтемы выражаются понятиями исходных текстов и соответствуют элементам семантической сети. Однако связи между понятиями односторонни и направлены от главного понятия к подчиненным. В результате представление тематической структуры текста оказывается иерархическим – от каждой темы раскрываются связи только к ее подтемам, от них – к подтемам следующего уровня и так далее, вплоть до самых незначительных тем, уже не имеющих нисходящих связей. Тематическая структура, таким образом, имеет вид древа, в корне которого стоят главные темы, в ветвях – подтемы, и каждая ветвь дерева заканчивается. Общий вид тематической структуры отражает смысловую структуру текстов. Так, если вся информация в текстах подчинена единой теме, структура будет иметь вид дерева с единственным корнем. Если же содержание текстов политематично, то вместо дерева мы видим целый "лес" независимых кустов, корни которых представляют главные темы, несвязанные друг с другом.

В дополнение к этому, TextAnalyst предоставляет возможность регулировать форму тематического дерева. Изменение порога по весу связей в семантической сети (разрыв более или менее сильных связей) изменяет вид дерева, разбивая его на большее или меньшее количество тематических кустов. В результате появляется возможность взглянуть на структуру текста в различных срезах, на разных уровнях глубины материала. 

В остальном, с точки зрения интерфейса работа с тематической структурой, описываемая ниже, полностью аналогична работе с семантической сетью. 

Тематическая структура представляется в окне 1 в виде дерева понятий. 

Понятия представляют названия тем, и некоторые из них имеют раскрывающиеся ветви связей с подтемами. Понятия в корне дерева представляют список главных тем анализируемых текстов, а связанные с ними элементы в ветвях последующих уровней дерева - списки подтем, в которых разворачиваются главные темы. 

Щелкнув мышью на значке <+> возле выбранного понятия, вы можете раскрыть список всех понятий, связанных с ним. Щелчком мыши на значке <-> возле понятия с раскрытым списком вы закроете его обратно. Так же, как в семантической сети, численное значение возле понятия представляет его вес, а второе значение (перед ним) - вес связи с понятием в вершине раскрытого списка. 

Чтобы просмотреть всю информацию по интересующему понятию, щелкните мышью на первом пункте <все> раскрытого списка. В окне 2 появятся все предложения текстов, включающие понятие. Само понятие выделяется цветом. 

Если же вас интересует не вся информация по понятию, а лишь та, которая касается его связи с одним из понятий раскрытого списка, щелкните мышью по второму понятию. В окне 2 появятся все предложения текстов, в которых встречалась эта пара понятий. Оба понятия выделены цветом. 

Выбрав интересующее предложение в окне 2, просто щелкните по нему мышью – и в окне 3 появится соответствующий фрагмент исходного текста. Вы можете настраивать вид тематической структуры на экране, изменяя количество отображаемых понятий и связей, способ их сортировки, а также количество кустов в дереве. 

 

 

 

 

Home | News | Technology | Products | Download | Contact Us

 

Яндекс.Метрика