Авторизация
Логин:
Пароль:
Регистрация
Забыли свой пароль?

Автоматизированное оценивание формулировок научной новизны публикаций


В. О. Толчеев; № 5 (83), 05.2017

Аннотация:

Показаны возможности использования методов интеллектуального анализа текстовых данных (Text Mining) для задач, которые ранее решались с помощью экспертных процедур. Рассмотрены вопросы определения качества научных публикаций, выявления научной новизны и идентификации зарождающихся технологических трендов средствами Text Mining (обнаружение «слабых» сигналов). Отмечена специфика этих проблем и способов их решения. Проведен обзор используемых методов выявления научной новизны. Исследованы способы автоматизированного обнаружения слов-маркеров, характеризующих научную новизну, и на их основе составлены специализированные шаблоны. Сформированы и описаны выборки, содержащие экспертно размеченные документы (авторефераты и научные статьи). Описаны результаты экспериментов по практическому использованию полученных шаблонов (на примере публикаций в области информатики).

Ключевые слова: интеллектуальный анализ данных; выявление маркеров научной новизны; построение шаблонов; библиографические описания; классификация научных статей.


Automated Estimation of the Wording of Scientific Novelty of Publications

Tolcheev V. O.

A possibility of using Text Mining methods for the tasks previously solved by expert procedures is demonstrated. We consider the issues attributed to determination of the scientific novelty of publications and identification of originating technological trends using Text Mining. We also consider the specificity of the problems and their possible solutions, formulate the problem and review the methods used in literature. Methods of automated detection of words-markers which characterize the scientific novelty and their use in creation of specialized templates are studied. The samples containing documents which underwent expert estimations are formed and described to develop the technique of template construction. The results of practical use of the templates thus obtained on the base of analysis of the publications in the field of Computer Science are discussed.

Keywords: text mining; identification of markers of scientific novelty; construction of templates; classification (categorization) of scientific articles.