
«Библиометрические инструменты в помощь исследователю». Ключевые слова. Часть первая: подводные камни поиска
Алексей Лутай
Итак, вы заинтересовались новой научной темой и открыли поисковую систему Scopus. Что определяет ее работу? Можно назвать два важных компонента – механизм поиска (правила обращения к определенным полям базы данных) и качество контента (однородность наполнения и частота ошибок).
Возможности поисковой системы Scopus опубликованы на сайте Elsevier в виде описания правил обращения к базе (команды, операторы, поля), поэтому мы не будем их обсуждать. Вместо этого мы поговорим о том, как влияют особенности описания документов в Scopus на качество поиска.
Поисковая машина обращается к описаниям документов, которые могут ощутимо различаться по наполнению отдельных полей.
Так, если журнал индексируется не только в Scopus, но и в базах данных Reaxys, Embase или Compendex, также принадлежащих Elsevier, то из последних в Scopus попадают словарные термины (index terms) и идентификаторы химических соединений (chemical names). На рисунке представлен фрагмент описания публикации из журнала Angewandte Chemie - International Edition (10.1002/anie.201305489), в котором помимо названия статьи, реферата и авторских ключевых слов присутствуют термины из нескольких «словарей» (EMTREE, MeSH и др.) и CAS номера химических соединений.

Таким образом, добавление словарных терминов, с одной стороны, значительно повышает чувствительность поиска, с другой – снижает его специфичность.
Необходимо также учитывать, что Scopus охватывает больше изданий, чем перечисленные базы данных, поэтому некоторые статьи там не содержат в своем описании ни index terms, ни CAS идентификаторов.
И, наконец, в Scopus (как в любой реферативной базе данных) можно встретить документы, в описании которых отсутствует реферат и/или авторские ключевые слова, таким образом, поиск будет осуществляться только по названию документа.
Резюмируем. Выбор поисковой стратегии – это всегда компромисс между чувствительностью и специфичностью, выбор между усилиями, необходимыми для обнаружения документов с недостаточным описанием, и теми, которые потребуются для отбора малорелевантных статей из результатов поиска.