
«Библиометрические инструменты в помощь исследователю». Ключевые слова. Часть четвёртая: VOSviewer-2
В предыдущей части мы использовали VOSviewerдля того, чтобы через анализ ключевых слов выделить отдельные исследовательские направления, связанные с использованием пептид-нуклеиновых кислот. В этот раз мы попытаемся решить эту задачу с помощью другой доступной опции VOSviewer, а именно с помощью анализа названий и рефератов статей.
VOSviewer использует свой собственный алгоритм для выделения существительных (и словосочетаний на их основе), что позволяет увидеть и анализировать более разнообразный набор терминов по сравнению с ключевыми словами.
Шаг 1. запускаем файл VOSviewer.exe
Шаг 2. нажимаем Create
Шаг 3. выбираем Create a map based on text data
Шаг 4. выбираем файл CSV, выгруженный из Scopus
Шаг 5. оставляем выделенными пункты
v Ignore structured abstract labels
v Ignore copyright statements
Шаг 6. Выбираем анализ только названий статей
Анализ по названиям удобен для получения быстрой картины, но также предпочтителен, поскольку в названиях, как правило, содержится больше специфических терминов, чем в рефератах.
Шаг 7. выбираем binary counting – тип подсчета, при котором учитывается не количество упоминаний термина внутри названия (или реферата), а только присутствие (1 – если термин встречается, 0 – если термин отсутствует).
На этом же этапе можно указать программе на файл с тезаурусом (см. предыдущий пост), что мы и сделаем.
Шаг 8. Устанавливаем минимальный порог упоминаний на 4, что позволит нам увидеть 260 терминов.
Шаг 9. Не соглашаемся с предложением программы показывать только часть терминов – указываем 260.
Шаг 10. Программа предлагает нам вновь редактировать список терминов, который отфильтрован по убыванию релевантности. Это удобно, поскольку в верхней части таблицы собраны более значимые термины, а в нижней – более общие. В этом списке удаляем всё, что слабо характеризует направление исследований (case report, study, reaction, use, sequence, human cell и т.п.).
Любуемся результатом.
Заключение
Очевидно, что использование VOSviewer для терминологического анализа темы имеет ограничения:
-
во-первых, из-за присутствия синонимов, словоформ и аббревиатур работа с тезаурусом неизбежна
-
во-вторых, программа не позволяет манипулировать отдельными узлами, объединять их в получившемся графе или переносить на отдельный граф, что лишает исследователя возможности сразу увидеть результат задуманных действий – для этого требуется повторно проходить этапы отбора и фильтрации.
В дополнение к этому, программа предлагает ограниченные возможности влиять на укладку графа - выбор пользователя сводится к перебору нескольких алгоритмов. В следующих постах мы рассмотрим программу Gephi, которая имеет несравнимо более богатый функционал для работы с графами.
Однако перечисленные недостатки нивелируются несомненными достоинствами
VOSviewer, к которым следует отнести простоту использования, скорость работы, гибкость в плане загрузки и выгрузки данных, возможность работы с материалами из разных баз данных.
Рассмотренная нами задача и примеры решения являются, безусловно, умозрительными – большинство исследователей вместо составления тезауруса предпочтут найти и прочесть хороший обзор о peptide nucleic acids. Специалисты с навыками программирования назовут готовые «пакетные решения» для популярных языков программирования (R, Python) – более того, будут настаивать на том, что лучше потратить время на изучение этих языков, чем на ручную фильтрацию терминов. И первые, и вторые будут правы – чтение хороших обзоров и освоение навыков программирования не повредят ни одному исследователю.
Однако, автор убежден, что и знакомство с VOSviewer (ну не называть же это «освоением») также имеет смысл – по сочетанию простоты и функциональности эта программа не имеет себе равных в отображении связей внутри публикационных массивов.
В следующей части мы поговорим об альтернативном подходе к анализу научной темы.