Корзина (0)
В корзине пусто!
«Библиометрические инструменты в помощь исследователю». Gephi. Первое знакомство

«Библиометрические инструменты в помощь исследователю». Gephi. Первое знакомство

2995
0
8 Ноября, 2018

В предыдущих частях, к которым читатель всегда может вернуться, мы использовали VOSviewer для того, чтобы препарировать массив научных публикаций, посвященных пептид-нуклеиновым кислотам (PNA). Попытки разглядеть уникальные научные направления через ключевые слова и термины особого удовольствия нам не доставили, после чего мы решили попробовать анализировать массив поэтапно сначала выделить коллективы, а потом уже каждый коллектив охарактеризовать с помощью ключевых слов. И делать мы это будем в замечательной программе Gephi. 

Программа Gephi (https://gephi.org) замечательна во многих смыслах:

– во-первых, она распространяется по открытой лицензии, что позволяет использовать её не только нам, но и программистам со всего мира разрабатывать дополнительные модули для решения новых задач;

– во-вторых, имеет очень гибкие настройки отображения графов, позволяя пользователю регулировать анализ, укладку и отрисовку сетевых структур, чем эта программа заслужила свое негласное название Photoshop для графов

– в-третьих, у программы есть русскоязычный интерфейс.

 

Единственная сложность – установка самой программы, которая на некоторых компьютерах ищет Javaи не находит. Но эта проблема решается редактированием одной строки в текстовом файле  и больше не беспокоит, поэтому мы про нее забудем.

В конце поста будут приведены несколько полезных ссылок и примеров, которые помогут вам узнать о Gephi больше.

Установка, системные требования

Подготовка данных в Gephi

Gephi может прочитать файлы в различных форматах.

Поскольку эта серия нацелена на аудиторию исследователей, не занимающихся анализом сетевых структур или той же библиометрией, в этом и следующих постах мы сосредоточимся на создании интересующих нас графов из самых простых текстовых файлов.

Для загрузки в Gephi сетевой структуры необходимо подготовить два текстовых файла:

 

1. Файл с вершинами (объекты), в котором должно быть поле Id. 

2. Файл с ребрами (связи), в котором должны быть поля Source иTarget.

Вспомним, что мы подобные файлы уже сохраняли, работая с VOSviewer – их можно скачать по ссылке http://bit.ly/2D76oko (архив zip, 2 файла txt).

Файл map содержал поле Id, нам остается лишь вручную поменять его расширение (с txt на csv). 

Файл network содержал 3 поля, первые два из которых и есть необходимые Source и Target. Открываем файл network в Блокноте, вставляем первую строку с названиями Source, Target, Weight, после чего сохраняем файл с расширением csv.

Всё готово, приступаем к загрузке данных.

 

Загрузка информации об объектах

Gephi> Создать проект (Ctrl+Shift+N) >> Вкладка «Лаборатория данных» >> Таблица данных >> Узлы >>  «Импортировать из CSV» >> выбираем файл map (его надо переименовать)

 

 

На первом шаге программа распознает структуру файла:  

 

 

На втором шаге позволяет выбрать загружаемые столбцы и указать их правильный формат. Мы оставляем выделенными все столбцы, кроме x и y(это координаты укладки в VOSviewer, нам они больше не понадобятся).  

 

На заключительной стадии Gephi сообщает, что данные загружены без ошибок – 264 узла и 0 ребер. 

 

Выбираем тип графа «Неориентированное» и нажимаем ОК.

 

В таблице данных должна появиться информация об узлах.

 

Загрузка информации о связях

Теперь загрузим информацию о связях между объектами (то есть ребра).

На той же Таблица данных >> Рёбра  >>  «Импортировать из CSV» >> выбираем файл network (его надо модифицировать, см. выше).

Первые два этапа не требуют модификации, на последнем этапе необходимо снова выбрать Неориентированный граф и сделать самый важный шаг – указать программе, что данные о связях следует добавить к уже имеющимся данным об объектах (Append to existing workplace).

 

 

Voila! Данные должны быть на обоих листах Таблицы данных (Узлы и Ребра).

 

Модификация данных

 

Вкладка «Лаборатория данных» очень похожа на Excel тем, что позволяет просматривать, фильтровать, копировать и вставлять данные в привычном табличном представлении. Пользователь может модифицировать данные без необходимости их повторной загрузки в систему. 

Например, на листе Узлы есть удобный фильтр, с помощью которого мы можем выделить авторов, чья фамилия (записанная в поле label) начинается с am (для этого используем регулярное выражение ^am).

 

Выделив авторов и нажав Ctrl-T(клик правой кнопкой мыши >> TagNode), мы можем ввести для данной группы авторов специальный тэг, который впоследствии может быть использован для задания цвета или размера узлов и их надписей.

 

Настройка отображения

 

Выбираем вкладку «Обработка» (слева наверху) и видим панели для настройки отображения.

 

Вкратце перечислим основные возможности:

  • для узлов можно задать цвет и размер (а также цвет и размер надписи)
  • для связей можно задать цвет (а также цвет и размер надписей)
  • размер задается через количественную переменную, которая может как присутствовать в загруженных данных, так и генерироваться в Gephi (через формулы в Лаборатории данных или через инструменты статистического анализа во вкладке Статистики)
  • цвет можно задавать через количественную переменную (значения которой будут укладываться вдоль цветового градиента) и через качественную переменную (значениям которой будут присвоены цвета одной из палитр)
  • укладка графа регулируется на одноименной вкладке
  • вкладка Фильтрпозволяет легко манипулировать связями и узлами с помощью фильтров, регулярных выражений и логических операторов.

Помимо этого Gephi предлагает разнообразные инструменты для раскрашивания графа и ручной корректировке узлов и связей и много другое.

 

Перечисленные возможности вряд ли можно перепробовать за несколько часов, не говоря уже о том, чтобы вместить в текст. Поэтому мы сделаем паузу и отложим настройку графа соавторов до следующего раза. 

 

Читатели могут поэкспериментировать сами с полученным графом, а также познакомиться с дополнительными материалами:

Англоязычные источники:

  • Видео(в том числе и на русском языке)
  • Канал с презентациями о Gephi (здесь на пути нашего стремления к знаниями встанет трехбуквенная аббревиатура РКН. Побеждается другими трехбуквенными заклинаниями, напр. VPN)
  • Gephi Cookbook (14-дневный тестовый доступ к книге)
  • Форум 

P.S. Почему Gephi? 

 

Я считаю, что выбирая между Gephiи любой специализированной программой для анализа публикаций, следует обратить внимание именно на первый продукт из-за его универсальности, применимости для решения задач, выходящих далеко за рамки наукометрических экзерсисов. Любой исследователь сталкивается с данными, которые можно представить в виде сетевой структуры, в некоторых случаях такой эксперимент оправдан и позволяет выявить новые закономерности. На мой взгляд, умение работать с Gephi – такой же полезный навык для исследователя, как  владение современными текстовыми процессорами (напр. Word,Libre Office) или графическими редакторами (Photoshop, InkScape).

2995
0
8 Ноября, 2018
Ваш комментарий будет первым

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, пользовательских данных (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) в целях функционирования сайта, проведения ретаргетинга и проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.

x