Автомобильный портал
Поиск по сайту

Проект "карта российской науки" готов к запуску. Как найти свой персональный номер ID в базе данных Scopus и посмотреть индекс Хирша? Номер личного кабинета в карте российской науки

ПЕРСОНАЛЬНЫЕ ИДЕНТИФИКАТОРЫ УЧЕНЫХ

ResearcherID - это ваше свободное, общедоступное интерактивное пространство для создания индивидуального номера ResearcherID и персонального профиля, идентификатора (ID). Каждому автору присвоен уникальный идентификационный номер (ID), который в дальнейшем позволяет легко находить опубликованные работы конкретного автора, в частности - в базе данных Web of Science. Ваш профиль ResearcherID может содержать данные о ваших институтских объединениях, исследовательских областях, а также список публикаций. Сервис ResearcherID компании Thomson Reuters.

ORCID (Open Researcher and Contributor ID компании ORCID).

ORCID - это реестр уникальных идентификаторов ученых (ID) и способ связи исследовательской деятельности с этими идентификаторами. Идентификаторы ученых используются для подтверждения авторства научных работ в SCOPUS и Web of Science. ORCID уникален благодаря своей независимости от научных дисциплин и национальных границ, а также взаимодействию с другими системами идентификации. ORCID - это некоммерческий проект, цель которого присвоить каждому автору научной статьи свой личный код. Главная задача идентификационного кода состоит в том, чтобы ликвидировать разночтения в именах автора.

Схожесть распространенных имен и фамилий как в одной стране, так и в разных, создает путаницу в идентификации авторов научных статей особенно в больших базах, таких, например, как Scopus. Даже для нашей базы РИНЦ индексация авторов с распространенными и поэтому схожими именами и фамилиями сталкивается со значительными трудностями и в первую очередь для самих авторов. Такая же ситуация наблюдается со всеми однофамильцами во всех странах.

Новая система идентификации ORCID ID (читается по-русски как «оркид») присваивает каждому ученому свой уникальный номер (ID ORCID), похожий на штрих-код в магазине. Он представляет собой 16-значный числовой код. Буквы из написания имени и фамилии заменяются на цифры, что сразу решает все проблемы: произношение и перевод на другие языки, автоматизируется идентификация автора и его связь с опубликованными статьями. По этому коду ученый легко идентифицируется научными организациями и сообществами, издательствами, фондами.

ORCID ID - это своего рода визитная карточка, которая не только делает владельца узнаваемым, но и позволяет общаться с коллегами со всего мира. В базе ORCID содержатся следующие данные об авторе: имя, фамилия в разной манере их написания; наименование организации, в которой работает автор; список опубликованных статей; гранты самого автора, а также те, в которых зафиксировано его участие.

Значение кода ORCID ID в освобождении ученого от необходимости рутинной работы по заполнению различных форм при публикации статей. Достаточно указать свой ORCID ID код как персональная информация из личного кабинета будет автоматически перенесена в формуляры.

Для регистрации ORCID ID необходимо:

Нужно зарегистрироваться на официальном сайте ORCID ID. После этого вводится информация о своих публикациях. Необходимо отвечать на все вопросы анкеты. После заполнения всех полей анкеты автору присваивается свой код ID, и с этого момента можно пользоваться системой ORCID. При заполнении своего профиля в Личном кабинете можно самому регулировать круг общения с людьми, сделав его по своему усмотрению общедоступным, ограниченным или только личным. Регистрация с присвоением ID ORCID бесплатная. Для получения информации об авторах с системой ORCID сотрудничают такие крупные издательства, как CrossRef, Elsevier, IEEE, ImpactStory, Thomson Reuters, Wiley и другие.

  • Инструкция по регистрации в ORCID
  • Регистрация в ORCID
  • Инструкция по работе с ORCID

Scopus AuthorID.

Scopus - одна из крупнейших в мире наукометрических и информационно-аналитических IT-платформ, расположенная по адресу http://www.scopus.com . Подобные ресурсы призваны облегчить работу ученого, связанную с поиском новой поступающей информации. Как правило, они дополнительно снабжены мощными информационно-аналитическими инструментами.

Как найти учетную запись (профиль ученого) в Scopus? Для осуществления сравнительного анализа научной деятельности в наукометрических базах данных (или IT-платформах) каждому автору присваивается свой персональный идентификатор (ID). Эта информация позволяет легко идентифицировать ученого и найти его учетную запись.

Профиль ученого в Scopus содержит основную информацию о нем: его ФИО (и различные варианты написания), последнее место работы, адрес электронной почты, библиографическое описание статей ученого (которые входят в Scopus), а также наукометрические показатели, такие как индекс Хирша и количество цитирований его статей (все данные по версии Scopus). Для того, чтобы просмотреть учетную запись автора в Scopus, необходимо знать уникальный номер ID - идентификатор ученого в Scopus ученого.

Как найти персональный идентификатор ученого в Scopus?

Для этого необходимо набрать http://www.scopus.com , кликнуть на «Author Preview » и осуществить поиск по ФИО или месту работы (возможен также поиск по идентификатору ORCID). Если ваша организация не подписана на Scopus (данная база данных является платной), то вы увидите только первые 20 результатов поиска по вашему запросу. Авторы будут упорядочены по количеству статей в Scopus. Другими словами, если вы ищете автора с распространенной фамилией и малым количеством статей в Scopus, то, скорее всего вы не сможете увидеть результат своего запроса в бесплатном варианте, т.е. он может оказаться за пределами первых 20-ти доступных ответов. В этом случае, рекомендуется просто усложнить запрос для поиска, т.е. комбинировать ФИО, место работы или хотя бы указать страну, в которой работает ученый. После того, как вы нашли автора, необходимо кликнуть на его ФИО (они оформлены как гиперссылки) и вы перейдете к его учетной записи. Здесь персональный номер ID ученого пишется рядом с «Author ID ».

Scopus создает учетную запись (профиль) для каждого автора автоматически. Отсюда следует несколько важных выводов. Во-первых, вам нет необходимости создавать свой профиль в Scopus. Если у вас есть хотя бы одна статья в журнале, индексируемом Scopus, то это уже сделано за вас. Напомним, что некоторые российские журналы также индексируются Scopus. Другими словами, статья на русском языке также может попасть в эту БД. Во-вторых, стоит всё-таки просмотреть свою учетную запись в Scopus и «провести работу над ошибками», поскольку идентификация авторов происходит автоматически. Ошибки идентификации встречаются достаточно часто. Для того, чтобы скорректировать свою учетную запись (профиль ученого) в Scopus можно воспользоваться руководством:

21 мая 2012 года Министром образования и науки Российской Федерации назначается Дмитрий Ливанов. В своем первом публичном выступлении он озвучивает намерение Министерства образования и науки (МОН РФ) провести всесторонний аудит сектора исследований и разработок, включая институты РАН, государственные научные организации и высшие учебные заведения. Это заявление можно назвать зарождением «Карты российской науки».

К сожалению, за событиями вокруг реформы РАН этот проект как-то потерялся и не получил, на наш взгляд, должного внимания со стороны IT-сообщества. Мы предлагаем вам небольшую ретроспективу: путь проекта от концепции до реализации.

Бесцельный путь синеет предо мной,
Далекий путь, потоками изрытый,
А дальше - мрак; и в этом мраке скрытый,
Парит судеб Вершитель роковой.

Александр Блок, октябрь 1899

Часть 1: конкурс

Проект «Карта российской науки» (http://mapofscience.ru/) был официально анонсирован в декабре 2012 года. Накануне МОН РФ был проведен конкурс на выполнение НИР по теме «Формирование системы оценки и мониторинга результатов научно-исследовательской деятельности организаций и ученых для регулярной оценки состояния сферы науки». Начальная (максимальная цена) контракта - 100 млн руб. Финансирование проекта обеспечивалось в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (Конкурс за 2012 год, Мероприятие 2.1, Очередь 11, Лот 1).

В конкурсе приняли участие следующие организации:

  1. Институт системного анализа Российской академии наук;
  2. ПрайсвотерхаусКуперс Раша Б. В. (далее - PwC);
  3. Научно-исследовательский институт автоматической аппаратуры им. академика В. С. Семенихина;
  4. Московский государственный университет приборостроения и информатики;
  5. Московский государственный технический университет имени Н. Э. Баумана;
  6. Московский государственный университет имени М. В. Ломоносова;
  7. ИНЭК-Информационные Технологии.
Бауманку не допустили по формальной причине: устаревшая выписка из ЕРГЮЛ. Являлось это халатностью при подготовке документов, или сыграл какой-то другой фактор, - уже вряд ли удастся узнать.

Победу в конкурсе одержала частная консалтинговая компания «ПрайсвотерхаусКуперс Раша Б.В.», предложив стоимость контракта 90 млн руб. и срок его выполнения - 90 дней.

Необходимо отметить, что МГУ предложил разработать «Карту науки» примерно вдвое дешевле - за 50 млн руб., однако получил от конкурсной комиссии невысокие баллы за качество и квалификацию, заняв второе место. Выглядит это странно, если учесть, что в Университете существуют полезные наработки в этой области: недавно запущена информационно­-аналитическая система «Наука-­МГУ», с помощью которой осуществляется сбор и анализ публикационной активности сотрудников.

В официальной прессе решение по выбору PwC в качестве исполнителя объяснили желанием заказчика в лице МОН РФ провести «аудит российской науки» силами внешней организации, никак не связанной с научной средой.

PwC потратило 40 млн на покупку данных из базы Web of Science (далее - WoS) у Thomson Reuters и 15 млн - на развертывание технической инфраструктуры. Плюс к этому система требует, по оценкам исполнителей, 10-15 млн руб. в год на поддержку.

К сожалению, мы не смогли найти в публичном доступе государственный контракт с победителем конкурса, а также техническое задание. (Внимание, вопрос: это не противоречит конкурсному законодательству?) Очень хотелось бы посмотреть на тот объем работ, который был заявлен на бумаге. Хотя с формальной точки зрения это уже не столь важно, так как проект оформлен как НИР: его результатом может являться просто отчет, реализация хотя бы прототипа совсем необязательна.

Часть 2: что хотели сделать?

«Наша цель - определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне. Мы будем делать этот проект с одной простой целью - понять, где сегодня Россия сохраняет конкурентоспособность, какие области науки сегодня для нас являются перспективными, где у нас есть шанс в будущем совершить рывок. И, что самое важно, поддержать - адресно - именно тех людей, тех ученых, те лаборатории, которые этой поддержки заслуживают»,- говорил Дмитрий Ливанов в своем интервью телеканалу «Просвещение».

В документе, подготовленном PwC , сам проект описывается следующим тезисом: «Карта российской науки» должна стать основой для принятия информированных управленческих решений в сфере научно-исследовательской деятельности ученых и организаций»; также поставлены конкретные цели:

  1. «инвентаризация» текущего состояния российской науки;
  2. быстрый доступ по требованию к актуальным и корректным показателям российской науки;
  3. аналитический инструментарий для принятия обоснованных управленческих решений;
  4. выявление наиболее авторитетных экспертов и научных коллективов для их адресной поддержки;
  5. сравнение уровня развития науки в России с другими странами и выявления точек роста;
  6. обеспечение прозрачности принимаемых управленческих решений.
В этом же документе заявлены три основных столпа проекта: охват данных , качество данных и фунционал .

Охват данных планировалось обеспечить через:

  • международные источники: публикации, доклады на международных конференциях, патенты, издания;
  • российские источники: публикации, патенты, гранты, НИОКР, издания;
  • показатели как фундаментальной, так и прикладной науки.
В итоге должна была получиться «уникальная по охвату база, обеспечивающая наиболее полное возможное покрытие результатов научно-исследовательской деятельности российских ученых».

Под качеством данных подразумевалось:

  • очистка исходных данных для исключения разнонаписаний имен собственных;
  • использование механизма корректировки данных самими учеными и организациями;
  • использование уникальных идентификаторов ученых и организаций.
В результате этого ожидалось достижение «беспрецедентного уровня точности данных, который поможет обеспечить видимость российской науки для международного сообщества».

И, наконец, фунционал включал:

  • инструментарий для сравнения и выявления точек роста в науке;
  • построение отчетов по заданным параметрам для ученых, организаций, научных направлений;
  • гибкий поиск и фильтрация данных;
  • выявление неформальных коллективов ученых.
Это «усовершенствованный набор аналитических инструментов и их гибкость, обеспечивающие решение управленческих задач».

А теперь непрофессионалам , наверное, станет не очень интересно, но так как Хабр - технологичный блог, мы посчитали необходимым показать план работ и архитектуру выстраиваемой системы. Всего три слайда.

Бочки и стрелочки


План работ


Архитектура!

Часть 3: что получилось?

Прежде всего, мы предлагаем читателям Хабра самим оценить, соответствует ли заявленный функционал тому, что было реализовано. «Карта российской науки» доступна по данной ссылке http://mapofscience.ru/ . Можно ли считать это образцом для подражания? Является ли этот проект уникальным не только в России, но и в мире? Попробуйте сами ответить на эти вопросы.

Не так давно главная страница «Карты» была обновлена. Был добавлен красный мигающий блок, говорящий нам: «Внимание! Система находится в опытной эксплуатации». Вероятно, это произошло из-за большого количества негативных отзывов о проекте. Если взглянуть на приложение к конкурсу , можно заметить, что deadline данного проекта - конец 2013 года. Таким образом, что-либо кардинально исправить в этой версии для «опытной эксплуатации» представляется уже маловероятным, и мы можем перейти к оценке всего проекта.

Целью проекта (если кто не запомнил) являлось «определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне». На наш взгляд, сделать это с помощью предложенных инструментов невозможно.

Охват данных
Скорее не получилось, чем получилось. Две основные базы - Российский индекс научного цитирования (РИНЦ) и Web of Science (WoS) - представлены в диапазоне 2007–2012 гг., да еще и с оговоркой в отношении WoS. Данные попросту неактуальны (верхняя планка года) и некорректны (нижняя планка года) для заявленной основной цели. И это при том, что доступ к базе WoS (её части, относящаяся к российским ученым) обошелся государству в 40 млн руб (практически без права передачи данных в МОН).

По остальным заявленным в проекте источникам данным также наблюдается, мягко говоря, некоторая неполнота. После длительного поиска по ведущим российским ученым не удалось обнаружить их книг, монографий, а также информации об участии в НИОКР и грантах. Можно предположить, что эти данные либо просто не предоставлены в карту науки, либо их не смогли подготовить.

Качество данных
По нашему мнению, эта задача являлась ключевой в реализации «Карты российской науки», это была именно та технологическая часть , которая составляла основную сложность и должна была отнять основные силы и время. Проще говоря, задача всей «Карты» состояла в том чтобы свести, очистить и грамотно перелинковать данные. Или, как следует из стенограммы установочного заседания экспертных групп по вопросам реализации проекта «Карта российской науки», ключевым блоком работ являлась «вычистка и интеграция данных из различных источников». И, к сожалению, эта часть совсем не получилась. Данные вообще не были сведены: нам предлагается или РИНЦ, или WoS. По сути, нам представлен просто интерфейс к этим двум базам, с не очень внятным функционалом. Так получилось, что именно к качеству данных возникло большинство претензий у научного сообщества. Мы попробовали собрать их воедино (но наверняка что-нибудь да упустили, - нареканий очень много):
  1. использование классификатора (рубрикатора) научных направлений, не применимого к действующим направлениям в российской науке;
  2. произвольный отбор (группировка) научных учреждений по рубрикам;
  3. отсутствие контроля уровня случайных совпадений;
  4. несоответствие числовых показателей реальным значениям (по численности состава научных учреждений, по количеству публикаций в WoS и РИНЦ, по числу патентов, по индексу цитирования), ошибки при переносе операторами данных из одной базы в другую;
  5. некорректный отбор «ведущих» учреждений или исследователей (топ-5), построенный на использовании произвольных признаков, не имеющих друг с другом связи (либо данные по WoS, либо по РИНЦ, либо алфавитный порядок, либо рубрикатор, и т.д.);
  6. неверное (некорректное) написание Ф.И.О. исследователя как в русской, так и в английской системе написания;
  7. неверная (некорректная) аффилиация исследователя;
  8. отсутствие разделения однофамильцев и их корректного соотношения с научным направлением и научным учреждением;
  9. отсутствие сведений о подразделениях организаций (в том числе, о факультетах крупных университетов, таких, как МГУ и СПбГУ).
Функционал
С функционалом тоже не все хорошо. Например, вот как реализован механизм корректировки данных: «Исправление технических ошибок, замеченных пользователями, происходит через предоставление бумажной версии замечаний, заверенной печатью организации, в которой работает пользователь». Между тем, в вышеупомянутой стенограмме говорится: «Основной принцип реализации проекта - минимизация усилий со стороны ученых. Предполагается, что большая часть информации в личных кабинетах будет заполняться в автоматическом режиме».

До сих пор не найден ни один человек, который может внятно объяснить, какую информацию несет в себе так называемая «тепловая карта». Единственная, на наш взгляд, интересная фича - это ссылка «свернуть карту» справа внизу, ее функционал, по крайней мере, неординарен и содержит львиную долю самоиронии.

Мы попробовали зарегистрироваться в системе, чтобы посмотреть, как она выглядит изнутри. Нам посчастливилось завести аккаунт примерно за месяц до написания настоящего обзора, потому что в настоящее время регистрация новых пользователей по каким-то причинами уже не работает (похоже были утеряны все полимеры).

Для регистрации ученому необходимо предоставить Ф.И.О., год рождения и email, после чего пройти процедуру «верификации». Это можно сделать двумя способами: по почте или через так называемый SPIN-код.

Верификация по почте осуществляется через «ручной контур». Чтобы этого избежать, мы решили освоить инновационный SPIN-код. Скорее всего, не каждый читатель знаком с этим понятием (среди нас тоже нашлись такие), поэтому расшифруем.

SPIN-код - это персональный идентификационный код автора в SCIENCE INDEX, информационно-аналитической системе, построенной на основе данных Российского индекса научного цитирования (РИНЦ).

Мы отправили заявку на получение SPIN-кода, заполнив для этого на сайте РИНЦ огромную форму с несколькими десятками полей и классификаторов (всего за какие-то 20 минут), и успешно получили код через две недели ожидания. Радуясь своим достижениям, мы ввели SPIN-код в профиле ученого, после чего «Карта» нам сообщила, что эта информация требует проверки (not again!). С момента ввода прошло уже две недели, а аккаунт до сих пор не верифицирован.

Если у вас хватило терпения, то вы добрались до личного кабинета.

Личный кабинет


Редактировать в личном кабинете особо нечего, так как в нем присутствуют только те данные, которые вы ввели при регистрации. Авторы системы подразумевают, что все остальное ученый расскажет о себе сам, заполнив немалое количество полей. Заметим, что в западных системах (ResearchGate, Academia.edu, Google Scholar) пользователь после регистрации получает практически готовый профиль, который система подготовила для него, автоматически собрав данные из различных источников. Ему остается только подтвердить их и при необходимости дополнить.

Сомнительно, что ученые по доброй воле станут пользоваться системой, в которой только на регистрацию уходит более 4 недель. Очевидно одно - «минимизации усилий со стороны ученых» не получилось.

Официальная неудовлетворительная оценка проекта также соответствует нашим выводам. «Это макет, это даже не пилотный проект », - отметила замминистра образования и науки РФ Людмила Огородова (макет за 90 миллионов).

Часть 4: реакция научного сообщества

Это будет самая лаконичная часть нашего повествования. Реакция научного сообщества была резко отрицательной.

Часть 5: причины провала

Как следует из официальной позиции МОН РФ и многочисленных отзывов экспертного научного сообщества, «Карта науки» получилось неудовлетворительной. Соответствует ли она целям выполненного государственного контракта, мы рассуждать не станем ввиду недостаточности информации о нем. Важно другое - как можно было бы избежать подобной ситуации? На наш взгляд, ключевым моментом в данной истории является то, что все данные, на которых строилась эта публичная информационная система, не являются открытыми.

И здесь мы хотели бы затронуть очень актуальную проблему открытых данных в науке. Их попросту нет. А ведь были бы они открыты, возможно, и необходимости в подобном госзаказе не было. «Карту науки» смог бы реализовать любой профессиональный разработчик, интересующийся тематикой открытых данных и наукой. Более того, таких «карт» при соответствующем спросе со стороны государства и научного сообщества было бы несколько.

Посмотрим на список предполагаемых российских источников для «Карты науки»:

  1. статьи в российских и зарубежных журналах (НЭБ);
  2. российские и зарубежные патенты (ФИПС);
  3. гранты (ФГБНУ НИИ РИНКЦЭ, РФФИ, РГНФ);
  4. отчеты по НИР и НИОКР (ЦИТиС);
  5. диссертации и авторефераты (ЦИТиС);
  6. издания книг (Российская книжная палата);
  7. сведения о научных организациях и их подразделениях (в том числе о вузах и их факультетах).
Подавляющее большинство вышеперечисленных источников были сформированы за счет государственного бюджета и непонятно, почему эти данные не являются публичными.

Часть 6: как исправить ситуацию?


21 мая 2012 года Министром образования и науки Российской Федерации назначается Дмитрий Ливанов. В своем первом публичном выступлении он озвучивает намерение Министерства образования и науки (МОН РФ) провести всесторонний аудит сектора исследований и разработок, включая институты РАН, государственные научные организации и высшие учебные заведения. Это заявление можно назвать зарождением «Карты российской науки».

К сожалению, за событиями вокруг реформы РАН этот проект как-то потерялся и не получил, на наш взгляд, должного внимания со стороны IT-сообщества. Мы предлагаем вам небольшую ретроспективу: путь проекта от концепции до реализации.

Бесцельный путь синеет предо мной,
Далекий путь, потоками изрытый,
А дальше - мрак; и в этом мраке скрытый,
Парит судеб Вершитель роковой.

Александр Блок, октябрь 1899

Часть 1: конкурс

Проект «Карта российской науки» (http://mapofscience.ru/) был официально анонсирован в декабре 2012 года. Накануне МОН РФ был проведен конкурс на выполнение НИР по теме «Формирование системы оценки и мониторинга результатов научно-исследовательской деятельности организаций и ученых для регулярной оценки состояния сферы науки». Начальная (максимальная цена) контракта - 100 млн руб. Финансирование проекта обеспечивалось в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (Конкурс за 2012 год, Мероприятие 2.1, Очередь 11, Лот 1).

В конкурсе приняли участие следующие организации:

  1. Институт системного анализа Российской академии наук;
  2. ПрайсвотерхаусКуперс Раша Б. В. (далее - PwC);
  3. Научно-исследовательский институт автоматической аппаратуры им. академика В. С. Семенихина;
  4. Московский государственный университет приборостроения и информатики;
  5. Московский государственный технический университет имени Н. Э. Баумана;
  6. Московский государственный университет имени М. В. Ломоносова;
  7. ИНЭК-Информационные Технологии.
Бауманку не допустили по формальной причине: устаревшая выписка из ЕРГЮЛ. Являлось это халатностью при подготовке документов, или сыграл какой-то другой фактор, - уже вряд ли удастся узнать.

Победу в конкурсе одержала частная консалтинговая компания «ПрайсвотерхаусКуперс Раша Б.В.», предложив стоимость контракта 90 млн руб. и срок его выполнения - 90 дней.

Необходимо отметить, что МГУ предложил разработать «Карту науки» примерно вдвое дешевле - за 50 млн руб., однако получил от конкурсной комиссии невысокие баллы за качество и квалификацию, заняв второе место. Выглядит это странно, если учесть, что в Университете существуют полезные наработки в этой области: недавно запущена информационно­-аналитическая система «Наука-­МГУ», с помощью которой осуществляется сбор и анализ публикационной активности сотрудников.

В официальной прессе решение по выбору PwC в качестве исполнителя объяснили желанием заказчика в лице МОН РФ провести «аудит российской науки» силами внешней организации, никак не связанной с научной средой.

PwC потратило 40 млн на покупку данных из базы Web of Science (далее - WoS) у Thomson Reuters и 15 млн - на развертывание технической инфраструктуры. Плюс к этому система требует, по оценкам исполнителей, 10-15 млн руб. в год на поддержку.

К сожалению, мы не смогли найти в публичном доступе государственный контракт с победителем конкурса, а также техническое задание. (Внимание, вопрос: это не противоречит конкурсному законодательству?) Очень хотелось бы посмотреть на тот объем работ, который был заявлен на бумаге. Хотя с формальной точки зрения это уже не столь важно, так как проект оформлен как НИР: его результатом может являться просто отчет, реализация хотя бы прототипа совсем необязательна.

Часть 2: что хотели сделать?

«Наша цель - определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне. Мы будем делать этот проект с одной простой целью - понять, где сегодня Россия сохраняет конкурентоспособность, какие области науки сегодня для нас являются перспективными, где у нас есть шанс в будущем совершить рывок. И, что самое важно, поддержать - адресно - именно тех людей, тех ученых, те лаборатории, которые этой поддержки заслуживают»,- говорил Дмитрий Ливанов в своем интервью телеканалу «Просвещение».

В документе, подготовленном PwC , сам проект описывается следующим тезисом: «Карта российской науки» должна стать основой для принятия информированных управленческих решений в сфере научно-исследовательской деятельности ученых и организаций»; также поставлены конкретные цели:

  1. «инвентаризация» текущего состояния российской науки;
  2. быстрый доступ по требованию к актуальным и корректным показателям российской науки;
  3. аналитический инструментарий для принятия обоснованных управленческих решений;
  4. выявление наиболее авторитетных экспертов и научных коллективов для их адресной поддержки;
  5. сравнение уровня развития науки в России с другими странами и выявления точек роста;
  6. обеспечение прозрачности принимаемых управленческих решений.
В этом же документе заявлены три основных столпа проекта: охват данных , качество данных и фунционал .

Охват данных планировалось обеспечить через:

  • международные источники: публикации, доклады на международных конференциях, патенты, издания;
  • российские источники: публикации, патенты, гранты, НИОКР, издания;
  • показатели как фундаментальной, так и прикладной науки.
В итоге должна была получиться «уникальная по охвату база, обеспечивающая наиболее полное возможное покрытие результатов научно-исследовательской деятельности российских ученых».

Под качеством данных подразумевалось:

  • очистка исходных данных для исключения разнонаписаний имен собственных;
  • использование механизма корректировки данных самими учеными и организациями;
  • использование уникальных идентификаторов ученых и организаций.
В результате этого ожидалось достижение «беспрецедентного уровня точности данных, который поможет обеспечить видимость российской науки для международного сообщества».

И, наконец, фунционал включал:

  • инструментарий для сравнения и выявления точек роста в науке;
  • построение отчетов по заданным параметрам для ученых, организаций, научных направлений;
  • гибкий поиск и фильтрация данных;
  • выявление неформальных коллективов ученых.
Это «усовершенствованный набор аналитических инструментов и их гибкость, обеспечивающие решение управленческих задач».

А теперь непрофессионалам , наверное, станет не очень интересно, но так как Хабр - технологичный блог, мы посчитали необходимым показать план работ и архитектуру выстраиваемой системы. Всего три слайда.

Бочки и стрелочки


План работ


Архитектура!

Часть 3: что получилось?

Прежде всего, мы предлагаем читателям Хабра самим оценить, соответствует ли заявленный функционал тому, что было реализовано. «Карта российской науки» доступна по данной ссылке http://mapofscience.ru/ . Можно ли считать это образцом для подражания? Является ли этот проект уникальным не только в России, но и в мире? Попробуйте сами ответить на эти вопросы.

Не так давно главная страница «Карты» была обновлена. Был добавлен красный мигающий блок, говорящий нам: «Внимание! Система находится в опытной эксплуатации». Вероятно, это произошло из-за большого количества негативных отзывов о проекте. Если взглянуть на приложение к конкурсу , можно заметить, что deadline данного проекта - конец 2013 года. Таким образом, что-либо кардинально исправить в этой версии для «опытной эксплуатации» представляется уже маловероятным, и мы можем перейти к оценке всего проекта.

Целью проекта (если кто не запомнил) являлось «определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне». На наш взгляд, сделать это с помощью предложенных инструментов невозможно.

Охват данных
Скорее не получилось, чем получилось. Две основные базы - Российский индекс научного цитирования (РИНЦ) и Web of Science (WoS) - представлены в диапазоне 2007–2012 гг., да еще и с оговоркой в отношении WoS. Данные попросту неактуальны (верхняя планка года) и некорректны (нижняя планка года) для заявленной основной цели. И это при том, что доступ к базе WoS (её части, относящаяся к российским ученым) обошелся государству в 40 млн руб (практически без права передачи данных в МОН).

По остальным заявленным в проекте источникам данным также наблюдается, мягко говоря, некоторая неполнота. После длительного поиска по ведущим российским ученым не удалось обнаружить их книг, монографий, а также информации об участии в НИОКР и грантах. Можно предположить, что эти данные либо просто не предоставлены в карту науки, либо их не смогли подготовить.

Качество данных
По нашему мнению, эта задача являлась ключевой в реализации «Карты российской науки», это была именно та технологическая часть , которая составляла основную сложность и должна была отнять основные силы и время. Проще говоря, задача всей «Карты» состояла в том чтобы свести, очистить и грамотно перелинковать данные. Или, как следует из стенограммы установочного заседания экспертных групп по вопросам реализации проекта «Карта российской науки», ключевым блоком работ являлась «вычистка и интеграция данных из различных источников». И, к сожалению, эта часть совсем не получилась. Данные вообще не были сведены: нам предлагается или РИНЦ, или WoS. По сути, нам представлен просто интерфейс к этим двум базам, с не очень внятным функционалом. Так получилось, что именно к качеству данных возникло большинство претензий у научного сообщества. Мы попробовали собрать их воедино (но наверняка что-нибудь да упустили, - нареканий очень много):
  1. использование классификатора (рубрикатора) научных направлений, не применимого к действующим направлениям в российской науке;
  2. произвольный отбор (группировка) научных учреждений по рубрикам;
  3. отсутствие контроля уровня случайных совпадений;
  4. несоответствие числовых показателей реальным значениям (по численности состава научных учреждений, по количеству публикаций в WoS и РИНЦ, по числу патентов, по индексу цитирования), ошибки при переносе операторами данных из одной базы в другую;
  5. некорректный отбор «ведущих» учреждений или исследователей (топ-5), построенный на использовании произвольных признаков, не имеющих друг с другом связи (либо данные по WoS, либо по РИНЦ, либо алфавитный порядок, либо рубрикатор, и т.д.);
  6. неверное (некорректное) написание Ф.И.О. исследователя как в русской, так и в английской системе написания;
  7. неверная (некорректная) аффилиация исследователя;
  8. отсутствие разделения однофамильцев и их корректного соотношения с научным направлением и научным учреждением;
  9. отсутствие сведений о подразделениях организаций (в том числе, о факультетах крупных университетов, таких, как МГУ и СПбГУ).
Функционал
С функционалом тоже не все хорошо. Например, вот как реализован механизм корректировки данных: «Исправление технических ошибок, замеченных пользователями, происходит через предоставление бумажной версии замечаний, заверенной печатью организации, в которой работает пользователь». Между тем, в вышеупомянутой стенограмме говорится: «Основной принцип реализации проекта - минимизация усилий со стороны ученых. Предполагается, что большая часть информации в личных кабинетах будет заполняться в автоматическом режиме».

До сих пор не найден ни один человек, который может внятно объяснить, какую информацию несет в себе так называемая «тепловая карта». Единственная, на наш взгляд, интересная фича - это ссылка «свернуть карту» справа внизу, ее функционал, по крайней мере, неординарен и содержит львиную долю самоиронии.

Мы попробовали зарегистрироваться в системе, чтобы посмотреть, как она выглядит изнутри. Нам посчастливилось завести аккаунт примерно за месяц до написания настоящего обзора, потому что в настоящее время регистрация новых пользователей по каким-то причинами уже не работает (похоже были утеряны все полимеры).

Для регистрации ученому необходимо предоставить Ф.И.О., год рождения и email, после чего пройти процедуру «верификации». Это можно сделать двумя способами: по почте или через так называемый SPIN-код.

Верификация по почте осуществляется через «ручной контур». Чтобы этого избежать, мы решили освоить инновационный SPIN-код. Скорее всего, не каждый читатель знаком с этим понятием (среди нас тоже нашлись такие), поэтому расшифруем.

SPIN-код - это персональный идентификационный код автора в SCIENCE INDEX, информационно-аналитической системе, построенной на основе данных Российского индекса научного цитирования (РИНЦ).

Мы отправили заявку на получение SPIN-кода, заполнив для этого на сайте РИНЦ огромную форму с несколькими десятками полей и классификаторов (всего за какие-то 20 минут), и успешно получили код через две недели ожидания. Радуясь своим достижениям, мы ввели SPIN-код в профиле ученого, после чего «Карта» нам сообщила, что эта информация требует проверки (not again!). С момента ввода прошло уже две недели, а аккаунт до сих пор не верифицирован.

Если у вас хватило терпения, то вы добрались до личного кабинета.

Личный кабинет


Редактировать в личном кабинете особо нечего, так как в нем присутствуют только те данные, которые вы ввели при регистрации. Авторы системы подразумевают, что все остальное ученый расскажет о себе сам, заполнив немалое количество полей. Заметим, что в западных системах (ResearchGate, Academia.edu, Google Scholar) пользователь после регистрации получает практически готовый профиль, который система подготовила для него, автоматически собрав данные из различных источников. Ему остается только подтвердить их и при необходимости дополнить.

Сомнительно, что ученые по доброй воле станут пользоваться системой, в которой только на регистрацию уходит более 4 недель. Очевидно одно - «минимизации усилий со стороны ученых» не получилось.

Официальная неудовлетворительная оценка проекта также соответствует нашим выводам. «Это макет, это даже не пилотный проект », - отметила замминистра образования и науки РФ Людмила Огородова (макет за 90 миллионов).

Часть 4: реакция научного сообщества

Это будет самая лаконичная часть нашего повествования. Реакция научного сообщества была резко отрицательной.

Часть 5: причины провала

Как следует из официальной позиции МОН РФ и многочисленных отзывов экспертного научного сообщества, «Карта науки» получилось неудовлетворительной. Соответствует ли она целям выполненного государственного контракта, мы рассуждать не станем ввиду недостаточности информации о нем. Важно другое - как можно было бы избежать подобной ситуации? На наш взгляд, ключевым моментом в данной истории является то, что все данные, на которых строилась эта публичная информационная система, не являются открытыми.

И здесь мы хотели бы затронуть очень актуальную проблему открытых данных в науке. Их попросту нет. А ведь были бы они открыты, возможно, и необходимости в подобном госзаказе не было. «Карту науки» смог бы реализовать любой профессиональный разработчик, интересующийся тематикой открытых данных и наукой. Более того, таких «карт» при соответствующем спросе со стороны государства и научного сообщества было бы несколько.

Посмотрим на список предполагаемых российских источников для «Карты науки»:

  1. статьи в российских и зарубежных журналах (НЭБ);
  2. российские и зарубежные патенты (ФИПС);
  3. гранты (ФГБНУ НИИ РИНКЦЭ, РФФИ, РГНФ);
  4. отчеты по НИР и НИОКР (ЦИТиС);
  5. диссертации и авторефераты (ЦИТиС);
  6. издания книг (Российская книжная палата);
  7. сведения о научных организациях и их подразделениях (в том числе о вузах и их факультетах).
Подавляющее большинство вышеперечисленных источников были сформированы за счет государственного бюджета и непонятно, почему эти данные не являются публичными.

Часть 6: как исправить ситуацию?


Любому автору, чьи публикации индексируются в базе данных Scopus, присваивается уникальный идентификационный номер (ID) . Другими словами, Scopus создает профиль для каждого автора автоматически. Система идентификации авторов (Author ID) была создана компанией Elsevier для того, чтобы решить проблему привязки авторов к публикациям, возникающую из‐за путаниц с совпадением имен и фамилий.

Поэтому нет необходимости создавать свой профиль самостоятельно. Если у Вас есть хотя бы одна статья в журнале, индексируемом Scopus, то это уже сделано за Вас. И при желании Вы можете зайти в свой профиль, хотя бы для того, чтобы узнать номер своего ID и число индекса Хирша (h-индекс) в БД Scopus. Cделать это можно одним из предлагаемых способов:

Первый способ . Поиск по статье.

Шаг 1. Зайти на вкладку Document search . Выбрать поисковое поле Article title и ввести название статьи (примечание: если в названии статьи есть скобки, лучше заменить их на пробелы).

Шаг 2. Search .

Шаг 3. Выбрать нужную статью и перейти на страничку, содержащую полное ее описание: выходные данные, авторы, их аффилиация, реферат и т. п.

Шаг 4. Нажать на свою фамилию, что приведет Вас в личный профиль, где указывается: персональный номер ID , h-индекс , области исследований, количество цитирований со ссылками на документы, визуализация профиля, список публикаций, которые система автоматически идентифицировала под Вашей фамилией и инициалами и т. д.

Шаг 1. Зайти на вкладку Author search . Ввести в поисковые поля свою фамилию (Last name), инициалы (Initials) или имя (First name) и по желанию аффилиацию (affiliation).

Шаг 2. В случае, если Ваша фамилия распространенная и у Вас много однофамильцев, для более точного поиска можно указать область исследований (Subject Areas) (обратите внимание, что область исследований определяется теми журналами, в которых опубликованы ваши статьи).

Шаг 3. Запустить поиск, нажав кнопку Search .

Шаг 4. Если у Вас в базе данных Scopus проиндексирована только одна статья, то перейти сразу на авторский профиль с фамилии автора невозможно. В данном случае следует выбрать команду Show Profile Matches with One Document (Показать профили с одним документом), затем по гиперссылке 1 Document перейти в полную запись статьи и уже через свою фамилию перейти в личный профиль (аналогично шагу 4 в первом способе поиска).

Напоминаем, что не всегда автоматическое формирование авторского профиля происходит достаточно корректно, поэтому авторский профиль необходимо отредактировать. В случае существования несколько учетных записей с различным написанием Вашего имени, Вы можете объединить их в один профиль.

Зачем нужна карта

«Сегодня мы хотим устроить общественную приёмку карты российской науки, - сказал на совещании в Минобрнауки директор Департамента науки и технологий Сергей Салихов. - В ноябре-декабре 2013 года основные результаты проекта были достигнуты. Состоялось несколько обсуждений карты внутри министерства, были организованы выездные совещания. Мы постарались учесть все замечания и пожелания учёных по доработке карты».

Создавая карту, в Министерстве преследовали несколько целей, сообщил заместитель директора Департамента науки и технологий Минобрнауки России Андрей Поляков. Первая - определение ландшафта российской науки, то есть текущего состояния научной активности учёных и организаций. Вторая - понимание национальных особенностей развития сектора исследований и разработок в тематическом, географическом и возрастном разрезах. Третья - информирование научного и бизнес-сообщества о ключевых компетенциях учёных и организаций. Четвёртая - снижение бюрократической нагрузки при организации исследовательской деятельности за счёт представленных в карте данных об учёных.

Карта должна помочь в формировании адресных механизмов поддержки учёных, укреплении репутации российской науки.

С ноября прошлого года карта находится в общем доступе. Тогда был представлен прототип системы, сейчас идёт подготовка к её запуску в штатном режиме. Развёрнута работа двух служб - по техническому сопровождению карты (за это отвечает ЦИТИС) и контент-сопровождению (ГПНТБ).

В карту уже загружены данные Web of Science, Thomson Reuters, РИНЦ. В ближайшее время появятся данные Scopus. Вся информация собрана за период с 2007-го по 2012 год. Скоро будут представлены сведения за 2013-й. В 2014-м планируется выйти на ежеквартальное обновление всех данных.

«Изначально мы исключали возможность использования одного источника для формирования карты, - подчеркнул Андрей Поляков. - Мы придерживались позиции, что данные по публикационной активности не являются самодостаточными. Нужно подключать данные по НИОКРам, патентам, монографиям. Развитие карты мы видим в расширении состава и качества представленных в ней сведений».

Заказчиком карты стало Минобрнауки России, непосредственным исполнителем - PwC, компания занималась координацией всех участников проекта.

«Перед началом работ мы провели анализ международного опыта создания систем, аналогичных карте российской науки - в Китае, Бразилии и других странах, - пояснил менеджер PwC Василий Садовский. - Все эти системы в той или иной степени представляют наукометрические показатели. Но мы решили этими данными не ограничиваться, представить более широкий спектр информации. При разработке прототипа информационной системы применили ряд автоматизированных алгоритмов по загрузке и обобщению всех данных».

Карта представляет непредвзятый взгляд на состояние российской науки, считают в PwC.

Основные принципы формирования карты науки: 1) интеграция данных из различных источников и сведение их под едиными справочниками уникальных объектов; 2) обеспечение максимальной прозрачности данных - любой пользователь интернета может познакомиться и проверить их.

Работа над ошибками

В открытом доступе карта появилась осенью 2013 года. С того момента проводится тестирование системы и устранение ошибок.

При разработке карты велось много дискуссий, в частности о применимости данных Web of Science. Но в итоге решено было их использовать. Остаётся нерешённой проблема качества данных WoS за 2007 год. Около 30% статей не имеют аффилиаций, то есть их авторы не имеют увязки с какой-то научной организацией. Кроме того, одним из поставщиков данных о монографиях, учебниках и учебных пособиях стала Российская книжная палата, которая, как оказалось, не смогла гарантировать полноты предоставления данных. Поэтому не все книги удалось учесть на карте. Но выход нашли - в карточке учёного появился инструмент, который позволяет в заявительном порядке отправить запрос о добавлении книг и монографий.

Ежедневно системой пользуется от 500 до 1000 пользователей, сообщил директор ЦИТИС Павел Стариков, отвечающий за информационно-технологическое сопровождение карты.

В карте содержатся сведения почти о 5 тысячах организаций, 500 тысячах учёных, около 2 миллионов перекрёстных ссылок. В системе зарегистрированы 4600 пользователей.

В ГПНТБ было создано подразделение, которое отвечает за контент-сопровождение работы карты. Основная задача - устранять некорректности, которые имеются в системе.

За прошедшее время было получено 1300 запросов от пользователей. Большинство из них связано с включением неучтённых статей в карточках того или иного учёного. И второй по популярности запрос - исключение каких-то статей из списка. «Это вполне объяснимо, - прокомментировал Василий Мукасьян из ГПНТБ. - В стране есть распространённые фамилии типа Иванова. Автоматизированные алгоритмы системы могли их некорректно объединить между собой».

Третий по популярности запрос - неправильная аффилиация. Ошибки исправляются не только на карте, но и у самих поставщиков данных. Четвёртый - некорректный расчёт индексов цитирования, который объясняется тем, что в карте представлены данные с 2007 года.

«Мы понимаем, что Thomson Reuters и Scopus не покрывают на 100% специализированные научные области, которые развиты в России. Поэтому планируем расширять перечень источников данных», - сказал Василий Мукасьян.

Что думают учёные

Разработчики проводят большую работу по устранению ошибок в карте, причем многие исправления вносятся благодаря учёным, которые активно включились в использование ресурса и сами сообщают о несоответствии данных. Например, директор Института молекулярной биологии им. Энгельгардта Александр Макаров заметил, что в карте неправильно указан юридический адрес института. Тем не менее он акцентировал внимание на том, что данные, аккумулированные на сайте, помогли ему оценить общую картину состояния научных исследований в области биологии.

«Карта науки помогла нам выстроить систему приоритетов. Мы не смотрели, какой институт дает больше публикаций, мы смотрели, какая наука более важна, мы, например, нашли 19 тысяч публикаций в области биологических наук, а в промышленных биотехнологиях - всего 119, - сказал Александр Макаров. - Карта науки также позволила установить, какие учреждения предлагают проекты по развитию уже зарекомендовавшего себя коллектива, или это проект, претендующий на открытие новых областей или новых горизонтов».

Одно из главных предложений учёных - дать им возможность самим редактировать данные в карте. С такой идеей, в частности, выступил проректор МГУ им. М.В. Ломоносова Алексей Хохлов: «Самим авторам надо разрешить править информацию о своей деятельности. А кураторы проекта потом смогут проверять размещённую информацию. В «Истине» МГУ такая практика реализована. Сами учёные вносят в базу свои статьи. А проверяем мы только те, которые входят в топ-25. Как только в карте науки будет реализован такой же подход, сразу же будет заметен эффект - улучшится качество всей базы данных».

Пока разработчики рассматривают вариант двухступенчатой верификации - авторам будет разрешено добавлять отсутствующие статьи, после чего контент-операторы будут проверять достоверность размещённых данных. В результате одну из главных претензий к разработчикам карты удастся снять.