Анализ российского и международного опыта в области разработки баз данных по биоразнообразию показал, что существуют общепринятые международные стандарты для описания данных, которые уже более 10 лет успешно применяются для разных таксономических групп (Иванова, Шашков, 2014). Под стандартом мы понимаем подробную спецификацию набора полей, описывающих атрибутивную информацию, а также правила их заполнения. Крупнейшими открытыми международными информационными системами по биоразнообразию – Global Biodiversity Information Facility (GBIF), Encyclopedia of Life (EOL) и др. в настоящее время используется стандарт Darwin Core (DwC) (Wieczorek et al., 2012). Стандарт DwC позволяет описывать по единой схеме данные, полученные из разных источников с однозначным указанием на авторов данных и правообладателей, хранить как исходную (указанную в первоисточнике), так и формализованную информацию о находках, указывать сведения о локалитетах, где целевые виды не обнаружены.
Структура базы данных
Ранее нами была разработана web-информационная система о находках Lobaria pulmonaria в России (Шашков, Иванова, 2012). Первоначальная структура базы данных была ориентирована на описание собственных полевых находок. Пополнение базы новыми сведениями из различных источников (гербарных коллекций, научных публикаций, открытых баз данных по биоразнообразию и др.) потребовало переработки и расширения ее структуры. Для приведения базы данных о распространении лобарии легочной в соответствие стандарту DwC нами была использована открытая объектно-ориентированная СУБД PostgreSQL. Обновленная база данных имеет реляционную структуру и состоит из 55 таблиц и 9 представлений (views). Для детального описания находок Lobaria pulmonaria были использованы 65 из более чем 180 основных терминов DwC, а также 8 терминов, не предусмотренных стандартом. Все эти термины были структурированы в справочные и рабочие таблицы. Всего было создано четыре справочника: три для описания административного деления страны («Государства», «Субъекты Федерации» и «Административные районы») и один для описания точности географической привязки мест находок. Справочник «Государства» включен в структуру базы данных для соответствия стандарту DwC. Также было разработано несколько обновляемых подстановочных таблиц: при добавлении в базу новых записей обновляются списки, доступные для полей «форофит», «название набора данных», «коллекция» и «библиографическая ссылка». Рабочие таблицы организованы в три логических блока: (1) описание района находки (содержание соответствует разделу «Location» стандарта DwC); (2) описание местообитания (используются термины раздела «Event» стандарта DwC и дополнительные термины, не предусмотренных стандартом); (3) собственно описание находки (содержание соответствует разделу «Occurrence» стандарта DwC). Отметим, что в DwC предусмотрено множество полей (в некоторых случаях взаимоисключающих) для как можно более подробного описания находки. Далеко не все из них представляется возможным заполнить для каждой записи в базе, поэтому для каждого логического блока были составлены одна таблица с обязательными полями и несколько с дополнительными. Подобный подход к составлению структуры базы способствует сохранению реляционных принципов организации базы данных (Codd, 1972) и соблюдению правил нормализации (Дейт, 2005). Для удобства восприятия и дальнейшей разработки для каждого блока сделано представление, объединяющее все поля, относящиеся к данному блоку.
Доступ к данным базы
Собранные в базе данные о находках Lobaria pulmonaria опубликованы в Глобальной информационной системе по биоразнообразию GBIF. Опубликованному набору данных присвоен электронный идентификатор цифрового объекта (doi:10.15468/uennht), все данные распространяются по открытой лицензии CC-BY (Creative Commons Attribution 4.0). Данные публикуются с полным сохранением авторства, источников и правообладателей первичных данных.
Цититрование: Ivanova N.V., Shashkov M.P. (2016) Database of finds of rare lichen species Lobaria pulmonaria in Russia. Institute of Mathematical Problems of Biology, Russian Academy of Sciences. Occurrence dataset. doi:10.15468/uennht