В. Н. Белоозеров, Т. А. Шкловская

Стандарт на описание информационных ресурсов

Рассматриваются требования новой версии государственного стандарта ГОСТ 7.70-2003 к описанию баз данных, машиночитаемых массивов и сетевых информационных ресурсов. Разъяснено содержание обязательных и условно обязательных реквизитов описания, перечислены факультативные реквизиты. Даны рекомендации по использованию нормативных источников для заполнения реквизитов. Проведено сопоставление и показано соответствие нового стандарта набору данных «Дублинское ядро», установленному международным стандартом ISO 15836:2003.

 

1. В 2004 году вступает в силу новая версия ГОСТ 7.70 «Описание баз данных и машиночитаемых информационных массивов» [1]. Цель пересмотра стандарта состояла в том, чтобы с одной стороны распространить его на сетевые информационные ресурсы, а с другой стороны – упростить систему описания и приблизить её к современной практике.

Предыдущая версия стандарта [2] разрабатывалась в традициях централизованного административного управления информационными ресурсами и при недостаточной практике использования глобальных коммуникационных сетей. В стандарте было прописано очень большое количество реквизитов, дающих возможность всестороннего описания информационного ресурса, на основании которого пользователь имеет возможность оценить его соответствие своим потребностям.  Однако в условиях свободного обмена данными между независимыми субъектами информационного процесса жесткая регламентация и принудительное навязывание дополнительных затрат на создание подробного описания ресурса оказались неэффективны. Следствием этого явилось почти полное игнорирование данного стандарта отечественным информационным сообществом.

Мировая практика, столкнувшись с необходимостью развития и нормализации средств быстрого поиска релевантных источников данных, пошла по пути добровольного согласования объёма и формы предоставления реквизитов, описывающих характер данных в информационном ресурсе. Большой авторитет завоевала инициатива неформальной группы издателей информационных ресурсов в Интернете, известная как Dublin Core Initiative. Они предложили минимальный набор дескриптивных реквизитов, который рекомендовано вводить в состав метаданных информационных ресурсов, представляемых через Интернет. Этот набор («дублинское ядро») уже стал фактически международным стандартом,[1] и внедрение его в нашей стране приведёт к улучшению доступа к нашим ресурсам в глобальных сетях при минимальных затратах со стороны разработчиков и издателей информации. Стандартная система описания информационных ресурсов необходима также для создания каталогов и регистрации имеющихся источников данных. Эти соображения явились основанием разработки новой версии ГОСТ 7.70 на базе «дублинского ядра».

Новый стандарт адресован двум категориям пользователей. Прежде всего, он направлен на то, чтобы в каталогах информационных ресурсов регистрирующие органы приводили согласованный набор сведений, позволяющий найти и оценить релевантные источники. Но также, что ещё важнее, стандарт обращён к разработчикам и распространителям ресурсов в Интернете, ориентируя их на представление пусть минимальной, но содержательной информации о своём произведении в составе его метаданных. Впрочем стандарт не ограничивается нормированием описания ресурсов в глобальных сетях. В равной мере он относится к массивам и базам данным данных, предоставляемым в корпоративных сетях, в локальном доступе и издаваемым на транспортабельных носителях.

2. Для описания информационного ресурса ГОСТ 7.70-2003 предлагает 29 реквизитов, из которых только 10 являются обязательными для всех категорий ресурсов. К ним относятся следующие данные.

2.1. Идентификатор информационного ресурса. Он представляет собой строку символов, однозначно идентифицирующую описываемый ресурс. Используется для ссылок на ресурс. Выбор способа назначения идентификатора – прерогатива службы регистрации или организации, внедряющей описываемую систему метаданных. Например, в случае регистрации электронных информационных ресурсов идентификатор – это номер регистрации. Каждый информационный ресурс должен иметь единственный уникальный идентификатор, не совпадающий с идентификаторами других ресурсов в пределах сети или коллекции ресурсов.

2.2. Наименование ресурса. Обычно присваивается ресурсу создателем либо владельцем, а если они этого не сделали, то назначается составителем описания ресурса при его регистрации и внесении в каталог. Если некоторый источник данных, представляемый как информационный ресурс, имеет альтернативные наименования, то основное наименование заносится в первый экземпляр данного реквизита.

2.3. Имя владельца. Наименование юридического или имя физического лица, распоряжающегося ресурсом. При совместном распоряжении ресурсом нескольких лиц имя каждого из них заносится в отдельный экземпляр реквизита. В процессе регистрации ресурса должна проводиться проверка и унификация формы представления имен владельцев. Для этого должен вестись нормативный массив имён физических лиц и наименований организаций с краткими данными, идентифицирующими их.

2.4. Описание. Текстовое изложение содержания ресурса, в частности - аннотация или реферат для текстовых документов, или описание содержимого в случае визуального, аудио или мультимедийного ресурса. Если описываемый ресурс представляет собой собрание однотипных или близких по структуре документов, рекомендуется отразить тип или структуру документов.

2.5. Код рубрики. Тематика электронного информационного ресурса, выраженная кодами Государственного рубрикатора НТИ, определённого межгосударственными стандартами ГОСТ 7.49 [3] и ГОСТ 7.77 [4]. Этот реквизит позволяет определить тематику информации в соответствии со стандартным перечнем тематических рубрик, принятым в странах СНГ. Для политематических ресурсов следует в отдельных экземплярах реквизита приводить все релевантные коды.

2.6. Ключевое слово. В этих реквизитах указывают термины основных понятий, информация о которых содержится в ресурсе. Каждый термин, однословный или многословный, оформляется как отдельный экземпляр реквизита.

2.7. Язык. Указывается язык, на котором написаны текстовые компоненты ресурса. Если имеются тексты на разных языках, то в отдельных экземплярах реквизита указывается каждый из них. Наименования языков приводятся в полной или сокращённой форме в соответствии с ГОСТ 7.75 Коды наименований языков [5].

2.8. Периодичность обновления. Указывается, с каким интервалом времени производится обновление ресурса путём записи в реквизит одного из следующих слов: год, квартал, месяц, неделя, день, постоянно, эпизодически, не обновляется.

2.9. Финансирование. Указывается род источника средств на создание и ведение ресурса путём записи в реквизит одного из следующих выражений:

федеральный бюджет;

бюджет субъектов федерации;

муниципальный бюджет;

государственные внебюджетные фонды;

собственные средства;

средства иных юридических и физических лиц;

источник финансирования не определен.

2.10. Дата обновления. Указывается дата (в формате ГОСТ ИСО 8601 [6]) последнего обновления содержания ресурса или дата создания, если обновление не производилось.

3. Некоторые реквизиты признаны условно обязательными, поскольку они имеют смысл не для всех информационных ресурсов. К ним относятся следующие реквизиты.

3.1 Дата обновления метаописания. Указывается дата (в формате ГОСТ ИСО 8601) последнего обновления метаданных ресурса в каталоге. Реквизит обязателен, если данные в каталоге корректировались в соответствии с содержанием ресурса.

3.2. Сетевой адрес. Адрес “http” или “ftp” доступа к ресурсу. Обязателен в том случае, если ресурс выставлен в глобальной сети. Можно указывать несколько адресов в отдельных экземплярах реквизита.

3.3. Консультант. Указывается лицо, к которому следует обращаться для получения дополнительной информации о ресурсе. Реквизит обязателен для несетевых ресурсов. Он позволяет выяснить способы доступа к данным. Можно указывать нескольких консультантов в отдельных экземплярах реквизита.

3.4. Дата регистрации. Дата в формате ГОСТ ИСО 8601.

3.5. Служба регистрации. Наименование организации, проверяемое по нормативному массиву наименований.

Два последних реквизита обязательно заполняются при регистрации ресурсов, а в случае их регистрации в нескольких службах все эти регистрации могут быть отражены в отдельных экземплярах реквизитов.

4. Факультативные реквизиты позволяют предоставить пользователю дополнительную информацию об информационном ресурсе, которая может усилить привлекательность ресурса и удобство его использования.

В повторяемых реквизитах Создатель и Участник помещаются имена лиц, внесших вклад в разработку предоставляемого информационного продукта, а в реквизите Права может быть уточнено отношение этих и других связанных лиц к обладанию авторскими и вещными правами на продукт. Для связи с авторами и консультантами в метаданные могут быть включены реквизиты Телефон и E-Mail.

Содержание сведений в ресурсе может быть уточнено включением тематического индекса по Универсальной десятичной классификации – международно признанной системе индексирования знаний (реквизит Индекс УДК). В тех случаях, когда сведения в ресурсе получены с использованием других источников, или авторы считают необходимым указать на связь данных с другими ресурсами, это может быть сделано с помощью реквизитов Ресурс-источник и Родственный ресурс. Степень секретности и другие ограничения для доступа к данным указываются в реквизите Ограничения по доступу. Временная привязка сведений уточняется реквизитами Дата создания и Ретроспектива. Последний реквизит характеризует тот временной интервал, к которому относятся собранные в ресурсе данные. Объём данных выражается в реквизите Объём в мегабайтах (объем хранящихся файлов) и в реквизите Количество документов, где указывается число однородных записей в базе данных.

Важными для пользователя могут быть сведения в реквизите Использование, где указывают на программные и технические средства, необходимые для получения информации из ресурса.

5. Cлужбам регистрации информационных ресурсов рекомендуется вести файлы нормативных данных об организациях и лицах, ответственных за разработку и предоставление ресурсов пользователям. Эти файлы должны обеспечить корректность и персональной информации и возможность однозначной идентификации источников сведений в информационных ресурсах. Наиболее авторитетные нормативные файла должна вести служба государственной регистрации информационных ресурсов.

В стандарте приводятся списки реквизитов, отражаемых в нормативных файлах данных о физических и юридических лицах. Для организаций предусмотрено 14 реквизитов, в том числе:  полное наименование, альтернативные наименования, контактные реквизиты (сайт, телефон, факс, электронная почта), место расположения (адрес, населённый пункт, регион), руководитель, вышестоящая организация, дата последнего обновления данных. Для физических лиц предусмотрено 9 реквизитов, включая: полное имя, должность, контактные данные и дата последнего обновления. Большинство реквизитов организаций имеют статус обязательных или условно обязательных. Для физического лица обязательно фиксируется только его полное имя («фамилия, имя и отчество») в соответствии с национальной практикой.

6. Большинство предусмотренных реквизитов соответствуют набору метаданных Дублинского ядра [7], что видно из следующей сопоставительной таблицы.

 

Реквизит метаописания

Элемент Dublin Core Metadata Element Set

Наименование ИР

Title

Создатель

Creator

Владелец

Консультант

Publisher

Ключевые слова

Код рубрикатора

Индекс УДК

Subject

Описание

Description

Участник

Contributor

Дата создания

Дата последнего обновления метаописания ИР

Период обновления

Дата последнего обновления ИР

Date

Использование

Объем

Количество документов

Format

Идентификатор ИР

Сетевой адрес

Identifier

Ресурс-источник

Source

Родственный ресурс

Relation

Язык

Language

Ретроспектива

Coverage

Права

Rights

Финансирование

Отсутствует

Ограничения по доступу

Отсутствует

Дата регистрации

Отсутствует

Служба регистрации

Отсутствует

 

Литература

1.                                  ГОСТ 7.70-96 СИБИД. Описание баз данных и машиночитаемых информационных ресурсов. Состав и обозначение характеристик. – Минск: Изд-во стандартов, 1996.

2.                                  ГОСТ 7.70-2003 СИБИД. Описание баз данных и машиночитаемых информационных ресурсов. Состав и обозначение характеристик. – Москва: Изд-во стандартов, 2003.

3.                                  ГОСТ 7.49-84 СИБИД. Рубрикатор ГАСНТИ. Структура, правила использования и ведения. – Москва: Изд-во стандартов, 1984.

4.                                  ГОСТ 7.77-98 СИБИД. Межгосударственный рубрикатор научно-технической информации. Структура, правила использования и ведения. – Минск: Изд-во стандартов, 1998.

5.                                  ГОСТ 7.75-97 СИБИД. Коды наименований языков. – Минск: Изд-во стандартов, 1997.

6.                                  ГОСТ ИСО 8601-2001 СИБИД. Представление дат и времени дня. Общие требования. – Минск: Изд-во стандартов, 2001.

7.                                  Dublin Core Metadata Element Set, Version 1.1: Reference Description. - http://dublincore.org/documents/dces/.

8.                                  ISO 15836:2003. Information and documentation - The Dublin Core metadata element set. – Genève, 2003

 

 

Авторы:

Белоозеров Виктор Николаевич - кандидат филологических наук, старший научный сотрудник ВИНИТИ.

Шкловская Татьяна Абрамовна – старший научный сотрудник Научно-технического центра «Информрегистр» Минсвязи России.

 



[1]  В марте 2003 г. «дублинское ядро» приобрело статус официального международного стандарта ISO [8].