Главная страница Исторического факультета МГУ   Главная страница кафедры исторической информатики  

А.Ю. Володин (Москва).

AD FONTES ERGO AD INTERNET

// Информационный бюллетень Ассоциации «История и компьютер». № 32.
Материалы X конференции АИК. Апрель 2004 г.
М.: Изд-во Моск. ун-та, 2004. C. 58-61.

О курсе инфоэвристики >>


Динамично развивающаяся глобальная сеть Интернет, в том числе и в научном секторе, оказывает всё большее влияние на информатизацию исторической науки. В.Н. Владимиров в 2001 году сформулировал ключевые вопросы, характеризующие основные этапы взаимоотношений историков и Интернет: (1) "Так что же всё-таки такое Интернет?", (2) "Насколько нужен Интернет историку?", (3) "Где можно найти необходимые ресурсы?" [1]. Сегодня к этим вопросам |С. 58| можно добавить становящийся всё более насущным вопрос: "А как создать грамотный историко-документальный электронный ресурс?"

«История пишется по источникам»– так ещё в конце XIX века была сформулирована аксиома профессиональной истории [2]. В задачи большинства исторических исследований входит введение в научный оборот новых исторических источников. Учитывая, что публикация книги с документами, на основе которых было проведено исследование, не всегда возможна, а ознакомление научной общественности с ключевыми источниками исследования – необходимо, принципиально важным и достаточно реалистичным для реализации такой задачи решением можно считать организацию историко-документального электронного ресурса [3].

В основу историко-документальной электронной публикации может быть положен принцип документальной коллекции, то есть систематизированного собрания различных типов исторических источников, представляющих историческую, научную, художественную ценность и объединяемых понятием "документ" (письменные, графические, машиночитаемые, кинофотофонодокументы) [4]. Отличительным свойством любой документальной коллекции является интерес к ней пользователя как к единому целому. Такого рода документальная коллекция может быть организована и хронологические, и проблемно, отличительным же её свойством должна быть целостность и систематичность включенных в её состав документов (то есть признаки тематического электронного ресурса).

В основе любой документальной коллекции, представленной в Интернет, лежат электронные копии исторических документов, определение юридического статуса которых находится на этапе становления [5]. Научный же статус электронной публикации документов (как и электронной публикации вообще) требует скорейшего определения, оформлением которого могут стать правила по изданию исторических документов в электронно-цифровой форме [6], в разработке которых АИК может сыграть важную роль.

В процессе создания электронной копии исторического документа (так называемой ретроконверсии [7]), включающем получение доступа и прав на копирование документов, сканирование, распознавание текста источника, организацию |С. 59| каталога и информационно-поисковой системы, одним из самых спорных вопросов является вопрос о выборе формата публикации и способах представления документа в рамках этого формата. Сегодня самыми распространенными форматами публикации можно считать форматы *.html, *.txt, *.rtf, *.doc, *.pdf, *.tiff, *.bmp, *.jpeg, *.gif. Каждый из этих форматов обладает различными возможностями по передаче как содержания текстов, графики, внешних особенностей источников, так и по аккумулированию метаинформации [8].

Сегодня значительно увеличилось число публикаций, соответствующих главному критерию отнесения издания к научному типу, а именно "полноте корпуса исторических документов, их текстов и научно-справочного аппарата" [9]. При этом нельзя не заметить отсутствие самостоятельного значения у большинства электронных публикаций; особенно явной становится их зависимость от прежних книжных изданий [10]. Обретение электронной публикацией самостоятельного значения, как и постепенное усложнение гипертекстовой модели информации [11], которое позволит любому пользователю, согласуясь со своими целями и ассоциациями, организовывать собственное знание из наличествующей информации, является перспективным направлением развития научных ресурсов Интернет.

Научная коммуникация подразумевает достаточно сложную и разветвленную систему внутрикорпоративной проверки достоверности результатов исследования каждого ученого. Сегодня такой же процесс наблюдается и в отношении к электронным ресурсам: проверка аутентичности документов определяет доверие к конкретному ресурсу [12]. Следует обратить внимание и на тот факт, что создание исторического электронного ресурса – это выход на рынок информационных услуг, который определяют экономические законы, а также конкретные интересы участников научной коммуникации (в нашем |С. 60| случае архивов, библиотек, музеев). Интернет-публикации резко меняют конъюнктуру на рынке архивной и библиотечной информации, участники которого руководствуются маркетинговой стратегией "снятия сливок", при которой "финансовая цель продавца заключена в получении максимального объема дохода посредством возможно меньшего числа сделок" [13]. Постоянно действующий электронный ресурс с систематически представленными историческим источниками обесценивает некоторый пласт библиотечно-архивных фондов.

Таким образом, формирование документальной коллекции, представленной, согласно продуманной гипертекстовой модели, в рамках тематического электронного ресурса, содержащего точные и полные электронные копии исторических документов, снабженных подробной метаинформацией, можно считать одной из важных задач сегодняшнего дня, решение которой позволит обогатить научную коммуникацию и поднять престиж отечественной исторической науки.


[1] Владимиров В.Н. Интернет для историка: и всё-таки новая парадигма! // Круг идей: историческая информатика в информационном обществе. Труды VII конференции Ассоциации "История и Компьютер". М., 2001. С. 288.
[2] Langlois Ch.-V., Seignobos Ch. Introduction aux etude historique. Paris: Hachette, 1897. P. 1.
[3] Подобный ход дела согласуется с текстологическим принципом, сформулированным Д.С. Лихачёвым: "Сперва изучить текст – потом его издать" (Лихачев Д.С. Текстология. СПб., 2001. С. 583).
[4] Российская музейная энциклопедия. М., 2001. Т. 1. С. 172-173.
[5] Наумов В.Б. Право и Интернет: очерки теории и практики. М., 2002; Злобин Е.В. О некоторых проблемах классификации и описания электронных документов как исторического источника // Круг идей: электронные ресурсы исторической информатики. Труды VIII конференции Ассоциации "История и компьютер". М., Барнаул, 2003. С. 7-36; Юшин И.Ф. Электронные документы как исторический источник // Там же. С. 37-50.
[6] Как известно, согласно действующим "Правилам издания исторических источников в СССР" (2-е изд. М., 1990. С. 14): «Исторические документы издаются типографским и нетипографским способами». Такое определение в 1990 г. было сформулировано в свете распространения факсимильного способа издания. Сегодня же можно говорить о том, что издание документа «нетипографским способом» включает и электронное издание.
[7] Термин применяется корпорацией ЭЛАР, см. подробнее: Ретроспективная конверсия компания Электронный архив.
[8] Так, например, содержание документа в формате *.html отражает не только информация, заключенная в рамках тэга <title></title>, но и описание его свойств в meta-тэгах (author, keywords, description, classification), что также относится и к указанию таких свойств документа, как название (отличное от имени файла), тема, автор, ключевые слова в форматах *.DOC и *.PDF. Особое внимание следует обратить и на материалы проекта "Dublin Core Metadata Initiative" (последние обновления документации доступны по адресу http://dublincore.org/documents/).
[9] Правила издания исторических источников в СССР. 2-е изд. М., 1990. С. 9 (курсив мой –А.В.).
[10] Издание источника, прежде опубликованного в книге (в силу отсутствия на сегодняшний день у электронной публикации научного статуса), становится тщетной попыткой правильной передачи разделения текста источника на страницы, вплоть до разбиения слов на части метой разрыва страницы. Таким образом, сутью публикации становится не электронное представление источника, а представление книжной публикации источника. В то же время при самостоятельном значении электронной публикации можно было бы принять и иную систему разметки, нежели совершенно неудобную для электронных текстов псевдопостраничную, например, нумерацию по абзацам, когда отсылка к номеру части, главе и абзацу (как делается при цитировании классических источников) позволяет легко найти цитируемый текст, причем текст источника приобретает независимость от издания, так как разметка проводится по существенным логическим его частям.
[11] Соколов Б.Г. Гипертекст истории. СПб., 2001.
[12] Парадоксы сети Web: этика и степень доверия // Вестник архивиста. 2003. № 3(69). С. 257–262.
[13] Маркетинг информации архивного фонда РФ. Справочно-методическое пособие. М., 1995. С. 35. Так, например, набор микрофильмов "Свода отчетов фабричных инспекторов" за 14 лет, PDF-копии которых предполагается выставить в рамках проекта МИС "Эволюция трудовых отношений в российской промышленности", оценены компанией "Datamics" в 255 долларов, а Библиотекой Конгресса в 55 долларов (Там же. С. 71).


 © Андрей Володин, проект Runetica: как найти чёрную кошку в Интернет?.