|
|
Материалы Проекта «Металлургия России в начале ХХ века» составлены в рамках работы над диссертацией «Формирование и развитие российского трубного производства в конце XIX - начале XX века (верификация статистических источников)», в связи с чем в наименовании таблиц присутствует название «Свод» с индексами от 2.1 (1) до 3.2 (8). В данном случае «Свод» обозначает сводную таблицу, составленную на основе одного или нескольких источников по определенным критериям, наименование которой было сокращено в целях ее формального отделения от прочих многочисленных таблиц, которые были составлены в рамках работы. При этом каждый «Свод» получил собственный индекс исходя из структуры работы, где его номер соответствует главе и параграфу в диссертации, где он был использован, а цифра в скобках указывает на порядок при рассмотрении материала.
1. Автоматическое скачивание таблицы в Excel происходит при нажатии соответствующей ссылки;
2. При необходимости (в зависимости от политики безопасности файлы могут открываться только для чтения в режиме защищенного просмотра) в целях возможности работы с файлами необходимо разрешить их редактирование (нажать на панели сообщений кнопку «Разрешить редактирование»). При осуществлении доступа к редактированию появляется возможность пользоваться файлами в режиме форматирования столбцов (пользоваться фильтрами и осуществлять поиск необходимых данных);
3. Все листы файлов в целях избегания их непроизвольного изменения значений по умолчанию заблокированы. Для возможности пользоваться всеми возможностями, в том числе рассмотрения взаимосвязей между значениями при расчёте показателей (установленные формулы), необходимо разблокировать интересующий лист. По умолчанию для всех листов всех файлов установлен единый простой пароль: 123 (также вписан под названием каждого свода на главной странице всех файлов), который необходимо ввести в меню «Снять защиту листа» (при наведении курсором на название листа книги нажать правой кнопкой мышки и выйти в меню «Снять защиту листа», а также вкладка «Рецензирование», на ленте в блоке инструментов «Изменения» нажать на кнопку «Снять защиту листа» и ввести пароль, и иные стандартные способы, используемые в Excel). После разблокировки возникают все возможности для использования материалов;
4. Все используемые в файлах настройки являются стандартными для Excel и по умолчанию настроены для удобства работы (закреплены области с заголовками таблиц, применены фильтры и пр.).
Всего база содержит более 167 тыс. значений, из которых более 73 тыс. – это непосредственно значения источников, а оставшиеся 94 тыс. – расчетные данные.
В основе ресурса лежит 9 видов источников, наименование которых указаны под каждым файлом для скачивания, а также непосредственно внутри документа над названием таблицы. Внутри таблиц в столбце «Источник данных» указание на источник обозначает, что все значения, расположенные по данной строке (если по столбцам не указанно иное), были получены непосредственно из данного конкретного источника. Конкретный год в столбце «Год» обозначает год, по которому представлены значения данного источникам (в случае наличия выпусков по месяцам также указывается и месяц), а страница в соответствующем столбце показывает конкретную страницу в источнике, откуда были получены значения. Таким образом, на основе указанных характеристик фактически к каждому значению формируется ссылка на источник данных, к которому при необходимости можно дополнительно обратиться. При этом год выпуска источника целенаправленно не был указан, так как по году отчетности конкретный источник легко определяется, а наличие сразу двух годовых периодов (год отчетности и год выпуска) при анализе показателей значительно затрудняет формирование сводных таблиц.
В столбце «Источник данных» указание на автоматический расчет или разницу показателей определяет расчетное происхождение значений по строкам расположения (если по конкретному столбцы не указано иное). Соответственно, расчетные значения могли формироваться как по строкам (формулы сформированы по строкам с исходными значениями выше или ниже в конкретном столбце), так и по столбцам (формулы сформированы по столбцам с исходными значениями справа или слева в конкретной строке). В файлах все исходные формулы сохранены.
Все своды структурированы единым образом, но имеют очень широкую номенклатуру рассматриваемых категорий значений. Все составленные таблицы информационной базы включают в себя различные показатели и категории значений, которые разделяются по своему местонахождению в таблице. Так, все показатели располагаются по строкам, достаточно структурированы между собой и не имеют дополнительных групп внутри себя (в соседних столбцах они связаны только логически и системно), а категории анализа находятся в шапке составленных таблиц, достаточно слабо структурированы и в абсолютном большинстве случаев делятся на ряд дополнительных подкатегорий. Например, среди показателей можно выделить следующие: «Тип завода», «Источник данных», «Год» и/или «Месяц», «Название продукции» и др. Отдельно выделяются показатели, которые могут составлять и уровни расчета, к которым в наиболее детализированном виде в первую очередь относятся «Завод» и «Статья таможенного тарифа» (и/или «Название статьи таможенного тарифа»), а в более общем – губернии, группы производств, вид продукции и т.д. В целом показателей по каждой составленной таблице, как правило, до 10 штук, наименования которых отражают их сущность. Так, например, категория «Завод» обозначает конкретный завод или сумму значений заводов по их типу или сумму типов заводов, аналогичным образом «Год» и/или «Месяц» – конкретный год и/или месяц и так далее по всем показателям. Характеристика каждого размещенного в таблице значения определяется совокупностью атрибутов, наименования показателей которых размещены в каждой строке, а наименования категорий – в названиях столбцов.
Каждый файл состоит из двух или более листов, где на главном листе, по умолчанию названном по индексу свода, представлена исходная составленная таблица, а на прочих листах – дополнительные таблицы, составленные на основе исходной по разработанной методике. Дополнительные таблицы составлены в целях возможности осуществления автоматического сводного анализа по различным критериям, которые определены целью и задачами работы. Дополнительные таблицы исходя из полноты и разветвлённости данных исходной таблицы получили условные наименования по типам от I и выше, где тип I обозначает стандартную схему структурирования исходной таблицы, а прочие типы – дополнительные варианты, которые при широком охвате данных исходной таблицы позволяют всесторонне сделать анализ значений по различным критериям. В целях возможности проведения автоматического сводного анализа во все таблицы по типам анализа были введены различные дополнительные категории и индексы, которые были определены исходя из специфики конкретного свода. Методология их составления и различные особенности представлены непосредственно в диссертации, а автоматический сводный анализ возможен при хорошем понимании статистического материала и источника. Между тем, использование исходных таблиц (Сводов) очень простое и интуитивное, не требующее каких-либо специальных знаний.
МТ I и МТ II – это месжводные таблицы, которые были составлены на основе данных нескольких сводов в целях их сравнения между собой, где также введены многочисленные дополнительные категории и индексы, а сами таблицы претерпели значительные изменения в целях возможности их сравнения.
Все своды также имеют единую цветовую гамму, где отдельные значения, требующие внимания, выделены дополнительными цветами, пояснения по которым представлены в самом низу после окончания исходной таблицы. Так, темно-зеленым цветом стандартно выделены первичные ошибки, получившие подобное наименование в рамках работы, а светло-зеленым – вторичные, а также использованы и другие цвета, пояснения по которым всегда представлены. В случае возможности определения причины ошибки или необходимости пояснения в столбце «Примечание» по конкретной строке представлены комментарии. Также в ряде случаев спорные значения или, напротив, точно определенные как ошибочные, но с выявленным верным числом и заменным на него, в обязательном порядке подлежали комментированию.
Подробное описание информационного ресурса в статье:
Акимов А.В. — Создание тематической информационной базы статистических источников по экономической истории: цифровой ресурс и опыт его верификации // Историческая информатика. – 2020. – № 2. – С. 35 – 55 (гиперссылка https://nbpublish.com/library_read_article.php?id=33401)