![]() |
![]() |
|||||||
|
ПРЕДСТАВЛЕНИЕ ТЕХНОЛОГИИ АВТОМАТИЗИРОВАННОГО ИЗДАНИЯ СПРАВОЧНИКОВ Соловьев Александр Владимирович, Разработана технология автоматизированного издания больших справочников. Исходная информация хранится в базе данных. БД будущего издания содержит числовую и текстовую информацию, графику и фотографические материалы. Эта технология опробована в реальном издании и была поддержана проектами РФФИ (проект 97-07-90055) и РГНФ (самый крупный издательский проект 1996-1997 гг. - проект 96-01-16109). Изданный справочник - мартиролог по пострадавшим в годы репрессий (1917-1955). Издание представляет собой двухтомник общим объемом около 1600 страниц, в котором содержится около 1100 уникальных фотографий. В БД на каждого человека отводилось до 100 полей различных типов [1]. Ввод информации в БД осуществлялся на протяжении 5 лет, за это время менялись макеты входных документов, пересматривались некоторые соглашения по вводу информации (например, сокращения наиболее часто встречающихся терминов, названий использованной литературы, географических названий, названий организаций и учреждений). Ввод информации также производился разными людьми с той или иной аккуратностью. Поэтому первая программа работы с БД осуществляет приведение информации к стандартному виду на основе механизма автоматических замен. Вторая программа осуществляет унификацию макетов входных документов и создание единого макета ввода. Третья программа осуществляет проверку-замену географии (т.к. географические названия менялись в различные годы), так же производилась проверка-замена названий учреждений. Четвертая программа осуществляет автоматическое создание индексов справочника (полные названия сокращений о которых сказано выше), так как эти индексы не могут быть автоматически созданы НИС (настольными издательскими системами). Пятая программа осуществляет перевод некоторой числовой информации в текстовую (месяцы), а также выборочный перевод ее в родительный падеж с использованием словаря. Шестая программа осуществляла проверку БД на возникновение людей-"двойников", когда из разных источников информации приходят сведения об одном и том же человеке. Все выше приведенные программы работали с БД. В качестве СУБД использовалась разработанная в институте системного анализа объектно-ориентированная СУБД "НИКА", которая по опыту использования более приспособлена к гуманитарным областям знаний, чем любая реляционная модель БД. СУБД "НИКА" допускает компактное хранение при разреженной структуре данных (на пустые поля не отводится места), что невозможно в реляционных моделях БД, основанных на таблицах данных [2]. Основная (седьмая) программа проекта осуществляет выкачку информации из БД с параллельной автоматической версткой издания [3]. Здесь решается задача перевода пространственной модели БД со многими перекрестными ссылками в плоскостные модели представления данных на листах бумаги [4]. На выходе седьмой программы получается готовый файл в формате НИС (в качестве НИС использовалась Corel Ventura Publisher). Эта НИС по мнению многих отечественных и зарубежных специалистов наиболее предназначена для создания публикаций большого объема [5]. Восьмая программа осуществляет корректорскую правку готового издания. Нужно отметить, что корректорская правка все же производится в основном "вручную". На этом этапе в текст были внесены многочисленные изменения, в том числе и добавлены люди, которых не было в БД. Поэтому следующим этапом работы явилось создание комплекса программ осуществляющих добавление людей в БД из уже сверстанной книги. Девятая программа осуществляла добавление в БД поля "Текст книги" и коррекцию макетов входных документов БД. Десятая программа осуществляла заполнение БД текстом книги. Этот комплекс программ необходим для поддержки автоматического быстрого переиздания справочника. Литература
|