Главная страница

поиск
 
события

Расписание

Участники конференции

Экспоненты выставки

секции

Содержание

- A -

- B -

- C -

- D -

- E -

- F -

- G -

- H -

- K -

Алфавитный список авторов

статистика
Рейтинг@Mail.ru Rambler's Top100 AllBest.Ru Яндекс цитирования

ИТО-98/99/Секция K

ПРЕДСТАВЛЕНИЕ ТЕХНОЛОГИИ АВТОМАТИЗИРОВАННОГО ИЗДАНИЯ СПРАВОЧНИКОВ

Соловьев Александр Владимирович,
Институт системного анализа РАН, Москва

Разработана технология автоматизированного издания больших справочников. Исходная информация хранится в базе данных. БД будущего издания содержит числовую и текстовую информацию, графику и фотографические материалы. Эта технология опробована в реальном издании и была поддержана проектами РФФИ (проект 97-07-90055) и РГНФ (самый крупный издательский проект 1996-1997 гг. - проект 96-01-16109). Изданный справочник - мартиролог по пострадавшим в годы репрессий (1917-1955). Издание представляет собой двухтомник общим объемом около 1600 страниц, в котором содержится около 1100 уникальных фотографий. В БД на каждого человека отводилось до 100 полей различных типов [1].

Ввод информации в БД осуществлялся на протяжении 5 лет, за это время менялись макеты входных документов, пересматривались некоторые соглашения по вводу информации (например, сокращения наиболее часто встречающихся терминов, названий использованной литературы, географических названий, названий организаций и учреждений). Ввод информации также производился разными людьми с той или иной аккуратностью. Поэтому первая программа работы с БД осуществляет приведение информации к стандартному виду на основе механизма автоматических замен. Вторая программа осуществляет унификацию макетов входных документов и создание единого макета ввода. Третья программа осуществляет проверку-замену географии (т.к. географические названия менялись в различные годы), так же производилась проверка-замена названий учреждений. Четвертая программа осуществляет автоматическое создание индексов справочника (полные названия сокращений о которых сказано выше), так как эти индексы не могут быть автоматически созданы НИС (настольными издательскими системами). Пятая программа осуществляет перевод некоторой числовой информации в текстовую (месяцы), а также выборочный перевод ее в родительный падеж с использованием словаря. Шестая программа осуществляла проверку БД на возникновение людей-"двойников", когда из разных источников информации приходят сведения об одном и том же человеке.

Все выше приведенные программы работали с БД. В качестве СУБД использовалась разработанная в институте системного анализа объектно-ориентированная СУБД "НИКА", которая по опыту использования более приспособлена к гуманитарным областям

знаний, чем любая реляционная модель БД. СУБД "НИКА" допускает компактное хранение при разреженной структуре данных (на пустые поля не отводится места), что невозможно в реляционных моделях БД, основанных на таблицах данных [2].

Основная (седьмая) программа проекта осуществляет выкачку информации из БД с параллельной автоматической версткой издания [3]. Здесь решается задача перевода пространственной модели БД со многими перекрестными ссылками в плоскостные модели представления данных на листах бумаги [4]. На выходе седьмой программы получается готовый файл в формате НИС (в качестве НИС использовалась Corel Ventura Publisher). Эта НИС по мнению многих отечественных и зарубежных специалистов наиболее предназначена для создания публикаций большого объема [5].

Восьмая программа осуществляет корректорскую правку готового издания. Нужно отметить, что корректорская правка все же производится в основном "вручную". На этом этапе в текст были внесены многочисленные изменения, в том числе и добавлены люди, которых не было в БД. Поэтому следующим этапом работы явилось создание комплекса программ осуществляющих добавление людей в БД из уже сверстанной книги. Девятая программа осуществляла добавление в БД поля "Текст книги" и коррекцию макетов входных документов БД. Десятая программа осуществляла заполнение БД текстом книги. Этот комплекс программ необходим для поддержки автоматического быстрого переиздания справочника.

Литература

  1. Аристова Л.С., Соловьев А.В., Соловьева Н.С., Сомин Н.В. База данных по новейшей истории Русской Православной Церкви. Тезисы доклада//Информационные системы в науке 95 - М.:Фазис, 1995, С.13-14
  2. Богачева А.Н., Емельянов Н.Е., Романов А.П. Генерация информационных систем по формам входных и выходных документов//PC Magazine - N1 - 1993 - С.85-89.
  3. Емельянов Н.Е., Соловьев А.В. Использование СУБД в издательской деятельности//Материалы VI Международной конференции "Применение новых технологий в образовании" 29 июня - 2 июля 1995 г. Троицк - С.123-125.
  4. N.E. Emelyanov, A.V. Soloviev, I.V. Schelkacheva. Classification of structured data representations/Proceedings of the Third International Workshop on Advances in Databases and Information Systems//MEPhI Publishing - 1996 - Vol.2 - P.4-8.
  5. Графические средства и системы. Лидеры настольных издательских систем//Computer Week Moscow - N49 - 1994 - С.42-46.
Сервер поддерживается фирмой НПП "БИТ про"
и Московским центром Федерации Интернет Образования