Библиотека ДИССЕРТАЦИЙ

Главная страница Каталог

Новые диссертации Авторефераты
Книги
Статьи
О сайте
Авторские права
О защите
Для авторов
Бюллетень ВАК
Аспирантам
Новости
Поиск
Конференции
Полезные ссылки Перевод текста

Введите слово для поиска

Зимакова Мария Вячеславовна. Математические модели и методы для автоматизированных систем обработки структурированной информации

Автореферат диссертации на соискание ученой степени кандидата технических наук

Пенза -2001

Работа выполнена на кафедре «Математическое обеспечение и применение ЭВМ» Пензенского государственного университета.

Научный руководитель: кандидат технических наук, профессор Хмелевской Борис Георгиевич
Научный консультант: доктор технических наук, профессор Щербаков Михаил Александрович
Официальные оппоненты: доктор технических наук, профессор Лебедев Виктор Борисович
доктор технических наук, профессор Чижухин Геннадий Николаевич

Ведущая организация: ФГУП НПП «Рубин», г. Пенза

Актуальность темы. Наиболее актуальной задачей в настоящее время для современных предприятий в информационном плане является обеспечение эффективного управления всем объемом разнородных данных, которые порождаются, хранятся и используются в автоматизированной системе управления предприятием. Существенное отличие в подходе к методам управления вызвано введением на предприятиях системы менеджмента качества в соответствии со стандартами серии ISO 9000:2000 и концепцией информационной поддержки жизненного цикла сложной продукции в соответствии с семейством стандартов ISO 10303 по CALS-технологиям, одним из главных требований которых является создание и хранение структурированной информации.

С внедрением корпоративных сетей для поддержки систем управления предприятием и использованием Web-сетей для межкорпоративного обмена, все большее распространение для представления логической структуры документов получает новый метаязык XML, который является подмножеством SGML. Указанные обстоятельства вызвали большой научный интерес к проблеме управления полуструктурированными данными, которая в настоящее время разрабатывается многочисленными фирмами и научными центрами, среди которых можно выделить группу Дж. Ульмана в Стэндфордском университете (США), Database Group из центра CS+E (Center 'Science + Education') при Вашингтонском университете (США), группу CEDAR (Center of Excellence for Document Analysis and Recognition) в университете Буффало (США), CENPARMI (Center for Pattern Recognition and Machine Intelligence) в Конкордском университете (Канада), а также группу DAR (Document Analysis and Recognition) во Фрибургском университете (Швейцария).

Большинство работ по проблеме определения логической структуры предназначены либо для документов строго определенного стиля, либо документов с изменяющейся структурой, но ограниченным числом изменений. Однако, существует большой класс корпоративной документации, который не имеет постоянного состава, причем каждый отдельный документ также может изменять свою логическую структуру и состав логических элементов, что делает неприменимым использование традиционного подхода по созданию фиксированного проблемно-ориентированного языка на базе XML.

В связи с этим актуальным становится решение задачи разработки автоматизированной системы обработки структурированной информации с целью определения логической структуры заданного класса документов и последующего сохранения структурированных документов в базе данных. Применение автоматизированной системы для работы с полуструктурированной информацией потребовало создания математических моделей и методов определения логической структуры класса полуструктурированных документов. Реализация функций хранения в автоматизированной системе обработки структурированной информации вызывает необходимость разработки отображения логической структуры документов на различные модели баз данных и языка запросов для извлечения структурированных данных.

Целью диссертационной работы является:
- исследование и разработка математических моделей и методов определения логической структуры класса документов для автоматизированной системы, способной эффективно функционировать в системе управления предприятием при изменяющемся составе класса полуструктурированных документов;
- исследование и разработка отображения логической структуры документов на различные модели баз данных и языка структурированных запросов с использованием коммерческих баз данных, позволяющих осуществлять эффективную поддержку работы автоматизированной системы при изменяющемся составе класса структурированных документов.

Задачи исследования. Для достижения поставленной цели необходимо решить следующие основные задачи:
1. Провести системный анализ информационных процессов систем управления предприятием с целью повышения качества корпоративного управления и эффективного обмена межкорпоративной информацией.
2. Осуществить критический анализ и классификацию методов создания и хранения структурированной информации для работы с классами полуструктурированных документов переменного состава.
3. Разработать модели для представления класса документов, позволяющих использовать контекстно-вероятностные зависимости между элементами структурированных документов.
4. Разработать методы формирования представления заданного конечного класса документов в соответствии с выбранной моделью, которые позволят создать представление класса документов с заданными характеристиками.
5. Разработать методы грамматического разбора, которые позволяют существенно улучшить характеристики по сравнению с недетерминированными методами.
6. Разработать методы хранения и языки запросов структурированной информации в реляционных базах данных, отличающиеся гибким представлением логической структуры класса документов с изменяющимся составом.
7. Разработать автоматизированную систему создания и хранения структурированной информации с использованием предложенных моделей и методов с целью получения численных характеристик и экспериментальных зависимостей, подтверждающих их эффективность.

Методы исследования. В диссертационной работе использованы методы системного анализа, абстрактной алгебры, теории предикатов, теории вероятностей и математической статистики, комбинаторики, теории нечетких множеств, теории синтаксического анализа. При программной реализации предлагаемых методов и алгоритмов использованы технологии модульного и объектно-ориентированного проектирования программного обеспечения.

Научная новизна. Научная новизна представленной диссертационной работы "Модели и методы управления структурой собственности жилого фонда" заключается в следующем:
1. Предложено с целью повышения эффективности работы с классами полуструктурированных документов переменного состава ввести в структуру системы управления предприятием автоматизированную систему создания и хранения структурированной информации.
2. Предложена новая абстрактная математическая модель класса структурированных документов, определяющая не только физическую и логическую структуру документов заданного класса, но и набор контекстно-вероятностных зависимостей между элементами структуры.
3. Разработаны и исследованы итерационные методы и алгоритмы формирования представления заданного конечного класса документов с использованием предложенной контекстно-вероятностной модели, которые позволяют создавать представление заданного класса документов за конечное число итераций.
4. Разработаны и исследованы методы и алгоритмы комбинированного грамматического разбора документов с общей тенденцией снизу вверх с использованием физической структуры и контекстно-вероятностных зависимостей, что позволило существенно улучшить характеристики алгоритмов по сравнению с недетерминированными методами.
5. Предложено исчисление для структурированных запросов, направленное на выделение логической структуры электронного документа и на основе предложенного исчисления разработан гибкий и выразительный язык для структурированных запросов.
6. Разработаны методы хранения структурированной информации в реляционных базах данных, отличающиеся гибким представлением логической структуры класса документов с изменяющимся составом.
7. Проведено экспериментальное исследование разработанной автоматизированной системы создания и хранения структурированной информации на множестве документов системы менеджмента качества и были получены численные характеристики и экспериментальные зависимости, подтверждающие эффективность предложенных моделей и методов.

Запрос на диссертацию присылайте на адрес kulseg@mail.ru

Биология
Ветеринария
Геология
Искусствоведение
История
Культурология
Медицина
Педагогика
Политика
Психология
Сельхоз
Социология
Техника
Физ-мат
Филология
Философия
Химия
Экономика
Юриспруденция

Подписаться на новости библиотеки


Пишите нам
X