|
Организация информационного обеспечения на основе банков данных и знаний ⇐ ПредыдущаяСтр 7 из 7 Банк данных (БнД) представляет собой совокупность данных и систему методов и средств, предназначенных для централизованного накопления, хранения, обновления, поиска и выдачи информации в процессе работы с ним. К банкам данных ИС предъявляют требования: 1. Динамическое расширение схемы данных. Это требование вызвано тем, что в процессе передачи информации могут быть использованы различные методы, каждый из которых требует разработки различных программ, причем заранее невозможно определять оптимальную схему организации данных. Проблему можно решить, если заранее предусмотреть все возможные варианты использования данных. но при этом получится очень громоздкая структура данных. которую трудно реализовать, а большая часть данных вообще может не использоваться. В связи с этим и необходима динамическая загрузка новых подсхем в базу данных по мере развития функциональных возможностей ИС. 2. Обеспечение многопользовательского режима работы ИС. Как правило, ИС одновременно используется для параллельной обработки совокупности аналогичных информационных ресурсов, при этом изменяются лишь исходные данные. Система должна иметь механизм идентификации принадлежности любой совокупности данных к конкретному информационному ресурсу. 3. Обеспечение многовариантной разработки. В реальной практике обычно разрабатывается несколько вариантов одного и того же проекта, а выбор окончательного производится на заключительных этапах передачи информации из-за отсутствия приемлемых критериев оценки качества информации на начальных этапах. Система должна иметь средства идентификации данных, относящихся к различным вариантам одной и той же информации. 4. Работа с данными в пакетном и диалоговом режимах. Режим пакетного взаимодействия эффективен для работы прикладных программ, полностью обеспеченных всеми необходимыми данными и работающих в строго определенной последовательности. Диалоговый режим работы необходим для оперативной работы с данными пользователям различной категории. 5. Наличие в системе средств, ориентированных на пользователей различной квалификации. Администрация БД должна иметь в своем распоряжении полный набор средств для работы с данными на всех уровнях их представления: концептуальном, логическом, физическом; прикладные программы - располагать средствами взаимодействия с данными для использования программных средств; непрофессиональные пользователи - иметь в своем распоряжении язык запросов, максимально отвечающий их прикладной ориентации. 6. Время реакции системы, т. е. время, необходимое на поиск, формирование и выдачу данных в соответствии с запросом пользователя в диалоговом режиме и с требованиями эргономики до 10 с. 7. Наличие средств, моделирования любой структуры данных структурой, принятой в качестве основной для данной системы без заметного ухудшения основных показателей. 8. Хранение в БД не только фактографических данных, описывающих количественные и качественные характеристики информации, но и описание его геометрического образа. Это вызвано тем, что в передаче информации значительный объем занимают работы по формированию документации. В системе должны быть средства, обеспечивающие взаимно однозначное соответствие фактографической и геометрической информации. 9. Следует установить условия для контроля непротиворечивости данных для полного исключения конфликтных ситуации при работе системы. 10. Необходимо устранить избыточность информации, что позволит уменьшить объем памяти для хранения данных, а также обеспечить их логическую целостность. 11. Необходимо обеспечить независимость прикладных программ от физической организации данных и методов доступа к ним, а также от логической структуры тех же данных в других прикладных программах. 12. Прикладные программы должны быть независимы от изменения логической структуры данных в базе. 13. Независимость БД от использующих ее прикладных программ и их модификаций, а также от физической организации памяти и аппаратной конфигурации вычислительной системы. 14. Создание предпосылок для безбумажной информационной технологии. Банк данных (см. рис. 4.1) включает следующие основные компоненты: базу данных (БД); систему управления базой данных (СУБД); администратора базы данных (АБД); словарь данных; вычислительную систему; обслуживающий персонал. При организации информационного обеспечения на основе БнД данные рассматриваются как информация, фиксированная в определенной форме, пригодной для последующей обработки, хранения и передачи. Различают два аспекта при создании БнД: инфологический и датологический. На этапе инфологического проектирования информационной системы решаются вопросы: о каких объектах технологии и производства требуется накапливать и обрабатывать информацию в системе; какие их основные характеристики взаимосвязи между собой будут учитываться; уточнения вводимых в информационную систему понятий. При даталогическом проектировании разрабатываются соответствующие формы представления информации в системе посредством данных, а также приводятся модели и методы представления и преобразования данных, формулируются правила их смысловой интерпретации.
Рис.4.1.Структура банка данных
Даталогическое представление информационной модели содержится в базе данных. Система управления базой данных - специальный пакет программ, посредством которого реализуется централизованное управление базой данных и обеспечивается доступ к ним. В словаре данных хранится единообразная централизованная информация об объектах технологии и производства, их свойствах и отношениях, об элементах БД (их наименование, смысловое описание, структура связи с другими данными); о возможных значениях и форматах представления данных; об источниках возникновения данных; о кодах защиты и разграничениях доступа к данным со стороны пользователей. Администратор базы данных - лицо (группа лиц), реализующее управление базой данных. В банках данных АРМ, когда база данных является самостоятельной единицей, обслуживаемой одним пользователем, который и выступает в роли АБД. Многоуровневая структура технических средств ИС по принципу "ЦВК-АРМы" приводит к необходимости организации децентрализованной обработки данных на основе распределенных БнД. При этом АРМ используют локальные БнД, а ЦВК - глобальные БнД. Такая организация представляет пользователю возможности работать не только со своим локальным БнД. но и разрешить доступ к другим. Соответственно различают два типа пользователей информационной системой: глобальный пользователь, который обрабатывает данные распределенной БД (логическое объединение.локальных БД) под контролем, глобальной системы управления (СУРБД), и локальный
Рис.4.2. Распределенный банк данных с централизованным управлением пользователь, который работает с данными локальной БД с помощью локальной системы управления (СУЛБД). Системы управления выполняют управляющие функции на двух уровнях, соответствующих возможности доступа к общим данным. При реализации глобальных функций управления распределенной БД различают: централизованное и децентрализованное. Первый способ характерен тем, что все процессы обработки выполняются централизованно под управлением ЦВК. Недостатком СУРБД является невозможность доступа к распределенной БД при отказе центральной ЭВМ, достоинство состоит в простоте защиты данных и целостности БД.При втором способе каждый узел имеет копию СУРБД и обрабатывает самостоятельно обращенные к нему заявки. Отказ одного узла в этом случае не ведет к блокированию всей распределенной БД. Однако защита данных и целостности БД здесь сопряжена с дополнительными затратами. В настоящее время разработан ряд типовых СУБД для больших и малых ЭВМ. Для выбора конкретной СУБД или принятия решения по созданию специализированной СУБД следует провести оценку эффективности вариантов БнД технологического назначения по качественным и количественным показателям. Качественные показатели: степень удовлетворения информационной потребности пользователей, удобство, простота, гибкость языковых средств; трудоемкость освоения БнД технологического назначения и применение его в конкретных условиях; способность к расширению определения данных (простота внесения изменений); наличие средств оптимизации работы БД. Количественные показатели разделяют на экономические и технические. Экономические показатели связаны с расчетом экономического эффекта от внедрения БнД в ИС за счет: снижения себестоимости проектирования; унификации и типизации ИС; снижения брака в основном производстве и трудоемкости разработки технической документации; снижения трудоемкости поиска информации; уменьшения трудоемкости в сфере производства; ликвидации локальных библиотек прикладных задач.
Рис.4.3. Распределенный банк данных с децентрализованным Сравнение определяется с капитальными затратами на приобретение или создание БнД технологического назначения. К техническим показателям относятся: среднее время выдачи ответа на запросы пользователей; среднее время обновления данных в БД; максимальное время выдачи ответа на запросы; поток запросов к БД; показатели полноты и точности ответов на запросы; частота обращения к отдельным записям. Технические показатели определяются в процессе функционирования БнД в ИС на основе статистической информации. База данных ИС представляет собой идентифицированную совокупность взаимосвязанных данных, предназначенных для многоцелевого использования. Для представления информационного обеспечения с помощью перечисленных структурных единиц необходимо провести отображение объектов информатизации на физические запоминающие носители. Процесс отображения содержит несколько этапов (см.рис.4.4). На первом этапе, исходя из свойств и отношений объекта проектирования, определяется мысленная модель, которая соответствует абстрактным представлениям технологов о реальности и частично или полностью отображает объект. На широту охвата мысленной модели влияют сложность моделируемого объекта и степень использования модели в задачах проектирования. Воображаемая модель описывает воззрение пользователя на технологическую систему и его информационные потребности при проектировании. Затем компонуется концептуальная инфологическая модель с учетом потребностей пользователей и прикладных программ. Дается описание информации, требуемой по каждой конкретной задаче в интерактивном и автоматическом режимах проектирования, т.е. формируются запросы к БД. Каждый запрос соотносится с определенным фрагментом предметной области. Полученные описания инфологических моделей отражают составляющие технологии, связи между ними и должны быть инвариантны к методам представления данных в конкретной СУБД. Задача логического этапа проектирования - организация данных, выделенных на предыдущем этапе, в структуру, принятую в выбранной СУБД. Структура БД должна обеспечивать: объединение данных любого количества и объема, допускающее совместное использование общих данных различными подсистемами ИС; минимальное время обработки и избыточность данных; минимальный объем памяти внешних запоминающих устройств АРМ для хранения данных; наиболее эффективный доступ к данным.
Рис.4.4. Структурная схема процесса отображения данных
В качестве основных логических схем (структур) используются: иерархическая, сетевая, реляционная, смешанная. Иерархическая структура - совокупность данных, в которой каждая запись связана не более чем с одной записью более высокого уровня и может иметь несколько подчиненных записей. Сетевая структура - совокупность данных, в которой каждая запись может быть связана с произвольным количеством других записей, находящихся на любых уровнях иерархии. Реляционная структура состоит из совокупности таблиц (отношений), каждая из которых есть несвязанная совокупность записей одного типа. Задача заключительного физического этапа проектирования - выбор рациональной структуры хранения данных и методов доступа к ним исходя из набора методов и средств, которые предоставляются разработчику СУБД. Система управления базой данных - это специальный пакет программ, посредством которого реализуется централизованное управление БД и обеспечивается доступ к данным. Для эффективной организации информационного обеспечения ИС СУБД должна реализовывать следующие функции: создавать схему БД. т.е. описание логической и физической структур данных; добавлять и исключать записи БД; изменять значения нолей в записях БД; выбирать записи и поля из БД на основе определенных критериев; преобразовывать данные из формы входных документов в форму записей и наоборот; выполнять арифметические и логические преобразования данных на уровне полей; обеспечивать секретность данных, т.е. защиту их от несанкционированного доступа на уровнях файлов, записей и полей; обеспечивать целостность данных, т.е. защиту их от несанкционированного пополнения и изменения на уровне файлов; осуществлять взаимосвязь БД с прикладными программами. Последняя функция имеет особое значение при автоматизированном проектировании. В этом случае прикладные программы пользователей обращаются с запросами в СУБД, которая, пользуясь информацией о конкретной внешней модели и основываясь на описании логической схемы БД, формирует обращение к программным средствам того или иного метода доступа в составе ОС. Полученные данные вначале поступают в системный буфер, а затем помещаются в доступную для пользователя рабочую область. Таким образом, СУБД можно рассматривать как некоторую надстройку над ОС. через которую происходит общение прикладного пользователя с массивами информации. В состав лингвистических средств БнД входят языки описания данных (ЯОД), язык манипулирования данными (ЯМД), язык запросов и язык документации. При создании этих средств используются концепции, предложенные КОДАСИЛ (см.рис.4.5), где ЯЛОД - язык логического определения данных, ЯФОД - язык физического определения данных. Язык описания данных предназначен для описания логической и физической структуры БД и должен быть независимым от языков программирования. Описания данных, представленные на этом языке, после трансляции отображаются в управляющих таблицах. ЯОД подразделяются на физические и логические. С помощью логических ЯОД определяются логические структуры БД (описание схемы). С помощью физического ЯОД описывается размещение данных на физической запоминающей среде (описание физической схемы БД). Отображение логических структур на физическое происходит путем сравнения использованных в описании схемы имен записей и полей с соответствующими именами в физическом описании БД разделяются на физические и логические. С помощью логических ЯОД определяются логические структуры БД (описание схемы). С помощью физического ЯОД описывается размещение данных на физической запоминающей среде (описание физической схемы БД). Отображение логических структур на физическое происходит путем сравнения использованных в описании схемы имен записей и полей с соответствующими именами в физическом описании БД.
Рис 4.5. Лингвистические средства БнД
Язык манипулирования данными предназначен для обращения к модулям СУБД из функциональных подсистем ИС. ЯМД представляет собой оперативное или процедурное расширение базового языка СУБД и обеспечивает обращение к данным в терминах логической структуры. Существующие специализированные ЯНД становятся одной из преград для широкого применения СУБД в ИС, так как сложны для усвоения. В АРМ на базе микроЭВМ, ПЭВМ находит применение лингвистическое обеспечение БнД, построенное на экранном принципе. Большой удельный вес интеллектуальной творческой деятельности проектировщиков в ИС приводит к необходимости использования прикладных систем искусственного интеллекта. Наиболее распространенными из них являются экспертные системы (ЭС), отличающиеся от информационных средств автоматизированного проектирования тем, что оперируют со знаниями, а не с данными. Однако большая часть ЭС в настоящее время - это экспериментальные программные системы, эффективность которых в различных проектных ситуациях уточняется. Все знания, содержащиеся в любой системе, в общем случае разделяют на две части: собственные о проблемной среде и о способах получения новых знаний из знаний, имеющихся в системе в явном виде. Знания первого типа представляются в декларативной форме и часто трактуются как данные, знания второго типа представляются в процедурной форме и реализуются в ЭВМ как программные модули. Знания могут быть представлены и в смешанном процедурно-декларативном виде. В традиционных ИС знания о предметной области, отражены в базе данных и прикладных программах, причем отдельные фрагменты процедурно-декларативных знаний представлены в виде модулей в прикладных программах. При использовании ЭС знания представляются в данных БД, базе знаний (БЗ) и прикладных программах, причем БЗ включает в себя фундаментальные знания о предметной области, а БД - совокупность по конкретной решаемой проблеме. Знания в БЗ не зависят от программных модулей. В ИС описание процесса обработки данных полностью и однозначно определено программой. В ЭС вычислительный процесс определяется только текущими данными и правилами обработки в БЗ. При реализации диалога в ИС запросы задаются предельно точно, в рамках формата и структуры данных в БД и прикладных программах. В ЭС диалог ведется в свободной форме, часто на естественном языке (ЕЯ). Система задает наводящие вопросы, уточняющие запрос пользователя. Поддерживаются три режима работы: консультация, приобретение знания у человека-эксперта и обучение пользователя правилам БЗ. Также как и для банков данных, основными компонентами ЭС являются база знаний и средства управления знаниями (логический вывод, извлечение знаний, объяснение). Сохраняется аналогично БД этапность создания БЗ. Другую форму приобретают структуры представления знаний. Используются сети фреймов, системы продукции и семантические сети. Фреймы, подобно записям, состоят из отдельных полей-слотов, которые заполняются при конкретизации знаний, происходящей тогда, когда фрейм применяется в связи с некоторой конкретной ситуацией. Для представления структуры общих понятий в определенной предметной области фреймы обычно организуются в сети. Продукция представляет собой правило, содержащее часть, связанную с распознаванием ситуации, и часть, связанную с действиями, т.е. это пара «ситуация-действие», где левая часть содержит список признаков, которые следует искать, а правая - список того, что следует сделать. В основе правил продукций лежит принцип: они определяют набор разрешенных преобразований, с помощью которых происходит продвижение от начального состояния до окончательного решения поставленной задачи. Текущее состояние отражается с помощью множества фактов, фиксируемых в БД. В ходе решения задачи происходит сопоставление одной из частей правила с содержимым в БД. В ЭС распространена ситуация, когда могут быть применены одновременно несколько правил, которые могут быть вероятностными. Совокупность правил образует систему продукций, которая используется для описания процедурных знаний в БЗ. Базовым функциональным элементом семантической сети, подобно сетевым схемам БД, служит структура из двух компонентов - узлов и связывающих их дуг. Каждый узел представляет некоторое понятие, а дуга - отношение между парами понятий. Узлы помечаются именем существующего отношения, дуга имеет направленность. Любой из узлов может быть соединен с любым числом других узлов; в результате этого обеспечивается формирование сети фактов.
![]() ![]() Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом... ![]() ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования... ![]() ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... ![]() Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|