Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Организация информационного обеспечения на основе банков данных и знаний





Банк данных (БнД) представляет собой совокупность данных и систему методов и средств, предназначенных для централизованного накопления, хранения, обновления, поиска и выдачи информации в процессе работы с ним. К банкам данных ИС предъявляют требова­ния:

1. Динамическое расширение схемы данных. Это требование вызвано тем, что в процессе передачи информации могут быть ис­пользованы различные методы, каждый из которых требует разработ­ки различных программ, причем заранее невозможно определять оп­тимальную схему организации данных. Проблему можно решить, если заранее предусмотреть все возможные варианты использования дан­ных. но при этом получится очень громоздкая структура данных. которую трудно реализовать, а большая часть данных вообще может не использоваться.

В связи с этим и необходима динамическая загрузка новых подсхем в базу данных по мере развития функциональных возможнос­тей ИС.

2. Обеспечение многопользовательского режима работы ИС. Как правило, ИС одновременно используется для параллельной обработки совокупности аналогичных информационных ресурсов, при этом изме­няются лишь исходные данные. Система должна иметь механизм иден­тификации принадлежности любой совокупности данных к конкретному информационному ресурсу.

3. Обеспечение многовариантной разработки. В реальной прак­тике обычно разрабатывается несколько вариантов одного и того же проекта, а выбор окончательного производится на заключительных этапах передачи информации из-за отсутствия приемлемых критериев оценки качества информации на начальных этапах. Система должна иметь средства идентификации данных, относящихся к различным ва­риантам одной и той же информации.



4. Работа с данными в пакетном и диалоговом режимах. Режим пакетного взаимодействия эффективен для работы прикладных прог­рамм, полностью обеспеченных всеми необходимыми данными и рабо­тающих в строго определенной последовательности. Диалоговый ре­жим работы необходим для оперативной работы с данными пользова­телям различной категории.

5. Наличие в системе средств, ориентированных на пользова­телей различной квалификации. Администрация БД должна иметь в своем распоряжении полный набор средств для работы с данными на всех уровнях их представления: концептуальном, логическом, физи­ческом; прикладные программы - располагать средствами взаимо­действия с данными для использования программных средств; непро­фессиональные пользователи - иметь в своем распоряжении язык запросов, максимально отвечающий их прикладной ориентации.

6. Время реакции системы, т. е. время, необходимое на по­иск, формирование и выдачу данных в соответствии с запросом пользователя в диалоговом режиме и с требованиями эргономики до 10 с.

7. Наличие средств, моделирования любой структуры данных структурой, принятой в качестве основной для данной системы без заметного ухудшения основных показателей.

8. Хранение в БД не только фактографических данных, описы­вающих количественные и качественные характеристики информации, но и описание его геометрического образа. Это вызвано тем, что в передаче информации значительный объем занимают работы по формированию документации. В системе должны быть средства, обеспечи­вающие взаимно однозначное соответствие фактографической и гео­метрической информации.

9. Следует установить условия для контроля непротиворечи­вости данных для полного исключения конфликтных ситуации при ра­боте системы.

10. Необходимо устранить избыточность информации, что позволит уменьшить объем памяти для хранения данных, а также обес­печить их логическую целостность.

11. Необходимо обеспечить независимость прикладных программ от физической организации данных и методов доступа к ним, а так­же от логической структуры тех же данных в других прикладных программах.

12. Прикладные программы должны быть независимы от измене­ния логической структуры данных в базе.

13. Независимость БД от использующих ее прикладных программ и их модификаций, а также от физической организации памяти и ап­паратной конфигурации вычислительной системы.

14. Создание предпосылок для безбумажной информационной технологии.

Банк данных (см. рис. 4.1) включает следующие основные ком­поненты: базу данных (БД); систему управления базой данных (СУБД); администратора базы данных (АБД); словарь данных; вычис­лительную систему; обслуживающий персонал. При организации ин­формационного обеспечения на основе БнД данные рассматриваются как информация, фиксированная в определенной форме, пригодной для последующей обработки, хранения и передачи.

Различают два аспекта при создании БнД: инфологический и датологический.

На этапеинфологического проектирования информационной сис­темы решаются вопросы: о каких объектах технологии и производс­тва требуется накапливать и обрабатывать информацию в системе; какие их основные характеристики взаимосвязи между собой будут учитываться; уточнения вводимых в информационную систему поня­тий. Придаталогическом проектировании разрабатываются соответс­твующие формы представления информации в системе посредством данных, а также приводятся модели и методы представления и пре­образования данных, формулируются правила их смысловой интерпре­тации.

 

Рис.4.1.Структура банка данных

 

Даталогическое представление информационной модели содер­жится в базе данных. Система управления базой данных - специаль­ный пакет программ, посредством которого реализуется централизо­ванное управление базой данных и обеспечивается доступ к ним. В словаре данных хранится единообразная централизованная информа­ция об объектах технологии и производства, их свойствах и отно­шениях, об элементах БД (их наименование, смысловое описание, структура связи с другими данными); о возможных значениях и фор­матах представления данных; об источниках возникновения данных; о кодах защиты и разграничениях доступа к данным со стороны пользователей. Администратор базы данных - лицо (группа лиц), реализующее управление базой данных. В банках данных АРМ, когда база данных является самостоятельной единицей, обслуживаемой од­ним пользователем, который и выступает в роли АБД.

Многоуровневая структура технических средств ИС по принципу "ЦВК-АРМы" приводит к необходимости организации децентрализован­ной обработки данных на основе распределенных БнД. При этом АРМ используют локальные БнД, а ЦВК - глобальные БнД. Такая органи­зация представляет пользователю возможности работать не только со своим локальным БнД. но и разрешить доступ к другим. Соответственно различают два типа пользователей информационной системой: глобальный пользователь, который обрабатывает данные распределенной БД (логическое объединение .локальных БД) под контролем, глобальной системы управления (СУРБД), и локальный

 

Рис.4.2. Распределенный банк данных с централизованным управлением

пользователь, который работает с данными локальной БД с помощью локальной системы управления (СУЛБД). Системы управления выпол­няют управляющие функции на двух уровнях, соответствующих воз­можности доступа к общим данным.

При реализации глобальных функций управления распределенной БД различают: централизованное и децентрализованное.

Первый способ характерен тем, что все процессы обработки выполняются централизованно под управлением ЦВК. Недостатком СУРБД является невозможность доступа к распределенной БД при от­казе центральной ЭВМ, достоинство состоит в простоте защиты дан­ных и целостности БД .При втором способе каждый узел имеет копию СУРБД и обрабатывает самостоятельно обращенные к нему заявки. Отказ одного узла в этом случае не ведет к блокированию всей распределенной БД. Однако защита данных и целостности БД здесь сопряжена с дополнительными затратами.

В настоящее время разработан ряд типовых СУБД для больших и малых ЭВМ. Для выбора конкретной СУБД или принятия решения по созданию специализированной СУБД следует провести оценку эффек­тивности вариантов БнД технологического назначения по качествен­ным и количественным показателям.

Качественные показатели: степень удовлетворения информаци­онной потребности пользователей, удобство, простота, гибкость языковых средств; трудоемкость освоения БнД технологического назначения и применение его в конкретных условиях; способность к расширению определения данных (простота внесения изменений); на­личие средств оптимизации работы БД.

Количественные показатели разделяют на экономические и тех­нические.

Экономические показатели связаны с расчетом экономического эффекта от внедрения БнД в ИС за счет: снижения себестоимости проектирования; унификации и типизации ИС; снижения брака в ос­новном производстве и трудоемкости разработки технической доку­ментации; снижения трудоемкости поиска информации; уменьшения трудоемкости в сфере производства; ликвидации локальных библио­тек прикладных задач.

 

 

Рис.4.3. Распределенный банк данных с децентрализованным
управлением

Сравнение определяется с капитальными затратами на приобре­тение или создание БнД технологического назначения.

К техническим показателям относятся: среднее время выдачи ответа на запросы пользователей; среднее время обновления данных в БД; максимальное время выдачи ответа на запросы; поток запро­сов к БД; показатели полноты и точности ответов на запросы; час­тота обращения к отдельным записям.

Технические показатели определяются в процессе функциониро­вания БнД в ИС на основе статистической информации.

База данных ИС представляет собой идентифицированную сово­купность взаимосвязанных данных, предназначенных для многоцеле­вого использования.

Для представления информационного обеспечения с помощью пе­речисленных структурных единиц необходимо провести отображение объектов информатизации на физические запоминающие носители. Процесс отображения содержит несколько этапов (см.рис.4.4).

На первом этапе, исходя из свойств и отношений объекта про­ектирования, определяется мысленная модель, которая соответству­ет абстрактным представлениям технологов о реальности и частично или полностью отображает объект. На широту охвата мысленной мо­дели влияют сложность моделируемого объекта и степень использо­вания модели в задачах проектирования. Воображаемая модель опи­сывает воззрение пользователя на технологическую систему и его информационные потребности при проектировании.

Затем компонуется концептуальная инфологическая модель с учетом потребностей пользователей и прикладных программ. Дается описание информации, требуемой по каждой конкретной задаче в ин­терактивном и автоматическом режимах проектирования, т.е. форми­руются запросы к БД. Каждый запрос соотносится с определенным фрагментом предметной области. Полученные описания инфологических моделей отражают составляющие технологии, связи между ними и должны быть инвариантны к методам представления данных в конк­ретной СУБД.

Задача логического этапа проектирования - организация дан­ных, выделенных на предыдущем этапе, в структуру, принятую в выбранной СУБД. Структура БД должна обеспечивать: объединение данных любого количества и объема, допускающее совместное ис­пользование общих данных различными подсистемами ИС; минимальное время обработки и избыточность данных; минимальный объем памяти внешних запоминающих устройств АРМ для хранения данных; наиболее эффективный доступ к данным.

 

 

Рис.4.4. Структурная схема процесса отображения данных

 

 

В качестве основных логических схем (структур) используют­ся: иерархическая, сетевая, реляционная, смешанная. Иерархичес­кая структура - совокупность данных, в которой каждая запись связана не более чем с одной записью более высокого уровня и мо­жет иметь несколько подчиненных записей. Сетевая структура - со­вокупность данных, в которой каждая запись может быть связана с произвольным количеством других записей, находящихся на любых уровнях иерархии. Реляционная структура состоит из совокупности таблиц (отношений), каждая из которых есть несвязанная совокуп­ность записей одного типа.

Задача заключительного физического этапа проектирования - выбор рациональной структуры хранения данных и методов доступа к ним исходя из набора методов и средств, которые предоставляются разработчику СУБД.

Система управления базой данных - это специальный пакет программ, посредством которого реализуется централизованное уп­равление БД и обеспечивается доступ к данным. Для эффективной организации информационного обеспечения ИС СУБД должна реализо­вывать следующие функции: создавать схему БД. т.е. описание логи­ческой и физической структур данных; добавлять и исключать запи­си БД; изменять значения нолей в записях БД; выбирать записи и поля из БД на основе определенных критериев; преобразовывать данные из формы входных документов в форму записей и наобо­рот; выполнять арифметические и логические преобразования данных на уровне полей; обеспечивать секретность данных, т.е. защиту их от несанкционированного доступа на уровнях файлов, записей и по­лей; обеспечивать целостность данных, т.е. защиту их от несанкци­онированного пополнения и изменения на уровне файлов; осущест­влять взаимосвязь БД с прикладными программами.

Последняя функция имеет особое значение при автоматизиро­ванном проектировании. В этом случае прикладные программы поль­зователей обращаются с запросами в СУБД, которая, пользуясь ин­формацией о конкретной внешней модели и основываясь на описании логической схемы БД, формирует обращение к программным средствам того или иного метода доступа в составе ОС. Полученные данные вначале поступают в системный буфер, а затем помещаются в дос­тупную для пользователя рабочую область. Таким образом, СУБД можно рассматривать как некоторую надстройку над ОС. через кото­рую происходит общение прикладного пользователя с массивами ин­формации.

В состав лингвистических средств БнД входят языки описания данных (ЯОД), язык манипулирования данными (ЯМД), язык запросов и язык документации. При создании этих средств используются кон­цепции, предложенные КОДАСИЛ (см.рис.4.5), где ЯЛОД - язык логи­ческого определения данных, ЯФОД - язык физического определения данных.

Язык описания данных предназначен для описания логической и физической структуры БД и должен быть независимым от языков программирования. Описания данных, представленные на этом языке, после трансляции отображаются в управляющих таблицах. ЯОД подразделяются на физические и логические. С помощью логических ЯОД определяются логические структуры БД (описание схемы). С помощью физического ЯОД описывается размещение данных на физической за­поминающей среде (описание физической схемы БД). Отображение ло­гических структур на физическое происходит путем сравнения ис­пользованных в описании схемы имен записей и полей с соответс­твующими именами в физическом описании БД разделяются на физические и логические. С помощью логических ЯОД определяются логические структуры БД (описание схемы). С помощью физического ЯОД описывается размещение данных на физической за­поминающей среде (описание физической схемы БД). Отображение ло­гических структур на физическое происходит путем сравнения ис­пользованных в описании схемы имен записей и полей с соответс­твующими именами в физическом описании БД.

 

 

 
 

Рис 4.5. Лингвистические средства БнД

 

Язык манипулирования данными предназначен для обращения к модулям СУБД из функциональных подсистем ИС. ЯМД представляет собой оперативное или процедурное расширение базового языка СУБД и обеспечивает обращение к данным в терминах логической структу­ры.

Существующие специализированные ЯНД становятся одной из преград для широкого применения СУБД в ИС, так как сложны для усвоения. В АРМ на базе микроЭВМ, ПЭВМ находит применение линг­вистическое обеспечение БнД, построенное на экранном принципе.

Большой удельный вес интеллектуальной творческой деятель­ности проектировщиков в ИС приводит к необходимости использова­ния прикладных систем искусственного интеллекта. Наиболее расп­ространенными из них являются экспертные системы (ЭС), отличаю­щиеся от информационных средств автоматизированного проектирова­ния тем, что оперируют со знаниями, а не с данными. Однако боль­шая часть ЭС в настоящее время - это экспериментальные программ­ные системы, эффективность которых в различных проектных ситуа­циях уточняется.

Все знания, содержащиеся в любой системе, в общем случае разделяют на две части: собственные о проблемной среде и о способах получения новых знаний из знаний, имеющихся в системе в явном виде. Знания первого типа представляются в декларативной форме и часто трактуются как данные, знания второго типа предс­тавляются в процедурной форме и реализуются в ЭВМ как программ­ные модули. Знания могут быть представлены и в смешанном проце­дурно-декларативном виде.

В традиционных ИС знания о предметной области, отражены в базе данных и прикладных программах, причем отдельные фрагменты процедурно-декларативных знаний представлены в виде модулей в прикладных программах. При использовании ЭС знания представляют­ся в данных БД, базе знаний (БЗ) и прикладных программах, причем БЗ включает в себя фундаментальные знания о предметной области, а БД - совокупность по конкретной решаемой проблеме. Знания в БЗ не зависят от программных модулей. В ИС описание процесса обра­ботки данных полностью и однозначно определено программой. В ЭС вычислительный процесс определяется только текущими данными и правилами обработки в БЗ. При реализации диалога в ИС запросы задаются предельно точно, в рамках формата и структуры данных в БД и прикладных программах. В ЭС диалог ведется в свободной фор­ме, часто на естественном языке (ЕЯ). Система задает наводящие вопросы, уточняющие запрос пользователя. Поддерживаются три ре­жима работы: консультация, приобретение знания у человека-экс­перта и обучение пользователя правилам БЗ.

Также как и для банков данных, основными компонентами ЭС являются база знаний и средства управления знаниями (логический вывод, извлечение знаний, объяснение). Сохраняется аналогично БД этапность создания БЗ. Другую форму приобретают струк­туры представления знаний. Используются сети фреймов, системы продукции и семантические сети.

Фреймы, подобно записям, состоят из отдельных полей-слотов, которые заполняются при конкретизации знаний, происходящей тог­да, когда фрейм применяется в связи с некоторой конкретной ситу­ацией. Для представления структуры общих понятий в определенной предметной области фреймы обычно организуются в сети.

Продукция представляет собой правило, содержащее часть, связанную с распознаванием ситуации, и часть, связанную с действиями, т.е. это пара «ситуация-действие», где левая часть со­держит список признаков, которые следует искать, а правая - спи­сок того, что следует сделать. В основе правил продукций лежит принцип: они определяют набор разрешенных преобразований, с по­мощью которых происходит продвижение от начального состояния до окончательного решения поставленной задачи. Текущее состояние отражается с помощью множества фактов, фиксируемых в БД. В ходе решения задачи происходит сопоставление одной из частей правила с содержимым в БД. В ЭС распространена ситуация, когда могут быть применены одновременно несколько правил, которые могут быть вероятностными. Совокупность правил образует систему продукций, которая используется для описания процедурных знаний в БЗ.

Базовым функциональным элементом семантической сети, подоб­но сетевым схемам БД, служит структура из двух компонентов - уз­лов и связывающих их дуг. Каждый узел представляет некоторое по­нятие, а дуга - отношение между парами понятий. Узлы помечаются именем существующего отношения, дуга имеет направленность. Любой из узлов может быть соединен с любым числом других узлов; в ре­зультате этого обеспечивается формирование сети фактов.

 









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.