Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Етапи розвитку інформаційних технологій (ІТ)





Етапи розвитку інформаційних технологій (ІТ)

Розглянемо етапи розвитку ІТ за методологією застосування ІТ:

1-й етап (до кінця 80-х рр. ХХ сторіччя) - централізоване опрацювання інформації на ЕОМ обчислювальних центрів. Створювалися обчислювальні центри колективного користування, оснащені великими ЕОМ. Застосування таких ЕОМ дозволяло опрацьовувати великі масиви вхідної інформації і одержувати на її основі різні види інформаційної продукції, яка потім пропонувалася користувачам.

2-й етап (до кінця 90-х рр. ХХ сторіччя) – децентралізоване опрацювання інформації, що зв’язане з появою персональних комп’ютерів (ПК) і розвитком засобів телекомунікації. З’явилися проблеми обміну інформацією між окремими ПК.

3-й етап – раціональне опрацювання інформації. Переваги і недоліки централізованих і децентралізованих ІТ призвели до необхідності розумного поєднання одного й іншого підходів.

В сучасному суспільстві основним технічним засобом технології переробки інформації є ПК і засоби накопичення інформації. В поняття сучасної ІТ включені також комунікаційні технології, які забезпечують передачу інформації різними засобами, а саме – телеграф, телефон, факс, відеоконференції тощо.

Тим користувачам, що не володіють мовами програмування, надана можливість прямого спілкування з ЕОМ в діалоговому режимі.

Сучасні ІТ базуються на трьох основних принципах:

1) інтерактивний (діалоговий) режим з «дружнім» інтерфейсом роботи користувача з комп’ютером;

2) інтегрованість (стиковка, взаємозв’язок) з іншими програмними продуктами;

3) гнучкість процесу змінення, як самих даних, так і постановки задач.

Інформаційні системи



Інформаційна система (ІС) –це сукупність засобів і методів ІТ, що використовується для збирання, зберігання, опрацювання і надання інформації задля досягнення поставленої мети. В якості основних технічних засобів переробки інформації використовують ЕОМ і засоби зв’язку, що реалізують інформаційні процеси та видачу інформації, необхідної в процесі прийняття рішень стосовно подальших дій.

ІС є середовищем, складовими елементами якого є люди, комп’ютери, комп’ютерні мережі, програмні продукти, бази даних (БД), різного роду технічні і програмні засоби зв’язку тощо. Хоча сама ідея ІС і деякі принципи їх організації виникли задовго до появи комп’ютерів, проте комп’ютеризація в десятки і сотні разів підвищила ефективність ІС і розширила сфери їх застосування.

Реалізація функцій ІС неможлива без знання орієнтованої на неї ІТ. ІТ може існувати і поза сферою ІС. Таким чином, ІТ є більш ємким поняттям. Конкретні задачі, які повинні вирішуватися інформаційною системою, залежать від сфери застосування. Наприклад, для оформлення перевізного документу товарному касиру необхідно заповнити безліч реквізитів, що стосуються відправника, експедитора, вантажовласника, перевізника, вантажу, умов та термінів перевезення, таксування, тощо. Автоматизоване робоче місце товарного касира (АРМ ТВК) – це ІС, що автоматизує багато функцій під час складання перевізних документів, запобігає помилкам, заощаджує час та підвищує їх якість.

В залежності від конкретної сфери застосування ІС можуть дуже сильно розрізнятися за своїми функціями, архітектурою, реалізацією. Однак всі вони повинні

1) відповідати поставленим цілям;

2) забезпечувати високий рівень надійності зберігання даних і ефективність доступу до них;

3) бути контрольованими, а також легко зрозумілими в користуванні на інтуїтивному рівні.

Класифікація ІС

Інформаційні системи можна класифікувати за різними ознаками. Відповідно до загальноприйнятої класифікації ІС підрозділяються:

1) за масштабами застосування – на настільні, офісні і корпоративні;

На залізничному транспорті активно впроваджуються тільки корпоративні ІС АРМи фахівця (конструктора, технолога, товарного касира, чергового по станції, прийомоздавальника, бухгалтера тощо), автоматизовані системи управління (АСУ) підрозділами залізничного транспорту, всі вони об’єднані в комплексну автоматизовану систему керування перевезеннями Укрзалізниці АСК УЗ

2) за функціональною ознакою – на виробничі (планування, нормування, розрахунку та аналізу показників роботи виробництва), навчальні (управління пізнавальною діяльністю в процесі навчання), маркетингові (аналізу ринку, рекламні, постачальницькі тощо), фінансові (бухгалтерські, статистичні тощо), кадрові, автоматизованого проектування (САПР);

3) за кваліфікацією персоналу і рівнем управління – стратегічні або корпоративні інформаційні системи для топ-менеджерів (КІС), функціональні для менеджерів середньої ланки (ІС здатні відповідати на питання: "що буде, якщо…?") і оперативні для фахівців;

4) по характеру опрацювання інформації – на системи опрацювання даних (СОД), системи підтримки прийняття рішень (СППР), системи управління (АСУ);

5) за оперативністю опрацювання даних – на ІС пакетного опрацювання і оперативні;

6) за ступенем автоматизації – на ручні, автоматизовані та автоматичні;

Автоматизовані ІС (АІС) припускають участь в процесі опрацювання інформації і людини, і технічних засобів, причому головна роль відводиться комп’ютеру. В сучасному тлумаченні в термін "ІС" обов’язково вкладається поняття автоматизованої системи.

7) за ступенем централізації опрацювання інформації – на централізовані, децентралізовані та колективного користування;

8) за сферою діяльності – на державні, територіальні (регіональні), галузеві, ІС об’єднань, підприємств або установ, технологічних процесів;

9) за місцем в процесі управління підприємства – на АРМ фахівця, ІС керівника, ІС зовнішнього контролера, інтегровані системи, що об’єднують в собі частину або всі з цих функцій;

10) за способом розподілу обчислювальних ресурсів – на локальні і розподілені;

Локальні ІС використовують одну ЕОМ і призначені для автоматизації окремих функцій управління на окремих рівнях управління. Така ІС може бути розрахованою на одного користувача, функціонуючою в окремих підрозділах системи управління.

В розподілених ІС взаємодіють декілька ЕОМ, зв’язаних мережею. Окремі вузли мережі, які звичайно територіально віддалені один від одного, вирішують різні задачі, але використовують спільну інформаційну базу.

11) за режимом роботи - на пакетні, діалогові і змішані.

Пакетні ІС працюють в пакетному режимі: спочатку дані накопичуються і формується пакет даних, а потім пакет послідовно опрацьовується низкою програм. Недолік цього режиму - низька оперативність ухвалення рішень і відособленість користувача від системи. Так обробляються підсумкові дані за звітний період роботи.

Діалогові ІС працюють в режимі обміну повідомленнями між користувачами і системою (наприклад, система продажу квитків). Цей режим особливо зручний, коли користувач може вибирати перспективні варіанти з числа запропонованих системою.

12) за характером вживання інформації - на інформаційно-пошукові, інформаційно-довідкові, інформаційно-вирішувальні, інформаційно-управляючі, інформаційно-дорадчі тощо;

Інформаційно-пошукові та інформаційно-довідкові системи орієнтовані на рішення задач пошуку інформації, документа або факту в безлічі джерел інформації (Змістовна обробка інформації в таких системах відсутня), введення, систематизацію, зберігання, видачу інформації за запитом користувача без складних перетворень даних. Наприклад, інформаційно-пошукова система в бібліотеці. Пошук інформації на вимогу користувача здійснюється або автоматично, або вручну.

Інформаційно-вирішувальні системи. В таких ІС за наслідками пошуку обчислюють значення арифметичних функцій. Здійснюють всі операції переробки інформації за певним алгоритмом. Серед них можна провести класифікацію за ступенем впливу виробленої спільної результатної інформації на процес ухвалення рішень і виділити два класи: управляючі і дорадчі.

Інформаційно-управляючі, або управлінські, системи (відомі у вітчизняній літературі під назвою «автоматизованої системи організаційного управління») є організаційно-технічними системами, які забезпечують отримання рішення на основі автоматизації інформаційних процесів у сфері управління, на підставі якого людина ухвалює своє рішення. Отже, вони призначені для автоматизованого вирішення широкого кола задач управління. На транспорті використовують автоматизовану систему оперативного управління перевезень (АСК УЗ).

Інформаційно-дорадчі системи виробляють інформацію, яка приймається людиною до відома і не перетворюється негайно на серію конкретних дій. Ці системи мають більш високий ступінь інтелекту, оскільки для них характерна обробка знань, а не даних.

13) за ознакою структурованості задач - на структуровані (що формалізуються), не структуровані (що не формалізуються), частково структуровані.;

При створенні або при класифікації ІС неминуче виникають проблеми, зв’язані з формальним (математичним і алгоритмічним) описом задач, що вирішуються.

Ступінь формалізації – це ступінь математичного опису задачі, від якої, багато в чому залежить ефективність роботи всієї системи, а також рівень автоматизації, що визначається ступенем участі людини при ухваленні рішення на основі отриманої інформації. Чим точніше математичний опис задач, тим вище можливості комп’ютерного опрацювання даних і тим менше ступінь участі людини в процесі рішення задачі. Цим і визначається ступінь автоматизації розв’язання задачі.

Частково-структуровані ІС діляться на: ІС репортінга та ІС розробки альтернативних рішень.

ІС репортінга просто відслідковуються і фіксуються всі дії працівника.

ІС розробки альтернативних рішень поділяють в свою чергу на модельні та експертні.

Експертні ІС засновані на застосуванні штучного інтелекту, і дають можливість менеджеру, диспетчеру або фахівцю одержувати консультації експертів по будь-яких проблемах, про які цими системами накопичені знання. Експертні системи забезпечують вироблення і оцінку можливих альтернативних рішень користувачем на базі опрацювання знань, накопичених ІС. Якщо користувач прийняв нестандартне рішення, система здатна зафіксувати його, оцінити його наслідки і, в разі задовільного результату, рекомендувати в подальшому це рішення , як альтернативне. Тобто система здатна накопичувати знання.

Модельні ІС надають користувачу математичні, статистичні, фінансові та інші моделі, використання яких полегшує вироблення і оцінку альтернативних рішень. Користувач може отримати інформацію, якої йому бракує для ухвалення рішення, шляхом встановлення діалогу з моделлю в процесі дослідження.

14) за концепцією побудови – на файлові системи, автоматизовані банки даних, банки знань, сховища даних;

Файлові системи забезпечують зберігання слабо структурованої інформації, залишаючи подальшу структуризацію прикладним програмам. В таких системах складно розв’язати проблеми узгодження даних в різних файлах, колективного доступу до даних, модифікації структури даних

Автоматизовані банки даних.Банк даних – це система спеціальним чином організованих БД, програмних, технічних, мовних і організаційно-методичних засобів, призначених для забезпечення централізованого накопичення і колективного багатоцільового використання даних. Банки даних з’явилися з початком використання інтегрованого опрацювання даних. Принцип інтегрованого опрацювання припускає одноразове введення і багаторазове використання інформації. Необхідно введену інформацію організувати і зберігати в пам’яті ЕОМ доти, поки не будуть вирішені всі задачі з її використанням. На відміну від файлових систем, всі функції по роботі з БД зосереджені в спеціальному компоненті - системі управління базами даних (СУБД), яка грає центральну роль у функціонуванні банку даних, оскільки забезпечує зв’язок прикладних програм і користувачів.

Інтелектуальні банки даних (ІБД), банки знань (БЗ).Це порівняно новий спосіб побудови ІС, при якому інформація про предметну область умовно ділиться між двома базами. Якщо БД містить відомості про кількісні і якісні характеристики конкретних об’єктів, то БЗ містить відомості про закономірності, що дозволяють виводити нові факти з тих, що є в БД; метаінформацію; відомості про структуру предметної області; відомості, що забезпечують розуміння запиту і синтез відповіді.

Якщо в традиційному банку даних знання про предметну область є закладеними програмістом в кожну прикладну програму, а також в структуру БД, то в інтелектуальному банку даних вони зберігаються в базі знань і є відокремленими від прикладних програм. На відміну від даних, знання активні: на їх основі формуються цілі і вибираються способи їх досягнення. Наприклад, ІБД в системі складського обліку може автоматично реагувати на таку подію, як зменшення запасів на складі до критичної норми, при цьому ІБД без участі користувача генерує документи для поповнення запасів і відправляє їх по електронній пошті постачальнику.

Інша характерна відмінність знань від даних - зв’язність, причому знання відображають як структурні взаємозв’язки між об’єктами предметної області, так і викликані конкретними бізнес-процесами, наприклад такі зв’язки, як "відбувається одночасно", "виходить з...", "якщо - те" тощо.

Нарешті, істотну роль в ІБД грає форма подання інформації для користувача: вона повинна бути якомога ближчою до природних для людини способів обміну даними (професійна природна мова, мовне введення/відображення, графічна форма).

Сховища даних.В даний час в корпоративних БД накопичені гігантські обсяги інформації, проте вона недостатньо ефективно використовується в процесі управління бізнесом, тому бурхливо розвивається нова форма побудови ІС - склади (сховища) даних.

Сховище даних є автономним банком даних, в якому база даних розділена на два компоненти: оперативна БД зберігає поточну інформацію, квазіпостійна БД містить історичні дані, наприклад, в оперативній БД можуть міститися дані про продажі за поточний рік, а в квазіпостійній БД зберігаються систематизовані річні звіти і баланси за весь час існування підприємства. Підсистема оперативного аналізу даних дозволяє ефективно і швидко аналізувати поточну інформацію. Підсистема ухвалення рішень користується узагальненою і історичною інформацією, застосовує методи логічного висновку. Для спілкування з користувачем використовується універсальний інтерфейс.

Структура ІС

Структуру ІС складає сукупність окремих її частин, виділених за певною ознакою. Загальну структуру ІС можна розглядати як сукупність двох частин: функціональної та забезпечувальної.

Функціональна частина складається з функціональних підсистем і визначає основні функції (задачі), що розв’язують за допомогою ІС. Наприклад для АСУ – це комплекс підсистем і задач керування об’єктом, для САПР функціональна частина – це комплекс проектних процедур, виконуваних за допомогою ЕОМ тощо.

Серед основних підсистем забезпечувальної частини ІС, як правило, виділяють інформаційне, технічне, математичне, програмне, організаційне і правове забезпечення (див. рис. 1).

Рис. 1. Структурна схема автоматизованої інформаційної системи

Правове забезпечення – це сукупність правових норм, визначальних для створення, юридичного статусу і функціонування ІС, регламентуючих порядок отримання, перетворення і використання інформації, права, обов’язки і відповідальність персоналу.

Організаційне забезпечення – це сукупність методів і засобів, що регламентують взаємодію працівників з технічними засобами і між собою в процесі розробки і експлуатації ІС.

Організаційне забезпечення реалізує наступні функції:

1) аналіз існуючої системи управління організацією, де використовуватиметься ІС, і виявлення задач, що підлягають автоматизації;

2) підготовку задач до рішення на комп’ютері, включаючи технічне завдання на проектування ІС і техніко-економічне обґрунтовування її ефективності;

3) розробку управлінських рішень по складу і структурі організації, методології рішення задач, спрямованих на підвищення ефективності системи управління. Організаційне забезпечення створюється за наслідками передпроектного обстеження на першому етапі побудови БД.

Математичне та програмне забезпечення — це сукупність математичних методів, моделей, алгоритмів і програм для реалізації цілей і задач ІС, а також для нормального функціонування комплексу технічних засобів.

До засобів математичного забезпечення відносяться:

1) засоби моделювання процесів;

2) типові задачі;

3) методи математичного програмування, математичної статистики, теорії масового обслуговування тощо.

До засобів програмного забезпечення (ПЗ) відносяться:

1) Загальносистемне ПЗ - це комплекс програм, орієнтований на користувачів і призначений для вирішення типових задач опрацювання інформації. Воно призначено для розширення функціональних можливостей комп’ютерів, контролю і управління процесом опрацювання даних.

2) Спеціальне ПЗ є сукупністю програм, розроблених при створенні конкретної ІС. До його складу входять пакети прикладних програм, що реалізують розроблені моделі різного ступеня адекватності і відображують функціонування реального об’єкту.

Технічне забезпечення ІС складається з обчислювальних комплексів та окремих ЕОМ, що здійснюють опрацювання інформації; пристроїв введення і відображення інформації, що призначені для спілкування користувача з ІС; систем передачі даних, які зв’язують ЕОМ між собою та з пристроями введення-видображення інформації.

Призначення підсистеми інформаційного забезпечення полягає в своєчасному формуванні і видачі достовірної інформації для ухвалення управлінських рішень.

Інформаційне забезпечення — це сукупність єдиної системи класифікації і кодування інформації, уніфікованих систем документації, схем інформаційних потоків, циркулюючих в організації, а також методологія побудови БД.

БАЗИ ДАНИХ

Інформаційні моделі даних

База даних (БД) – організована відповідно до певних правил і підтримувана в пам'яті комп'ютера сукупність даних, що характеризує актуальний стан деякої предметной області і використовується для задоволення інформаційних потреб користувачів.

Поняття база даних можна застосувати до будь-якої зв’язаної між собою за певною ознакою інформації, яка зберігається і є організованою особливим чином – як правило, у вигляді таблиць.

Основним призначенням БД в першу чергу є швидкий пошук інформації в ній. При значному розмірі БД ручний пошук, а також модифікація інформації, що міститься в ній, займає багато часу.

Існує досить велика кількість програм, які призначені для організації інформації, утримання її і маніпуляцій з нею – такі програми отримали назву системи управління базами даних (СУБД).

Дані в БД повинні мати визначену структуру. Сукупність правил побудови структур даних у БД та операцій із ними називається моделлю даних.

Останнім часом в більшості БД використовуються реляційні моделі даних, однак спочатку коротко розглянемо решту основних моделей даних.

Ієрархічна модель даних

Ієрархічна модель передбачає організацію даних у вигляді дерева (графа без циклів):

Рис.2. Структура ієрархічної моделі даних

Структура моделі, яка має вузли та листя, зв’язані між собою дугами,складається з впорядкованого набора піддерев. Кожне дерево складене з одного кореневого вузла (предка) та впорядкованого набора зв’язаних з ним піддерев (нащадків).

Приклад:

Рис. 3. Приклад ієрархічної моделі даних

Основними поняттями моделі є об’єкти, що складаються з атрибутів, які є об’єктами нижчого рівня ієрархії та ієрархічні відношення (зв’язки) між ними.

Основними недоліками моделі є

1) неможливість відображувати зв’язки між об’єктами одного рівня ієрархії (пунктир),

2) неможливість відображувати зв’язки між об’єктами, яки не знаходяться на сусідніх рівнях ієрархії (штрих-пунктир),

3) неможливість підпорядкування об’єкта різним об’єктам вищого рівня ієрархії (штрих).

Мережева модель даних

Мережева модель припускає організацію даних у вигляді графа, в якому можуть бути цикли.

Наприклад:

Рис. 4. Мережева модель даних.

Структура моделі має вершини, поділені на дві групи; вершини, які належать до різних груп, зв’язані між собою дугами.

На рисунку 4 графічно зображені дані про студентів та викладачів і зв’язки між ними у вигляді графа, що складається з вершин і дуг.

Кожний викладач навчає хоча б одного студента.

Кожний студент навчається більш ніж в одного викладача.

Вершини: V1 V2 V3 … Vn

Дуги: e1 e2 e3 … em

Основними поняттями моделі є об’єкти, які поділені на групи, та зв’язкиміж об’єктами, що належать до різних груп.

Основним недоліком моделі є неможливість відображення зв’язків між об’єктами, які належать до однієї групи (штрихова лінія).

Мережева модель відрізняється від ієрархічної тим, що припускає використання циклів.

Реляційна модель даних

Реляційна модель– це найбільш поширена модель даних, в якої дані і зв’язки між ними організовані у вигляді таблиць. В її основі лежить математичне поняття «відношення» (relation).

Відношенняявляє собою підмножину декартового добутку доменів.

Домен(domain) означає множину всіх значень деякого елемента даних.

Наприклад – якщо об’єктом є вагон поїзда, то елементом даних про нього може бути інвентарний № вагона, відмітка про ролики, код станції призначення, маса вагона тощо.

Доменом інвентарного № вагона є множина значень – {10000000 – 99999999}.

Для відмітки про ролики доменом є множина – {0, 1}.

Доменом назви залізниці України є множина значень – {Донецька, Львівська, Одеська, Південна, Південно-західна, Придніпровська}.

Декартовим добутком k доменів (D1,D2,..,Dk) є множина всіх кортежів виду (V1,V2,..,Vk) довжиною k, таких що V1ÎD1, V2ÎD2,…,VkÎDk.

Наприклад: D1*D2*D3 – декартовий добуток доменів D1, D2 і D3.

де D1={0, 1}, D2={a, b, c}, D3={x, z}, тобто це є множина всіх кортежів, що складені з 3-х елементів по 1-му з кожного домену.

Відношення R на множинах D1,D2,…,Dk являє собою підмножину в декартовому добутку доменів D1*D2*…*Dk. Елементами відношення є кортежі довжиною k.

 

Оскільки відношення є множиною, то в ньому не може бути однакових кортежів, а порядок їх не має значення.

Наприклад: візьмемо рядки 2, 5, 11: - Відношення А на множинах D1,D2,…,Dk.

В реляційних моделях даних відношення представляється як правило в вигляді таблиці, в котрій рядок – це кортеж, стовпчик – атрибут.

В роботі із базами даних використовують паралельно наступні поняття:

Таблиця 1

Проектування Користування Програмування
відношення таблиця файл
кортеж рядок запис
атрибут стовпчик поле запису

При опрацюванні даних на ЕОМ переважно використовуються поняття: файл, запис, поле.

Приклад: побудуємо відношення (таблицю даних) НАВАНТАЖЕННЯ, де

об’єкт: навантажений вагон;

атрибути: № вагона (множина 8-розрядних цілих чисел з домену D1);

рід вагона{пв, кр, пл, цс, пр}(множина двосимвольних слів з домену D2);

найменування вантажу (множина найменувань вантажу з домену D3);

маса (множина 3-розрядних цілих чисел з домену D4).

РЕЛЯЦІЙНІ БАЗИ ДАНИХ

Реляційна база даних (РБД) –це сукупність зв’язаних між собою відношень, які містять всю інформацію, що повинна зберігатися в базі даних.

Приклад: РБД металургійного заводу містить три типи даних:

1. Інформація про одержувачів вантажу – унікальний код одержувача, назва одержувача, залізнична станція призначення, тарифна відстань до станції – міститься у відношенні ОДЕРЖУВАЧ).

2. Інформація про вантажі, що відправляються – унікальний код вантажу, найменування, необхідний рухомий склад, вартість одиниці цього вантажу – міститься у відношенні ВАНТАЖ).

3. Інформація про постачання вантажу – код одержувача, код вантажу, маса відправки – міститься у відношенні ПОСТАЧАННЯ).

Таблиця 3 – Відношення ОДЕРЖУВАЧ:

Код одержувача Назва Станція Відстань
Мех. з-д Н.Д. Вузол
Фабрика Запоріжжя 1
Мех. з-д Кр. Ріг-Голов.
ЗБК Запоріжжя 1
Будтрест Донецьк

Таблиця 4 – Відношення ВАНТАЖ:

Код вантажу Найменування вантажу Рід вагона Вартість
Метізи кр
Рейки пл
Дріт пв
Прокат пл

Таблиця 5 – Відношення ПОСТАЧАННЯ:

Код одержувача Код вантажу Маса

Вміст кожного відношення у базі даних може періодично змінюватися, оскільки кортеж може бути доданий, вилучений або змінений (модифікований). Вміст (листінг) відношення РБД у поточний момент називається фотографією відношення. В будь який момент часу користувач РБД має справу з фотографієювідношення, тобто з даними, які містяться у відношенні в певний момент часу.

РБД може бути складеною з одного, двох, чи кількох відношень. Якщо в РБД кілька відношень, то вони обов’язково повинні бути певним чином зв’язані між собою. Кількість відношень у РБД (тут 3) і перелік атрибутів, що залучаються в кожне з них, визначається в процесі проектування бази даних.

Цілі проектування РБД

Ціль 1. Забезпечити можливість збереження всіх необхідних даних у РБД. Необхідно визначити всі атрибути, що потрібно помістити в РБД. За умови, що всього таких атрибутів нараховується не більше 20, на початку проектування РБД всі вони залучаються в одне відношення.

Ціль 2. Вилучити явної надлишковості даних. Для того щоб позбавитись явної надлишковості даних потрібно розрізняти поняття дублювання та надлишкового дублювання даних (чи, інакше кажучи, неявної та явної надлишковості даних). Розглянемо 2 відношення

Таблиця 6 – ВідношенняОДЕРЖУВАЧ 1:

Код одержувача Станція
Запоріжжя 1
НДВузол
Запоріжжя 1

Дані про станцію Запоріжжя 1 дублюються (Запоріжжя 1 – 2 рази). Але втрата одного значення станції (де знаходиться одержувач 1423) призведе до того, що ми не зможемо дізнатися станцію примикання для нього. Тут дублювання даних про станцію не є надлишковим. Це приклад неявної надлишковості даних.

Таблиця 7 – Відношення ОДЕРЖУВАЧ 2:

Код одержувача Станція Код станції
Запоріжжя 1
НДВузол
Запоріжжя 1

Тут є надлишкове дублювання даних: втрачений код станції примикання одержувача 1423 можна дізнатися по назві станції примикання іншого одержувача 1537. Це приклад явної надлишковості даних.

Надлишкове дублювання даних потрібно прагнути виключити з відношення в процесі проектування РБД.

Ціль 3. Нормалізувати відношенняозначаєрозбити одне відношення на декілька відношень, з метою уникнути проблем, що можуть трапитися при вставці, вилученні і модифікації даних. Нормалізація відношення усуває явна надлишковість даних у відношенні.

Ціль 4. Звести до мінімуму кількість відношень, що зберігатимуться у РБД. Прагнути треба до мінімуму відношень. Розбивка одного відношення на декілька дозволяє уникнути низки проблем (у тому числі і пов’язаних з надлишковим дублюванням даних), але це незручно для користувача, якому інколи важко визначити в якому саме відношенні знаходиться потрібна інформація.

В процесі проектування РБД необхідно розв’язати компроміс між 3-ю і 4-ю цілями.

Універсальне відношення

Відповідно до першої цілі процес проектування РБД розпочинається зі складання відношення, в яке залучаються всі потрібні для зберігання у РБД атрибути.

Якщо в РБД лише одне відношення, то це відношення називають універсальним.

Розглянемо етап складання універсального відношення на прикладі.

Допустимо, що потрібно створити РБД для підприємства, що відправляє вантажі клієнтам. По-перше виявимо, які атрибути потрібно залучити до РБД та встановимо для них обмеження і зв’язки між ними. Візьмемо такі атрибути:

1 Код_одержувача – ціле число, унікальне для кожного одержувача.

2 Назва_одержувача – символьний атрибут, кожний одержувач має одну назву, але одна назва може бути у декількох одержувачів (за кодом одержувача можна знайти його назву, зворотна операція неможлива).

3 Код_станції – ціле число, код станції, на якій знаходиться одержувач, кожний одержувач пов’язаний з одною станцією, на кожній станції може бути декілька одержувачів.

4 Код_вантажу – ціле число, кожний вантаж має унікальний код, кожний одержувач може одержувати декілька різних вантажів.

5 Найм_вантажу – символьний атрибут, кожний код вантажу має єдине відповідне найменування вантажу, кожному найменуванню відповідає єдиний код вантажу.

6 Маса_вантажу – ціле число, кожний одержувач одержує вантаж одного найменування і визначеної маси (значення маси можуть повторюватися).

Запишемо в таблицю зразок даних про навантаження за минулу добу:

Таблиця 8

Код одержувача Назва одержувача Код станції Код вантажу Найм. вантажу Маса вантажу
Мех. з-д Метізи Рейки Дріт
Ф-ка Метізи Дріт
Мех. з-д Рейки Дріт
ЗБК Прокат
Будтрест - - -

Нормалізація відношення

Для ліквідації зазначених проблем виконують розбивку універсального відношення на 2 і більше відношень. Цей етап проектування РБД називається нормалізацією (чи декомпозицією) відношення.

Перед нормалізацією відношення повинно знаходитися в першій нормальній формі.

Нормальна форма Бойса-Кодда

Запитання: Чи можна, не аналізуючи проблем, що можуть виникнути при роботі з відношенням, визначити, чи потребує це відношення нормалізації?

Відповідь: Якщо відношення знаходиться в нормальній формі Бойса-Кодда (НФБК), то воно майже напевно не потребує декомпозиції і може застосовуватися в РБД, інакше потрібна його нормалізація.

Відношення знаходиться в НФБК, якщо і тільки якщо кожний детермінант відношення є можливим ключем відношення.

Що стосується можливих ключів універсального відношення НАВАНТАЖЕННЯ, то їх два й обидва вони складові:

<Код_одержувача, Код_вантажу>;

<Код_одержувача, Найм_вантажу>.

Функціональні залежності

Детермінант. Нехай дані 2 атрибути: А та В, то говорять, що атрибут В функціонально залежить від атрибуту А, якщо для кожного значення атрибуту А існує рівно одне пов’язане з ним значення атрибуту В (у будь-які моменти часу). Або навпаки, атрибут А є детермінантом атрибуту В. А й В можуть бути складовими, тобто кожний з них може бути складений з декількох атрибутів.

У конкретній ситуації функціональна залежність визначається шляхом деталізації властивостей всіх атрибутів у відношенні і обґрунтування висновку про те, як атрибути співвідносяться між собою. Функціональні залежності не можуть бути доведені шляхом простого перегляду окремого екземпляра відношення. На його основі може бути висунуте тільки припущення про наявність функціональної залежності між конкретними атрибутами. Але кожне таке припущення повинне бути перевірене на предмет того, чи може порушитися ця передбачувана функціональна залежність після додавання кортежів у відношення, або після зміни значень атрибутів у майбутньому.

У будь-якому випадку при визначенні функціональної залежності не слід відволікатися від смислу самих атрибутів, від їх взаємної смислової залежності, а також від обмежень, що накладаються на можливі значення цих атрибутів.

Візьмемо два атрибути <Назва_одержувача> та <Код_одержувача>.

Переглянувши екземпляр відношення можна установити, що одному значенню атрибута <Код_одержувача> відповідає одне значення атрибута <Назва_одержувача>. Отже, можна припустити, що атрибут <Назва_одержувача> функціонально залежить від атрибута <Код_одержувача>.

Тепер перевіримо за змістом це припущення. А чи може одержувач з певним кодом мати іншу назву?

Кожен одержувач має унікальний код, тобто немає і не може бути двох одержувачів з однаковими кодами. Отже, у відношення не може бути в принципі доданий кортеж, у якому повториться код одержувача з іншою назвою одержувача. Код одержувача може повторитися тільки з тією же самою назвою. З цього боку гіпотеза про існування функціональної залежності між атрибутами <Код_одержувача> і <Назва_одержувача> підтверджується.

З іншого боку, чи може той самий одержувач мати кілька різних назв? Очевидно, що ні, якщо інше не обговорено окремо чи спеціально. Якщо такого застереження нема, то можна зробити остаточний висновок про те, що між атрибутами <Код_одержувача> і <Назва_одержувача> дійсно існує функціональна залежність, причому атр









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2019 zdamsam.ru Размещенные материалы защищены законодательством РФ.