Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Етапи розвитку інформаційних технологій





Етапи розвитку інформаційних технологій

1-й етап (до кінця 80-х рр. ХХ сторіччя) - централізоване опрацювання інформації на ЕОМ обчислювальних центрів. На цьому етапі створювалися обчислювальні центри колективного користування, оснащені великими ЕОМ. Застосування таких ЕОМ дозволяло опрацьовувати великі масиви інформації і отримувати на її основі різні види інформаційної продукції, яка потім пропонувалася користувачам.

2-й етап (до кінця 90-х рр. ХХ сторіччя) – децентралізоване опрацювання інформації на персональних комп’ютерах (ПК). На цьому етапі у зв’язку з появою персональних комп’ютерів (ПК) і розвитком засобів телекомунікації з’явилися проблеми обміну інформацією між окремими ПК.

3-й етап – раціональне опрацювання інформації. Переваги і недоліки централізованих і децентралізованих ІТ призвели до необхідності розумного поєднання одного й іншого підходів.

В сучасному суспільстві основним технічним засобом технології опрацювання інформації є ПК і засоби накопичення інформації. В поняття сучасної ІТ включені також комунікаційні технології, які забезпечують передачу інформації різними засобами зв’язку (телеграф, телефон, факс, інтернет тощо).

Тим користувачам, що не володіють мовами програмування, надана можливість прямого спілкування з ЕОМ в діалоговому режимі.

Сучасні ІТ базуються на трьох основних принципах:

1) інтерактивний (діалоговий) режим з «дружнім» інтерфейсом роботи користувача з комп’ютером;

2) інтегрованість (стиковка, взаємозв’язок) між різними програмними продуктами;

3) гнучкість процесів зміни, як самих даних, так і зміни постановки задач.

Інформаційні системи

Поняття інформаційної системи тісно пов'язане з орієнтованою на неї інформаційною технологією.

Інформаційна система (ІС) – це взаємозалежна сукупність засобів і методів ІТ та персоналу, які використовуються для збирання, зберігання, передачі, опрацювання і надання інформації користувачу задля досягнення поставленої мети. В якості основних технічних засобів переробки інформації використовують ЕОМ і засоби зв’язку, що реалізують інформаційні процеси та видачу інформації, необхідної в процесі прийняття рішень стосовно подальших дій.

ІС є середовищем, складовими елементами якого є люди, комп’ютери, комп’ютерні мережі, програмні продукти, бази даних (БД), різного роду технічні і програмні засоби зв’язку тощо. Хоча сама ідея ІС і деякі принципи їх організації виникли задовго до появи комп’ютерів, проте комп’ютеризація в десятки і сотні разів підвищила ефективність ІС і розширила сфери їх застосування. Комп'ютери, оснащені спеціалізованими програмними засобами, служать технічною базою для ІС. Таким чином сучасна ІС людино-комп'ютерна.

Реалізація функцій ІС неможлива без знання орієнтованої на неї ІТ. ІТ може існувати і поза сферою ІС. Таким чином, ІТ є більш ємким поняттям. Конкретні задачі, які повинні вирішуватися інформаційною системою, залежать від сфери застосування. Наприклад, для оформлення перевізного документу товарному касиру необхідно заповнити безліч реквізитів, що стосуються відправника, експедитора, вантажовласника, перевізника, вантажу, умов та термінів перевезення, таксування тощо. Автоматизоване робоче місце товарного касира (АРМ ТВК) – це ІС, що автоматизує багато функцій під час складання перевізних документів, заощаджує час та підвищує їх якість оформлення, запобігає помилкам.

В залежності від конкретної сфери застосування ІС можуть дуже сильно розрізнятися за своїми функціями, архітектурою і реалізацією. Однак всі вони повинні

1) відповідати поставленим цілям;

2) забезпечувати високий рівень надійності зберігання даних і ефективності доступу до них;

3) бути контрольованими, а також легко зрозумілими в користуванні на інтуїтивному рівні.

Структура ІС

Структуру ІС складає сукупність окремих її частин, виділених за певною ознакою. Загальну структуру ІС можна розглядати як сукупність двох частин: функціональної та забезпечувальної.

Функціональна частина складається з функціональних підсистем і визначає основні функції (задачі), що розв’язують за допомогою ІС. Наприклад для АСК – це комплекс підсистем і задач керування об’єктом, для САПР функціональна частина – це комплекс проектних процедур, виконуваних за допомогою ЕОМ тощо.

Серед основних підсистем забезпечувальної частини ІС, як правило, виділяють інформаційне, технічне, математичне, програмне, організаційне і правове забезпечення (див. рис. 1).

Рис. 1. Структурна схема автоматизованої інформаційної системи

Правове забезпечення – це сукупність правових норм, визначальних для створення юридичного статусу і функціонування ІС, регламентуючих порядок отримання, опрацювання і використання інформації, права, обов’язки і відповідальність персоналу.

Організаційне забезпечення – це сукупність методів та засобів, що регламентують взаємодію працівників з технічними засобами і між собою в процесі розробки та експлуатації ІС.

Організаційне забезпечення створюється за наслідками передпроектного обстеження і реалізує наступні функції:

1) аналіз існуючої системи керування організацією, де використовуватиметься ІС, і виявлення задач, що підлягають автоматизації;

2) підготовку задач для рішення на комп’ютері, включаючи технічне завдання на проектування ІС і техніко-економічне обґрунтовування;

3) розробку керівних рішень стосовно складу і структурі організації, методології рішення задач, спрямованих на підвищення ефективності системи керування.

Математичне та програмне забезпечення ІС — це сукупність математичних методів, моделей, алгоритмів і програм, спрямованих на реалізацію цілей і задач ІС, а також на нормальне функціонування технічних засобів.

До засобів математичного забезпечення відносяться:

1) засоби моделювання процесів і явищ;

2) типові задачі;

3) методи математичного програмування, математичної статистики, теорії масового обслуговування тощо.

До засобів програмного забезпечення (ПЗ) відносяться:

1) Загальносистемне ПЗ - це комплекс програм, орієнтований на користувачів і призначений для вирішення типових задач опрацювання інформації, розширення функціональних можливостей комп’ютерів, контролю і керування процесом опрацювання даних.

2) Спеціальне ПЗ є сукупністю програм, розроблених під час створення конкретної ІС. До його складу входять пакети прикладних програм, що реалізують розроблені моделі і відтворюють функціонування реального об’єкту.

Технічне забезпечення ІС складається з обчислювальних комплексів та окремих ЕОМ, що здійснюють опрацювання інформації; пристроїв введення і відображення інформації, що призначені для спілкування користувача з ІС; систем передачі даних, що зв’язують ЕОМ між собою та з пристроями введення-видображення інформації.

Інформаційне забезпечення ІС — це сукупність єдиної системи класифікації і кодування інформації, уніфікованої системи документації, схема інформаційних потоків, циркулюючих в організації, а також методологія побудови БД. Інформаційне забезпечення призначене для своєчасного формування і надання достовірної інформації для ухвалення керівних рішень.

Класифікація ІС

ІС можна класифікувати за різними ознаками. Відповідно до загальноприйнятої класифікації ІС підрозділяються:

1) за масштабами застосування – на настільні, офісні і корпоративні;

На залізничному транспорті активно впроваджуються тільки корпоративні ІС АРМи фахівця (конструктора, технолога, товарного касира, чергового по станції, прийомоздавальника, бухгалтера тощо), автоматизовані системи керування (АСК) підрозділами залізничного транспорту, всі вони об’єднані в комплексну автоматизовану систему керування перевезеннями Укрзалізниці АСК УЗ

2) за функціональною ознакою – на виробничі (планування, нормування, розрахунку та аналізу показників роботи виробництва), навчальні (керування пізнавальною діяльністю в процесі навчання), маркетингові (аналізу ринку, рекламні, постачальницькі тощо), фінансові (бухгалтерські, статистичні тощо), кадрові, автоматизованого проектування (САПР);

3) за кваліфікацією персоналу і рівнем керування – стратегічні або корпоративні ІС для топ-менеджерів (КІС), функціональні для менеджерів середньої ланки (ІС здатні відповідати на питання: "що буде, якщо…?") і оперативні для фахівців (безпосередніх виконавців);

4) за характером опрацювання інформації – на системи опрацювання даних (СОД), системи підтримки прийняття рішень (СППР) і автоматизовані системи керування (АСК);

5) за оперативністю опрацювання даних – на системи пакетного опрацювання даних і системи оперативного опрацювання даних;

6) за ступенем автоматизації – на ручні, автоматизовані і автоматичні;

Автоматизовані ІС (АІС) припускають участь в процесі опрацювання інформації як людини, так і технічних засобів, причому головна роль відводиться комп’ютеру. В сучасному тлумаченні в термін "ІС" обов’язково вкладається поняття автоматизованої системи.

7) за ступенем централізації опрацювання інформації – на централізовані, децентралізовані і колективного користування;

8) за сферою діяльності – на державні, регіональні, галузеві, ІС підприємств або установ та ІС технологічних процесів;

9) за місцем в процесі керування підприємством – на АРМ фахівця, ІС керівника, ІС зовнішнього контролера та інтегровані ІС, що об’єднують в собі частину або всі ці функції;

10) за способом розподілу обчислювальних ресурсів – на локальні і розподілені;

Локальні ІС використовують одну ЕОМ і призначені для автоматизації окремих функцій на окремому рівні керування. Такі ІС можуть бути розраховані на одного користувача, що працює в окремому підрозділі системи керування.

В розподілених ІС взаємодіють кілька ЕОМ, зв’язаних інформаційною мережею. Окремі вузли інформаційної мережі, які зазвичай територіально віддалені один від одного, вирішують різні задачі, але використовують спільну інформаційну базу даних.

11) за режимом роботи – на пакетні, діалогові і змішані.

Пакетні ІС спочатку дані накопичують і формується з них пакет даних, а потім пакет послідовно опрацьовується низкою програм. Недолік цього режиму – низька оперативність ухвалення рішень і відокремленість користувача від системи. Так опрацьовують, наприклад, підсумкові дані за звітний період роботи.

Діалогові ІС працюють в режимі обміну повідомленнями між користувачем і ІС (наприклад, ІС резервування місць та продажу квитків пасажирам). Цей режим особливо зручний, коли користувач може вибирати перспективні варіанти з кількох запропонованих системою.

12) за характером використання інформації – на інформаційно-пошукові, інформаційно-довідкові, інформаційно-вирішувальні, інформаційно-керуючі, інформаційно-дорадчі тощо;

Інформаційно-пошукові та інформаційно-довідкові системи орієнтовані на рішення задач пошуку інформації, документа або факту в безлічі джерел інформації, на введення, систематизацію, зберігання та видачу інформації за запитом користувача без складних перетворень даних. Наприклад, інформаційно-пошукова система в бібліотеці. Пошук інформації на вимогу користувача здійснюється або автоматично, або вручну. Змістовна обробка інформації в таких системах відсутня.

Інформаційно-вирішувальні системи за наслідками пошуку інформації обчислюють значення арифметичних функцій та здійснюють всі операції опрацювання інформації за певним алгоритмом.

Інформаційно-керуючі системи (відомі у вітчизняній літературі під назвою «автоматизованих систем організаційного керування») є організаційно-технічними системами, які забезпечують отримання рішень за допомогою автоматизації інформаційних процесів у сфері керування, на підставі яких людина ухвалює своє рішення. На транспорті використовують єдину автоматизовану систему оперативного керування вантажними перевезеннями (АСК ВП УЗ-Є).

Інформаційно-дорадчі системи виробляють інформацію, яка приймається людиною до відома, але не перетворюється негайно на серію конкретних дій. (Ці системи мають більш високий ступінь інтелекту, оскільки їм притаманне опрацювання знань, а не даних.)

13) за ознакою структурованості задач – на структуровані (що формалізуються), неструктуровані (що не формалізуються), частково структуровані;

Під час створення або класифікації ІС неминуче виникають проблеми, зв’язані з формальним (математичним і алгоритмічним) описом задач, що вирішуються.

Ступінь формалізації – це ступінь математичного опису задачі, від якої, багато в чому залежить ефективність роботи всієї системи, а також рівень автоматизації, що визначається ступенем участі людини при ухваленні рішення на основі отриманої інформації. Чим точніше математичний опис задач, тим вище можливості комп’ютерного опрацювання даних і тим менше ступінь участі людини в процесі рішення задачі. Цим і обумовлюється ступінь автоматизації розв’язання задачі.

Частково-структуровані ІС діляться на: ІС репортінга та ІС розробки альтернативних рішень.

ІС репортінга просто відслідковують і фіксують всі дії працівника.

ІС розробки альтернативних рішень поділяють в свою чергу на модельні та експертні.

Експертні ІС засновані на застосуванні штучного інтелекту, і дають можливість менеджеру, диспетчеру або фахівцю отримувати консультації експертів з будь-яких проблем, про які цими системами накопичені знання. Експертні системи забезпечують вироблення і оцінку можливих альтернативних рішень користувачем на базі опрацювання знань, накопичених ІС. Якщо користувач прийняв нестандартне рішення, система здатна зафіксувати його, оцінити його наслідки і, в разі задовільного результату, рекомендувати в подальшому це рішення, як альтернативне. Тобто система здатна накопичувати знання.

Модельні ІС надають користувачу математичні, статистичні, фінансові та інші моделі, використання яких полегшує вироблення і оцінку альтернативних рішень. Користувач може отримати інформацію, якої йому бракує для ухвалення рішення, шляхом встановлення діалогу з моделлю в процесі дослідження.

14) за концепцією побудови – на файлові системи, автоматизовані банки даних (АБД), інтелектуальні банки даних (банки знань), сховища даних;

Файлові системи забезпечують зберігання слабо структурованої інформації, залишаючи подальшу структуризацію прикладним програмам. В таких системах складно розв’язати проблеми узгодження даних в різних файлах, колективного доступу до даних, модифікації структури даних

Автоматизовані банки даних.

(Автоматизований) банк даних – це система спеціальним чином організованих баз даних, програмних, технічних, мовних і організаційно-методичних засобів, призначених для централізованого накопичення і колективного багатоцільового використання даних.

Банки даних з’явилися з початком використання інтегрованого опрацювання даних. Принцип інтегрованого опрацювання припускає одноразове введення і багаторазове використання інформації. Необхідно введену інформацію організувати і зберігати в пам’яті ЕОМ доти, поки не будуть вирішені всі задачі з її використанням. На відміну від файлових систем, всі функції по роботі з даними в АБД зосереджені в спеціальному компоненті - системі керування базами даних (СКБД). СКБД забезпечує зв’язок прикладних програм і користувачів.

Інтелектуальні банки даних (ІБД) або банки знань (БЗ). Це порівняно новий спосіб побудови ІС. Якщо АБД містить відомості тільки про кількісні і якісні характеристики конкретних об’єктів, тоді як БЗ містить ще і відомості про закономірності, які дозволяють виводити нові факти з тіх даних, що є в АБД, а також відомості, що забезпечують розуміння запиту і синтез відповіді.

На відміну від даних, знання активні: на їх основі формуються цілі і обираються способи їх досягнення. Наприклад, БЗ в системі складського обліку може автоматично реагувати на зменшення запасів на складі до критичної межі, при цьому БЗ без участі користувача генерує документи для поповнення запасів і відправляє їх електронною поштою постачальнику.

Інша характерна відмінність знань від даних – зв’язність, причому знання відображають як структурні взаємозв’язки між об’єктами предметної області, так і зв’язки викликані конкретними процесами, наприклад такі, як "відбувається одночасно", "випливає з...", "якщо – тоді" тощо.

Нарешті, істотну роль в БЗ грає форма подання інформації для користувача: вона повинна бути якомога ближчою до природних для людини способів обміну даними (професійна природна мова, мовне введення/відображення, графічна форма).

Сховища даних. Сховище даних є автономним банком даних, в якому база даних розділена на два компоненти: оперативна БД зберігає поточну інформацію, квазіпостійна БД містить історичні дані. Наприклад, в оперативній БД можуть міститися дані про відправлення поїздів за поточну добу або за місяць, а в квазіпостійній БД зберігаються систематизовані звіти за весь час існування підприємства. Підсистема оперативного аналізу даних дозволяє ефективно і швидко аналізувати поточну інформацію. Підсистема ухвалення рішень використовує підсумкову і історичну інформацію, застосовує методи логічного висновку. Для спілкування з користувачем використовується універсальний інтерфейс.

БАЗИ ДАНИХ

Інформаційні моделі даних

База даних (БД) – це організована відповідно до певних правил і підтримувана в пам'яті комп'ютера сукупність даних, що характеризує актуальний стан деякої предметної області і використовується для задоволення інформаційних потреб користувачів.

Поняття база даних можна застосувати до будь-якої зв’язаної між собою за певною ознакою інформації, яка зберігається і є організованою особливим чином.

Основним призначенням БД перш за все є швидкий пошук інформації в ній. За значних розмірів БД ручний пошук і модифікація інформації, що міститься в ній, займає багато часу.

Існує досить велика кількість програм, які призначені для організації інформації, її утримання і маніпуляцій з нею – комплекси таких програм отримали назву системи керування базами даних (СКБД).

Дані в БД повинні мати визначену структуру. Сукупність правил побудови структур даних у БД та операцій із ними називається інформаційною моделлю даних.

Останнім часом в більшості БД використовуються реляційні моделі даних, однак спочатку коротко розглянемо решту основних інформаційнихмоделей даних.

Ієрархічна модель даних

Ієрархічна модель передбачає організацію даних у вигляді дерева (графа без циклів):

Рис.2. Структура ієрархічної моделі даних

Структура моделі, яка має вузли та листя, зв’язані між собою дугами,складається з впорядкованого набору піддерев. Кожне дерево складене з одного кореневого вузла (предка) та впорядкованого набора зв’язаних з ним піддерев (нащадків).

Основними поняттями моделі є об’єкти, що складаються з атрибутів, які є об’єктами нижчого рівня ієрархії та ієрархічні відношення (зв’язки) між ними.

Приклад:

Рис. 3. Приклад ієрархічної моделі даних

Основними недоліками моделі є

1) неможливість відображувати зв’язки між об’єктами одного рівня ієрархії (пунктирна лінія),

2) неможливість відображувати зв’язки між об’єктами, які не знаходяться на сусідніх рівнях ієрархії (штрих-пунктирна лінія),

3) неможливість підпорядкування об’єкта різним об’єктам вищого рівня ієрархії (штрихова лінія).

Мережева модель даних

Мережева модель припускає організацію даних у вигляді графа, в якому можуть бути цикли.

Наприклад:

Рис. 4. Мережева модель даних.

Структура моделі має вершини, поділені на дві групи; вершини, які належать до різних груп, зв’язані між собою дугами.

На рисунку 4 графічно зображені дані про студентів та викладачів і зв’язки між ними у вигляді графа, що складається з вершин і дуг.

Кожний викладач навчає хоча б одного студента.

Кожний студент навчається більш ніж в одного викладача.

Вершини: V1 V2 V3 … Vn

Дуги: e1 e2 e3 … em

Основними поняттями моделі є об’єкти, які поділені на групи, та зв’язки між об’єктами, що належать до різних груп.

Основним недоліком моделі є неможливість відображення зв’язків між об’єктами, які належать до однієї групи (штрихова лінія).

Мережева модель відрізняється від ієрархічної тим, що припускає використання циклів.

Реляційна модель даних

Реляційна модель – це найбільш поширена модель даних, в якій дані і зв’язки між ними організовані у вигляді таблиць. В її основі лежить математичне поняття «відношення» (relation).

Відношення являє собою підмножину декартового добутку доменів.

Домен (domain) означає множину всіх значень деякого елемента даних про інформаційний об’єкт.

Наприклад – якщо інформаційним об’єктом є вагон поїзда, то елементом даних про нього може бути інвентарний № вагона, відмітка про ролики, код станції призначення, маса вагона тощо.

Доменом значущих цифр інвентарного № вагона є множина значень – {0000001 – 9999999}.

Для відмітки про ролики доменом є множина – {0, 1}.

Доменом назви залізниці України є множина значень – {Донецька, Львівська, Одеська, Південна, Південно-західна, Придніпровська}.

Декартовим добутком k доменів D 1, D 2,.., D k є множина всіх кортежів виду (V 1, V 2,.., V k) довжиною k, таких що V 1Î D 1, V 2Î D 2,…, V kÎ D k.

 

Кортеж – це послідовність елементів.

Наприклад: визначимо декартовий добуток трьох доменів D1, D2 і D3, де D1={0, 1}, D2={a, b, c}, D3={x, z}. Декартовим добутком D1*D2*D3 є множина всіх кортежів, що складені з 3-х елементів по 1-му з кожного домену.

Відношення R на множинах D 1, D 2,…, D k являє собою підмножину декартового добутку доменів D 1* D 2*…* D k. Елементами відношення є кортежі довжиною k.

Оскільки відношення є множиною, то в ньому не може бути однакових кортежів, а порядок їх не має значення.

Наприклад: візьмемо рядки 2, 5, 11: - Відношення А на множинах D 1, D 2,…, D k.

В реляційних моделях даних відношення представляється як правило у вигляді таблиці, в якій рядок називається кортежем, стовпчик – атрибутом.

Тобто в роботі із реляційними моделями даних використовують паралельно наступні поняття:

Таблиця 1

Проектування Користування Програмування
відношення таблиця файл
кортеж рядок запис
атрибут стовпчик поле запису

При опрацюванні даних на ЕОМ переважно використовуються поняття: файл, запис, поле.

Приклад: побудуємо відношення (таблицю даних) НАВАНТАЖЕННЯ, де

об’єкт: навантажений вагон;

атрибути: № вагона (множина 8-розрядних цілих чисел з домену D 1);

рід вагона{пв, кр, пл, цс, пр}(множина двосимвольних слів з домену D 2);

найменування вантажу (множина найменувань вантажу з домену D 3);

маса (множина 3-розрядних цілих чисел з домену D 4).

РЕЛЯЦІЙНІ БАЗИ ДАНИХ

Реляційна база даних (РБД) – це сукупність зв’язаних між собою відношень, які містять всю інформацію, що повинна зберігатися в базі даних.

Приклад: РБД металургійного заводу містить три типи даних:

1. Інформація про одержувачів вантажу – унікальний код одержувача, назва одержувача, залізнична станція призначення, тарифна відстань до станції – міститься у відношенні ОДЕРЖУВАЧ).

2. Інформація про вантажі, що відправляються – унікальний код вантажу, найменування вантажу, необхідний рухомий склад, вартість одиниці вантажу – міститься у відношенні ВАНТАЖ).

3. Інформація про постачання вантажу – код одержувача, код вантажу, маса вантажу– міститься у відношенні ПОСТАЧАННЯ).

Таблиця 3 – Відношення ОДЕРЖУВАЧ:

Код одержувача Назва Станція Відстань
  Мех. з-д Н.Д. Вузол  
  Фабрика Запоріжжя 1  
  Мех. з-д Кр. Ріг-Голов.  
  ЗБК Запоріжжя 1  
  Будтрест Донецьк  

Таблиця 4 – Відношення ВАНТАЖ:

Код вантажу Найменування вантажу Рід вагона Вартість
  Метвироби кр  
  Рейки пл  
  Дріт пв  
  Прокат пл  

Таблиця 5 – Відношення ПОСТАЧАННЯ:

Код одержувача Код вантажу Маса вантажу
     
     
     
     
     
     
     
     
     
     

Вміст кожного відношення у базі даних може періодично змінюватися, оскільки кортеж може бути доданий, вилучений або змінений (модифікований). Вміст (листінг) відношення РБД у поточний момент називається фотографією відношення. В будь який момент часу користувач РБД має справу з фотографієювідношення, тобто з даними, які містяться у відношенні в певний момент часу.

РБД може бути складеною з одного, двох, чи кількох відношень. Якщо в РБД кілька відношень, то вони обов’язково повинні бути певним чином зв’язані між собою. Кількість відношень у РБД (тут 3) і перелік атрибутів, що залучаються в кожне з них, визначається в процесі проектування бази даних.

Цілі проектування РБД

Ціль 1. Забезпечити можливість збереження всіх необхідних даних у РБД. Необхідно визначити всі атрибути, що потрібно помістити в РБД. За умови, що всього таких атрибутів налічується не більше двадцяти, на початку проектування РБД всі вони залучаються в одне відношення.

Ціль 2. Вилучити явну надлишковість даних з відношень. Для того щоб позбавитись явної надлишковості даних у відношенні потрібно розрізняти поняття дублювання та надлишкового дублювання даних (інакше кажучи, неявної та явної надлишковості даних). Розглянемо 2 відношення

Таблиця 6 – Відношення ОДЕРЖУВАЧ 1:

Код одержувача Станція
  Запоріжжя 1
  НДВузол
  Запоріжжя 1

Дані про станцію Запоріжжя 1 дублюються (Запоріжжя 1 – 2 рази). Але втрата одного значення станції (де знаходиться одержувач 1423) призведе до того, що ми не зможемо дізнатися станцію примикання для нього. Тут дублювання даних про станцію не є надлишковим. Це приклад неявної надлишковості даних.

Таблиця 7 – Відношення ОДЕРЖУВАЧ 2:

Код одержувача Станція Код станції
  Запоріжжя 1  
  НДВузол  
  Запоріжжя 1  

Тут є надлишкове дублювання даних: втрачену назву станції примикання одержувача 1423 можна дізнатися за кодом станції примикання іншого одержувача 1537. Це приклад явної надлишковості даних.

Надлишкове дублювання даних потрібно прагнути виключити з відношення в процесі проектування РБД.

Ціль 3. Нормалізувати відношення означає розділитиодне відношення на кілька відношень. Нормалізацію відношень виконуютьз метою уникнути проблем, що можуть трапитися під час роботи з РБД. За допомогою нормалізації відношення можна позбавитися явної надлишковості даних у відношенні.

Ціль 4. Звести до мінімуму кількість відношень, що зберігатимуться у РБД. Прагнути треба до мінімуму відношень. Розкладання одного відношення на кілька відношень дозволяє уникнути низки, що можуть трапитися під час роботи з РБД, але це незручно для користувача, якому інколи важко визначити в якому саме відношенні знаходиться потрібна інформація.

В процесі проектування РБД необхідно знайти компроміс між 3-ю і 4-ю цілями.

Універсальне відношення

Відповідно до першої цілі процес проектування РБД розпочинається зі складання відношення, в яке залучаються всі потрібні для зберігання у РБД атрибути.

Якщо РБД складається лише з одного відношення, то це відношення називають універсальним.

Розглянемо етап складання універсального відношення на прикладі РБД для підприємства, що відправляє вантажі клієнтам. По-перше виявимо, які атрибути потрібно залучити до РБД та встановимо для них обмеження і зв’язки між ними:

1) Код_одержувача – ціле число, унікальне для кожного одержувача.

2) Назва_одержувача – символьний атрибут, кожний одержувач має одну назву, але одна назва може бути у декількох одержувачів (за кодом одержувача можна знайти його назву, зворотна операція неможлива).

3) Код_станції – ціле число, код станції, на якій знаходиться одержувач, кожний одержувач пов’язаний з одною станцією, на станції може бути кілька одержувачів.

4) Код_вантажу – ціле число, кожний вантаж має унікальний код, кожний одержувач може одержувати кілька різних вантажів.

5) Найм_вантажу – символьний атрибут, кожний вантаж має одне єдине відповідне найменування, кожному найменуванню вантажу відповідає один єдиний код вантажу.

6) Маса_вантажу – ціле число, кожний одержувач одержує вантаж одного найменування і визначеної маси (значення маси можуть повторюватися), одному одержувачу може бути відвантажено кілька вантажів.

Запишемо в таблицю зразок даних про навантаження за минулу добу:

Таблиця 8 – Дані про навантаження за добу

Код одержувача Назва одержувача Код станції Код вантажу Найм. вантажу Маса вантажу
  Мех. з-д     Метвироби Рейки Дріт  
  Ф-ка     Метвироби Дріт  
  Мех. з-д     Рейки Дріт  
  ЗБК     Прокат  
  Будтрест   - - -

Нормалізація відношення

Для усунення ризику виникнення зазначених проблем під час роботи з РБД виконують нормалізацію універсального відношення.

Перед нормалізацією відношення повинно знаходитися в першій нормальній формі.

Нормальна форма Бойса-Кодда

Запитання: Чи можна, не аналізуючи проблем, що можуть виникнути під час роботи з РБД, визначити, чи потребує відношення нормалізації?

Відповідь: Так. Якщо відношення знаходиться в нормальній формі Бойса-Кодда (НФБК), то воно майже напевно не потребує нормалізації і може застосовуватися в РБД, інакше потрібна його нормалізація.

Відношення знаходиться в НФБК, якщо і тільки якщо кожний детермінант відношення є можливим ключем відношення.

Що стосується можливих ключів універсального відношення НАВАНТАЖЕННЯ, то їх два й обидва вони складові:

<Код_одержувача, Код_вантажу>;

<Код_одержувача, Найм_вантажу>.

Функціональні залежності

Детермінант. Нехай дані 2 атрибути: А та В, то говорять, що атрибут В функціонально залежить від атрибуту А, якщо для кожного значення атрибуту А завжди існує рівно одне пов’язане з ним значення атрибуту В. Або навпаки, атрибут А є детермінантом атрибуту В. А й В можуть бути складовими, тобто кожний з них може бути складений з декількох атрибутів.

В конкретній ситуації функціональна залежність визначається шляхом деталізації властивостей всіх атрибутів у відношенні і обґрунтування висновку про те, як атрибути співвідносяться між собою. Функціональні залежності не можуть бути доведені шляхом простого перегляду окремого екземпляра відношення. На його основі може бути висунуте тільки припущення про наявність функціональної залежності між конкретними атрибутами. Але кожне таке припущення повинне бути перевірене на предмет того, чи може порушитися ця передбачувана функціональна залежність після додавання кортежів у відношення, або після зміни значень атрибутів у майбутньому.

В будь-якому випадку при визначенні функціональної залежності не слід відволікатися від смислу самих атрибутів, від їх взаємної смислової залежності, а також від обмежень, що накладаються на можливі значення цих атрибутів.

Візьмемо два атрибути <Назва_одержувача> та <Код_одержувача>.

Переглянувши екземпляр відношення можна установити, що одному значенню атрибута <Код_одержувача> відповідає одне значення атрибута <Назва_одержувача>. Отже, можна припустити, що атрибут <Назва_одержувача> функціонально залежить від атрибута <Код_одержувача>.

Тепер перевіримо за змістом це припущення. А чи може одержувач з певним кодом мати іншу назву?

Кожен одержувач має унікальний код, тобто немає і не може бути двох одержувачів з однаковими кодами. Отже, у відношення не може бути в принципі доданий кортеж, у якому повториться код одержувача з іншою назвою одержувача. Код одержувача може повторитися тільки з тією же самою назвою. З цього боку гіпотеза про існування функціональної залежності між атрибутами <Код_одержувача> і <Назва_одержувача> підтверджується.

З іншого боку, чи може той самий одержувач мати кілька різних назв? Очевидно, що ні, якщо інше не обговорено окремо чи спеціально. Якщо такого застереження нема, то можна зробити остаточний висновок про те, що між атрибутами <Код_одержувача> і <Назва_одержувача> дійсно існує функціональна залежність, причому атрибут <Код_одержувача> є детермінантом атрибута <Назва_одержувача>.

Необхідно перевірити, чи є зворотна функціональна залежність між цими атрибутами.

В представленому екземплярі відношення зустрічається значення атрибута <Назва_одержувача>, якому відповідають два значення атрибута <Код_одержувача>. Два одержувачі 1010 і 1425 мають однакові назви. Отже, зворотна функціональна залежність між цими ат







Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...

Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.