00.BD.INTR.Història de les bases de dades

May 29, 2017 | Autor: Miquel Boada Artigas | Categoria: Database Systems, Databases, Bases de datos, Base de dades
Share Embed


Descrição do Produto

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Història de les bases de dades 1950 - ….

Autor: Miquel Boada Artigas

Data última modificació: 30/09/2016

Pàgina 1 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Història de les bases de dades

Introducció.........................................................................................................................3 Model en bases de dades..............................................................................................3 Cintes i targetes perforades (1950-1960)......................................................................3 Models no relacionals (1960-1980)................................................................................4 Fitxers........................................................................................................................4 Limitacions fitxers..................................................................................................5 Model jeràrquic (Hierarchical model). D’aquí a la lluna..............................................6 Característiques model jeràrquic............................................................................7 Limitacions model jeràrquic...................................................................................7 Model en xarxa (Network model)...............................................................................8 Característiques del model en xarxa......................................................................9 Desavantatges del model en xarxa......................................................................10 Models relacionals (1980)............................................................................................10 Característiques dels models relacionals.................................................................10 Desavantatges del model relacional....................................................................11 Bases de dades orientades a objectes.........................................................................11 Bases de dades objecte relacionals.............................................................................11 Bases de dades documentals......................................................................................11 Bases de dades XML....................................................................................................12 Webgrafia........................................................................................................................13

Data última modificació: 30/09/2016

Pàgina 2 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Introducció La informació des de sempre ha estat important per les empreses. Quan no hi havia ordinadors, o aquests eren massa cars, hi havien persones a les empreses que la seva feina consistia en anotar les dades en llibretes o registres: quantitat pendent de pagar o cobrar, registre de clients ... Amb l'aparició dels ordinadors s'ha aconseguit tenir una gestió i una consulta de la informació «simple», ràpida i eficient. Tot i que al principi els sistemes eren «rudimentaris» els models en què es basa l'emmagatzematge de la informació ha anat millorant per aconseguir l'eficiència en la gestió de la informació. Apart de l'emmagatzematge i la gestió de la informació, és important que la informació estigui relacionada entre ella. Si les dades són «illetes» d'informació sense relació serà molt difícil realitzar consultes on es relacionin dades de les diferents «illetes».

Model en bases de dades Un model en bases de dades fa referència a les regles que cal seguir per a poder representar la informació en el sistema informàtic i, en última instància, en el dispositiu d’emmagatzematge físic. El model representa en sí mateix una limitació en les possibilitats, però garanteix, si s’aplica de forma correcte, que el sistema de bases de dades funcionarà de forma eficient i sense problemes segons el model aportat. Tots els models de bases de dades com a mínim han de presentar dues característiques: 1. Regles per a estructurar la informació. Per exemple, si vull fer una base de dades per un gavinet mèdic, tindré pacients que fan visites a metges que realitzen els diagnòstics … El model cal que em determini com haig d’estructurar la informació dels metges , dels pacients, dels diagnòstics… i com establir les relacions entre les diferents informacions. 2. Les operacions que podré realitzar amb la informació El model m’ha de determinar quines operacions (inserir, consultar, eliminar …) podré realitzar i com afectaran aquestes operacions a les dades i a les relacions entre elles.

Cintes i targetes perforades (1950-1960) Durant els anys 50 i principi dels 60 es desenvolupen les cintes magnètiques com a medi d’emmagatzematge de la informació. La informació s’introduia a l’ordinador a través de cintes o targetes perforades. Per altra banda s’introduien les instruccions que l’ordinador havia d’executar. L’ordinador realitzava els càlculs (processava) i els nous resultats eren emmagatzemats en cinta i opcionalment impressos en impressores. El processament de la informació amb els medis de l’època era molt lent (comparat amb avui dia) i la lectura sequencial de les cintes era un «handicap» molt important.

Data última modificació: 30/09/2016

Pàgina 3 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Models no relacionals (1960-1980) S’ha decidit dividir els sistemes amb relacionals i no relacionals donat la importància que ha tingut el model relacional en la informàtica ja moderna, tot i que avui dia s’estan començant a imposar el model objecte-relacional i altres models no relacionals com bases de dades XML. Durant la dècada del 60 i 70 s’imposaven els models no relacionals, bàsicament el model jeràrquic (hierarchical model) i el model en xarxa (network model). Abans d’incidir amb aquests models, s’introduirà una breu explicació de la creació de sistemes d’informació utilitzant fitxers i les limitacions que presenta aquest sistema.

Fitxers L'aparició de les bases de dades , tal i com les entenem avui dia, comencen amb l'aparició del disc dur l'any 1960. El disc dur és un dispositiu, que a diferència de la cinta magnètica, permet l'accés directe a la informació: possibilitat d'accedir a una dada sense necessitat de llegir totes les dades precedents. La idea d'utilitzar fitxers prové de l'aplicació directa de l'emmagatzematge de la informació amb arxivadors. Cada arxivador conté una sèrie de fitxes ordenades i cada fitxa conté unes dades associades a una etiqueta. A nivell informàtic un fitxer és un conjunt de dades organitzades amb una determinada estructura. Els fitxers permeten emmagatzemar les dades de forma permanent i, per tant, poder-los recuperar en qualsevol moment posterior. En relació a l'estructura del fitxer pot venir determinada per un usuari, pel sistema operatiu o per un programador. En el procés manual quan una persona vol obtenir una determinada informació accedeix a l'arxivador i dins el mateix busca la fitxa o fitxes amb la informació necessària. En el procés informàtic caldrà primer accedir al fitxer (arxivador) i buscar dins el seu contingut la fitxa o fitxes necessàries. Està clar que en el procés informàtic s'inclouen programes que faciliten i acceleren aquesta feina, de forma que l'usuari, per exemple, no tingui necessitat de saber ni tan sols com es diu el fitxer. Cal tenir clar que en les bases de dades modernes es continua utilitzant fitxers per a guardar la informació. Quan en el següent punt s’anomenen algunes de les limitacions dels fitxers es fa referència a la creació d’una base de dades només amb fitxers sense utilitzar cap software específic ja desenvolupat.

Data última modificació: 30/09/2016

Pàgina 4 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Limitacions fitxers1 1. El fet que els programes siguin personalitzats per a cada fitxer, fa que si es modifica l'estructura d'un fitxer calgui modificar també els programes per poder-hi accedir: dependència d’estructura. 2. Si cal afegir una dada per una determinada fitxa , cal incloure aquella informació a totes les fitxes. Per exemple, si es vol informar de l'email d'una persona, caldrà que totes les persones tinguin també informació sobre aquest email. 3. Redundància de la informació: si el fitxer conté molta informació es pot donar el cas que per error es puguin duplicar dades. 4. Consistència de la informació: el fet que no hi hagi control de duplicats pot incidir que la informació sigui incoherent: no tota la informació duplicada té el mateix valor (errors ortogràfics, d’introducció de la informació ...). 5. Dificultats per la inserció ordenada de noves dades i la modificació de les mateixes. 6. Compartició de la informació: la compartició de la informació no és eficient. Si es vol evitar que dos usuaris modifiquin una mateixa dada cal bloquejar tot el fitxer. Si es bloqueja tot el fitxer no hi ha possibilitat que dos usuaris modifiquin dues dades diferents d'un mateix fitxer. 7. La validació de la informació introduïda cal realitzar-la a nivell de programa (per exemple, l'increment de salari no pot ser superior al 2%). Si canvia la validació cal canviar també tots els programes on es s'implementi la validació. 8. Consultes complexes són complicades: quan en una consulta cal obtenir informació emmagatzemada en diferents arxius cal realitzar programes complexos. 9. El sistema implementa seguretat (edició, lectura, eliminació, modificació) a nivell d'arxiu, però no a nivell de detall de la informació. O pot modifcar totes les dades de l'arxiu o no en pot modificar cap. 10. Atomicitat: quan és necessari modificar dades de diferents llocs no es pot garantir que l'operació no quedi a mitjes. Per exemple, si es fa un traspàs bancari entre dos clients, cal realitzar dues operacions: anotar l'increment de diners per un client i la disminució per l'altre. Si hi ha algun problema que impedeixi que es realitzi la segona operació , la informació queda inconsistent. 11. No es garenteix la integritat de les dades. Per exemple, si vull representar en fitxers les especialitats que exerceix un metge, es podrà donar d’alta un metge sense que s’hagi d’introduir (ni existeixi) cap especialitat en el sistema.

1

El fet que les limitacions estiguin limitades no està relacionat amb la importància que pugui tenir cada un dels punts.

Data última modificació: 30/09/2016

Pàgina 5 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Model jeràrquic (Hierarchical model). D’aquí a la lluna El model jeràrquic es va desenvolupar en primer lloc per l’empresa IBM per a poder tenir un control de totes les peces de la nau especial Apollo, que havia d’enviar una persona a la lluna i retornar-la a la terra. La primera base de dades jeràrquica es va dissenyar i desenvolupar l’any 1966. La primera instal·lació es va realitzar dos anys després (1968). Tenia el nom de Information Control System (ICS) i el seu objectiu era la de tenir un control de totes les peces necessàries per a construir el primer cohet que enviaria l’home a la lluna. El 1969 el sistema ICS passa a rebatejar-se com a IMS/360 (information management system). Cal tenir en compte que encara hi ha empreses que utilitzen el sistema IMS2. El model jeràrquic es caracteritza per a relacionar la informació a través d’un arbre, on s’estableix la relació entre la informació de pare a fill. En el model jeràrquic es parteix d’un node que és l’arrel de l’arbre i a partir d’aquí es van establint les diverses relacions entre les diferents dades que conformaran la base de dades. Imatge 1: Representació model jeràrquic per a un gavinet mèdic

2

Imatge 2: Representació model físic

https://www-01.ibm.com/software/data/ims/

Data última modificació: 30/09/2016

Pàgina 6 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Característiques model jeràrquic 1. Independència de dispositiu Per l’utilització exhaustiva que s’estava realitzant del sistema informàtic i per l’evolució pròpia de l’època, es tenia clar que els dispositius d’emmagatzematge anirien evolucionant. Era imprescindible crear un software que pogués funcionar amb qualsevol dispositiu. 2. Independència de dades Els programes que dónen accés a les dades continuen funcionant si les dades canvien. Per exemple, si canvio una dada de «float» a «integer» no cal realitzar canvis als programes per accedir al seu valor. 3. Eficiència d’emmagatzematge En aquella època els discos tenien un tamany molt reduït. Calia montar un sistema eficient per a minimitzar el temps de gravació de la informació. 4. Integritat de les dades El sistema havia d’assegurar que les dades sempre fossin coherents. Per exemple, si una peça s’havia d’acoplar a una altra peça, les dues peces han d’existir en el sistema! 5. Eines per la recuperació de dades El model jeràrquic incorpora eines pròpies per a la recuperació de dades. 6. Compartició de dades Es poden definir quines operacions podrà realitzar cada usuari per a cada una de les dades. Limitacions model jeràrquic El model jeràrquic , com veurem a continuació , presenta algunes limitacions que fa que només sigui aplicable en alguns casos particulars. 1. Implementació complexe. Per a implementar el software cal tenir coneixements de l’estructura física dels dispositius d’emmagatzematge. 2. Dependència en l’estructura de la base de dades. Tot i que el sistema jeràrquic contempla la independència de les dades la independència en relació a l’estructura de les dades no està suportada. Així, per exemple, si cal afegir una nova informació «email» a la fitxa de clients, és necessari reajustar els programes ja existents. 3. Creació de programes complexe. El sistema de punters i la pròpia naturalesa de les bases de dades jeràrquiques fa que el desenvolupament de les aplicacions sigui complex. Els programadors necessiten saber com les dades estan distribuides físicament en el disc. Es diu que és un sistema creat per programadors per tal que l’utilitzin programadors.

Data última modificació: 30/09/2016

Pàgina 7 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

4. Relacions n:m no estan suportades En el nostre exemple d’un gavinet mèdic, un metge només pot tenir una especialitat o bé un client no pot visitar a més d’un doctor. Per a poder cubrir aquestes relacions de forma standard, cal duplicar la informació. En la imatge es mostra com un metge pot tenir dues especialitats assignades. Imatge 3: Jerarquia no vàlida

5. Duplicitat de la informació Com s’ha vist en el punt anterior, per a poder representar algunes relacions cal duplicar la informació. Els problemes de la duplicitat de la informació , apart de l’espai en disc, són les actualitzacions de les dades que presenten una major lentitud i complexitat. 6. Estàndards No es disposa d’una documentació precisa dels conceptes del model ni el model s’ajusta a cap estàndard.

Model en xarxa (Network model) El model en xarxa es formalitza a final dels anys 60 i està estandaritzat com a model CODASYL. Es tracta d’un model semblant al jeràrquic, però la relació entre les diferents informacions es tracta mitjançant nodes. Per veure com implementa les relacions el model Imatge 4: Representació model en xarxa en xarxa utilitzarem un exemple. Seguint en l’exemple del gavinet mèdic guardarem la informació dels metges , pacients i els seus diagnòstics (per facilitar la comprensió hem eliminat les especialitats). Les diferents relacions que hi ha són que un metge visitarà molts pacients i un pacient pot ser visitat per diferents metges. Un client tindrà molts diagnòstics, però un diagnòstic només serà per un pacient. En la imatge es pot observar com la relació que hi ha entre la informació de pacient i la de doctor ha generat un nou element que s’ha indicat amb el nom de Visita. Aquest element conté a més una informació del tipus de visita (programada, urgència …) que s’ha realitzat.

Data última modificació: 30/09/2016

Pàgina 8 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Característiques del model en xarxa ✔ Permet relacions N:M Els problemes que existien en el model jeràrquic per a representar que un metge exerceix vàries especialitats i que una especialitat és exercida per varis metges són suportades de forma estàndard en el model en xarxa. ✔ Millora l’accés a les dades Els mecanismes de navegació entre els diferents nodes és més eficient ja s’estableixen més enllaços entre els diferents tipus d’informació. ✔ Integritat de les dades Si hi ha una relació entre dues informacions, per exemple doctor i pacient, el sistema garanteix que existeixen les dues informacions o bé la relació no es podrà dur a terme. ✔ Independència de dispositiu ✔ Independència de dades ✔ Existència d’estàndards

Data última modificació: 30/09/2016

Pàgina 9 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Desavantatges del model en xarxa ✗



Implementació complexe i desenvolupament complex El model en xarxa es basa en l’existència de punters que relacionen la informació. La implementació d’aquests punters requereixen coneixements de l’emmagatzematge físic de les dades. Dependència en l’estructura de la base de dades. Igual com passava amb el model jeràrquic la independència de l’estructura de dades no està suportada.

Models relacionals (1980) Tot i que s’ha indicat l’època dels 80 com a naixement dels models relacionals cal dir, per ser justos, que aquests es varen desenvolupar a partir d’un article de Edgar Frank "Ted" Codd publicat el 1970. El rendiment dels models relacionals no podia competir amb els models jeràrquics i de xarxa, que eren molt més eficients. L’aparició de la base de dades relacional System R desenvolupada per IBM va fer que la situació es capgirés i els sistemes relacionals es varen començar a imposar en el mercat.

Característiques dels models relacionals 1. Representació de la informació El sistema permet representar gairebé tots els tipus de dades i establir de forma fàcil la relacions entre les diverses dades. 2. Facilitat d’ús La disposició d’un llenguatge propi d’alt nivell permet accedir a les dades de forma més fàcil. El programador només es preocupa d’accedir a les dades, sense necessitat de saber com es guarden físicament en el disc. 3. Independència de les dades i estructura de dades Es poden realitzar alguns canvis en l’estructura de les dades i continuar fent ús dels programes ja existents sense necessitat d’introduir canvis. 4. Independència física L’emmagatzematge de les dades és totalment independent dels programes, podent-se utilitzar qualsevol sistema d’arxius o bé sistemes d’arxius diferents per una mateixa base de dades. 5. Integritat de les dades El sistema garanteix que les dades sempre siguin coherents. El sistema controla també que no hi hagi duplicitat d’informació: per exemple, que la informació d’un client estigui dues vegades en la base de dades. 6. Compartició i bloquejos El sistema controla l’accés multiusuari a les dades i permet definir la seguretat en diferents nivells. Quan hi ha modificacions concurrents, el sistema bloqueja només una part d’informació, per tal que no es produeixin inconsistències. 7. Escalable El sistema permet un creixement gradual per a poder-se adaptar a les necessitats de cada moment.

Data última modificació: 30/09/2016

Pàgina 10 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

8. Estàndards Hi ha nombrosa documentació tant del model com dels diferents llenguatges que implementa. Desavantatges del model relacional ✗



Incompetència amb objectes L’estructura de la informació dels models relacionals no s’adapten a la representació de dades que uitlitzen els llenguatges de programació moderns: cal fer programes intermitjos per a transformar les dades del model relacional al model de dades del llenguatge. Informació multimèdia, gràfica ... El model relacional no incorpora eines per a poder treballar amb aquest tipus de dades o informacions.

Bases de dades orientades a objectes El sistema relacional és un sistema molt implantat en el món empresarial. Aquest sistema però té un problema molt important que és la comunicació amb els llenguatges de programació que s’utilitzen actualment: llenguatges orientats a objecte. Quan es necessita gestionar una informació , cal transformar aquesta informació a un o varis objectes i després poder operar sobre ells. Per evitar aquesta transformació es va pensar en montar bases de dades orientades a objectes.

Bases de dades objecte relacionals Les bases de dades orientades a objectes , tot i ser una bona idea, no es varen acabar imposant en el mercat ja que el model relacional és una solució molt eficient als requeriments dels usuaris. Les bases de dades objecte relacionals neixen de la idea d’aprofitar tota la potència dels llenguatges orientat a objectes i del model relacional creant sistemes gestors de bases de dades que barregessin els dos conceptes. Caldrà veure si aquests sistemes s’acaben imposant a les bases de dades relacionals.

Bases de dades documentals Els sistemes gestors de bases de dades relacionals tenen un problema quan han de representar grans informacions. Així, per exemple, l’emmagatzematge de videos, audio i textos grans, tot i que està permès, presenten problemes amb la representació i cerca de la informació. Les bases de dades documentals varen crear-se per a poder gestionar tota classe de «documents» sense aplicar el model relacional.

Data última modificació: 30/09/2016

Pàgina 11 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Bases de dades XML Un dels problemes que hi ha amb les bases de dades relacionals és que tot i que l’estructura de la informació es pot canviar alguns canvis poden afectar als programes , essent necessaris canvis en aquests. Per exemple, quan es defineix un objecte: treballador, client, article … en el model relacional tots han de tenir les mateixes característiques. Si d’un client vull guardar el seu nif, nom, adreça, email i telèfon tots els clients tindran una estructura per a poder emmagatzemar aquesta informació. Si es vol afegir una nova dada, per exemple «data de naixement», es modificarà l’estructura de tots els clients: a tots els clients podré emmagatzemar la data de naixement 3. Les bases de dades XML defineixen una estructura pròpia per a cada element: per a cada client puc decidir, per exemple, si vull que se li pugui informar o no de la data de naixement. Les bases de dades XML no tenen la intenció de substituir al model relacional. Alguns sistemes gestors de bases de dades relacionals incorporen la possibilitat de treballar amb bases de dades XML. La idea és disposar d’una eina molt flexible quan s’han de guardar petites informacions però amb una estructura de dades molt variable.

3

En alguns casos aquesta opció ja és adequada.

Data última modificació: 30/09/2016

Pàgina 12 de 13

Introducció a les bases de dades - Tema 0 – Introducció

Autor: Miquel Boada Artigas

Webgrafia https://www.dlsweb.rmit.edu.au/toolbox/knowmang/content/models/network_model.htm http://osm.cs.byu.edu/CS452/supplements/FileOrg.pdf http://robotica.uv.es/pub/Libro/PDFs/CAPI6.pdf http://www.comphist.org/computing_history/new_page_9.htm https://www.seas.upenn.edu/~zives/03f/cis550/codd.pdf https://es.wikipedia.org/wiki/Modelo_relacional#Ventajas

Data última modificació: 30/09/2016

Pàgina 13 de 13

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.