Datu-base

baliabide informatikoen bidez sistematikoki bildutako eta sailkatutako datu askoren biltegia

Datu-basea beraien artean zerikusia duten datuen bilduma da,[1] datuak gorde eta ondoren modu erraz eta egituratuan eskuratzea ahalbidetzen dituena (Informatikan Datu-baseak kudeatzeko sistemak (DBKS). Gaur egun, informatika eta elektronikari esker, datu-base gehienek formatu elektronikoa dute, zeinak datuen kudeaketarako abantaila ugari eskaintzen dituen.

Datu-base baten bi taulen arteko erlazioa.

Adibidez, liburutegi bat dokumentuz eta testuz osatutako datu-base bat dela esan daiteke, erraz aurkitu ahal izateko zerrendatutako informazio bilduma alegia.

Datu-base motak

Datu-base hierarkikoak

Informazioa sailkapen hierarkiko baten bidez banatzen duten datu-baseak dira. Gurasoak ez dituzten nodoei sustraia deitzen zaie eta semeak ez dituztenei hosto (Nodo guraso bakoitzak hainbat nodo ume izan ditzake). Hauek oso erabilgarriak dira datu bolumen oso handiak edo elkarbanatuak erabiltzen dituzten aplikazioentzat eta, honela, oso egitura finko eta ekoizpen handikoak lortzen dira. Datu-base hauen eragozpen handiena datu erredundantzia errepresentatzeko gaitasuna oso murriztua daukatela da.

Sare datu-baseak

Zenbait nodo guraso desberdin izan ditzake. Aurrerakuntza handia izan zen hierarkikoekin konparatuta, datu erredundantziaren arazoa konpontzeko aukera ematen duelako. Datu-base honek ematen dituen zailtasunak direla eta programatzaileek, erabiltzaileek baino gehiago erabiltzen duten modelo bat da.

Datu-base erlazionalak

Datu-egitura taulak dira, hau da, datu bakoitza ilara batean eta zutabe batean jarriko da. Oso erabilia da datuak administratzeko eta arazo errealak modelatzeko. Funtsezko ideia “erlazioen” erabilpena da. Horiek “tupla” izeneko datu erantsi bat dira. Modelo horretan datuak ematen diren lekuak eta formak ez dira gailentzen. Horrek, errazago ulertzeko abantaila dauka erabiltzaile ez-jakitun batentzat. Datuen arteko konexioak egiteko aukera ematen dute, hauek tauletan gordeta daudelarik eta honela, bi taulen datuak erlazionatzen dira, datu-baseari izena emanez. Datu base erlazionala eratzeko, kategoriak jarri eta horien arteko harremanak zehaztu behar dira. Kontsultekin informazioa berreskuratu edo biltegiratzeko aukera ematen dute eta honela informazioa administratu. SQLa da erlaziozko datu-baseak eraikitzeko lengoaiarik erabiliena.[2]

Ezaugarriak:

  • Datu-base erlazional bat hainbat taula edo erlazioz osatzen da.
  • Ezinezkoa da izen bereko bi taula edo entitate egotea.
  • Taula bakoitza erregistro multzo bat da. Taularen errenkadak erregistroak dira eta zutabeak atributu edo eremuak.
  • Taulen arteko erlazioak gauzatzeko gakoak eta kanpo gakoak erabiltzen dira.

Datu-base transakzionalak

Datu-base transakzionalak datuak abiadura handian bidaltzeko eta jasotzeko sortuak dira. Ez dira oso ohikoak eta normalean kalitate analisietan, produkzioetan eta arlo industrialetan erabiltzen dira. Datuak batzea eta errekuperatzea da datu-base honen betekizunik garrantzitsuena. Horregatik datuen erredundantzia eta informazioaren errepikapena[3] ez du arazorik ematen, beste datu-baseekin alderatuta. Orokorrean, funtzionamendua maximizatzeko datu-base erlazionaletara konexioak egitea ahalbidetzen da. Adibiderik ohikoena bi kontu-korronteen arten diru transferentzia bat egitea izango litzateke. Normalean bi eragiketa desberdinen artean egikarituko litzateke, lehenengoan kontu batetik dirua kenduko genuke eta bigarrenean beste kontu batean kendutako dirua gehituko genuke. Sistemaren atomikotasuna ziurtatzeko (hau da, dirua ez desagerrarazteko edo agerrarazteko), eragiketa biak atomikoak izan behar dira, sistema ziurtatu egin behar da, edozein baldintza emanda (sistemaren jauzia barne), eragiketa biak egikaritu direla edo ez dela bat ere ez egikaritu.

Datu-base multidimentsionalak

Aplikazio oso espezifikoak garatzeko pentsatutako datu-baseak dira, OLAP kuboak adibidez. Ez dira asko desberdintzen datu-base erlazionaletatik (datu-base erlazional bateko taula bat, datu-base multidimentsionaleko taula bat izan daiteke) desberdintasuna kontzeptuala da bakarrik; datu-base multidimentsional bateko atributuak bi mota desberdinekoak izan daitezke, taula baten dimentsioak adieraz ditzake edo ikasi nahi diren metrikak adieraz ditzake.

Objektuetara bideratutako datu-baseak

Objektuetara bideratutako eredu informatikoen datu-base eredu bat da. Datu-basean objektuak osorik gordetzean datza honen betebeharra (egoera eta jarrera). Objektuetara bideratutako datu-basea objektuen paradigmaren kontzeptu garrantzitsuenak bere barne dituen datu-base bat da.

  • Kapsulatzea: gainerako objektuetatik informazioa ezkutatzeko propietatea eta erabilera okerrak edo gatazkak saihesteko propietatea.
  • Herentzia: objektuek, klase hierarkiko batean, jarrerak herentzia modura jasotzeko propietatea.
  • Polimorfismoa: eragiketa berbera objektu mota desberdinei aplikatzeko ahalbidetzen duen propietatea.

Objektuetara bideratutako datu-base batean, erabiltzaileek datu-basearen definizio modura eragiketak definitu ditzakete datuen gainean. Eragiketa batek (funtzio deritzona) bi ataletan definitzen da.

  • Eragiketa baten interfazeak (edo sinadura) eragiketaren izena eta argumentuen (edo parametroen) datu motak jasotzen ditu.
  • Eragiketaren inplementazioak (edo metodoa) banandua adierazten da eta interfazeari eraginik egin gabe aldatu daiteke.

Erabiltzaileen aplikazio programek, horien izena eta argumentuak deitzeko erabiliz, datuen gainean lan egin dezakete eragiketaren inplementazio era kontuan hartu gabe. Programen eta eragiketen arteko independentzia deitzen zaio.

Datu-base dokumentalak

Datu-base dokumentaletan, datuak gutxi egituraturik daude, eremu askoren luzera eta edukia ezin da aurretik jakin eta arazo linguistikoei aurre egin behar izaten diete.Testua osorik indexatzea ahalbidetzen dute, eta oro har, bilaketa handiagoak egitea. Bolumen handiko informazio historikoa gordetzeko erabiltzen dira. Thesaurus indize bidez optimizatutako datu-base dokumentaletarako sistema bat da.

Datu-base deduktiboak edo datu-base logikoak

Sistema deduktibozko datu-base bat,[4] datu-base arrunt batekin alderaturik, inferentziaren bitartez ondorioak lortzea bermatzen du. Gehien bat datu-basean gordetzen diren arauetan eta gertaeretan oinarritzen da. Datu-base deduktiboak, datu-base logikoak deitzen zaie oinarritzat logika matematikoa[5] erabiltzen dutelako. Mota honetako datu-baseak, datu-base erlazionaletan kontsultak modu errekurtziboan egiteko murriztapenen eta gordetzen dituzten datuen zeharkako harremanak ondorioztatzeko gai ez izatearen ondorioz sortu ziren.

Edukiari begira

Erreferentzien datu-baseak ditugu alde batetik (metadatuak) eta bestetik, datu base-iturriak (metadatuak eta informazio osoa eskaintzen dizkigutenak).

Erreferentzien datu-baseak

Errepresentazioak soilik gordetzen dituzte. Hiru mota daude:

Bibliografikoak

Datu-base bibliografikoa erregistro bibliografikoen datu-basea da. Liburutegi bateko liburuei eta beste material batzuei buruzko informazioa duen datu-basea izan daiteke (katalogo izena hartzen du orduan). Edo, terminoaren adiera erabilienari jarraituz, aldizkarien eta beste argitalpen zientifiko batzuen edukiaren aurkibide bibliografikoa, hala nola artikulu zientifikoak, hitzaldi eta biltzarretako aktak, liburuetako kapituluak, etab. Jakintza arlo batekoa edo anitzekoa izan daiteke. Datu-base horiek Internet bidez kontsultatzen dira. Erreferentziak, abstractak (argitalpen zientifiko baten laburpena) eta, sarritan, indexatutako edukien testu osoa edo testu osorako estekak dituzte. Adibidez, EHUko liburutegiko katalogoan, liburuaren egilearen izena edo liburuaren izena bilatu ahal ditugu jakiteko bilatzen ari garen liburu hori EHUko liburutegian dagoen edo ez.

Direktorioak

Datu pertsonalizatuen, helbide elektronikoen, telefono-zenbakien eta beste datu askoren zerrenda handiak dira . Adibidez, formatu elektronikoko telefono-gidak.

Direktorio horiek bi motatakoak izan daitezke, pertsonalak (orrialde zuriak) edo enpresakoak (orrialde horiak). Enpresa-direktorioak hiru motatakoak izan daitezke:

  • Enpresaren izena eta helbidea dituztenak.
  • Telefonoa dutenak eta aurreratuenek posta elektronikoa.
  • Zenbait datu dituztenak, hala nola fakturazioa edo langile-kopurua, eta horiek bereizten laguntzen duten kode nazionalak.

Direktorio pertsonalak mota bakarrekoak dira; izan ere, Espainian DBLOk eta antzeko legeek direktorioko erabiltzaileen pribatutasuna babesten dute. Horres gain, alderantzizko bilaketa debekatuta dago direktorio pertsonaletan.

EHUko direktorioan[6] sartzen bagara instituzioko langile baten izena bilatuz jakingo dugu ea ze kargu duen pertsona horrek, eta alderantziz, kargu bat bilatzen badugu jakingo dugu ze pertsonak betetzen duen kargu hori.

Objektuen deskripzioak

Artium museoko adibidea dugu hemen, bere katalogoan[7] sartzen baldin bagara artelanen deskripzioak eta metadatuak aurkitu ahal ditugu artelan horren izena jarriz.

Datu-base iturriak

Informazio osoa dute:

  • Zenbakiak: (adibidez, datu estatistikoak)
  • Testuak
  • Irudiak
  • Multimediak: Haiekin, hainbat bitarteko (irudia, audioa, bideoa edo beste eduki interaktiboak) dituzten dokumentuak aurkitzen ditugu. Iturri horietan Amazon bezalako eragina duten online liburutegi komertzialak, multimedia-dokumentuen datu-baseak (Candid Photos71, WebSeek72), multimedia-dokumentuen errepertorioak eta bilatzaile espezializatuak sar ditzakegu.

Datu-baseen egitura

Datu-baseen egitura lau elementuk osatzen dute:

  • Entitateak: Errealitatean dagoen zerbait, gauza fisikoa (adibidez, Loiolako Hegiak liburua)
  • Erregistroak: Errealitate horri datu-basean dagokion fitxa (aadibidez, Loiolako Hegiak liburuaren  fitxa)
  • Eremuak: Fitxaren atalak (adibidez, titulua, egilea, argitaletxea …
  • Datuak: Fitxan dagoen informazioa entitateari buruz (adibidez, Loiolako Hegiak, Imanol Murua Uria[8]

Beste sailkapen batzuk

  • Eskuragarritasuna: Publikoak (EHUko liburutegiko katalogoa) edo pribatuak (ETB).
  • Banaketa: Lokala (nire ordenagailuan), linean (Internet), editatua (DVD).
  • Ekoizlea: Instituzionalak, komertzialak…
  • Arlo tematikoa: Ekonomia, zuzenbidea...

Datu-base banatuak kudeatzeko sistema (DBBKS)

Datu-basea eta DBBKS-erako softwarea sarearen bidez konektaturik, leku askotan banandurik egon daitezke. Bi motatakoak existitzen dira.

  1. Homogeneoki bananduak: datu-baseak kudeatzeko sistema (DBKS) berdina erabiltzen da nodo guztietan.
  2. Heterogeneoki bananduak: datu-base kudeatzeko sistema (DBKS) federatuak edo oinarri anitzeko sistemak bermatzea ahalbidetzen dute, non DBKSek autonomi maila jakin bat eta lehendik existitzen ziren DBKSko zenbait datu-base autonomoetara atzipena duten. Mota honetako sistema askok bezero-zerbitzari motako arkitektura erabiltzen dute.

Horiek organismo deszentralizatu fisikoen ondorioz sortzen dira. Datu-base banatuen kudeatzeko sistemari esker herri desberdinetako datu-baseak batzeko gaitasuna ahalbidetzen dute eta edonondik unibertsitatearen, denda-adarraren eta beste zenbait lekuren informazioa lortzea posible egiten du.

Datu-baseetara kontsulta

Kontsulta adibide bat (Select motakoa).

Datu-base baten informazioa lortzeko erabiltzen den metodoa “kontsulta” izenarekin ezagutzen da. Kontsulten bitartez datu-base baten informazioa eguneratu, ezabatu, erakutsi eta datu berriak gehitu, txantiloiak erregistro iturri gisa ere erabil daitezke. Horretarako, kontsulta-lengoaia bat erabiltzen da. Datu-baserako kontsultak datuen datuak manipulatzeko lengoaiaren (DML) bidez egiten dira, gehien erabiltzen den datu-baseen kontsulta-lengoaia SQL da.

SQL

Structured Query Language” edo Kontsultekin Eraikitako Lengoaia esan nahi dute eta gaur egungo datu-baseek erabiltzen duten lengoaia da. 1980ko hamarkadan agertutako dBASE programazio lengoaiaren eta datu sistemen administrazioen ondorengoa bilakatu da.

SQL:2003, SQL92 estandarraren luzapena da, objektuetara bideratutako kontzeptuak eta SQL92-rekin bateragarritasuna mantentzen ditu.

Erreferentziak

Bibliografia

  • Bachman, Charles W. (1973). "The Programmer as Navigator". Communications of the ACM. 16 (11): 653–658. doi:10.1145/355611.362534.
  • Beynon-Davies, Paul (2003). Database Systems (3rd ed.). Palgrave Macmillan. ISBN 978-1403916013.
  • Chapple, Mike (2005). "SQL Fundamentals". Databases. About.com. Archived from the original on 22 February 2009. Retrieved 28 January 2009.
  • Childs, David L. (1968a). Description of a set-theoretic data structure (PDF) (Technical report). CONCOMP (Research in Conversational Use of Computers) Project. University of Michigan. Technical Report 3.
  • Childs, David L. (1968b). Feasibility of a set-theoretic data structure: a general structure based on a reconstituted definition (PDF) (Technical report). CONCOMP (Research in Conversational Use of Computers) Project. University of Michigan. Technical Report 6.
  • Chong, Raul F.; Wang, Xiaomei; Dang, Michael; Snow, Dwaine R. (2007). "Introduction to DB2". Understanding DB2: Learning Visually with Examples (2nd ed.). ISBN 978-0131580183. Retrieved 17 March 2013.
  • Codd, Edgar F. (1970). "A Relational Model of Data for Large Shared Data Banks" (PDF). Communications of the ACM. 13 (6): 377–387. doi:10.1145/362384.362685. S2CID 207549016.
  • Connolly, Thomas M.; Begg, Carolyn E. (2014). Database Systems – A Practical Approach to Design Implementation and Management (6th ed.). Pearson. ISBN 978-1292061184.
  • Date, C. J. (2003). An Introduction to Database Systems (8th ed.). Pearson. ISBN 978-0321197849.
  • Halder, Raju; Cortesi, Agostino (2011). "Abstract Interpretation of Database Query Languages" (PDF). Computer Languages, Systems & Structures. 38 (2): 123–157. doi:10.1016/j.cl.2011.10.004. ISSN 1477-8424.
  • Hershey, William; Easthope, Carol (1972). A set theoretic data structure and retrieval language. Spring Joint Computer Conference, May 1972. ACM SIGIR Forum. Vol. 7, no. 4. pp. 45–55. doi:10.1145/1095495.1095500.
  • Nelson, Anne Fulcher; Nelson, William Harris Morehead (2001). Building Electronic Commerce: With Web Database Constructions. Prentice Hall. ISBN 978-0201741308.
  • North, Ken (10 March 2010). "Sets, Data Models and Data Independence". Dr. Dobb's. Archived from the original on 24 October 2010.
  • Tsitchizris, Dionysios C.; Lochovsky, Fred H. (1982). Data Models. Prentice–Hall. ISBN 978-0131964280.
  • Ullman, Jeffrey; Widom, Jennifer (1997). A First Course in Database Systems. Prentice–Hall. ISBN 978-0138613372.
  • Wagner, Michael (2010), SQL/XML:2006 – Evaluierung der Standardkonformität ausgewählter Datenbanksysteme, Diplomica Verlag, ISBN 978-3836696098

Ikus, gainera

Kanpo estekak