Databases

Befejeződött

A fájlrendszerek általában fájlként tárolják az adatokat lemezeken, emellett pedig metaadatokat is tárolnak (például a fájlnév), amellyel azonosíthatók és megkereshetők ezen a fájlok. A fájlrendszerek kezdetleges keresési és indexelési funkciókat is nyújtanak, a fájlok tartalmának átvizsgálása egy adott információ megkereséséhez pedig sokszor hosszas és nehéz folyamat. Ha az adatok strukturálhatók, általában egy jól definiált modellel (sémával) rendszerezzük őket egy adatbázisban. Az alábbi videó áttekintést nyújt az adatbázisokról:

Az adatbázisok egy egyszer vagy többször használható, általában digitális formában létező, rendszerezett adatgyűjteményből állnak. Az adatbázisok jelentik számos alkalmazásnál a legnépszerűbb adattárolási és -lekérési módszert, így például pénzügyi, gyártási, üzleti és személyzeti adatok esetén.

Az adatbázisok az évek során sokat fejlődtek. Elsőként a navigációs modell jelent meg az 1960-as években, amely olyan rekordokként tárolta az adatokat, amelyek mutatókkal kapcsolódtak az adatbázis előző és/vagy következő rekordjához. Ilyen volt például a CODASYL módszer, amely a Common Business Oriented Language (COBOL) nyelv alapjául szolgált. A CODASYL módszer a kapcsolódó adatkészletek „manuális” navigációján alapult. Ezen adatkészletek kapcsolódó adatok egy nagy „hálózatát” alkották, mint egyfajta körkörösen összekapcsolt lista. Amikor az adatbázist először megnyitotta egy program, az egy, az adatbázis első rekordjára mutató kapcsolatot kapott vissza, amely a többi adatra utaló mutatókat tartalmazott. Egy adott rekord megkereséséhez a programozónak egyesével végig kellett lépkednie ezeken a mutatókon, amíg meg nem találta a keresett rekordot. Az egyszerű, rekordok közti adatösszesítő lekérdezésekhez a teljes adatbázis átvizsgálására volt szükség, a keresés és az indexelés fogalmai ugyanis még nem léteztek. A CODASYL módszer megállta a helyét egy olyan korban, amikor a nem ideiglenes tárolás elsődleges módja a mágneses szalag volt, amely csak sorozatosan olvasható, és nem rendelkezik véletlenszerű elérési tulajdonságokkal.

A relációs adatbázis modelljének kialakulása, majd az IBM System R rendszerének megjelenése fontos mérföldkő volt az adatbázisrendszerek történetében. Sok évtizeden át a relációs adatbázisrendszerek voltak az egyetlen, széles körben használt adatbázisok, sikerük pedig páratlan volt. Az internet elterjedésével és a nagy léptékben méretezhető, több millió egyidejű kérést kiszolgálni képes rendszerek iránti igény megjelenésével felbukkantak a NoSQL adatbázisrendszerek. Mostanában azonban megjelent a relációs adatbázisrendszerek egy új osztálya, amelyet az alapoktól terveztek újra a két modell előnyeinek egyesítése érdekében.

Az adatbázisrendszerek típusai

Napjaink adatbázisrendszerei az alábbi típusokra oszthatók:

A relációs adatbázisok a klasszikus adatbázisrendszerek, amelyek évtizedek óta léteznek. Az adatok entitások közti kapcsolatként való megjelenítési relációs modelljét követik. A relációs adatbázisrendszerek általában egy merev sémát követnek, az SQL-t használják felületként az adatbázis használatához, és tipikusan erős ACID-tulajdonságokkal rendelkeznek.

A NoSQL-adatbázisok az adatbázisok új fajtáját képviselik, és jelentősen eltérnek a relációs adatbázisrendszerektől. A NoSQL-rendszerek általában nem kényszerítenek erős sémát vagy relációs modellt. Egy SQL-szerű felület helyett egy más típusú absztrakciót nyújtanak (egy kulcs-érték tárolóhoz hasonlóan). A NoSQL-adatbázisok a méretezhetőség és a teljesítmény terén emelkednek ki, és általában nem biztosítanak tranzakciós garanciát az adatbázis-műveletekhez.

A NewSQL a relációs adatbázisrendszerek egy modern osztálya, amely a NoSQL-rendszerekkel egyenértékű teljesítményt és méretezhetőséget kívánt nyújtani, miközben a relációs adatbázisok által kínált ACID-tulajdonságok némelyikét is igyekszik megőrizni.