Vad är en vertikal databas?

En vertikal databas är en där den fysiska layouten för data är kolumn för kolumn snarare än rad för rad. I stället för att ordnas i horisontella registerstrukturer och bearbetas vertikalt, är data i en vertikal databas ordnade i vertikala strukturer, kända som predikaträd eller P-träd, och bearbetas horisontellt.

Data Mining

Horisontella databaser är lämpliga för applikationer där det begärda resultatet är en uppsättning horisontella poster, men mindre för applikationer som data mining, där forskare vanligtvis är intresserade av resultat som kan uttryckas kortfattat. P-träd, å andra sidan, är väl lämpade för datautvinning. P-träd skapas vanligtvis genom att sönderdela varje attribut, eller kolumn, i en tabell med horisontella poster i separata bitvektorer eller array-datastrukturer. P-träd kan vara endimensionella, tvådimensionella eller flerdimensionella; om de data som ska lagras i databasen har naturliga dimensioner - till exempel geospatial data eller geografisk information - matchas P-trädets dimensioner med dataens.

Prestanda

Data i en vertikal databas bearbetas via snabba logiska operatörer, till exempel AND, OR, exklusiv OR och komplement. Dessutom, genom att ordna data kolumnvis snarare än radvis, är det möjligt att utföra frågor eller sökningar på data utan att komma åt sidor på en hårddisk som inte påverkas av frågan och därmed öka hastigheten för datainhämtningen . Detta är ett viktigt övervägande vid datautvinning i mycket stora datalagrar.

Sidstorlek

En annan fördel med vertikala databaser är att de tillåter att data lagras på stora sidor. En stor sidstorlek innebär att ett stort antal relevanta dataposter kan hämtas i en enda läsoperation. Däremot hämtar en enda läsoperation i en horisontell databas inte bara relevanta dataobjekt utan även attribut eller kolumner som inte är relevanta för frågan i fråga och gynnar små sidstorlekar.

Vetenskapliga tillämpningar

Vertikala databaser har fått förnyat intresse från vetenskapssamhället de senaste åren. Antalet samtidiga användare i vetenskapliga databasapplikationer är vanligtvis mycket mindre än i kommersiella applikationer, men användare tenderar att skicka mer komplexa, oförutsedda frågor. Dessutom måste vetenskapliga databasapplikationer vanligtvis ge ett mer automatiskt svar på komplexa frågor på grund av avsaknaden av databas- och systemstödpersonal. Vetenskapliga användare föredrar vanligtvis att arbeta med dedikerade, interna datorsystem, så vetenskapliga databasapplikationer måste vara bärbara mellan olika datormodeller. Vertikala databaser är bättre på alla dessa punkter än deras horisontella motsvarigheter.