A nagy szervezetek minden nap frissítik azokat a technológiákat, amelyek megkönnyítik és jobban megfelelnek az egyes vállalatoknak, és olyan nagy kihívásokkal néznek szembe, amelyek lehetővé teszik számukra, hogy a napi rendszerességű eszközökön túl is felfedezzék és elemezzék őket. az úgynevezett Big Data vagy hatalmas adat spanyolul, amelyek nagyméretű adattároló rendszerek.
Ezt a tárolási jelenséget az új információs és kommunikációs technológiák keretezik. A Big Data az, ami az összes olyan tevékenységet lefoglalja, amely a nagy adatkészletet tároló rendszerekhez kapcsolódik. Az egyik fő jellemző, hogy nagy mennyiségű információt manipulál, gyűjt, osztályoz, majd tárol. A gyűjtemény célja statisztikai jelentések készítése a szervezetek felhasználására, akár üzleti tervek elemzéséül, reklámozásként, kémkedésként.
A tárolási margó az évek során nőtt, 2008 óta a tárolási szintet petabájt és zettabájt adat között mérték. A szakértők rendszeresen új tárolási intézkedéseket keresnek, mert vannak olyan területek, ahol nagy mennyiségű adatot kell tárolni, és a meglévő programok nem túl optimálisak.
Ezer eszköz létezik a Big Data végrehajtására és kezelésére, azonban nem mindegyik egyforma, háromféle adat létezik:
- Strukturált adatok: azok, amelyeknél az adatok nagyon sajátos felépítésűek, például dátumok, számok. Példa ezekre a táblázatok.
- Strukturálatlan adatok: általában olyan adatok vannak, amelyeknek van egy meghatározott formátumuk, és nem tárolhatók táblázatban, még kevésbé manipulálják az információkat, példaként szolgálnak a PDF dokumentumokra.
- Félig strukturált adatok: ennek az adattípusnak nincs sajátos formátuma, mivel saját félig strukturált metaadatai vannak, erre példa a HTML kódok.