Veľké dáta sú oblasťou, ktorá spracováva spôsoby analýzy, systematického získavania informácií z iných súborov údajov alebo iným spôsobom s nimi súvisiacimi, ktoré sú príliš veľké alebo zložité na to, aby ich bolo možné riešiť pomocou tradičného softvéru na spracovanie údajov. Údaje ponúkajú väčšiu štatistickú silu, zatiaľ čo údaje s väčšou zložitosťou (viac atribútov alebo stĺpcov) môžu viesť k vyššej miere chybného zisťovania. Medzi veľké dátové výzvy patrí zachytávanie údajov, ukladanie údajov, analýza údajov, vyhľadávanie, zdieľanie, prenos, vizualizácia, dopytovanie, aktualizácia, ochrana osobných údajov a zdroj údajov. Veľké údaje boli pôvodne spojené s tromi kľúčovými pojmami: objem, rozmanitosť a rýchlosť. Keď spracúvame veľké údaje, nemusíme vzorkovať, ale jednoducho sledujeme, čo sa stane. Preto veľké dáta často zahŕňajú údaje s veľkosťami, ktoré presahujú kapacitu tradičného softvéru na spracovanie v prijateľnom čase a hodnote.