أي أنها كمية هائلة من البيانات المعقدة التي تحقق مستويات عالية في التوزيع، ومصادر بيانية تتسم بضخامة كميتها، وسرعتها الفائقة وشدة تنوعها، والتي يفوق حجمها قدرة البرمجيات والآليات الحاسوبية التقليدية على خزنها، ومعالجتها، وتوزيعها، وكثيرا ما تتاح في وقتها، وتتطلب أشكالا من حيث التكلفة إذا فهمت بشكل أعمق، واستخدمت على نحو أفضل في عملية اتخاذ القرارات.