در پایان نامه کامپیوتر می خوانیم که دادههای بزرگ یا "کلاندادهها" (Big data) به مجموعه ای بسیار بزرگ، پیچیده و در حال رشد از دادهها اطلاق میشود که دارای منابع متعدد و خودکار هستند. این دادهها به قدری بزرگ هستند که با ابزارهای سنتی، تکنیک ها و ابزارهای معمول داده کاوی درپایان نامه کامپیوتر قابل تحلیل و داده کاوی نیستند. برداشت و گردآوری، تحلیل، ذخیره و پردازش این نوع داده ها نیز چالشی بزرگ محسوب میشود. بر اساس این پایان نامه، تحلیل و دادهکاوی کلاندادهها، افق وسیعی را در جهت ارتقاء دانش، بهبود خدمات سلامت، رشد اقتصادی و ارائه خدمات بهتر اجتماعی فراهم مینماید.
در پایان نامه کامپیوتر با موضوع تحلیل دادههای بزرگ گفته میشود امروزه، تولید داده در مقیاس Zettabyte است که هر سال ۴۰٪ نیز به میزان آن اضافه می گردد. در خصوص مدیریت دادههای بزرگ در این پایاننامه چالش های متعددی مطرح است که از جمله مهمترین آن ها میتوان به حجم داده، نرخ تولید، تنوع، صحت، اعتبار، نوسان، نمایش و ارزش اشاره نمود. استخراج اطلاعات بهینه و مورد استفاده از مجموعه های کلاندادهها با بهره گیری از روش های سنتی به سختی امکان پذیر و یا غیر ممکن است. بنابراین در پایان نامه کامپیوترگفته میشود که ارائه الگوریتم و ابزارهای توانا به منظور تحلیل این نوع دادهها، بسیار حائز اهمیت است. اگرچه کلاندادهها حاوی دادههای بسیار زیادی هستند، اما همه آن ها مفید نیستند. بیشتر این دادهها ممکن است مبهم و یا غیر نرمال باشند. همچنین روشهای تحلیل کلاندادهها در این پایان نامه، به دلیل چالشهای آنالیز دادههای بزرگ از جمله عدم تجانس و کمال، مقیاس، تحلیل به موقع، حریم خصوصی، تعامل انسانی و کلاندادههای پنهان، نسبت به داده های معمولی متفاوت است.