کلان داده

برخی تحلیلگران معتقد هستند که کلان داده مانند جویندگان طلا در دهه ۱۸۴۰ است که در آن عده ای ثروت هنگفتی به دست آوردند و عده ای هم فرصت از دست دادند. برخی تحلیلگران نیز کلان داده را نفت قرن ۲۱ می دانند. در مقایسه کلان داده با نفت، همانطور که نفت مشکلاتی از قبیل جنگ و گرما به وجود آورده است، استفاده از کلان داده نیز ممکن است مشکلاتی از قبیل ریسک های امنیتی، نقض حریم شخصی و خطراتی که هنوز شناخته نشده است، را به وجود بیاورد.

کلمه “کلان داده” اولین بار توسط سیلیکون گرافیک (Silicon Graphics) در اواسط دهه ۱۹۹۰ به کار گرفته شد. در سال ۲۰۰۸ تعدادی از مجلات تکنولوژی محور از این کلمه برای اشاره به داده های حجیم –حدودا پتابایت- استفاده کردند اما در سال ۲۰۱۲ “کلان داده” رسانه ای شد. داستان های مربوط به کلان داده در رسانه های خبری، مانند “نیویورک تایمز”، “واشینگتون پست”، “اکونومیست”، “فوربز” و “مجمع جهانی اقتصاد” منتشر شد. کلمه کلان داده به طور افراطی در مورد هر موضوعی که مربوط به داده بود، حتی داده های بسیار کم، به کار گرفته می شد. به نظر می رسد با توجه به رسانه ای شدن واژه “کلان داده”، نهایتا این واژه جایگزین واژه های “هوش تجاری” و “تحلیل تجاری” در واژه نامه ها شود. از نقطه نظر افراد حرفه ای، کلان داده سه ویژگی اصلی دارد که آن را از هوش کسب و کار جدا می کند. این سه ویژگی عبارتند از: حجم، تنوع و نرخ تولید

حجم: هوش تجاری اغلب با داده های در حجم گیگابایت و ترابایت سر و کار دارد. در حالی که کلان داده، داده های در حجم پتابایت را در بر می گیرد.

نرخ تولید: انبار داده در هوش تجاری ممکن است به صورت هفتگی و با داده های مربوط  به روز رسانی شود اما در کلان داده نرخ تولید داده بسیار بالاست. به عنوان مثال، داده های تولید شده توسط   RFID (Radio Frequency Identification)، لاگ ها در سایت های تجارت الکترونیک، داده های موجود در شبکه های اجتماعی را در نظر بگیرید. سرعت تولید چنین داده بسیار بالاست. در کلان داده، نرخ تولید داده جدید و اجبار به تصمیم گیری سریع موجب توسعه تکنولوژی هایی شده است که نرخ تولید داده جدید را مدیریت کند.

تنوع: بیشتر سیستم های هوش کسب و کار، داده های سیستم های تراکنشی را تحلیل می کنند. اما از آنجاییکه انواع جدیدی از داده، دیجیتالی می شوند، کلان داده درگیر تحلیل انواع داده جدید مانند داده های متنی در توییتر، نظرات در شبکه های اجتماعی و وبلاگ ها، عکس، تصویر و ویدئو است.

تحلیلگر گارتنر، دگ لانی، اولین بار مفاهیم حجم، نرخ تولید و تنوع را در کلان داده در  دهه ۱۹۹۰ میلادی مطرح کرد. با توجه به ویژگی های کلان داده، استفاده و توسعه آن توسط شرکت های نوپا مانند یاهو، گوگل و فیس بوک دور از انتظار نیست. به تازگی، صنعت بازی و تجارت الکترونیک نیز به جمع استفاده کنندگان از کلان داده پیوسته اند. البته استفاده از کلان داده در جامعه پزشکی جهت یافتن درمان بیماری نیز متداول شده است. تروریسم نیز به تازگی از کلان داده استفاده می کند. در حادثه تروریستی دو ماراتن در بوستون آمریکا، FBI با کمک کلان داده توانست مجرمین را در بین میلیون ها عکس شناسایی کند.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.