از کدام نمودار جهت نمایش داده استفاده کنیم؟ (۲)

نمودار ترکیبی

این دسته از نمودارها سهم اجزای مختلف از یک کل را نشان می دهند. نمودار های دایره ای، تجمعی یا انباشته … در این دسته قرار می گیرند.

دایره ای: نمودار دایره ای که گاها با نام نمودار کلوچه ای به آن اشاره می شود، جهت نمایش داده ها به صورت درصدی از کل، مورد استفاده قرار می گیرد. این نوع نمودار برای بررسی داده های هم جنس در یک مقطع از زمان (مثلا سهم هر مشتری از مقدار کل خرید در سال ۱۳۹۶) مناسب می‌باشد، در واقع در حالتی که ما بخواهیم سهم هر یک از موارد یا اتفاقات از یک کل را به دست آوریم، این نمودار بهترین گزینه پیش رو می‌باشد.

 

 


 

تجمعی: این نمودار نیز مشابه نمودار دایره ای جهت نمایش داده ها به صوردت درصدی از کل مورد استفاده قرار می گیرد. با این تفاوت که برخلاف نمودار دایره ای که درصد از کل را بر اساس چند بعد مقایسه می کند. به عنوان مثال در نمودار دایره ای در تصویر قبلی، درصد خرید فقط در یک فصل نمایش داده شده است اما در نمودار تجمعی که در ادامه مشاهده می کنید، در چهار فصل سال نمایش داده شده است.

 

 

 


نمودارهای پراکندگی

 این دسته از نمودارها پراکندگی داده‌ها را بر روی یک صفحه مشخص می‌کنند. پر استفاده ترین نمودار این دسته، نمودار نقاط پراکنده یا همان اسکاتر است.

نقاط پراکنده (scatter):
مودار نقاط پراکنده برای ترسیم داده های پیوسته و حتی گسسته علمی / مهندسی / ریاضی / آماری / آزمایشگاهی دقیق مناسب است، مانند ترسیم روند تغییرات آب و هوایی، یا رشد سلولی یا داده های خروجی نرم افزارهای تحلیلی و هزاران کاربرد دیگر.

در تصویر زیر نمونه ای از یک نمودار نقاط پراکنده(Scatter Diagrams) ترسیم شده است، هر نقطه از این نمودار نشان دهنده ی یک داده ی بدست آمده از یک کار آماری یا آزمایشگاهی و یا یک نقطه از یک رابطه ریاضی میباشد.

 


 

نمودارهای رابطه‌ای

 این دسته از نمودارها رابطه‌ی متغیرها را با یکدیگر نشان می‌دهند. پر استفاده ترین نمودار این دسته، نمودار حبابی است.

 

حبابی
(Bubble): با کمک این نمودار می توان میزان رشد یک آیتم در ازای تغییرات دو پارمتر استفاده نمود، فرض کنید می خواهید در یک نگاه میزان فروش خود را در ماه های یک سال و به ازای هزینه های تبلیغات مختلف ببیند. با کمک نمودار حبابی به راحتی این کار امکان پذیر است. در نمودار زیر اندازه حباب ها نشان دهنده مقدار هزینه است، محور Y مقدار فروش را نشان می دهد و محور X ماه را.

 


از کدام نمودار جهت نمایش داده استفاده کنیم؟ (۱)

داده ها با طیف متنوعی از نمودارها نشان داده می شوند، اما کدام نمودار وضعیت داده های را به بهترین نحو نمایش می دهد؟ دقت کنید که نمودارها جهت شفاف سازی اطلاعات به وجود آمدند و انتخاب اشتباه نمودار منجر به کج فهمی داده ها شده و اطلاعات درست را به تحلیلگر منتقل نمی کند و ممکن است کاربران نهایی را به اشتباه بیاندازید.

نمودارها به صورت کلی به ۴ دسته تقسیم می شوند که عبارتند از : نمودارهای مقایسه ای، نمودارهای ترکیبی، نمودارهای توزیع و نمودارهای رابطه ای. در ادامه انواع به بررسی انواع نمودارها می پردازیم.

 

 

نمودار مقایسه ای

نمودار های مقایسه ای، همانطور که از نام آنها مشخص است برای مقایسه چند قلم اطلاعاتی مورد استفاده قرار می گیرند و به سادگی کمترین و بیشترین مقدار را نمایش می دهند. با توجه به نوع اقلام اطلاعاتی و گزارش های مورد نظر می توانید از این دسته از نمودارهای استفاده کنید.

 

ستونی: در صورتی که اقلام اطلاعاتی وابسته به زمان نیستند و تعداد آنها کم است، بهترین انتخاب برای نمایش آن، نمودار ستونی است.


 

میله ای: در صورتی که اقلام اطلاعاتی وابسته به زمان نیستند و تعداد آیتم هایی که قرار است مقایسه شوند، زیاد باشد بهتر است که از نمودار میله ای استفاده کنید.


 

رادار: در صورتی که داده های شما شامل شرایط زیر می شود، وابسته به زمان است، در دوره های زمانی مختلف تکرار می شود و تعدا اقلام اطلاعاتی که قرار است با هم مقایسه شوند، اندک است، بهترین گزینه برای نمایش آن، نمودار رادار است. در نمودار زیر تعدا خرید مشتریان در فصل های مختلف مقایسه شده است.

خطی: آیا داده های شما وابسته به زمان است اما تکرار آن در دوره های زمانی مختلف اهمیتی ندارد؟ از نموار خطی استفاده کنید. نمونه آن را در ادامه می بینید.


 

چگونه هوش تجاری ایجاد ارزش می کند (۲)

هوش تجاری جهت بهبود کارایی
هوش تجاری به سازمان ها کمک می کند تا کارایی را افزایش دهند. کارایی کسب و کار توسط یک سری شاخص های مالی مانند درآمد، حاشیه سود، هزینه … اندازه گیری می شود. در بازاریابی، با شناسایی ویژگی های مشتریان بازار هدف، کارایی یک کمپینگ تبلیغاتی خاص را افزایش داد. حذف کمپینگ های غیر موثر، میلیون ها دلار را برای شرکت ذخیره می کند. شرکت ها با کمک هوش تجاری می توانند درآمد را با فروش جانبی محصولات به مشتریان فعلی افزایش دهند. کارشناسان حسابداری، می تواند با شناسایی مشتریان بدحساب، طول عمر حساب های دریافتنی را کاهش دهد. در تولید، هوش کسب و کار به تحلیل گران کمک میکند تا مشخص کنند چرا یک برنامه تولید از برنامه دیگر کاراتر است.
جهت افزایش کارایی سازمان با کمک سامانه هوش تجاری، ابتدا افراد باید به داده های موجود در سامانه دسترسی داشته باشند سپس باید به تعامل با سامانه بپردازند، داده ها را تحلیل کنند و مشخص کنند که جهت افزایش کارایی چه گام هایی باید برداشته شود. اما متاسفانه بعد از مشخص شدن، گام ها جهت افزایش کارایی، ممکن است افراد به دلایل مالی، فرهنگی و یا سیاسی، از اجرای گام های لازم خودداری نمایند. اگر که سامانه های هوش کسب و کار را جهت افزایش کارایی در شرکت خود به کار می برید، حتما انگیزه های مالی، سیاسی و یا فرهنگی افراد را هم در نظر بگیرید. شرکت هایی را دیده ام که از سامانه هوش تجاری صرفا جهت دسترسی به داده استفاده می کنند و هیچ تصمیم را بر اساس آن اتخاذ نمی کنند و نتایج سامانه هیچ تاثیری بر استراتژی های شرکت ندارد. مسلم است که چنین شرکت هایی نباید انتظار افزایش کارایی شرکت خود، پس از پیاده سازی سامانه هوش تجاری داشته باشند. دوباره تاکید می کنم که افزایش کارایی در صورتی اتفاق می افتد که اولا افراد با سامانه تعامل کنند، ثانیا یافته های به دست آمده از تعامل با سامانه را اجرایی کنند. مواظب انگیزه های افراد باشید. سیستم های هوش کسب و کار شفافیت را به ارمغان می آورد ممکن است افراد زیادی نسبت به این موضوع واکنش نشان بدهند و انگیزه های خرابکاری در آنها تقویت شود.
کلید اصلی موفقیت هوش کسب و کار مقدار اثر آن بر روی کارایی سازمان است.

هوش تجاری در بهبود فرآیند
هر کسب و کار ترکیبی از تعداد زیادی فرآیند است. افراد در هر گام هر فرآیند، می توانند از هوش تجاری جهت تصمیم گیری بهتر استفاده کنند. با کمک هوش تجاری می توان مدت زمان انجام یک فرآیند را اندازه گیری کرد و گلوگاه های فرآیند را شناسایی کرد. به عنوان مثال فرض کنید که شرکت الف شکایات مختلفی در مورد دیر رسیدن سفارشات از مشتریان دریافت کند. با کمک هوش تجاری می توان زمان ورود و خروج هر گام از فرآیند “تولید به حمل و نقل” را تحلیل کند و متوجه شود که گلوگاه سیستم کدام بخش است.

  • در یک شرکت پستی تعداد بسته های ارسالی در هر روز و هر ساعت در سامانه هوش تجاری نمایش داده می شود. کارکنان بر تعداد بسته های ارسالی در روزها و ساعت های مختلف نظارت دارند. هر گونه تغییر در این تعداد منجر به بازبینی مجدد فرآیند ارسال بسته و در نتیجه بهبود جریان کار می شود.
  • در یک شرکت فعال در حوزه نفت و گاز، اغلب جریان وجه نقد مساله ساز بود و این شرکت در دریافت به موقع بدهی های خود مشکل داشت. بررسی فرآیند تحویل گاز به مشتریان با کمک سامانه هوش تجاری نشان داد که اغلب اوقات گاز به موقع به مشتریان تحویل داده می شود اما فاکتور هزینه ها یک هفته بعد برای آنها ارسال می شود و تاخیر صدور فاکتورها دلیل اصلی تاخیر دریافت بدهی ها است.
  • هواپیمایی بویینگ از یک دشبورد تقریبا بلادرنگ جهت دنبال کردن مراحل ساخت هواپیما استفاده می کند. دشبورد اسمبل های اصلی، سفارش قطعات، وضعیت تولید قطعات اصلی و … را نشان می دهد.

چگونه هوش تجاری ایجاد ارزش می کند (۱)

امکان به کار گیری هوش تجاری در تمامی صنایع و عملیات آنها وجود دارد. تمام افراد داخل سازمان و خارج از سازمان مانند مشتریان و تامین کنندگان می توانند به سامانه هوش کسب و کار دسترسی داشته باشند. همانطور که قبلا نیز اشاره شد، هوش تجاری تنها در صورتی ایجاد ارزش می کند که به صورت موثر توسط افراد به کار گرفته شود. بین استفاده موثر هوش تجاری و کارایی سازمان همبستگی وجود دارد. اما دسترسی بهتر به داده، کارایی را افزایش نمی دهد، بلکه آنچه باعث بهبود کارای می شود، نحوه استفاده از داده توسط شرکت ها است. در این مقاله و چند مقاله آتی به بررسی نحوه ایجاد ارزش توسط هوش تجاری در واحدهای مختلف سازمان می پردازیم

هوش تجاری جهت مدیریت و کنترل
هدف اولیه هوش تجاری در ابتدای تولد آن تهیه اطلاعاتی بود که مدیران بتوانند با استفاده از آن به لحظه از اتفاقات رخ داده در سازمان مطلع شوند. قبل از هوش تجاری، مدیران تا زمان انتشار گزارشات مالی سه ماهه، هیچ اطلاعاتی از سازمان نداشتند و اصطلاحا “پرواز کور” داشتند. با کمک هوش تجاری، اطلاعات در هر زمان در دسترس است. اطلاعاتی مانند:
• مقدار فروش در مناطق مختلف به تفکیک محصولات
• مقدار هزینه در مقایسه با بودجه
• موجودی انبار برای مواد خام یا محصولات
• مقدار فروش در مقابل فروش پیش بینی شده
در صورتی که هر یک از مقادیر بالا، خارج از محدوده مورد انتظار باشد، استفاده کنندگان هوش تجاری می توانند در سامانه کند و کاو کنند و علت را ریشه یابی کنند. به عنوان مثال، فرض کنید که مقدار درآمد در سال های مختلف در سامانه هوش تجاری نمایش داده شده است. درآمد در بهمن ۹۴ بسیار کمتر از ماه های دیگر است. فرض کنید که شما قصد دارید علت فروش پایین را ریشه یابی کنید و متوجه شوید که کدام فروشنده، فروش کمتری داشته است. می توانید بر روی نمودار کلیک کنید و مقدار فروش بهمن را به تفکیک فروشندگان ببینید. فرض کنید که فروشنده ای که کمترین فروش را داشته، پیدا کردید و می خواهید بدانید که کمترین فروش به ازا کدام محصول و در کدام منطقه صورت گرفته است. مجددا با کلیک بر روی فروشنده، می توانید مقدار فروش به ازا هر منطقه یا محصول را ببینید.
قبل از سیستم های هوش تجاری، وقتی که مدیران، گزارشات را بر روی کاغذ یا به صورت گزارشات ثابت در سیستم های تراکنشی می دیدند و امکان تعامل با گزارشات و ریشه یابی وقایع را نداشتند. در حالی که گزارشات هوش تجاری کاملا پویا و تعاملی است و کاربران می توانند بر روی هر قسمت گزارش کلیک کنند و اطلاعات بیشتری را دریافت کنند. به عنوان مثال، بسیاری از شرکت ها از هوش تجاری جهت کنترل مخارج استفاده می کنند تا مطمئن شوند که هزینه ها بیشتر از بودجه ای در نظر گرفته شده برای آنها، نشود. به جای انتظار تا پایان سه ماه، جهت دیدن مخارجی که سودآوری را پایین می آورد، دسترسی به موقع به داده مخارج، به مدیر اجازه می دهد تا واحد تجاری پر خرج را شناسایی کند و تصمیم های لازم جهت کنترل مخارج را اتخاذ کند.

هوشمندی موقعیت

هوشمندی موقعیت (Location intelligence) یکی از مباحث داغ در انجمن نرم افزارهای هوش تجاری است و تحلیل گران پیش بینی کرده اند که ارزش بازار تحلیل موقعیت در سال ۲۰۲۱، به بیش از ۱۶٫۳۴ میلیون دلار خواهد رسید.

موقعیت جغرافیایی قدمت طولانی در تحلیل های هوش تجاری دارد، به عنوان مثال شهر و استان مشتری در بسیاری از سیستم های اطلاعاتی ذخیره می شود  و نقشه جغرافیای نقش پررنگی در اغلب دشبوردها دارد.

با شیوع تلفن های هوشمند و انفجار سرویس های مبتنی بر موقعیت، شرکت ها به نوع جدیدی از اطلاعات در مورد مشتری دسترسی دارند، اطلاعاتی مانند اینکه مشتریان اغلب در کجاها تردد دارند، هر چند وقت یک بار به یک مرکز تجاری خاص سر می زنند، و یا اینکه برای کدام مغازه زمان بیشتری را صرف می کنند؟

این اطلاعات برای کسب کارهایی که شعب پراکنده ای دارند، مانند رستوران های زنجیره ای، نمایندگی خودروها و بیمه ها … بسیار مفید است و با کمک آن می توانند رفتار مشتریان و شعب را به خوبی تحلیل کنند.

چندی پیش آمازون با خرید هول فودز مارکت، همه را شگفت زده کرد. هول فودز مارکت یک فروشگاه زنجیره ای مواد غذایی است که بر محصولات طبیعی و ارگانیک تمرکزد دارد. متخصصان موقعیت جغرافیایی، معتقد بودند که هر چند این فروشگاه عایدی چندانی از محل خرده فروشی مواد غذایی نصیب آمازون نمی کند، اما اطلاعات ارزشمندی در مورد عادات مصرف کنندگان محلی و تراکم جمعیت در اختیار آمازون قرار میداد.

موقعیت مشتریان با داده های دیگر مشتریان مانند اطلاعات پروفایل، رفتار و سابقه خرید ترکیب می شود و روندهای مشتریان را آشکار می کند. به عنوان مثال آیا مشتری بعد از اینکه روی آفر آنلاین کلیک کرد به یکی از شعب هم سر می زند؟ مشتریان چه مدت در شعب توقف میکنند؟ کدام آفر موجب مراجعه سریع تر مشتریان به شعب می شود؟…

سرریز اطلاعاتی یکی از چالش های پیش روی کسب و کارها است. مصرف کنندگان روزانه ده ها و یا صدها پیام تبلیغاتی مشاهده می کنند و به صورت ناخودآگاه بسیاری از تبلیغات را فیلتر می کنند. هوش موقعیت، امکان تبلیغ با توجه به موقعیت را فراهم می کند. به عنوان مثال در صورتی که مشتری در مکان خاصی بود، آفرهای خاصی برای او نمایش داده شود.

هوش موقعیت

مجازی سازی داده و انتقال داده

 

مجازی سازی داده (Data virtualization): در مجازی سازی، داده ها از منابع مختلف و فرمت های مختلف با هم ترکیب می شوند تا یک لایه مجازی را برای افراد و برنامه های مختلف ایجاد کنند. در مجازی سازی داده، نیازی به طی کردن فرآیند ساخت انبارداده و عملیات ای تی ال نیست و افراد درگیر جزئیات فنی در خصوص داده (مانند فرمت داده یا محل ذحیره سازی آن) نمی شوند. در مجازی سازی داده های غیر ساخت یافته مثل وب یا متن هم وجود دارد.

انتقال داده (Data movement): در انتقال، داده ها از منابع مختلف استخراج می شود و با کمک فرآیند ای تی ال (ETL) به یک انبار داده منتقل می شود. وجود انبار داده و انجام فرایند ای تی ال در انتقال داده ضروری است. در انتقال داده، داده های غیر ساخت یافته مانند متن یا وب وجود ندارد.

چه زمان هایی از مجازی سازی داده استفاده کنیم و چه زمانی از انتقال داده؟

زمانی که دیتاست های مختلف با هم جوین (Join) می شوند و سرعت و کارایی باید بسیار بالا باشد، از انتقال استفاده می کنیم.

زمانی که داده ها فقط یک بار در بازه های مختلف به انبار داده منتقل می شوند و بارها از آنها گزارش تهیه می شود، از انتقال استفاده می کنیم.

و در مورد تعداد زیادی کوئری موردی، بدون اجبار به سرعت بالا، از مجازی سازی داده استفاده می کنیم.

 

مجازی سازی داده چه مزایا و چه معایبی دارد؟

در مجازی سازی، عملیات ای تی ال انجام نمی شود بنابراین سربار جابجایی داده ها به شدت کاهش پیدا می کند. سرعت دسترسی به داده ها، به صورت بلادرنگ به طرز چشمگیری افزایش پیدا می کند (البته با این فرض که جوین (Join) های سنگینی بین جداول وجود نداشته باشد.). زمان توسعه و پیشتیبانی کاهش پیدا می کند. و فضایی جهت انبارداده لازم نیست.

از طرف دیگر به علت عدم استفاده از انبار داده، سوابق داده ها را به خوبی نگهداری نمی کند. یک مدل داده همگن را بکارنمیگیرد. بنابراین باید خود کاربر داده ها را تفسیر کند، مگر اینکه با مدل های دیگری ترکیب شده باشد. مدیریت تغییرات سربار بسیار زیادی دارد. زیرا هر تغییر باید توسط تمام برنامه های کاربردی و کاربرانی که داده با آنها به اشتراک گذاشته شده است مورد پذیرش قرار گیرد.

 

 

 

 

هوش تجاری و کسب و کارهای کوچک

در اوایل زندگی هوش تجاری، بسیاری از تحلیل گران معتقد بودند که هوش تجاری صرفا برای سازمان های بزرگ است. اما الان تحلیل ها تغییر کرده است و بسیاری از تحلیلگران معتقدند که تمام شرکت ها در تمامی سایزها به هوش تجاری نیاز دارند. هوش تجاری امکانات و ابزارهای مختلفی در اختیار کاربران اش قرار می دهد و سوالی که در اینجا مطرح می شود این است که کدام ابزار هوش تجاری برای کسب و کارهای کوچک مناسب است؟
برای پیدا کردن پاسخ این سوال، سایت های مختلفی را در اینترنت جستجو کردم. از فروشندگان ابزار هوش تجاری و دلایل آنها در پیشنهاد هوش تجاری به کسب و کارهای کوچک تا کسب و کارهای کوچک و تجربه آنها در استفاده از هوش تجاری.تقریبا تمام آنها بر روی سه ابزار زیر توافق داشتند.

دشبورد
منابع مالی، زمانی و نیروی انسانی در کسب و کارهای کوچک محدود است و متخصیص لاکچری مثل تحلیلگر داده در کسب و کارهای کوچک وجود ندارد. افراد اغلب چندین کار و تخصص را با هم انجام می دهند و زمان و انرژی زیادی را صرف یافتن داده و تحلیل آنها می کنند. دشبوردها دید سریع و ساده ای از شاخص های اصلی کسب و کار فراهم می کند و کارکنان شرکت های کوچک می توانند در کمترین زمان، بیشترین حجم داده مربوط به کسب و کار را دریافت کنند.

شاخص کلیدی عملکرد
دشبورد مهم است اما تمام ماجرا نیست. برای اینکه دشبورد مفید و قابل استفاده باشد، باید شاخص های درستی در آن قرار داشته باشد. شاخص ها با توجه به کسب و کار تعریف می شود و نشان دهنده مهم ترین معیارهای ارزیابی کسب و کار است. فرقی نمی کند که کسب و کار کوچک هستید یا سازمان بزرگ، در هر دو صورت باید هدف و چشم انداز داشته باشید و شاخص هایی برای پیگیری رسیدن به اهداف سازمان یا شرکت را تعریف کنید.

گزارش ساز
پیش از ظهور هوش تجاری، مدیران شرکت و سازمان به علت فقدان وجود دانش فنی لازم، جهت بررسی هر گزارش از وضعیت سازمان، باید درخواست تهیه گزارش را به واحد آی تی ارائه می دادند و نتیجه را از واحد آی تی دریافت می کردند. با ظهور هوش تجاری، یک لایه مفهومی بر روی پایگاه داده سازمان قرار گرفت و مدیران می توانستند با مراجعه به سامانه هوش تجاری، گزارشات خود را تهیه کنند. دقت کنید این قسمت از سامانه هوش تجاری که اصطلاحا گزارش ساز نامیده می شود، برخلاف واحد آی تی ۲۴ ساعت شبانه روز و ۷ روز هفته در دسترس است.
کسب و کار شما از کدام ابزار هوش تجاری استفاده می کند؟

کلان داده

برخی تحلیلگران معتقد هستند که کلان داده مانند جویندگان طلا در دهه ۱۸۴۰ است که در آن عده ای ثروت هنگفتی به دست آوردند و عده ای هم فرصت از دست دادند. برخی تحلیلگران نیز کلان داده را نفت قرن ۲۱ می دانند. در مقایسه کلان داده با نفت، همانطور که نفت مشکلاتی از قبیل جنگ و گرما به وجود آورده است، استفاده از کلان داده نیز ممکن است مشکلاتی از قبیل ریسک های امنیتی، نقض حریم شخصی و خطراتی که هنوز شناخته نشده است، را به وجود بیاورد.

کلمه “کلان داده” اولین بار توسط سیلیکون گرافیک (Silicon Graphics) در اواسط دهه ۱۹۹۰ به کار گرفته شد. در سال ۲۰۰۸ تعدادی از مجلات تکنولوژی محور از این کلمه برای اشاره به داده های حجیم –حدودا پتابایت- استفاده کردند اما در سال ۲۰۱۲ “کلان داده” رسانه ای شد. داستان های مربوط به کلان داده در رسانه های خبری، مانند “نیویورک تایمز”، “واشینگتون پست”، “اکونومیست”، “فوربز” و “مجمع جهانی اقتصاد” منتشر شد. کلمه کلان داده به طور افراطی در مورد هر موضوعی که مربوط به داده بود، حتی داده های بسیار کم، به کار گرفته می شد. به نظر می رسد با توجه به رسانه ای شدن واژه “کلان داده”، نهایتا این واژه جایگزین واژه های “هوش تجاری” و “تحلیل تجاری” در واژه نامه ها شود. از نقطه نظر افراد حرفه ای، کلان داده سه ویژگی اصلی دارد که آن را از هوش کسب و کار جدا می کند. این سه ویژگی عبارتند از: حجم، تنوع و نرخ تولید

حجم: هوش تجاری اغلب با داده های در حجم گیگابایت و ترابایت سر و کار دارد. در حالی که کلان داده، داده های در حجم پتابایت را در بر می گیرد.

نرخ تولید: انبار داده در هوش تجاری ممکن است به صورت هفتگی و با داده های مربوط  به روز رسانی شود اما در کلان داده نرخ تولید داده بسیار بالاست. به عنوان مثال، داده های تولید شده توسط   RFID (Radio Frequency Identification)، لاگ ها در سایت های تجارت الکترونیک، داده های موجود در شبکه های اجتماعی را در نظر بگیرید. سرعت تولید چنین داده بسیار بالاست. در کلان داده، نرخ تولید داده جدید و اجبار به تصمیم گیری سریع موجب توسعه تکنولوژی هایی شده است که نرخ تولید داده جدید را مدیریت کند.

تنوع: بیشتر سیستم های هوش کسب و کار، داده های سیستم های تراکنشی را تحلیل می کنند. اما از آنجاییکه انواع جدیدی از داده، دیجیتالی می شوند، کلان داده درگیر تحلیل انواع داده جدید مانند داده های متنی در توییتر، نظرات در شبکه های اجتماعی و وبلاگ ها، عکس، تصویر و ویدئو است.

تحلیلگر گارتنر، دگ لانی، اولین بار مفاهیم حجم، نرخ تولید و تنوع را در کلان داده در  دهه ۱۹۹۰ میلادی مطرح کرد. با توجه به ویژگی های کلان داده، استفاده و توسعه آن توسط شرکت های نوپا مانند یاهو، گوگل و فیس بوک دور از انتظار نیست. به تازگی، صنعت بازی و تجارت الکترونیک نیز به جمع استفاده کنندگان از کلان داده پیوسته اند. البته استفاده از کلان داده در جامعه پزشکی جهت یافتن درمان بیماری نیز متداول شده است. تروریسم نیز به تازگی از کلان داده استفاده می کند. در حادثه تروریستی دو ماراتن در بوستون آمریکا، FBI با کمک کلان داده توانست مجرمین را در بین میلیون ها عکس شناسایی کند.

 

متن کاوی

متن کاوی یک فرآیند نیمه خودکار برای استخراج الگو از حجم وسیعی از منابع داده غیر ساخت یافته مانند صفحات وب، صفحات متنی، شبکه های اجتماعی مانند توییتر … می باشد.

 

 

 

متن کاوی با داده کاوی متفاوت است. هر چند هدف هر دو یکی است. هر دو به دنبال شناسایی یک سری الگو های مفید در مجموعه ای از داده هستند. اما مجموعه داده ای در مورد هر دو متفاوت است. داده کاوی به شناسایی الگوها در منابع داده ای ساخت یافته و ذخیره شده در پایگاه داده های ساخت یافته مانند اس کیو ال سرور، اوراکل … می پردازد در حالی که متن کاوی با داده های غیر ساخت یافته مانند مستندات تهیه شده توسط نرم افزار ورد (Word)، فایل های پی دی اف، متن موجود در صفحات وب یا شبکه های اجتماعی سر و کار دارد.

متن کاوی در حوزه های مانند حوزه های قانونی (احکام دادگاه)، تحقیقات آکادمی (مقالات تحقیقق)، گزارش های مالی، پزشکی (گزارش ترخیص)، تکنولوژی (فایل های حق ثبت اختراع) و بازاریابی (توضیحات مشتریان) … کاربرد دارد.

از متن کاوی می توان در دسته بندی و فیلتر کردن ایمیل ها استفاده کرد. می توان ایمیل ها را بر اساس اهمیت آنها به صورت خودکار اولویت بندی کرد و به صورت خودکار به آنها پاسخ داد.

برخی از مهم ترین حوزه های متن کاوی عبارتند از:

  • خلاصه سازی: خلاصه سازی مستندات به منظور صرفه جویی در زمان.
  • طبقه بندی: تشخیص موضوع اصلی مستندات و طبقه بندی خودکار آنها در گروه هایی که پیش تر تعریف شده اند.
  • خوشه بندی: تشخیص موضوع اصلی مستندات و طبقه بندی خودکار آنها صرفا با توجه به شباهت آنها و نه بر اساس گروه هایی که قبلا تعریف شده اند.
  • پاسخ به سوالات: یافتن بهترین جواب برای سوالات مطرح شده.
  • استخراج اطالات: شناسایی کلمات کلیدی، و رابط بین متون از طریق جستجو برای دنباله های از پیش تعریف شده در متن

 

 

ابزارهای سمت کاربر در هوش تجاری

اگر که معماری هوش تجاری را به عنوان موتور یک خودرو در نظر بگیریم، ابزارهای سمت کاربر به عنوان بدنه خودرو در نظر گرفته می‌شود و  نقش مهمی در موفقیت هوش تجاری دارد. توجه داشته باشید که با تعریف هوش تجاری به عنوان مجموعه ای از تکنولوژی ها و فرآیندهایی که امکان دسترسی، تعامل و تحلیل داده را برای  تمام افراد در تمام سطوح سازمان را فراهم می‌کند، هر ابزار سمت کاربری که امکان دسترسی، تعامل و تحلیل داده را فراهم کند، به عنوان زیرمجموعه ای از ابزارهای هوش تجاری در نظر گرفته می شود. ابزارهای سمت کاربر در هوش تجاری در گروه های مختلفی دسته بندی می شوند که عبارتند از:

  • ابزار پرس‌و‌جو و گزارش از کسب و کار: با کمک این دسته از ابزارها، کارکنان واحد کسب و کار شخصا گزارش‌های مورد نیاز خود را می سازند و نیازی به مراجعه به واحد آی تی ندارند. برای استفاده از این ابزارها ابتدا تیم آی‌تی و تیم کسب و کار با همکاری هم یک لایه متادیتا و قابل فهم بر روی داده‌های ایجاد می کنند و پس از آن تیم کسب و کار گزارش‌های مورد نیاز خود را با کمک آن لایه متادیتا تهیه میکند. از جمله مهم ترین ابزارهای این حوزه می‌توان به ابزارهای زیر اشاره کرد:

SAP BusinessObjects Web intelligence

IBM Cognos WorkSpace

MicroStrategy Web

 

در تصویر زیر نمونه ای از ابزار پرس‌و‌جو و گزارش از کسب و کار را مشاهده می کنید.

 

 

  • کشف بصری داده: این دسته از ابزارها، امکاناتی چون محاسبه در حافظه و بصری سازی را فراهمی می‌کنند و از این طریق امکان کندوکاو و مرور داده‌ها را تسهیل می کنند. چه فرقی با دسته قبلی دارد؟ به دو تفاوت اصلی می توان اشاره کرد. اول این که ابزار پرس‌و‌جو و گزارش از کسب و کار با یک لایه مفهومی و متادیتا کار می‌کرد اما ابزار کشف بصری داده مستقیما با خود داده کار میکند. و دوم این که تمرکز اصلی ابزار کشف بصری داده بر روی بصری سازی و سرعت گزارش‌ها است در حالی که دسته قبلی تمرکز بر روی استقلال تیم کسب و کار از تیم آی تی داشت. از معروف ترین ابزارهای این دسته می‌توان به موارد زیر اشاره کرد:

Tableau

SAS Visual Analytics Explorer

MicroStratgy Visual Insight

SAP Lumira

در تصویر زیر نمونه ای از ابزار کشف بصری داده را مشاهده می کنید.

  • دشبورد: استفان فیو، نویسنده چندین کتاب در زمینه دشبورد و مدیر شرکت “لبه مفهومی” دشبورد را اینگونه تعریف می کند: دشبورد نمایش بصری مهم ترین اطلاعاتی است که شما برای رسیدن به یک یا چند هدف به آن نیاز دارید. این اطلاعات در یک صفحه قرار دارند و می توان با یک چشم بهم زدن، آن را نظاره کرد. در تصویر زیر نمونه ای از دشبورد را مشاهده می کنید.

  • اسکورکارت: اسکورکارت و دشبورد اغلب با هم اشتباه گرفته می‌شوند در حالی که دو موضوع متفاوت هستند. تفاوت اصلی آنها این است که اسکورکارت یک تعداد شاخص را با توجه به مقدار هدف نشان می دهد. در تصویر زیر نمونه ای از اسکورکارت را مشاهده می کنید.