سلسله مراتب جغرافیایی

 

در مقاله سلسله مراتب در هوش تجاری به تعریف سلسله مراتب پرداختیم و گفتیم که سلسله مراتب یکی از راه‌های دسته بندی و پیماش داده است و اغلب برای داده‌هایی که ذات سلسله مراتبی دارند مانند سلسله مراتب اداری (مدیرعامل/مدیر میانی/کارمند)، تاریخ (سال/فصل/ماه/روز)، جغرافیا (کشور/استان/شهر) … مورد استفاده قرار می‌گیرد.

در این مقاله قصد دارم سلسله مراتب جغرافیایی ایران را بررسی کنم. برای این کار در ابتدا باید تقسیمات کشوری ایران را پیدا می‌کردم. طیق تعریف ویکی پدیا، کشور ایران به چندین استان و هر استان به چند شهرستان و هر شهرستان به تعدادی بخش و هر بخش به چند دهستان و هر دهستان به تعدادی آبادی تقسیم می‌شود. بنابراین تصویر شماتیک سلسله مراتب جغرافیایی ایران به شکل زیر خواهد بود.

 

 

قصد دارم که در نهایت به ساختار سلسه مراتبی به صورت زیر برسم که در آن با کلیک بر روی علامت + کنار هر منطقه جغرافیایی، زیر مجموعه‌های آن را مشاهده کنم. به عنوان مثال در فایل زیر، بر روی استان تهران کلیک کردم. شهرستان‌ها، بخش‌ها، دهستان‌ها و آبادی‌های این استان نمایش داده شد.

 

 


این ساختار سلسله مراتبی می‌تواند به داده‌های فروش، تعداد پرسنل، میزان تولید …. وصل شود. مثلا تعداد کل فروش در هر استان در مقابل آن نمایش داده شود، سپس با کلیک بر روی علامت + کنار نام هر استان، مقدار فروش در هر شهرستان آن استان نمایش داده شود و الی آخر.

برای تهیه سلسله مراتب جغرافیایی ایران باید لیست استان، شهرستان، بخش، دهستان و آبادی ایران را پیدا می‌کردم. بنابراین دست به دامن گوگل شدم و از سایت آمار ایران اکسل فایل تقسیمات کشوری ایران برای سال ۹۶ را پیدا کردم. فایل مشابه تصویر زیر بود. این فایل را از اینجا هم ‌می‌توانید دانلود کنید.


نام تقسیمات کشوری استان، شهرستان، بخش، دهستان، آبادی را تصویر فوق مشاهده می‌کنید. برای هر تقسیم کشوری دو ستون تخصیص یافته است یکی برای نام و دیگری کد مربوط به آن.

شهر (در اکسل فوق با نام City) در تقسیمات اصلی کشور وجود ندارد و همانطور که در تصویر می‌بینید اکثر سلول‌های مربوط به City خالی است. آنچه که ما به نام شهر می‌شناسیم در تقسیمات کشوری به نام شهرستان شناخته شده است. بنابراین من دو ستون City و City_Name را پاک کردم.

دو ستون آخر هم برای ساخت سلسله مراتب مورد استفاده قرار نمیگیرد، بنابراین آنها را هم پاک کردم.

 


 

اگر که به داده‌ها دقت کنید، تعدادی سلول خالی مشاهده می‌کنید. این سلول‌ها لازم نیستند و بهتر است که داده‌ها پاکسازی شده و سلول‌های خالی حذف شوند. جهت حذف این سلول‌ها از پاور کوئری استفاده کردم. برای انجام این کار، مراحل زیر را طی کردم: 

۱- تمام داده ها را انتخاب کرده و از تب Insert گزینه Table را انتخاب کردم.

۲- همانطور که داده‌ها در حالت انتخاب بودند، از تب Data گزینه From Table را انتخاب کردم تا داده‌ها به فضای پاور کوئری اضافه شود.

۳- در فضای پاور کوئری بر روی زبانه کوچک کنار ستون Abadi_Name کلیک کرده و تیک کنار Null را برداشتم. با این کار تمام سطرهای حاوی مقدار Null حذف می‌شوند. در نهایت Load and Close را کلیک کردم تا به فضای اکسل بر گردم.

 

 

 

بعد از پاکسازی داده‌ها، باید سلسله مراتب یا Hierarchy ساخته شود. سلسله مراتب یا Hierarchy همان چیزی است که باعث می‌شود تا این داده‌های تخت یا Flat در سطوح مختلف یا سلسله مراتب مختلف مانند تصویر ابتدای مقاله نمایش داده شوند. برای ساخت سلسله مراتب یا Hierarchy مراحل زیر را انجام دادم. 

۱- ابتدا داده‌ها را انتخاب کرده و سپس از تب Power Pivot گزینه Add to Data Model را انتخاب کردم.

۲- سپس نحوه نمایش را به Diagram View تغییر دادم.

۳- بر روی علامت گوشه بالا سمت راست جدول کلیک کرده و نام Hierarchy  را به GEO تغییر دادم و سپس به ترتیب نام ستون‌های Ostan_Name, Shahrestan_Name, Bakhsh_Name, Dehestan_Name, Abadi_Name را درگ کرده و بر روی نام Geo  رها  کردم. سلسله مراتب ساخته شد.

۴- بر روی Pivot Table کلیک کردم.

۵- گزینه GEO را در Pivot Table Field تیک زدم تا سلسله مراتب استان، شهرستان، بخش، دهستان و آبادی نمایش داده شود.

 

 

 

فایل اکسل نهایی را می‌توانید از اینجا دانلود کنید.

سلسه مراتب در هوش تجاری

سلسه مراتب در فضای هوش تجاری یک روش دسته بندی اطلاعات است که در بسیاری از گزارش‌ها مورد استفاده قرار می‌گیرد. به عنوان مثال اطلاعات مربوط به مدیر کل، مدیر میانی و کارمند یک ساختار سلسه مراتبی دارد. مدیرکل در بالاترین سطح قرار دارد، سپس مدیر میانی قرار دارد و در نهایت کارمند. ساختار سلسه مراتبی مدیر کل/ مدیر میانی/ مدیر مشابه تصویر زیر است.

جهت پیاده سازی این ساختار در جدول (اس کیو ال یا اکسل) باید یک جدول با حداقل دو ستون تعریف کنیم. در یک ستون مشخص کنیم که عنوان هر سطح چیست و در ستون دوم مشخص کنیم که والد هر سطح کدام است. سلسه مراتب فوق در اکسل به صورت زیر تعریف می‌شود.

ستون اول آی‌دی هر یک از پرسنل را مشخص می‌کند. ستون دوم عنوان یا سمت هر یک از پرسنل را مشخص می‌کند و ستون سوم والد یا سطح بالاتر هر یک از پرسنل را در ساختار سلسه مراتبی مشخص می‌کند. همانطور که در تصویر مشخص است، مدیر کل در سطح اول قرار دارد و با آی‌دی ۱ مشخص شده است. اما چون سطحی بالاتر از مدیرعامل وجود ندارد، ستون والد آن خالی است.

در سطح دوم، مدیر فروش مستقیم، مدیر فروش اینترنتی و مدیر فروش تلفنی قرار دارند که به ترتیب با آی‌دی های ۲، ۵ و ۷ مشخص شده‌اند. از آنجاییکه سطح بالا این سه مدیر یا اصطلاحا والد آنها مدیرعامل است، ستون Parent آنها با عبارت مدیرعامل مشخص شده است.

به همین ترتیب والد یا سطح بالاتر کارمندان فروش نیز مشخص می‌شود.

تا الان فهمیدم که یک ساختار سلسه مراتبی چگونه تعریف می‌شود و چگونه جدول آن ساخته می‌شود. با ساختن صرفا جدول، نمی توانیم از سلسه مراتب در گزارش‌ها استفاده کنیم، بلکه باید سلسله مراتب (Hierarchy) را در مدل داده‌ای نیز تعریف کنیم. چگونه این کار را انجام می‌دهیم؟ در ادامه مقاله بررسی می‌کنیم.

فرض کنید که جدول فروش به صورت زیر داریم


این جدول داری سه ستون است. ستون اول با نام ID، آی‌دی هر سطر را مشخص می‌کند. ستون دوم با نام PersonnelID به آی‌دی پرسنلی اشاره می‌کند و ستون سوم با نام Sale Value مقدار فروش را مشخص می‌کند. به عنوان مثال سطر اول مشخص می‌کند که آی‌دی پرسنلی ۳ ( کارمند فروش مستقیم ۱) مقدار ۵۰۰ واحد فروش داشته است.

 

 

 

می خواهیم با کمک ساختار سلسه مراتب مدیر و کارمند فروش، گزارشی مشابه گزارش زیر تهیه کنیم.


در گزارش فوق مقدار فروش کل تمام زیر مجموعه‌های هر مدیر مشخص است. گذشته از آن اگر بر روی علامت + کنار نام مدیر فروش تلفنی کلیک کنید، مقدار فروش به تفکیک هر کدام از کارمندان زیرمجموعه نمایش داده می‌شود.


برای ساخت چنین گزارشی باید سلسله مراتب (Hierarchy) تعریف شود.

برای ساخت سلسه مراتب (Hierarchy) ابتدا مطابق آموزش مقاله، به تب Power Pivot بروید و گزینه Add to DataModel را کلیک کنید. این کار را برای هر دو جدول Sale و Personnel انجام دهید. سپس حالت نمایش را به حالت Diagram View تغییر دهید. طبق مقاله ارتباط بین دو جدول را برقرار کنید. برای این کار کافی است تا بر روی نام PesoonelId در جدول Sale کلیک کنید و آن را به سمت ستون ID در جدول Personnel کشیده و رها کنید. در این صورت ارتباط بین دو جدول برقرار می‌شود.

در مرحله بعد بر روی علامت مشخص شده در تصویر زیر کلیک کنید و گزینه Create Hierarchy را کلیک کنید.

یک سلسله مراتب جدید با نام Hierarchy1 ساخته می‌‌شود. به ترتیب ابتدا ستون Parent را انتخاب کنید و به سمت Hierarchy1 کشیده و رها کنید. سپس ستون Title را انتخاب کنید و به سمت Hierarchy1 کشیده و رها کنید.

نهایتا سلسله مراتب شما ساخته شد.

بر روی گزینه Pivot Table کلیک کنید تا داده ها را به شکل زیر مشاهده کنید.

بر روی Hierarchy1 و Sale Value کلیک کنید تا گزارشی مشابه تصویر زیر ببینید.

این گزارش مقدار فروش کل هر مدیر را نمایش میدهد. اگر بخواهید مقدار فروش رده‌های پایین‌تر در سلسله مراتب را ببینید، کافی است بر روی علامت + کنار نام هر مدیر کلیک کنید و مقدر فروش رده‌های پایین تر در سلسه مراتب را مشاهده کنید.

فایل را می‌توانید از اینجا دانلود کنید.

 

 

 

مدل داده‌ای در اکسل

در مقاله قبلی داده‌های فروش شرکت را با کمک ابزار پاور کوئری پاکسازی کردیم. در این مقاله قصد داریم که به مدل سازی داده‌های فروش با کمک ابزار پاور پیوت بپردازیم.

فرض کنید که مدیریت گزارش مقدار فروش پرسنل بر اساس جنسیت را بخواهد. شما داده‌های فروش را از واحد فروش تهیه کردید و طبق مقاله آن را پاکسازی کردید. داده‌های مربوط به پرسنل را هم از واحد منابع انسانی تهیه کردید و خدا را شکر داده‌های تمیزی بود و احتیاج به پاکسازی نداشت. حالا قصد دارید که مقدار فروش را بر اساس جنسیت پرسنل مشخص کنید. جهت انجام این کار ابتدا باید مدل داده‌ای را تهیه کنید.

مدل داده‌ای در اکسل چیست؟

با کمک مفهوم مدل داده‌ای و ابزار پاور پیوت، می‌توان هر کدام از شیت‌های اکسل را به حافظه اکسل بارگزاری کرد و سپس با یک درگ اند دراپ ساده، بین ستون‌های مشترک ارتباط برقرار کرد. قبل از تولد ابزار پاور پیوت، اکسل کاران از فرمول جهت ارتباط بین شیت‌ها استفاده می‌کردند. گاهی این ارتباطات پیچیده بود و اکسل کاران مجبور بودند بارها از توابعی چون VlOOKUP, SUMIF, INDEX … استفاده کنند. اما با کمک این ابزار، ارتباط بین شیت‌ها به راحتی درگ اند دراپ انجام می‌شود.

برای ساخت مدل داده‌ای به هر دو داده مربوط به فروش و پرسنل احتیاج داریم. تصاویر فایل مربوط به این دو داده را در ادامه مشاهده می‌کنید.


 

 

شیت‌ها حتما باید به صورت جدول باشند. شیت فروش (Sale) به صورت جدول است. اما شیت کارمندان (Employee) به صورت جدول نیست. در اولین گام باید این شیت را به جدول تبدیل کنیم. برای تبدیل داده‌های این شیت به جدول کافی است که ابتدا تمام داده‌ها را انتخاب کنیم و سپس از منو Insert گزینه Table را انتخاب کنیم. داده‌ها به جدول تبدیل می شوند.

 

 

در مرحله بعدی باید هر دو جدول Sale و Employee باید به دیتا مدل اضافه شوند. برای اضافه کردن این دو جدول کافی است آنها را انتخاب کنیم و سپس از منو Power Pivot گزینه Add to Data Model را انتخاب کنید. اگر که منو Power Pivot را مشاهده نمیکنید، باید طبق این مقاله آن را فعال کنید.

 

پس از اضافه کردن هر دو جدول به مدل داده‌ای در پاور پیوت، تصویری مشابه تصویر زیر را مشاهده میکنید.

  1. آیکون پاور پیوت
  2. دو جدول Sale و Employee که به فضای پاور پیوت اضافه شده است.
  3. داده‌های جدول Employee
  4. انواع روش‌های نمایش مدل داده‌ای. در حال حاضر نمایش داده‌ای در حالت Data View قرار دارد. اما در مرحله بعدی و ساخت ارتباط بین دو جدول Sale و Employee از حالت Diagram View استفاده می‌کنیم.

بر روی گزینه Diagram View که در تصویر بالا با شماره ۴ مشخص شده است کلیک ‌کنید. نحوه نمایش جداول تغییر می‌کنید و به صورت زیر نمایش داده می‌شود. جهت ارتباط بین این دو جدول کافی است که بر روی EmployeeID در جدول Sale کلیک کنید و آن را به سمت Id در جدول Employee بکشید و رها کنید. ستون EmployeeId در جدول Sale حاوی شماره پرسنلی هر کدام از پرسنل است. ستون Id در جدول Employee نیز حاوی شماره پرسنلی هر کدام از پرسنل است. بنابراین اطلاعات موجود در این دو ستون یکسان است و می‌توان این دو را به هم متصل کرد.

برای تهیه گزارش کافی است بر روی گزینه PivotTable که در تصویر زیر مشخص شده است کلیک کنید. در ابتدا از شما سوال می‌پرسد که PivotTable در یک شیت جدید ساخته شود و یا بر روی شیت جاری. گزینه شیت جدید را انتخاب کنید.



پس از انتخاب شیت جدید، صفحه‌ای مشابه تصویر زیر باز می‌شود. گزارش در قسمتی که با شماره ۱ مشخص شده است، نمایش داده می‌شود. جهت ساخت گزارش باید سطرها، ستون‌ها و مقادیر را از ستون سمت راست که با عدد ۲ مشخص شده است، انتخاب کنید.

از ستون سمت راست، و از جدول فروش مهر، گزینه Sales را انتخاب می‌کنیم. این گزینه مقدار فروش را مشخص می‌کند. سپس از جدول Table3 گزینه جنسیت را انتخاب می‌کنیم. نتیجه گزارش ساخته شده را در سمت چپ مشاهده میکنید.


فایل نهایی را از اینجا دانلود کنید.

پاکسازی داده با کمک پاور کوئری

برای این مقاله، من یک فایل اکسل آماده کردم که مقدار فروش را به ازا تاریخ های مختلف و برای فروشنده‌های مختلف محاسبه می‌کند. این فایل به گونه ای طراحی شده است که به سادگی قابل فهم توسط افراد است اما برای تحلیل مناسب نیست. در این پست بررسی می‌کنیم که چطور با کمک پاور کوئری این داده ها را برای تحلیل مرتب و پاکسازی کنیم.

مشکلات زیر در داده وجود دارد که قصد داریم آنها را مرتب کنیم

 

  1. داده ها با توجه به تاریخ دسته بندی شده اند و تاریخ مربوط به هر دسته یک بار و آن هم در ابتدای هر دسته تکرار شده است. در حالی که برای تحلیل، تاریخ در هر سطر باید مشخص باشد.
  2. فضای خالی پشت نام فروشنده وجود دارد.
  3. نام فروشنده و شماره پرسنلی فروشنده با هم ترکیب شده است. برای تحلیل بهتر است که نام فروشنده و شماره پرسنلی در دو ستون جدا باشد.
  4. سطرهای خالی در بین داده ها وجود دارد که باید حذف شوند.
  5. مقدار فروش با توجه به شهر، در چهار ستون مختلف قرار گرفته است. برای تحلیل ما نیاز داریم که مقدار فروش در یک ستون باشد و در ستون دیگر نام شهر مشخص شود.
  6. سطری به نام مجموع وجود دارد که ما به آن نیاز نداریم و باید حذف شود.

فایل به صورت زیر جهت تحلیل مناسب است. و با طی کردن مراحل زیر، نهایتا فایل اولیه ما به این شکل درخواهد آمد.


ایمپورت کردن داده

در گام اول باید داده موجود در فایل اکسل را به پاور کوئری وارد کنیم. جهت این کار ابتدا وارد تب Data شوید و سپس مراحل زیر را طی کنید.

Data --> New Query --> From File --> From WorkBook

سپس فایل اکسل را انتخاب کنید.


بعد از انتخاب فایل اکسل، با صفحه ای مشابه تصویر زیر مواجه می شوید. جهت بارگذاری داده‌ها در فایل اکسل گزینه Load را انتخاب کنید. اما از آنجاییکه ما قصد داریم قبل از بارگذاری، داده‌ها را ویرایش کنیم، گزینه Edit را انتخاب می‌کنیم و وارد ویرایشگر پاور کوئری می‌شویم.


ویرایشگر پاور کوئری

بعد از آنکه گزینه Edit را انتخاب کردید، ویرایشگر پاور کوئری مشابه تصویر زیر ظاهر می‌شود. هر تغییری که بر روی داده‌ها اعمال کنید، به صورت گام به گام بر روی ستون سمت راست که با فلش مشخص شده است، ثبت می‌شود.

در سمت چپ هر گام یک علامت ضربدر وجود دارد. با کلیک بر روی آن علامت ضربدر، آن گام حذف می‌شود.

 

جداسازی تاریخ

همانطور که در داده‌های اصلی مشاهده می‌کنید، داده‌ها بر اساس تاریخ دسته بندی شده اند. این فرمت نمایش داده، برای تحلیل مناسب نیست. برای تحلیل باید تاریخ مرتبط با هر سطر مشخص شود. برای جداسازی تاریخ و تکرار آن در هر سطر مراحل زیر را مطابق تصاویر طی کنید.

بر روی ستون کلیک راست کنید. از منو ظاهر شده گزینه Split Column را انتخاب کنید و سپس By Delimiter را انتخاب کنید.

 


تاریخ و عبارت کنار آن با علامت دو نقطه یا کولن از هم جدا شده است. در صفحه ظاهر شده گزینه کولن را انتخاب کنید.

 


 

حالا یک ستون جدید اضافه شده است که مقدار تاریخ در آن درج شده است. اما بسیاری از سطرها، مقدار null دارد. با طی کردن مراحل زیر میتوانیم سطرهای خالی را با مقدار مناسب پر کنیم.

 


جدا کردن نام فروشنده و شماره پرسنلی

برای جدا کردن نام فروشنده و شماره پرسنلی مشابه تاریخ عمل می‌کنیم، اما این بار جداکننده را به جای علامت کولن به علامت پرانتز تغییر میدهیم.

 


ستون جدید، هنوز پرانتز بسته را دارد. بنابراین با کمک گزینه Replace Values پرانتز بسته را حذف می‌کنیم.

 

 

حذف فضای خالی قبل از نام فروشنده

برای جذف فضای خالی قبل از نام فروشنده کافی است ستون مورد نظر را انتخاب کنید و مطابق تصویر زیر عمل نمایید.

 

 

حذف سطرهای غیر ضروری

ستون مورد نظر را انتخاب کنید و مطابق تصویر زیر عمل نمایید.

 


 

تغییر نام ستون ها

بر روی نام ستون دبل کلیک کنید و نام جدید را تایپ کنید.

 


 

آنپیوت کردن نام شهر

مقدار فروش هر شهر در ستون جداگانه ای درج شده است. در حالی که فرمت مناسب برای تحلیل به این صورت است که نام شهر در یک ستون و مقدار فروش در ستون دیگر درج شده باشد. برای آنکه مقدار فروش در هر شهر را از حالت پیوت به حالت آنپیوت دربیاوریم ابتدا تمام ۴ ستون مربوط به شهرها را انتخاب می‌کنیم، سپس کلیک راست می‌کنیم و گزینه Unpivot Column را انتخاب می‌کنیم.

 


 

تغییر فرمت تاریخ

فرمت تاریخ Date است اما از آنجاییکه ما تاریخ را به شمسی وارد کردیم برای اکسل خوانا نیست. برای اینکه به مشکل برنخوریم، فرمت تاریخ را به Text تغییر می‌دهیم. در مقالات آتی بیشتر به مساله تاریخ شمسی در پیوت خواهیم پرداخت.

 


 

در نهایت هم گزینه Close & Load را کلیک کنید.

 


 

و در نهایت داده شما پاکسازی شده و آماده تحلیل است.

چگونه با ابزارهای هوش تجاری تعداد برد/باخت/تساوی پرسپولیس در لیگ برتر امسال را با تیم‌های دیگر مقایسه کنیم؟

به سادگی. فقط کافی است که مراحل زیر را طی کنید.

۱-  طبق مقاله “نصب ابزارهای هوش تجاری در اکسل ۲۰۱۶” ابزار پاور کوئری را در اکسل نصب کنید.

۲- مطابق تصویر به آدرس زیر بروید و بر روی گزینه From Web کلیک کنید.

Data --> New Query --> From Other Sources --> From Web

 

 

 

 

۳- به سایت ورزش ۳ بروید و در آنجا دنبال جدول لیگ برتر بگردید. آدرس صفحه را کپی کنید و مطابق تصویر در کادر زیر URL وارد کنید. سپس گزینه OK‌را کلیک کنید. می‌توانید از آدرس زیر استفاده کنید.

https://www.varzesh3.com/table/%D8%AC%D8%AF%D9%88%D9%84-%D9%84%DB%8C%DA%AF-%D8%A8%D8%B1%D8%AA%D8%B1-98-97

دقت کنید که نمی‌توانید از آدرس‌های کوتاه شده استفاده کنید.

 

۴ – بر روی گزینه Connect کلیک کنید.

 

 

۵- اکسل ادرسی را که شما وارد کردید را بررسی می‌کند و اطلاعاتی را که به فرمت جدول هستند را در ستون سمت چپ مطابق تصویر مشخص می‌کند. در آدرس فوق دو جدول قرار دارد. یکی جدولی که در تصویر زیر با نام “Document” مشخص شده است و دیگری جدولی که با نام “جدول لیگ برتر (۹۷-۹۸)” مشخص شده است. در ستون سمت راست نمونه‌ای از اطلاعات هر کدام از جداول نمایش داده شده است. همانطور که در تصویر می‌بینید جدول Document فاقد اطلاعات مورد نظر ما است. اما “جدول لیگ برتر (۹۷-۹۸)” دقیقا حاوی اطلاعات مورد نظر ما است. ابتدا این جدول را‌ در حالت انتخاب شده قرار دهید و سپس دکمه Load را کلیک کنید.

 

 

 

۶- تبریک می گویم. شما اطلاعات جدول لیگ برتر را در اکسل وارد کردید.

 

۷- می‌توانید با توجه به این داده‌ها نمودارهای متنوعی رسم کنید. به عنوان مثال در تصویر زیر تعداد برد/باخت/تساوی تیم‌ها با هم مقایسه شده است. برای این کار کافی است ستون‌های  نام تیم/ برد/باخت/ تساوی را انتخاب کنید و مسیر زیر را طی کنید.

Insert --> Recommanded Charts --> All Chart --> Column

نهایتا نموداری به صورت زیر رسم می‌گردد.

 

 

و از نمای نزدیک تر

 

 

 

تحلیل افزوده

وبلاگ capterra یکی از وبلاگ های فعال در حوزه هوش تجاری است که مقالات خوبی درباره اخبار و تازه های حوزه هوش تجاری منتشر می‌کند. چند روز پیش دیدم که مقاله‌ای درباره تحلیل افزوده (Augmented Analytics) منتشر کرده بود و عنوان کرده بود که طبق پیش بینی گارتنر برای سال ۲۰۲۰، این قابلیت، محرک اصلی خرید نرم افزارهای هوش تجاری در سال‌های پیش رو است. تحلیل افزوده اصطلاح جدیدی برای من بود. و دقیقا مفهوم اش را درک نمی کردم و از آنجاییکه گارتنر اعلام کرده بود که تحلیل افزوده، آینده داده و تحلیل است، مصصمم شدم که از این اصطلاح نسبتا جدید رمزگشایی کنم.

سوال اول و اصلی این بود که تحلیل افزوده چیست؟ و چه فرقی با تحلیل معمولی دارد؟

تحلیل افزوده همان هوش تجاری است که الگوریتم‌های یادگیری ماشین نیز به آن اضافه شده است. می‌دانید که الگوریتم‌های یادگیری ماشین، دسته‌ای از الگوریتم‌ها هستند که الگویی را یاد می‌گیرند و سپس می‌توانند آن الگو را تشخیص بدهند و دوباره تولید کنند. به عنوان مثال عکس یک سیب را به الگوریتم یادگیری ماشین می‌دهیم، بعد از آن عکس سیب تشخیص می‌دهد و می‌تواند عکس سیب را رسم کند.

حالا در فضای هوش تجاری، الگوریتم یادگیری ماشین چه گره‌ای را باز میکند؟ تقریبا تمام کسانی که درگیر پروژ‌ه‌های هوش تجاری هستند، اذعان دارند که آماده کردن داده (Data Preparation) ، یکی از مراحل بسیار زمان بر و تکراری پروژه‌های هوش تجاری است. الگوریتم‌های هوش تجاری در این مرحله به کمک توسعه دهندگان و تحلیل گران میآیند و آنها را از شر بسیاری از کارهای تکراری نجات می‌دهد. به عنوان مثال فرض کنید که ۱۰۰ فایل اکسل دارید که در همه آنها شهر علی آباد به اشتباه سرهم (علیاباد) نوشته شده است. پیشتر تحلیل‌گر یا توسعه دهنده باید زمان زیادی صرف تصحیح این اشتباه می‌کرد. اما الگوریتم‌های یادگیری ماشین مسولیت تصحیح چنین کارهای تکراری و زمانبری را برعهده گرفته اند.

در تحلیل افزوده امکان پرس و جو به زبان طبیعی وجود دارد. به عنوان مثال اگر می‌خواهید قیمت متوسط اجناس را بدانید، فقط کافی که عبارت “Whats the average price of this item” را تایپ کنید. خود الگوریتم‌ عبارت شما را به اس کیو ال تبدیل می‌کند، اجرا می‌کند و نتیجه را برای شما نمایش می‌دهد. (متاسفانه بلاد کفر کلا زبان فارسی را نادیده گرفتند و امکان پرس و جو به زبان فارسی را در سیستم‌های هوش تجاری تعبیه نکردند.)

در حال حاضر و بدون چنین امکانی، برای پاسخ به سوال فوق باید کدهای زیر تایپ شود.

 

 

 

تعریف تحلیل افزوده و پیاده سازی آن، در حال گذراندن دوران طفولیت خود است و تنوع مثال، ابزار، تعریف، کاربرد آن در سطح نت کم بود. در صورتی که اطلاعات بیشتری در مورد تحلیل افزوده دارید و یا اگر پروژه ای در این زمینه انجام دادید، لطفا در پایین این پست تجربه خود را به اشتراک بگذارید.

هوش تجاری چیست؟

هوش تجاری چیست؟

چند سال پیش، مسولیت برگزاری جلسات آموزش هوش تجاری در سطح مدیران ارشد در چندین شرکت فعال و مطرح در حوزه ها و صنایع مختلف را بر عهده داشتم. اغلب اوقات قبل از شروع مباحث، جهت تخمین آشنایی افراد با مبحث هوش تجاری، از آنها می‌خواستم تعریف و برداشت خود از هوش تجاری را بیان کنند. خیلی اوقات افراد به ابزارهای هوش تجاری اشاره می کردند و هوش تجاری را معادل “پاور بی آی”، “تبلو” و یا “کلیک ویو” می دانستند. برخی هم  هوش تجاری را معادل برخی مفاهیم موجود در هوش تجاری می دانستند مثلا می گفتند هوش تجاری همان انبار داده است یا همان داشبوردهای مدیریتی است. برخی هم از Cube، Olap و یکپارچه سازی نام می بردند و هوش تجاری را معادل این مفاهیم می دانستند. برخی هم به قسمت تصمیم سازی هوش تجاری اشاره می کردند و معتقد بودند که هوش تجاری یک ابزار تصمیم گیری است.

جالب ترین تعریف را، مدیر فروش یکی از شرکت ها داشت. به شوخی گفت: “هوش تجاری چیزی که ما را در تجارت با هوش می کنه. می فهمیم کی بخریم، کی بفروشیم و چطور بیشتر سود کنیم. کلا یه چیزی که پولدارمون میکنه.” بعد هم اضافه کرد که ” هوش ریاضی و هوش هیجانی قبلا شنیده بودیم. الان هم هوش تجاری اومده و البته اصل هم همین. چیزی که پولدارمون کنه.” دوست عزیز، مشخصا هیچ ذهنیتی از هوش تجاری نداشت و فقط برداشت شخصی اش را از عبارت “هوش تجاری” بیان کرده بود. اما برداشت اش برای من جالب بود و به نظرم به مفهوم واقعی هوش تجاری بسیار نزدیک بود. در ادامه به تعریف هوش تجاری از دیدگاه های مختلف می پردازم و بررسی می‌کنم که چرا این تعریف برای من جالب بود.

موسسه گارتنر معتقد است که”هوش تجاری” مجموعه ای از ساختارها، ابزارها و برنامه های کاربردی است که امکان دسترسی و تحلیل اطلاعات را فراهم می‌کند و از این جهت فرآیند تصمیم گیری و کارایی کلی سازمان را بهبود می‌بخشد.

هر چند که تعریف گارتنر معتبر و مورد قبول است. اما بیشتر به زیرساخت فنی و تکنولوژی هوش تجاری اشاره می‌کند و جنبه‌ مدیریتی هوش تجاری را در نظر نگرفته است. توربن در کتاب “هوش تجاری، یک رویکرد مدیریتی” این جنبه از هوش تجاری را نیز در نظر گرفته و معتقد است که هوش تجاری یک رویکرد مدیریتی مبتنی بر داده است.

به نظر من تعریف دقیق هوش تجاری ترکیبی از دو تعریف بالا است. هوش تجاری در واقع یک رویکرد مدیریتی است که بر اساس آن مدیران سازمان نه بر اساس حدس و گمان بلکه بر اساس داده‌های واقعی موجود در داخل یا خارج سازمان، فکر می‌کنند و تصمیم می‌گیرند. اما بر اساس کدام داده‌ها؟ این داده‌ها چگونه، از کجا و طی چه فرآیندی جمع آوری می‌شوند و در کجا یکپارچه می‌شوند. اینجا است که تعریف گارتنر به کار میآید و هوش تجاری را مجموعه ای از ساختارها، ابزارها و برنامه‌های کاربردی می داند که امکان دسترسی، جمع آوری و یکپارچه سازی داده‌ها را فراهم می‌کند. “پاور بی آی”، “تبلو”، “کلیک ویو”، “انبار داده”، “داشبورد مدیریتی”، “Cube”، “Olap” … همه جزئی از همان ساختار، ابزار و برنامه های کاربردی هستند که امکان جمع آوری و یکپارچه کردن داده را فراهم می‌کنند اما به هیچ وجه معادل هوش تجاری نیست و فقط به یک وجه آن اشاره می‌کنند.

برگردیم به دوست عزیزی که معتقد بود “هوش تجاری چیزی که ما را در تجارت باهوش می‌کنه. می فهمیم کی بخریم، کی بفروشیم و چطور بیشتر سود کنیم.” به کلمه “چیزی” دقت کنید. هر چند که دوست عزیز دقیقا باز نکرد که “چیزی” دقیقا، چیست. اما می‌توانم حدس بزنم که در چارچوب هوش تجاری “چیزی” فقط می‌تواند معادل داده باشد. مدیر شرکت با دانستن داده‌های مانند میزان فروش سال‌ها و ماه‌ها قبل، میزان فروش محصول توسط رقبا در کل کشور، میزان تقاضا برای خرید محصول در کشورهای دیگر و …. و در کنار هم قرار دادن آنها می‌تواند بهترین زمان فروش و مناسب‌ترین خریدار را انتخاب کرده و بهترین سود کسب کند.

موتور جستجوی دیتاست گوگل

پایان‌نامه کارشناسی ارشدم درباره لبخوانی بود. مستقل از چالش‌هایی که برای پیدا کردن الگوریتم بهینه و ارزیابی آن داشتم، چالش اصلی من تهیه دیتاست مناسب بود. دیتاست استانداردی وجود نداشت و اگر هم وجود داشت، با سرچ معمول گوگل پیدا نمیشدند.

فقط من با چنین مشکلی روبرو نبودم، تقریبا تمام دوستان با مشکلات مشابهی دست و پنچه می کردند. یکی بر روی پردازش تصاویر دندان کار می کرد، دیگری روی تشخیص سلول های سرطانی. الگوریتم جدید شناسایی اثر انگشت موضوع پایانه نامه دیگری بود و یکی از همکلاسی ها هم بر روی شناسایی خویشاندی در تصاویر تمرکز کرده بود. مستقل از تعریف پایان‌نامه، دیتاست مشکل همه ما بود. دیتاست مناسب با سرچ معمولی در اینترنت پیدا نمیشد، باید مقالات بسیاری می‌خواندیم و رد دیتاست‌ها را از مقالات پیدا می‌کردیم.

خاطرم هست که پیدا کردن دیتاست مناسب و دانلود با اینترنت کند و دور زدن تحریم‌ها آنقدر سخت بود که بسیاری از دوستان در آن زمان ترجیح دادند که دیتاست مخصوص به خود را تهیه کنند.

چالش دیتاست همه گیر بود و بسیاری در سراسر دنیا، مانند دوستانم، اقدام به جمع آوری دیتاست‌های مخصوص به خود کرده‌اند. اما علی رغم کارگشا بودن آنها، این دیتاست‌ها در جایی ایندکس نشده بودند و امکان یافتن آنها با کمک موتور جستجوی فعلی گوگل بسیار مشکل بود.

چند روز پیش خبردار شدم که گوگل این چالش و فرصت را درک کرده است و بالاخره موتور جستجوی مخصوص دیتاست (Dataset Search) خود را راه اندازی کرده است. این موتور جستجو صرفا بر روی یافتن مناسب ترین دیتاست تمرکز کرده است.

 

روش کار به این صورت است که هر فرد، دانشگاه، موسسه، دولت … که قصد انتشار دیتاست خود را دارد، ابتدا باید یک سری تگ بر روی داده تعریف کند و اطلاعاتی مانند این که داده توسط چه کسی، در چه زمانی، با چه هدفی تهیه شده است را مشخص کند. سپس این اطلاعات در گوگل ایندکس می‌شود و در نهایت با سرچ در این سامانه در دسترس خواهد بود.

ظاهر و طراحی سایت مشابه گوگل است. می توان از تکنیک های پیشرفته جستجو در گوگل مانند استفاده از دبل کوتیشن و کلمات کلیدی چون site  در آن استفاده کرد. به عنوان مثال با نوشتن عبارت “daily weather”‌ داخل دبل کوتیشن، دقیقا این عبارت جستجو می شود و با نوشتن عبارت weather site:noaa.gov صرفا دیتاست‌های موجود در سایت noaa.gov بررسی می شود.

گوگل معتقد است که با توجه به حرکت دولت‌ها به سمت شفافیت و انتشار داده و همچنین اصرار مجلات علمی بر انتشار عمومی دیتاست مربوط به هر مقالات، این موتور جستجوی به سرعت رشد خواهد کرد.

مایند مپ ابزار هوش تجاری در مایکروسافت

در چند مقاله گذشته به بررسی ابزار هوش تجاری در مایکروسافت پرداختیم. در این مقاله به جمع بندی کلی این ابزارهای با کمک نقشه ذهنی (Mind Map) می پردازیم.
ابزارهای هوش تجاری مایکروسافت را از یک منظر می توان به دو دسته کلی ابزارهای سلف سرویس و سرویس ها تقسیم کرد. ابزارهای سلف سرویس هوش تجاری برای استفاده عموم، شرکت های کوچک و افرادی که تخصص کافی در زمینه آی تی و نرم افزار ندارند، طراحی شده است. دسته دوم سرویس های مایکروسافت است که همراه با اس کیو ال سرور نصب می شود. این دسته از سرویس خصوص متخصصان آی تی و شرکت های بزرگ است. هر دو دسته در نقشه ذهنی زیر مشخص شده اند.
هوش تجاری سلف سرویس به دو دسته هوش تجاری در اکسل و پاور بی آی تقسیم می شود.
سرویس های مایکروسافت در زمینه هوش تجاری هم به سه سرویس اصلی ، SSIS, SSRS , و SSAS تعلق دارد.
برای نمایش گزارش های هوش تجاری بر روی موبایل نیز موبایل ریپورت پابلیشر مورد استفاده قرار می گیرد.

نقشه ذهنی ابزارهای فوق را در تصویر زیر مشاهده می کنید. با کلیک بر روی هر قسمت به مقاله مرتبط هدایت می شوید.

ابزار هوش تجاری در مایکروسافت (۵)

موبایل ریپورت پابلیشر (Mobile Report Publisher)

در سلسه مقالات ” هوش تجاری در مایکروسافت” به بررسی ابزارهای هوش تجاری که توسط مایکروسافت ارائه شده است پرداختیم و گفتیم که این ابزارها به دو دسته کلی تقسیم می شوند، یک دسته از ابزارها مخصوص متخصصان آی تی، شرکت های بزرگ و دیتابیس های بزرگ و متنوع است. سرویس‌های SSIS, SSAS, SSRS در این دسته از ابزارها قرار دارند. دسته دیگر از ابزارها که اصطلاحا به ابزارهای سلف سرویس (خویش فرما) شهرت دارند، برای شرکت‌ها و پایگاه داده‌های کوچک مناسب هستند و برای استفاده از این دسته به دانش تخصصی آی تی خاصی نیست. هوش تجاری در اکسل و پاور بی آی در این دسته قرار می گیرند.

در سال ۲۰۱۵ مایکروسافت نقشه راه توسعه‌های آتی خود را منتشر کرد و در آن عنوان کرد که تمرکز اصلی مایکروسافت در توسعه‌های آتی ابزارهای هوش تجاری، بر روی “ابزارهای بین سیستمی و بین پلت فرمی” خواهد بود. به این معنی که گزارش‌های هوش تجاری هم در سیستم‌های مختلف اعم از کامپیوتر، تبلت، موبایل … و هم در بین پلت فرم‌های مختلف اعم از ویندوز، لینوکس … قابل طراحی و نمایش خواهد بود.

در راستای توسعه گزارش‌های بین سیستمی، مایکروسافت در آپریل ۲۰۱۵ شرکت دیتازن (DataZen) را خریداری نمود. شرکت دیتازن از سال ۲۰۰۲ فعالیت خود را در زمینه ساخت ابزارهای گزارش ساری و مصورسازی داده شروع کرده بود. این شرکت به طور خاص بر روی طراحی و نمایش گزارش بر روی گوشی موبایل تمرکز کرده بود و بیش از ۱۰۰۰۰ شرکت از سراسر دنیا از محصولات آن استفاده می کردند.

 مایکروسافت پس از مشاهده استقبال خوب از این ابزار شرکت دیتازن، به جای آنکه یک ابزار طراحی و نمایش گزارش بر روی موبایل را از صفر طراحی کند، شرکت دیتازن را در آپریل ۲۰۱۵ خرید. در نسخه ۲۰۱۶ مایکروسافت، محصولات دیتازن با اس کیو ال ۲۰۱۶ ترکیب کرد و پلتفرم هوش تجاری برای نماش گزارش ها بر روی گوشی و تبلت را به وجود آورد. این پلت فرم اصطلاحا موبایل ریپورت پابلیشر (Mobile Report Publisher) نامیده شد.

موبایل ریپورت پابلیشر، ابزار گزارشگیری نسبتا جدید مایکروسافت است که امکان طراحی و نمایش گزارش‌ها بر روی سیستم‌های مختلف (ویندوز، اندروید، آی او اس، ..) و اندازه‌های مختلف صفحه نمایش ( موبایل، تبلت، لپ تاپ … ) را فراهم می کند.

برای طراحی گزارش با استفاده از موبایل ریپورت پابلیشر، SSRS‌ باید بر روی سیستم نصب شود. بعد از آن موبایل ریپورت پابلیشر می‌تواند به منابع داده‌ای مختلفی چون اکسل، اس کیو ال یا کیوب وصل شود و داده‌ها موردنیاز را از آنها بخواند. طراح گزارش‌ها می‌تواند گزارش‌های مورد نیاز خود را طراحی کرده و بر روی سرور گزارش‌های قرار دهد. در تصویر زیر محیط طراحی گزارش را مشاهده می‌کنید.

پس از طراحی گزارش توسط طراح و انتشار آن بر روی سرور گزارش‌ها، کاربر نهایی (مشاهده کننده گزارش‌ها) باید اپلیکشن موبایل ریپورت پابلیشر را بر روی گوشی همراه خود نصب کند و سپس تنظیمات لازم بر روی اپلیکشن را انجام دهد تا به سرور گزارش وصل شود. پس از آن می تواند گزارش‌های طراحی شده مختص موبایل را مشاهده کند. نمونه‌ای از گزارش‌های طراحی شده برای سایز‌‌ها مختلف صفحه نمایش را در تصویر زیر مشاهده می‌کنید.