سازمان ها در حالی که تعداد زیادی بایت از اطلاعات مربوط به عملیات، مشتریان و تامین کنندگان خود را جمع آوری می کنند، حجم انفجاری داده تولید می کنند و این داده ها به طور مداوم در حال افزایش است. برای ارائه یک ایده، شرکت بینالمللی داده (IDC) پیشبینی کرده است که بین سالهای 2009 تا 2020، دادهها 44 برابر معادل 35.3 زتابایت که معادل 1.8 تریلیون گیگابایت است، افزایش خواهد یافت. بنابراین، حجم فزایندهای از «دادههای اگزوز» دیجیتال توسط شرکتها تولید میشود که کسبوکار خود را مدیریت میکنند و با سهامداران تعامل دارند.
مقدمه ای بر داده های بزرگ:
Big Data به ترکیبی از انواع مختلف داده ها اشاره دارد. این شامل داده های سنتی تولید شده شرکت مانند مدیریت ارتباط با مشتری (CRM)، جزئیات اداری و مالی، سیستم های اطلاعات مدیریت، عملیات زنجیره تامین و غیره است که می تواند در پایگاه داده شرکت ذخیره شود. همچنین شامل محتوایی مانند رسانه های اجتماعی، ویدئو، داده های حسگر (تولید شده با کلیک کردن بر روی لینک ها در شبکه های اجتماعی) و ایمیل است. اما اصطلاح Big Data برای انواع داده های فوق زمانی ابداع می شود که برای کنترل سیستم های معمولی بسیار بزرگ باشد. اندازه به تنهایی نشانگر بزرگی نیست. داده ها بزرگ هستند به دلیل:
- حجم: اطلاعات فراوان.
- سرعت: به سرعت در حال تغییر است.
- تنوع: بدون ساختار و غیر قابل استفاده به شکل فعلی.
این دادهها را میتوان با برش دادن و برش دادن آنها با ابزارهای تحلیلی برای شناسایی روندها و الگوها و کمک به تصمیمگیری با انجام هوش تجاری بسیار مفید ساخت. در دنیای امروزی، با استقرار سیستم های SAP، Microsoft Dynamics و Oracle Enterprise Resource Planning (ERP) می توان به راحتی اطلاعات را در سراسر سازمان به اشتراک گذاشت. این ادغام و به اشتراک گذاری داده ها نه تنها پیچیدگی، بلکه پتانسیل تحلیلی را نیز افزایش می دهد. برای نشان دادن، حدود یک دهه پیش، داده های تاریخی شرکت تنها راه برآورد فروش آتی بود. اما امروزه منابع بسیار بیشتری مانند تحلیل رقابتی، اقتصاد بازار و کلیک های وب سایت می توانند به عنوان ورودی برای پیش بینی درآمد مورد استفاده قرار گیرند. همه اینها چیزی نیست، به جز راه های داده های بزرگ.
چالش ها:
زمانی که شرکتها مجبورند روشهای نوآورانهای برای جمعآوری آنها و درک آنها طراحی کنند، واقعاً بزرگ است که یک کار چالش برانگیز است. شرکت ها با داده ها بمباران می شوند و ممکن است در مدیریت و تجزیه و تحلیل تریلیون ها بایت داده مهارت نداشته باشند. این را می توان به موارد زیر نسبت داد:
- کمبود زیرساخت شرکت برای مدیریت حجم انبوه دادهها: معمولاً فضای ذخیرهسازی یا اندازه سرور محدودی برای گنجاندن تمام دادههای تولید شده وجود دارد.
- فقدان استعداد مناسب، به عنوان مثال تحلیلگران کلان داده یا متخصصان هوش تجاری: طبق گفته مک کینزی و شرکت، کمبود نیروی کار با تجربه در تجزیه و تحلیل داده های بزرگ وجود دارد. همچنین، مدیریت در اکثر شرکتهای کوچک و متوسط و تا حدی شرکتهای بزرگ فاقد استراتژی مدیریتی برای سرمایهگذاری بر دادهها هستند.
- تهدید یکپارچگی داده ها: همانطور که قبلاً ذکر شد، به دلیل سیستم های ERP، داده های بدون ساختار از منابع مختلف اغلب با هم مخلوط می شوند و اعتبارسنجی دقت آن را دشوار می کند و منجر به داده های زباله می شود.
رویکرد استفاده از داده های بزرگ:
بخش های فناوری اطلاعات در برخورد با کلان داده ها با مشکل مواجه هستند. اقدامات متعددی برای کاهش این مشکل وجود دارد. ابر پهنای باندی برای مدیریت داده های هیولا دارد و از این رو محیطی مناسب را بدون نیاز به سرمایه گذاری در سرورهای گران قیمت با ظرفیت عظیم فراهم می کند. XBRL به طور گسترده به عنوان یک زبان داده ساختاریافته برای قالب بندی داده ها و خوانایی آنها توسط رایانه استفاده می شود. یک فناوری محبوب برای تجزیه و تحلیل داده های بزرگ Apache Hadoop (پلت فرم شی گرا توزیع شده با دسترسی بالا) است.
بدون نظر