شکل داده ها تعیین کننده نوع ابزارهایی است که می توان از آنها برای نتیجه گیری استفاده کرد. در اینجا نحوه ترسیم گرافیکی داده ها برای یافتن شکل آن آورده شده است:

مرحله 1: داده ها را در دسته بندی ها ترسیم کنید

برای شروع، داده ها باید به دسته های مساوی تقسیم شوند. دسته ها باید فواصل مساوی داشته باشند تا داده ها معنی دار شوند. سپس یک جدول فرکانس باید از مجموعه داده های موجود تهیه شود و تعداد دفعاتی که یک آیتم در یک طبقه بندی فاصله رخ می دهد باید یادداشت شود.

مرحله 2: یک هیستوگرام رسم کنید

مرحله بعدی این است که فواصل داده ها را بر روی یک کاغذ گراف رسم کنید و یک هیستوگرام ایجاد کنید. هیستوگرام چیزی نیست جز نمودار میله ای مجموعه ای پیوسته از داده ها با فواصل مساوی.

مرحله 3: نقاط میانی را برای یافتن شکل بپیوندید

مرحله بعدی ترسیم نقاط میانی میله های هیستوگرام است. سپس این نقاط میانی باید به هم متصل شوند تا منحنی داده ها ایجاد شود که شکل داده نیز نامیده می شود.

در میان بسیاری از ویژگی های شکل داده ها که مهم هستند، شاید مقوله اصلی تقارن باشد. دلایل مشابه در زیر ذکر شده است.

ویژگی های شکل

شکل داده ها از اهمیت بالایی برخوردار است، زیرا تکنیک های آماری توسعه یافته اند که می توانند در مورد احتمال داده ها بر اساس شکل آن تصمیم گیری کنند. مشروح آن به شرح زیر است:

داده های متقارن: داده های متقارن ساده ترین نوع داده برای کار با آنها است. این به این دلیل است که بسیاری از تکنیک های آماری برای همان توسعه داده شده اند. در واقع داده های متقارن آنقدر رایج هستند که به آن منحنی نرمال می گویند. همچنین نام های دیگری مانند منحنی زنگ دارد. اندازه‌گیری‌های استانداردی وجود دارد که می‌تواند احتمال وقوع یک نقطه داده را بر اساس تعداد انحرافات استاندارد که از میانگین فاصله دارد، بگوید. از دیدگاه شش سیگما به درک چگونگی توزیع نتایج یک فرآیند کمک می کند.

اکثر چیزهایی که به طور مداوم در طبیعت و همچنین در عملیات اندازه گیری می شوند، توزیع نرمال دارند. به همین دلیل است که کاربردهای داده های متقارن بسیار زیاد است.

داده های کج: بسیاری از اوقات داده ها متقارن نیستند یعنی به سمت یک طرف کج می شوند. داده ها می توانند دارای انحراف مثبت یا منفی باشند. تکنیک‌های آماری در دسترس هستند که به ما کمک می‌کنند تا توزیع‌های احتمالی داده‌های اریب را نیز پیدا کنیم. با این حال چنین تکنیک هایی به خوبی توسعه نیافته اند. این به این دلیل است که بیشتر داده های نمونه جمع آوری شده معمولاً از توزیع نرمال پیروی می کنند. بنابراین تجزیه و تحلیل آماری داده‌های کج‌شده اغلب انجام نمی‌شود.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *