شکل داده ها تعیین کننده نوع ابزارهایی است که می توان از آنها برای نتیجه گیری استفاده کرد. در اینجا نحوه ترسیم گرافیکی داده ها برای یافتن شکل آن آورده شده است:
مرحله 1: داده ها را در دسته بندی ها ترسیم کنید
برای شروع، داده ها باید به دسته های مساوی تقسیم شوند. دسته ها باید فواصل مساوی داشته باشند تا داده ها معنی دار شوند. سپس یک جدول فرکانس باید از مجموعه داده های موجود تهیه شود و تعداد دفعاتی که یک آیتم در یک طبقه بندی فاصله رخ می دهد باید یادداشت شود.
مرحله 2: یک هیستوگرام رسم کنید
مرحله بعدی این است که فواصل داده ها را بر روی یک کاغذ گراف رسم کنید و یک هیستوگرام ایجاد کنید. هیستوگرام چیزی نیست جز نمودار میله ای مجموعه ای پیوسته از داده ها با فواصل مساوی.
مرحله 3: نقاط میانی را برای یافتن شکل بپیوندید
مرحله بعدی ترسیم نقاط میانی میله های هیستوگرام است. سپس این نقاط میانی باید به هم متصل شوند تا منحنی داده ها ایجاد شود که شکل داده نیز نامیده می شود.
در میان بسیاری از ویژگی های شکل داده ها که مهم هستند، شاید مقوله اصلی تقارن باشد. دلایل مشابه در زیر ذکر شده است.
ویژگی های شکل
شکل داده ها از اهمیت بالایی برخوردار است، زیرا تکنیک های آماری توسعه یافته اند که می توانند در مورد احتمال داده ها بر اساس شکل آن تصمیم گیری کنند. مشروح آن به شرح زیر است:
داده های متقارن: داده های متقارن ساده ترین نوع داده برای کار با آنها است. این به این دلیل است که بسیاری از تکنیک های آماری برای همان توسعه داده شده اند. در واقع داده های متقارن آنقدر رایج هستند که به آن منحنی نرمال می گویند. همچنین نام های دیگری مانند منحنی زنگ دارد. اندازهگیریهای استانداردی وجود دارد که میتواند احتمال وقوع یک نقطه داده را بر اساس تعداد انحرافات استاندارد که از میانگین فاصله دارد، بگوید. از دیدگاه شش سیگما به درک چگونگی توزیع نتایج یک فرآیند کمک می کند.
اکثر چیزهایی که به طور مداوم در طبیعت و همچنین در عملیات اندازه گیری می شوند، توزیع نرمال دارند. به همین دلیل است که کاربردهای داده های متقارن بسیار زیاد است.
داده های کج: بسیاری از اوقات داده ها متقارن نیستند یعنی به سمت یک طرف کج می شوند. داده ها می توانند دارای انحراف مثبت یا منفی باشند. تکنیکهای آماری در دسترس هستند که به ما کمک میکنند تا توزیعهای احتمالی دادههای اریب را نیز پیدا کنیم. با این حال چنین تکنیک هایی به خوبی توسعه نیافته اند. این به این دلیل است که بیشتر داده های نمونه جمع آوری شده معمولاً از توزیع نرمال پیروی می کنند. بنابراین تجزیه و تحلیل آماری دادههای کجشده اغلب انجام نمیشود.


بدون نظر