آموزش آمار توصیفی به زبان ساده + بررسی آمار توصیفی در تحلیل داده ها
یکی از دروس مهمی که در زمینه مدیریت کاربرد فراوانی دارد مربوط به بحث آمار و احتمال میشود و این مبحث از دروس اصلی رشته مدیریت میباشد و هدف آن آشنا کردن دانشجویان با علم آمار و داده و همچنین نحوهی بهکارگیری آن در دانش مدیریت میباشد. یکی از مهمترین آمارهایی که در هر جامعهای به آن پرداخت میشود مربوط به آمار توصیفی است. بهطور کلی با آمار توصیفی میتوانیم به توصیف یک جامعه بپردازیم و هدف از آن محاسبه کردن پارامترهای جامعه میباشد. اگر محاسبه مقادیر و شاخصهای جامعهی آماری با بهره بردن از سرشماری تمامی عناصر و اعضای آن صورت گیرد به آن آمار توصیفی می گوییم. البته این نوع سرشماری را تابهحال در کشورمان ایران دیدهایم و هر ۱۰ سال یکبار این نوع آمارگیری انجام میشود. حال در ادامه این مطلب میخواهیم در مورد یکی از کاربردیترین نوع آمارهای مورد نیاز برای مدیریت یک جامعه، کشور یا اتحادیه بینالمللی جهانی بحث کنیم و به آموزش آمار توصیفی و تمامی تعاریف مورد نیاز برای آن بپردازیم. پس با ما همراه باشید.
مقدمه ای بر علم آمار و تعاریف آن
قبل از هر چیزی می خواهیم با مفهوم علم آمار و جزئیات زیرمجموعه های آن آشنا شویم.
تعریف آمار: روشی علمی که برای جمع آوری، تلخیص، تفسیر، تجزیه و تحلیل و بصورت کلی برای مطالعه و بررسی مشاهدات بکار گرفته می شود.
ابتدا باید بپرسیم که از اطلاعات آماری گرفته شده برای چه اهدافی در مدیریت استفاده می شود؟ در پاسخ ۳ هدف مهم را بیان می کنیم که از اهداف مورد نظر برای بکارگیری اطلاعات آماری در مدیریت می باشد :
- جهت بررسی و صحت و سقم فرضیات
- جهت تبدیل داده های خام به اطلاعات پالایش شده
- جهت تعیین اعتبار تحقیقات مصاحبه و پرسشنامه ای
حال که با مفهوم آمار آشنا شدیم و اشاره کردیم اطلاعات از جامعه هدف جمع آوری می شود بد نیست تعریف دقیقی از یک جامعه داشته باشیم :
تعریف جامعه: جامعه بعنوان بزرگترین مجموعه از موجودات است که در زمان معین و مشخصی، اعضای آن مورد نظر و مطلوب ما قرار خواهند گرفت. مانند جامعه کارگران، جامعه دبیران آموزش و پرورش و …
لازم به ذکر است که هر جامعه متناسب با هدف ما تغییر خواهد کرد. بهعنوان مثال اگر هدف ما بررسی میزان رضایتمندی کارکنان یک بانک باشد، جامعه هدف ما تمامی کارکنان بانک در سراسر کشور میباشند یا اگر هدف ما رضایتمندی دبیران باشد جامعه ما تمامی دبیران سراسر کشور میباشد. برای اینکه بخواهیم جامعهی آماری مورد نظرمان را بهتر بشناسیم میبایست از آموزشهای کامل و منابع یادگیری استفاده کنیم تا بتواند به ما در این مسیر کمک کند، یکی از این منابع یادگیری آموزشهای آنلاین فرادرس میباشد که توانسته است در زمینه علم آمار و داده فیلمهای آموزشی ارزشمندی را تهیه و تنظیم کند.
جامعه آماری چیست؟
حال که با مفهوم جامعه و آمار آشنا شدیم می خواهیم عبارت جامعه آماری را که در مبحث آموزش آمار توصیفی به آن اشاره می کنیم را تعریف کنیم:
جامعه آماری عبارتست از تعدادی از عناصر و اجزای مطلوب و مورد نیاز ما که حداقل دارای یک صفت مشخصه و خاص باشند. منظور از صفحه مشخصه نیز صفتی است که در بین همه ی عناصر و اعضای جامعه ی آماری مشترک و متمایز است و جامعه ی آماری مورد نیاز ما را از سایر جوامع جدا خواهد کرد.
جوامع آماری بطور کلی شامل ۲ نوع می باشند که شامل:
- جامعه محدود : عبارتست از جامعه ای که با مقادیر ثابت و محدودی تشکیل شده و پایان پذیر هستند. (مانند کارگران ایران)
- جامعه نامحدود: عبارتست از جامعه ای که از مقدار بی انتهایی تشکیل شده است. (تمام برگ های درختان)
تعریف نمونه: نمونه عبارتست از تعداد محدودی از اعضای یک جامعه ی آمار که مشخص کننده ی ویژگی های اصلی آن جامعه باشند. نمونه انتخاب شده باید تا حد ممکن شبیه به جامعه ی مورد نظر باشد. بطور مثال برای اینکه بررسی نوع آموزش در یک حوزه ی آموزشی درست نیست که تنها دانش آموزان با معدل بالا را انتخاب کنیم و باید از تمامی دانش آموزان از هر طیف معدل انتخاب شوند.
انواع شاخص های آماری عبارتند از:
پارامتر: شاخص هایی که از راه سرشماری یعنی اندازه گیری تمامی عناصر جامعه ی آماری بدست می آیند. بعنوان مثال وقتی بخواهیم متوسط درآمد کارکنان بانک مرکزی را با استفاده از اندازه گیری درآمد تمامی کارکنان دولت بدست بیاوریم از شاخص آماری پارمتر استفاده کرده ایم.
آماره: شاخص هایی که از راه نمونه گیری یعنی اندازه گیری بخشی از جامعه ی آماری بدست می آیند. بعنوان مثال هنگامی که بخواهیم متوسط درآمد کارکنان بانک مرکزی را اینبار با استفاده از اندازه گیری درآمد نمونه ای از کارکنان دولت بدست بیاوریم از نوع شاخص آماره بهره برده ایم.
بررسی سیر تحول در علم آمار
بطور کلی سیر تحویل و تحول در علم آمار را می توانیم به انواع مدل های آماری مختلف تقسیم و طبقه بندی کنیم که عبارتند از :
- آمار توصیفی
- آمار استنباطی
- آمار ناپارامتریک
آمار توصیفی
بهطور کلی این نوع از آمار، به توصیف یک جامعهی آماری میپردازد و هدف مهم آن محاسبهی پارامترهای یک جامعه است. اگر محاسبه مقادیر و شاخصهای جامعهی آماری با تکیه بر سرشماری تمامی عناصر و اجرای موجود صورت گیرد به آن آمار توصیفی می گوییم. در ادامه نیز با آموزش آمار توصیفی به شرح بیشتر جزئیات این مدل خواهیم پرداخت.
آمار استنباطی
در این نوع آمار با استفاده از مقادیر نمونه، آمارهها محاسبه خواهند شد و به کمک تخمین و آزمون فرضی آماری، آمارهها به پارامترهای جامعه تعمیم داده خواهند شد. در این مدل وقتی به تمامی اعضای جامعهی آماری دسترسی نداریم و تنها با بخشی از یک جامعهی کل ارتباط داریم میتوانیم از آن استفاده کنیم.
آمار ناپارامتریک
آمار ناپارامتریک در برابر آمار پارامتریک قرار دارد که یکی از فرضهای اساسی در آمار پارامتریک برخورداری از مشاهدات از طریق توزیع نرمال است، در حالی که در روش ناپارامتریک این فرض ضرورت ندارد. در بررسیهایی که متغیرهای آنها دارای مقیاس کیفی هستند، از این روشها میتوانیم استفاده کنیم چون که متغیرهایی که دارای مقیاس کیفی هستند فاقد توزیع آماری بوده و به آنها آزاد توزیع می گویند.
بررسی مفهوم علم داده و آمار توصیفی
یکی از مهمترین حوزههایی که در جوامع امروزی و عصر تکنولوژی به آن دقت ویژهای شده است علم داده یا Data Science است که از آن بهعنوان یکی از جذابترین مشاغل قرن نام برده میشود و افراد زیادی در سراسر دنیا مشغول آموختن آن هستند. برای این انتخاب میتوانیم دلایل مختلفی بیان کنیم که برجستهترین آنها وجود منابع عظیمی از دادهها و نیاز سازمانها و دولتها برای استخراج و تحلیل دانش مفید از آن میباشد. این ویژگی باعث شده است که میزان تقاضا برای دانشمندان و کارشناسان علم داده بسیار زیاد شود. بهطور کلی منظور از آمار توصیفی این است که به تحلیل کامل دادهها بپردازیم که میتواند به خلاصه کردن دادهها، توصیف و نمایش آنها بهطور کاملاً بامعنا کمک ویژهای کند.
پس آمار توصیفی بسیار مهم و حیاتی است چون میتوانیم دادههای بی معنی و خام را که از طریق روشهای مختلفی مانند پرسشنامه و مصاحبه دریافت شده است پالایش کنیم و سپس جزئیات پردازش شده را بهصورت آمار توصیفی از هر جامعهای، به اطلاعات با معنی تبدیل و منتشر کنیم. علم داده پیشنیازهای مختلفی دارد که یکی از آنها دارا بودن دانش آمار میباشد و برجستهترین پیشنیاز را هم میتوانیم آمار توصیفی بیان کنیم که در ادامه به جزئیات دقیق آن خواهیم پرداخت.
بررسی انواع داده در آمار توصیفی
برای اینکه بصورت تخصصی به بیان علم داده بپردازیم باید طبقه بندی ابتدایی از داده ها را در اختیار داشته باشیم که بصورت کلی شامل ۳ گروه اصلی می باشد :
- داده های طبقه ای
- داده های ترتیبی
- داده های عددی
داده های طبقه ای
این نوع از دادهها عموماً مربوط به ویژگیهای کیفی و صفتهای مشخصی هستند و برای گروه بندی و طبقه بندی اعضای یک جامعهی آماری مورد استفاده قرار میگیرند. اگر بخواهیم برای مشخص کردن و نمایش هر گروه از جامعه از نماد عددی استفاده کنیم، در این حالت از مدل کدگذاری بهره بردهایم و باید دقت داشته باشیم که این اعداد نباید به شکل محاسبات ریاضی در نظر گرفته شوند. دادههایی که به صورت طبقهای مورد استفاده قرار میگیرد بهعنوان نمونه عبارتاند از نوع سکونت، جنسیت افراد، محل تولد و…
داده های ترتیبی
در ادامه مبحث آموزش آمار توصیفی دومین مورد از انواع داده، داده های ترتیبی هستند، مقدارهایی از ویژگی های کیفی که دارای ترتیب مشخصی باشند می توانند جزء داده های ترتیبی تقسیم بندی شوند. بعنوان مثال نمونه ای از صفت های مشخصه وجود دارند که دارای اولویت و رتبه هستند و با استفاده از ویژگی ها و صفت های مشخص شده می توانیم اعضای یک جامعه را مرتب کنیم. مانند رتبه علمی اساتید دانشگاه، رتبه هتل ها و رستوران ها و…
داده های عددی
سومین مورد از انواع داده، داده های عددی می باشد که مقادیر آن را می توانیم با استفاده از اندازه گیری و روش های محاسباتی شمارش کنیم. داده های عددی را می توانیم به ۲ دسته ی اصلی زیر تقسیم کنیم :
داده های عددی گسسته: منظور از داده های عددی گسسته این است که مقادیر آن زیرمجموعه ای از اعداد طبیعی می باشند. مانند تعداد کارکنان بانک مرکزی، تعداد دبیران آموزش و پرورش و…
داده های عددی پیوسته: منظور از داده های عددی پیوسته این است که مقادیر آن زیرمجموعه ای از اعداد دارای اعشار و حقیقی هستند. مانند متراژ زمین، سرعت حرکت خودرو و…
در حال حاضر در دنیایی زندگی می کنیم که با خیل عظیمی از داده ها ارتباط داریم و برای اینکه با آنها کار کنیم باید با ویژگی های خاصی که دارند از یکدیگر متمایز کنیم. این تمایز به این خاطر است چون وقتی داده های خام و بی معنی زیادی را در اختیار داشته باشیم تجسم آنچه داده ها به ما نشان می دهند سخت خواهد بود مخصوصا هنگامی که مقدار داده ها بسیار زیاد باشد. پس در این حالت آموزش آمار توصیفی به کمک ما خواهد آمد تا بتوانیم با روشی صحیح و بهینه اطلاعاتی با معنی و با مفهوم را از یک جامعه ی آماری نمایش دهیم و تفسیر ساده تری از داده ها در اختیار افراد قرار دهیم.
مهمترین ویژگی های شاخص های توصیفی
برخی از ویژگی هایی که در آمار توصیفی می توانند برای متمایز کردن داده ها به کمک ما بیایند شاخص های توصیفی نام دارند که بصورت کلی برای توصیف و بررسی یک نمونه یا جامعه ی آماری می توانیم از ۳ معیار و شاخص کلی بشکل زیر استفاده کنیم :
- شاخص تمایل به مرکز
- شاخص پراکندگی
- شاخص تقارن توزیع
شاخص تمایل به مرکز
شاخصهایی که تمایل به مرکز دارند دارای مقادیر کمی یا کیفی بوده که مشخص کنندهی میزان تمرکز دادهها هستند. شاخصهای تمرکز را با نام معیارهای مرکزی هم میشناسیم. یکی از معروفترین و مهمترین شاخصهایی که بهعنوان شاخص تمایل به مرکز معرفی میشود میانگین است که به معنای برآیند و معدل مقادیر میباشد و مرکز ثقل دادهها را مشخص میکند. شاخصهای بعدی در این زمینه عبارتاند از: شاخص میانه که منظور مقدار میانی اعدادی است که به ترتیب در کنار هم قرار گرفتهاند، شاخص نما یا مُد که منظور مقداری است که بیشترین فراوانی و تکرار را در بین دیگر مقادیر دارد. هرکدام از شاخصهایی میانگین، میانه، نما کاربردهای مختلفی دارند و میتوانند جنبهی مشخصی از خصوصیات یک جامعهی آماری یا نمونه را نمایش دهند.
شاخص پراکندگی
میزان پراکندگی و تغییرات دادهها را میتوانیم توسط معیارها و شاخصهای پراکندگی اندازه گیری کنیم. با محاسباتی که میتوانیم در این مدل آماری انجام دهیم، معیار عددی جهت میزان پراکندگی دادهها را بهدست میآوریم. در این بین هرچه مقدار معیار مورد نظر بزرگتر بود نمایانگر پراکندگی بیشتری در بین دادهها خواهیم داشت و بالعکس هرچه مقدار معیار کوچکتر باشد، دادهها نزدیکتر نسبت به یکدیگر خواهند بود. نمونه از محاسبات مربوط به شاخص پراکندگی را میتوانیم با استفاده از دامنهی تغییرات، واریانس، انحراف معیار و ضریب تغییرات بهدست بیاوریم.
شاخص تقارن در توزیع
در شاخص تقارن در توزیع میتوانیم مقایسهای بین اشکال توزیع داده با توزیع استاندارد داشته باشیم. اگر مقادیر شاخص تقارن در توزیع به صفر نزدیک نباشند شاهد عدم تقارن در نمونه و جامعهی آماری خواهیم بود. عدم تقارن در توزیع به شکل افقی و عمودی با استفاده از دو معیار چولگی و برجستگی قابل اندازه گیری هستند.
کلام آخر درباره آموزش آمار توصیفی
در این مطلب بهصورت تخصصی با تعاریف و اصطلاحات آماری آشنا شدیم و کلیهی مفاهیم مورد نظر برای اندازه گیری و سرشماری که برای علم داده نیاز داریم را شناختیم. سپس انواع مدلهای آماری مخصوصاً آمار توصیفی را بررسی کردیم که خود دارای جزئیات و خصوصیات بسیار متعددی میباشد. در ادامه به مهمترین شاخصهای توصیفی مورد نظر در زمینهی بررسی یک نمونه و جامعهی آماری اشاره کردیم که میتواند در آموزش آمار توصیفی به دانشجویان رشتهی آمار و کسانی که به این حوزه علاقه دارند کمک شایانی کند. حال برای اینکه با تمامی معیارها و اندازه گیریهای تخصصی در زمینهی ارائه آمارهای دقیق برای یک نمونه و جامعهی هدف آشنا شوید پیشنهاد میکنیم با استفاده از فیلمهای آموزشی فرادرس به اطلاعات ارزشمندی در این زمینه دست پیدا کنید که توسط اساتید برجسته رشتهی آمار تدریس و تدوین شدهاند و میتواند ادامه دهندهی مسیر شما برای کسب یادگیریهای کاملتر گردد.