تحلیل آماری در علوم اجتماعی

فهرست مطالب

زمان مطالعه: 8 دقیقه

نویسنده: علی رجب‌زاده

نقش آمار توصیفی و استنباطی در تحلیل داده‌های علوم اجتماعی

آمار ابزاری است که به پژوهشگران امکان می‌دهد داده‌ها را خلاصه کنند، ارتباط میان متغیرها را بسنجند و نتایج را از نمونه به کل جامعه تعمیم دهند. در علوم اجتماعی، آمار توصیفی و استنباطی نقشی حیاتی در تحلیل داده‌ها و فهم پدیده‌های اجتماعی ایفا می‌کنند. این مقاله با تمرکز بر توضیح مختصر و کاربردی این دو شاخه از آمار، دانشجویان را با مفاهیم بنیادی آمار در پژوهش‌های علوم اجتماعی آشنا می‌کند.

آمار توصیفی1 ابزاری است که به ما امکان می‌دهد داده‌ها را به شکلی منطقی و منظم توصیف کنیم. به عبارت دیگر، با استفاده از شاخص‌های مرکزی و پراکندگی می‌توانیم ویژگی‌های اصلی یک جامعه آماری را بیان کنیم. برای مثال، محاسبه میانگین درآمد می‌تواند تصویری کلی از وضعیت اقتصادی یک جامعه ارائه دهد یا بررسی تأثیر سطح تحصیلات بر نحوه رأی‌دادن افراد، الگوهای رفتاری آن‌ها را آشکار سازد.

در مقابل، آمار استنباطی2 به پژوهشگران این امکان را می‌دهد که با مطالعه یک نمونه از جامعه، درباره ویژگی‌های کل جامعه نتیجه‌گیری کنند. برای مثال، در پیش‌بینی نتایج انتخابات، با انتخاب یک نمونه‌ی هزارنفری و پرسش از آن‌ها درباره انتخابشان، می‌توان با احتمال بالایی تخمین زد که کدام نامزد بیشترین شانس پیروزی را دارد. آمار استنباطی در واقع در پی «پیش‌بینی» یا «تفسیر» جامعه بر اساس داده‌های نمونه است و نشان می‌دهد که نتایج به‌دست‌آمده تا چه اندازه به واقعیت‌های جامعه نزدیک هستند.

ترکیب آمار توصیفی و استنباطی به پژوهشگران این امکان را می‌دهد که ویژگی‌های جامعه را به‌درستی تحلیل کرده و به نتایجی معتبر و قابل اعتماد دست یابند. این مقاله می‌کوشد تا با ارائه مفاهیم کلیدی و مثال‌های کاربردی، دانشجویان را در مسیر درک و استفاده از آمار در تحقیقات علوم اجتماعی یاری رساند.


آمار توصیفی

در آمار توصیفی، با مفاهیمی از جمله میانگین، میانه و مد دست و پنجه نرم می‌کنیم که به شرح مختصر آن‌ها خواهیم پرداخت؛

۱- میانگین: میانگین3، معیاری است که با تقسیم مجموع مقادیر بر تعداد آن‌ها به دست می‌آید. به‌عنوان مثال، اگر مجموع درآمد فارغ‌التحصیلان علوم انسانی در ایران را بر تعداد آن‌ها تقسیم کنیم، به یک شاخص مرکزی دست می‌یابیم که می‌تواند به توصیف وضعیت کلی این جامعه آماری کمک کند. با داشتن میانگین، می‌توانیم دیدگاهی کلی نسبت به کل داده‌ها به دست آوریم. در واقع، میانگین به نوعی نماینده تمامی داده‌های ما محسوب می‌شود. البته این تنها ویژگی مثبت میانگین نیست؛ بسیاری از تکنیک‌ها و تحلیل‌های آماری به این شاخص مرکزی وابسته‌اند و از آن به‌عنوان مبنایی برای ارزیابی و استنباط استفاده می‌کنند.

با وجود تمام جنبه‌های مثبت، میانگین از ضعف نیز مبرا نیست. یکی از مهم‌ترین ضعف‌های آن، تأثیرپذیری شدید از داده‌های پرت4 است. برای مثال، تصور کنید در نمونه‌ای از فارغ‌التحصیلان علوم انسانی، درآمد اکثر افراد حدود ۲۰ میلیون تومان باشد، اما یک نفر با درآمد ۲۰۰ میلیون تومان در این نمونه حضور داشته باشد. در چنین وضعیتی، اگر تنها به میانگین تکیه کنید، به نتیجه‌ای نادرست خواهید رسید؛ چرا که میانگین به طور چشم‌گیری تحت تأثیر این داده پرت قرار می‌گیرد. به همین دلیل، در مجموعه داده‌هایی که توزیع نرمال ندارند، میانگین نمی‌تواند نماینده خوبی برای توصیف وضعیت کلی داده‌ها باشد و ممکن است نتایج را به بیراهه ببرد.

۲- میانه: اگر در مثال پیشین، درآمدها را از کم به زیاد مرتب کنیم، عددی که دقیقا در میان لیست قرار می‌گیرد همان «میانه5» است. برخلاف میانگین، میانه کمتر تحت تأثیر داده‌های پرت یا چولگی6 قرار می‌گیرد. این ویژگی، میانه را به شاخصی مناسب برای مجموعه‌هایی از داده‌ها تبدیل می‌کند که توزیع نرمال ندارند یا شامل مقادیر نامتعارف هستند. به‌ویژه در داده‌های ترتیبی، میانه به‌خوبی می‌تواند نماینده توزیع باشد.

در عین حال، میانه برخلاف میانگین، در بسیاری از تکنیک‌های آماری به‌کار نمی‌رود. با این حال، در برخی تحلیل‌ها، به‌ویژه زمانی که داده‌ها نرمال نیستند یا حاوی داده‌های پرت‌اند، میانه بسیار مفید است. روش‌های آماری مقاوم7 از میانه و دیگر شاخص‌های مقاوم استفاده می‌کنند، زیرا این شاخص‌ها به‌خوبی در برابر تأثیر داده‌های پرت مقاوم‌اند. علاوه بر میانه، «مد» نیز در تحلیل داده‌های کیفی و اسمی کاربرد دارد و می‌تواند به‌عنوان شاخصی مفید در تحلیل آماری داده‌های دسته‌بندی‌شده مورد استفاده قرار گیرد.

۳- مد (Mode): «مد8» پرتکرارترین مقادیر را به سادگی نشان می‌دهد؛ درست همان‌طور که در زندگی روزمره چیزهایی که در میان دیگران پرتکرار هستند را «مد» می‌نامیم. یکی از ویژگی‌های مثبت مد این است که می‌توان از آن در داده‌های کیفی استفاده کرد. به همین دلیل، در پژوهش‌های افکار عمومی یا تحلیل بازار بسیار پرطرفدار است. با این حال، اگر مجموعه داده‌ها دارای چند مد باشد، دیگر به‌عنوان یک معیار منحصر‌به‌فرد عمل نخواهد کرد.

نکته قابل توجه این است که، همانند میانه، مد در مراحل بعدی تحلیل‌های آماری به کار نمی‌رود و ممکن است مرکز واقعی داده‌ها را نشان ندهد. همچنین، بسته به حجم نمونه یا نحوه دسته‌بندی داده‌ها، مد ممکن است اشکال مختلفی به خود بگیرد که بر تفسیر و تحلیل داده‌ها تأثیرگذار است. البته بر اساس اینکه داده‌ها یک یا چند مد دارند، اطلاعات ارزشمندی برای محقق فراهم می‌شود و همچنین در آزمون‌های غیر پارامتریک کاربرد دارد.

آمار استنباطی

آمار استنباطی از سوی دیگر، در پی پیش‌بینی یا تفسیر جامعه بر اساس نمونه است. در آمار استنباطی، امکان تعمیم از نمونه به جامعه را داریم. با فرض اینکه نمونه، نماینده خوبی برای جامعه باشد، امکان تحلیل جامعه بر اساس تحلیل نمونه برای محقق فراهم است. همچنین یکی از کاربردهای آمار استنباطی، بررسی فرضیه و نظریه‌های موجود در علوم اجتماعی با روش‌هایی مثل آزمون فرضیه9، فاصله اطمینان و تحلیل رگرسیون وجود دارد.

با آمار توصیفی می‌توان ویژگی‌های نمونه را توضیح داد ولی سخن گفتن از علت و معلول مقدور نیست. اگر بخواهیم راجع به جامعه بزنیم و برای مثال نشان دهیم تحصیلات بیشتر با افزایش درآمد در کل جامعه همبستگی دارد، وارد قلمرو آمار استنباطی شده‌ایم. بنابراین، آمار توصیفی مربوط به مراحل اولیه تحقیق است و یک فهم و دانش کلی راجع به اینکه چطور باید از آمار استنباطی استفاده کرد، ارائه می‌کند. بینش‌های حاصل از آمار توصیفی در انتخاب روش و رویکرد ما در آمار استنباطی بسیار موثر است. مثلا در صورت مشاهده چولگی در توزیع داده‌ها، سراغ تکنیک‌های خاصی می‌رویم. پس، با ترکیب آمار توصیفی و استنباطی است که یک پژوهش کامل و معتبر شکل می‌گیرد و هر کدام به تنهایی ناقص هستند.

آزمون‌ فرضیه‌ها

برای ارزیابی اینکه آیا شواهد موجود در نمونه، از یک فرضیه راجع به جامعه حمایت می‌کنند یا نه، از آزمون فرضیه استفاده می‌شود. گام نخست، فرموله‌کردن فرضیه است که شامل دو بخش می‌شود: فرض صفر10 و فرض جایگزین11. فرض صفر معمولاً بیانگر این است که هیچ تفاوت یا رابطه‌ای وجود ندارد، در حالی که فرض جایگزین نشان‌دهنده وجود یک تفاوت یا رابطه است.

پس از تعیین فرضیه‌ها، گام بعدی مشخص‌کردن سطح معناداری12 یا P-Value است. در علوم اجتماعی معمولاً از سطح 0.05 استفاده می‌شود (این عدد وحی منزل نیست بلکه بیشتر به یک توافق در جماعتی از محققان می‌ماند)، که نشان می‌دهد اگر مقدار p کمتر از این عدد باشد، احتمال اینکه نتایج به‌دست‌آمده ناشی از شانس یا تصادف باشند، بسیار پایین است. البته مقدار P-Value کوچک تنها شواهد قوی علیه فرضیه صفر فراهم می‌کند و به‌تنهایی اندازه اثر13 یا اهمیت عملی نتایج را نشان نمی‌دهد؛ اما برای ساده‌سازی می‌توان این طور تعبیر کرد که هرچه مقدار p کمتر باشد، شواهد در تایید فرضیه جایگزین قوی‌تر است.

پس از جمع‌آوری داده‌ها، باید یک آزمون آماری مناسب برای محاسبه مقدار P انتخاب شود. در علوم اجتماعی، آزمون‌هایی مانند آنالیز واریانس (ANOVA) و آزمون T14 به‌طور گسترده استفاده می‌شوند. این آزمون‌ها به محقق کمک می‌کنند تا تفاوت‌ها و روابط میان متغیرها را بررسی کند. به لطف نرم‌افزارهای آماری مانند SPSS یا R، انجام این آزمون‌ها نسبتاً ساده است و تنها نیاز به درک مفاهیم پشت آن‌ها دارد.

در ادامه، برای درک بهتر این مفاهیم، به ارائه یک مثال ساده از فرضیه و آزمون آماری در علوم اجتماعی می‌پردازیم:

فرض کنید می‌خواهیم بررسی کنیم که آیا تحصیلات بالاتر منجر به درآمد بیشتری می‌شود. فرض صفر این است که هیچ رابطه‌ای بین تحصیلات و درآمد وجود ندارد (H0: تحصیلات تأثیری بر درآمد ندارد). فرض جایگزین این است که تحصیلات بر درآمد تأثیر می‌گذارد (H1: تحصیلات تأثیر مثبتی بر درآمد دارد). پس از جمع‌آوری داده‌های لازم، با استفاده از آزمون T یا آنالیز واریانس می‌توانیم مقدار P را محاسبه کنیم و ببینیم که آیا شواهد کافی برای رد فرض صفر و پذیرش فرض جایگزین وجود دارد یا خیر.

یک مثال از فرضیه و آزمون در علوم اجتماعی


تحلیل واریانس

تحلیل واریانس15، آزمونی آماری است که در علوم اجتماعی به منظور وجود یا عدم وجود یک تفاوت معنادار در میانگین سه یا چند گروه مستقل استفاده می‌شود. معمولا، زمانی از این آزمون استفاده می‌شود که یک متغیر مستقل کیفی با بیش از دو سطح(گروه) و یک متغیر وابسته پیوسته وجود داشته باشد. 

یک مثال از تحلیل واریانس 

اندازه اثر چیست و چه اهمیتی دارد؟

اگرچه آزمون معناداری به محقق نشان می‌دهد آیا یافته‌ها و تفسیرش از داده‌ها واقعی هست، این معناداری به‌تنهایی کافی نیست. مقدار P، به حجم نمونه بستگی دارد و با افزایش حجم نمونه، احتمال رسیدن به مقدار P معنادار را نیز افزایش می‌دهد اما معناداری به تنهایی، کافی نیست. در ادامه با ذکر یک مثال، تفاوت معناداری و اندازه‌ اثر را نشان خواهم داد و خواهیم دید که اهمیت گزارش اندازه اثر در پژوهش چیست؟

تأثیر کمک‌های خارجی بر توسعه دموکراتیک

سناریو:
پژوهشگران روابط بین‌الملل در حال بررسی این موضوع هستند که آیا کمک‌های خارجی به توسعه دموکراتیک در کشورهای دریافت‌کننده کمک می‌کند یا خیر. آن‌ها تمرکز خود را بر گروهی از کشورهای در حال توسعه طی یک دوره ۲۰ ساله معطوف کرده‌اند تا ارزیابی کنند که آیا افزایش کمک‌ها با بهبود نهادها و شاخص‌های دموکراتیک مانند انتخابات آزاد، استقلال قضایی و آزادی مطبوعات همبستگی دارد یا خیر.

یافته‌ها

  • معناداری آماری: تحلیل‌ها نشان‌دهنده رابطه آماری معنادار بین کمک‌های خارجی و شاخص‌های توسعه دموکراتیک است، به‌طوری‌که مقدار p-value کمتر از ۰.۰۵ گزارش شده است. این نتیجه به معنای آن است که احتمال اینکه همبستگی مشاهده‌شده بر اساس تصادف باشد، بسیار کم است.
  • اندازه اثر: اندازه اثر محاسبه‌شده نشان می‌دهد که با افزایش ۱۰ درصدی کمک‌های خارجی، شاخص‌های توسعه دموکراتیک ۰.۵ درصد بهبود می‌یابند.

تفسیر و اهمیت اندازه اثر

در حالی که معناداری آماری تأیید می‌کند که ارتباطی بین کمک‌های خارجی و توسعه دموکراتیک وجود دارد، اندازه اثر نشان‌دهنده میزان واقعی این تأثیر است. بهبود ۰.۵ درصدی شاخص‌های دموکراتیک در برابر افزایش ۱۰ درصدی کمک‌ها نشان از تأثیر کم و نسبتاً ناچیز کمک‌های خارجی بر تقویت دموکراسی دارد. این مسئله بیانگر این است که کمک‌های خارجی به‌تنهایی اثر قابل‌توجهی در پیشبرد دموکراسی در کشورهای دریافت‌کننده ندارد. درصورت عدم توجه به مفهوم اندازه اثر، ممکن است پژوهشگر صرفا با توجه به آزمون معناداری از یافته تحقیق خرسند شده و چنین نتیجه بگیرد که میان کشورهایی که کمک خارجی دریافت می‌کنند و آن‌ها که نمی‌کنند تفاوت معناداری وجود دارد؛‌ اما مسئله این است که اگرچه تفاوت معناداری وجود دارد، این تفاوت به قدری ناچیز است که گویی در عمل تفاوتی وجود ندارد. گاهی به جای اندازه اثر، از معناداری عملی نیز یاد می‌شود. برای محاسبه اندازه اثر، پژوهشگران معمولاً تفاوت میانگین یا ضریب همبستگی بین دو گروه یا دو متغیر را به دست آورده و سپس آن را بر انحراف معیار تقسیم می‌کنند. این روش باعث می‌شود تا تفاوت یا رابطه به صورت استاندارد بیان شده و امکان مقایسه نتایج میان مطالعات مختلف فراهم شود. اندازه اثر کوچک نشان‌دهنده رابطه یا تفاوت ضعیف است، در حالی که اندازه اثر بزرگ به معنای رابطه یا تفاوت قوی‌تر است. با این حال، تعریف اینکه چه چیزی یک اندازه اثر کوچک یا بزرگ محسوب می‌شود، به حوزه و شرایط تحقیق بستگی دارد. اندازه اثر، معمولا با d کوهن16 یا ضریب پیرسون17 گزارش می‌شود. 

نتیجه گیری

آمار توصیفی و استنباطی به طور بنیادی با یکدیگر در ارتباط هستند و هر کدام در حوزه تحقیق نقشی حیاتی و مکمل دیگری را بازی می‌کنند. آمار توصیفی به عنوان پایه‌ای اولیه عمل می‌کند و خلاصه‌ای روشن و موجز از داده‌ها ارائه می‌دهد. این نوع آمار با تشریح ویژگی‌های کلیدی مانند تمایل مرکزی و تغییرپذیری(پراکندگی)، زمینه‌ای را برای درک اولیه مجموعه داده‌ها فراهم می‌کند. این تحلیل ابتدایی بسیار مهم است زیرا می‌تواند جهت تحقیقات عمیق‌تر را هدایت و روشن کند. پس از بنا نهادن این پایه‌ها، آمار استنباطی به میدان می‌آید و بر دوش این بینش‌های اولیه می‌ایستد. آمار استنباطی به محققان این توانایی را می‌دهد که بر اساس داده‌های نمونه، دست به پیش‌بینی زنند، فرضیه‌ها را آزمایش کنند و نتیجه‌گیری‌هایی داشته باشند که فراتر از داده‌های ابتدایی، به جمعیت وسیع‌تری اشاره دارند. این پیشرفت از توصیف به استنتاج، در روش‌شناسی اساسی است، زیرا به محققان اجازه می‌دهد تا ابتدا داده‌های خود را درک کرده و سپس از آن درک برای استنتاج نتایجی با دامنه‌ی وسیع‌تر استفاده کنند و در نهایت شکاف میان تحلیل داده‌ها و کاربرد در دنیای واقعی را پر کنند. مفاهیم و تکنیک‌های تحلیل آماری بسیار پیچیده و گسترده هستند و در این نوشتار، به برخی از آن‌ها اشاره شد.


منابع

Cetinkaya-Rundel, M., Diez, D., & Barr, C. (2019). OpenIntro Statistics. (Fourth Edition ed.) OpenIntro, Inc. https://www.openintro.org/book/os/

Freedman, D. (1998). Statistics.

Sirkin, R. M. (2006). Statistics for the Social Sciences. SAGE.

Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications Limited. https://us.sagepub.com/en-us/nam/discovering-statistics-using-ibm-spss-statistics/bo%C3%B4k257672

  1. Descriptive Statistics ↩︎
  2. Inferential Statistics ↩︎
  3. Mean ↩︎
  4. Outliers ↩︎
  5. Median ↩︎
  6. Skewness ↩︎
  7. Robust Statistics ↩︎
  8. Mode ↩︎
  9. Hypothesis Testing ↩︎
  10. Null Hypothesis (H0) ↩︎
  11. Alternative Hypothesis (H1) ↩︎
  12. Significance Level ↩︎
  13. Effect Size ↩︎
  14. T-Test ↩︎
  15. Analysis of Variance ↩︎
  16. Cohen’s d ↩︎
  17. Pearson Correlation Coefficient ↩︎

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مطالب پیشنهادی

ادامه مطلب
image
ادامه مطلب
ادامه مطلب

فهرست مطالب

به اشتراک بگذارید