خطاهای رایج در استفاده از آمار در تحقیقات علوم اجتماعی – I: تفسیر ضریب همبستگی

[ad_1]

هنگام بررسی بازده تحقیق در علوم اجتماعی ، با وجود استفاده از داده های با کیفیت از نظرسنجی اولیه یا از منابع ثانویه معتبر ، اشتباهات رایج در فرمول بندی ، انتخاب مدل / ها و تفسیر مشهود است. در اینجا سعی شده است تا به سود محققان با چند خطا مقابله شود تا نتایج آنها از اعتبار جامعه برخوردار شود و بعداً برای تدوین سیاست های صحیح مفید واقع شود. در این مقاله ، اشتباهات در تفسیر ضریب همبستگی برای بحث انتخاب شده است.

همبستگی ارتباط خطی و نه علیت را اندازه گیری می کند

همبستگی ارتباط خطی و نه علیت را اندازه گیری می کند. در رابطه با کلمه “رابطه” و “ارتباط” در آمار تفاوت وجود دارد که ممکن است به انگلیسی نباشد. اصطلاح “همبستگی” کلمه “رابطه” را دارد اما باید فقط به عنوان درجه یا قدرت “خطی” “ارتباط” بین هر دو متغیر کمی قابل درک باشد ، و نه به عنوان قدرت “وابستگی یا رابطه” بین دو متغیر. لحظه ای که از کلمه “رابطه” استفاده می کنیم در دام “وابستگی” در میان دو متغیر قرار می گیریم. فرض در همبستگی این است که دو متغیر به طور متقارن رفتار می شوند ، یعنی هر دو متغیر به طور یکسان رفتار می شوند ، آنها نه مستقل هستند و نه متغیرهای وابسته. آنها فقط به عنوان دو متغیر رفتار می شوند و ضریب همبستگی لحظه ای محصول پیرسون یا ضریب همبستگی پیرسون (PCC) یا ضریب همبستگی به سادگی قدرت یا درجه ارتباط خطی بین دو متغیر کمی را اندازه گیری می کند. PCC کوواریانس بین دو متغیر است که بر اساس محصول انحراف معیار دو متغیر تقسیم می شود که بین -1 و 1+ متفاوت است. از این رو استفاده از خرد علمی در انتخاب متغیرها بسیار مهم است ، در غیر این صورت منجر به همبستگی کاذب می شود. استخراج نفت در کشورهای اوپک و تولید ناخالص داخلی کشورهای وارد کننده ممکن است همبستگی زیادی داشته باشد ، اما ممکن است جعلی باشد. رابطه همبستگی نام غلطی است. انجمن مناسب است.

حتی تلفظ همبستگی به عنوان “رابطه مشترک” یا “بهم پیوسته” نیز اشتباه است. همانطور که قبلاً ذکر شد ، حتی اگر کلمه همبستگی کلمه رابطه را داشته باشد ، رابطه را اندازه گیری نمی کند ، بلکه قدرت یا درجه ارتباط خطی بین دو متغیر (قابل اندازه گیری) را اندازه گیری می کند. قابل اندازه گیری فقط به این معنی است که هر دو متغیر باید کمی شوند و می توانند متغیرهای ناپیوسته یا مداوم باشند. به عنوان مثال ، همبستگی بین وزن و قد فقط قدرت ارتباط بین وزن و قد را اندازه گیری می کند و به هیچ نتیجه ای نمی رسد که با افزایش وزن ، قد کاهش یابد یا برعکس. در علوم اجتماعی ، این مثال می تواند درآمد سرانه افراد و تعداد سالهای تحصیل باشد. فرض کنید همبستگی بین این دو مثبت و از نظر آماری معنادار باشد ، این فقط به این معنی است که درآمد سرانه و سالهای تحصیل با هم ارتباط مثبت دارند و به این معنی نیست که با افزایش سالهای تحصیل ، درآمد سرانه افزایش می یابد یا بالعکس. برای اثبات هر یک از این وابستگی ها ، محقق باید از رگرسیون (ساده چندگانه) استفاده کند.

مراحل قبل از همبستگی

قبل از محاسبه PCC ، محقق باید تأیید کند که آیا دو متغیر مورد بررسی در مقیاس فاصله یا نسبت کمی هستند. اگر به عنوان مثال دو متغیر مربوط به رتبه ها باشد ، ضریب همبستگی قابل محاسبه نیست ، در عوض ضریب همبستگی Spearman باید محاسبه شود. برای اطمینان از ارتباط خطی بین دو متغیر ، یک نمودار پراکندگی باید در MS Excel یا هر نرم افزاری مشاهده شود. اگر پراکندگی نشان دهنده ارتباط منحنی است ، بنابراین ضریب همبستگی نباید محاسبه شود. درعوض “نسبت همبستگی” باید محاسبه شود. فقط اگر پراکندگی ارتباط خطی را نشان دهد ، آنگاه ضریب همبستگی لحظه ای محصول پیرسون یا ضریب همبستگی پیرسون (PCC) داده شده توسط کوواریانس بین دو متغیر تقسیم بر محصول انحراف معیار دو متغیر قابل محاسبه است.

تفسیر ضریب همبستگی

پس از محاسبه ضریب همبستگی بین X و Y ، باید از نظر معنی داری آماری با مقایسه مقدار t محاسبه شده با مقدار t جدول در 5٪ یا 1٪ سطح معنی داری و (n-2) درجه آزادی ، که n اشاره دارد ، آزمایش شود. به تعداد جفت مشاهدات X و Y. اگر مقدار t محاسبه شده از مقدار t جدول بالاتر باشد ، ضریب همبستگی از نظر آماری معنادار است و بر این اساس تفسیر می شود به عنوان دو متغیر به طور مثبت مرتبط هستند یا منفی هستند یا اصلاً مرتبط نیستند. به عنوان مثال ، ممکن است علاقه مند به یافتن رابطه (ضریب) بین (1) دفعات استعمال دخانیات و بروز سرطان ریه ، (2) نمره در آمار و امتحان ریاضی ، (3) درآمد سرانه و هزینه سرانه باشد (4 ) بهره وری محصول و آب آبیاری ، (5) نرخ باروری و درآمد سرانه ، (6) مشارکت زنان در کار و درآمد سرانه و غیره. در همه این موارد ، اگر از نظر آماری همبستگی قابل توجهی پیدا کنیم ، تمایل به نشان دادن وجود دارد: سیگار کشیدن باعث افزایش سرطان ریه می شود. از آنجا که داوطلبان در ریاضیات نمره بالایی کسب می کنند ، از نظر آماری نیز نمره بالایی کسب می کنند. با افزایش درآمد سرانه ، نرخ باروری کاهش می یابد و غیره. اما چنین نتیجه گیری هایی اشتباه است زیرا ضریب همبستگی نشان دهنده علیت نیست ، بلکه فقط میزان ارتباط بین دو متغیر را نشان می دهد. از این رو همبستگی به استنتاج اینکه چه عواملی باعث چه چیزی می شود ، کمک می کند و کدام یک از رگرسیون ها است. بنابراین ، برای نتیجه گیری در مورد وابستگی متغیر ، محقق نیاز به اجرای رگرسیون دارد ، و متغیر وابسته را به متغیر مستقل رگرسیون می کند. از این رو قبل از اجرای رگرسیون ، محقق نیاز به فرضیه بندی و نامگذاری متغیر وابسته دارد ، و متغیر (های) مستقل را نام می برد ، یک مدل خطی یا غیرخطی انتخاب می کند و متغیر وابسته را به متغیر (های) مستقل رگرسیون می کند.

درجه آزادی

داشتن درجه آزادی کافی برای همبستگی یا بازگشت به مرحله بسیار حیاتی است. بعضی اوقات همبستگی فقط برای 8 جفت مشاهده محاسبه می شود که در این حالت مقدار جدول “t” در سطح 5 درصد 45/2 است. مگر اینکه مقدار “t” بالاتر از 45/2 محاسبه شود ، پس همبستگی معنی دار نیست. بنابراین داشتن تعداد زیادی مشاهدات برای بدست آوردن برآوردهای قابل اعتماد از نظر آماری بسیار مهم است. در کل پیشنهاد می شود محققین با “همبستگی” اندازه گیری ساده ارتباط بین دو متغیر آشنا شوند.



لینک شده


سلب مسئولیت

نظرات بیان شده در بالا از نظر نویسنده است.



پایان مقاله



Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>