محاسبه ضریب همبستگی پیرسون در متلب به همراه مثال (pearson in matlab)
ضریب همبستگی پیرسون ، یکی از معیار های شباهت می باشد که به بررسی میزان شباهت بین دو آیتم یا بردار می پردازد. در ادامه به نحوه محاسبه ضریب همبستگی پیروسون در متلب می پردازیم.
فرض کنید که میخواهیم معیار پیرسون بین دو بردار زیر را محاسبه کنیم:
برای محاسبه ضریب همبستگی پیروسون در متلب میتوانیم از دستور corr به صورت زیر استفاده کنیم:
به این ترتیب میزان شباهت دو بردار a و b بر اساس معیار پیرسون محاسبه میشود و در x قرار میگیرد.
در مباحث آماری، ضریب همبستگی پیرسون یا ضریب همبستگی حاصلضرب-گشتاور پیرسون ، میزان همبستگی خطی بین دو متغیر تصادفی را میسنجد.
مقدار این ضریب بین ۱- تا ۱ تغییر میکند که:
- «۱» به معنای همبستگی مثبت کامل،
- «۰» به معنی نبود همبستگی،
- و «۱-» به معنی همبستگی منفی کامل است.
این ضریب که کاربرد فراوانی در آمار دارد، توسط کارل پیرسون بر اساس ایدهٔ اولیهٔ فرانسیس گالتون تدوین شد.
ضریب همبستگی پیرسون بین دو متغیر تصادفی برابر با کوواریانس آنها تقسیم بر انحراف معیار آنها تعریف میشود.
برای آشنایی بیشتر با ضریب چگونه محاسبه ضریب همبستگی پیرسون در ویکیپدیا مراجعه کنید.
محاسبه ضریب همبستگی پیرسون در سیستم توصیه گر در متلب
یکی از کاربردهای مهم ضریب همبستگی پیرسون در سیستم های توصیه گر می باشد. در سیستم های توصیه گر فیلتر مشارکتی ، برای محاسبه میزان شباهت دو کاربر از معیار پیرسون استفاده میشود.
برای آشنایی با سیستم های توصیه گر ، حتما مقاله “سیستم توصیه گر یا Recommender System ” را مطالعه کنید.
نکته ای که وجود دارد این است که اگر شما میخواهید از ضریب همبستگی Pearson در سیستم های توصیه گر استفاده کنید ، باید بردار ورودی به دستور corr را اصلاح کنید و آیتم های مشترک بین دو کاربر را فقط در نظر بگیرید.
بعنوان مثال با فرض اینکه دو بردار a و b ای که در بالا تعریف کردیم امتیازات دو کاربر به آیتم های موجود باشد ، اگر شما برای محاسبه معیار شباهت پیروسون در متلب دستور زیر را وارد کنید اشتباه کرده اید:
ضریب همبستگی پیرسون
ضریب
همبستگی پیرسون که به آن همبستگی گشتاوری پیرسون نیز گفته می شود و با
علامت r همواره با کنار نوشت آن که معرف متغیرهایی است که ضریب همبستگی
آنها محاسبه می شود (برای نمونه، rxy که همبستگی بین متغیرهای x و y را
نشان می دهد) نمایش داده می شود به منظور بررسی رابطه بین دو متغیر پیوسته (
فاصله ای یا نسبی) نظیر قد، وزن، نمره آزمون یا درآمد مورد استفاده قرار
می گیرد و میزان تغییرپذیری مشترک بین دو متغیر یا اشتراک آنها را نشان می
دهد. مقدار ضریب همبستگی بین 1+ و 1- در نوسان است. اگر تغییر متغیرها همسو
باشد (هر دو متغیر در یک جهت تغییر کنند و با هر گونه افزایش یا کاهش در
یک متغیر، مقدار دیگر نیز به ترتیب و همسو با آن افزایش یا کاهش یابد)،
همبستگی یا قدار r مثبت بوده و به آن همبستگی مستقیم یا مثبت می گویند. اما
اگر تغییر متغیرها همسو نباشد ( هردو متغیر چگونه محاسبه ضریب همبستگی در جهت عکس هم تغییر کنند و با
افزایش مقدار یک متغیر، مقدار متغیر دیگر کاهش یابد و بر عکس)، همبستگی یا
مقدار r منفی بوده و به آن همبستگی غیرمستقیم یا منفی می گویند. اگر مقدار
به دست آمده برای ضریب همبستگی صفر باشد این بدان معناست که دو متغیر مورد
نظر مستقل از هم هستند و هیچگونه رابطه ای بین آنها وجود ندارد. باید توجه
داشت که مقدار مطلق ضریب همبستگی نشانگر قوت همبستگی است و علامت مثبت یا
منفی تاثیری در این زمینه ندارد.
محاسبه ضریب همبستگی
اشکال
عمده ای که در نمودار پراکندگی وجود دارد این است که با این روش نمی توان
یک شاخص عددی از درجه همبستگی بین متغیرها به دست آورد. برای این منظور،
شاخص های متعددی تدوینه شده است. معروف ترین و در عین حال پر کاربردی ترین
آنها زمانی به کار برده می شود که متغیرهای مورد مطالعه با استفاده از
مقیاس فاصله ای یا نسبی اندازه گیری شده باشد این روش را کارل پیرسون تهیه و
تنظیم کرده است و ضریب همبستگی گشتاوری پیرسون نامیده شده است. در محاسبه
ضریب همبستگی پیرسون، آشنایی با یک شاخص آماری به نام کواریانس که شاخص
بسیار مناسبی برای نشان دادن میزان ارتباط است ضروریست.
ضریب همبستگی پیرسون با نماد r نشان داده می شود.
ضریب
همبستگی پیرسون برای توصیف همبستگی بین دو متغیر که با استفاده از مقیاس
فاصله ای یا نسبی اندازه گیری شده اند به کار برده می شود. متغیرهایی نیز
وجود دارند که نمی توان آنها را به صورت فاصله ای یا نسبی اندازه گیری کرد.
ضریب همبستگی اسپیرمن، صورتی از ضریب همبستگی پیرسون است و زمانی استفاده
می شود که نمره ها، رتبه بندی شده چگونه محاسبه ضریب همبستگی باشند یا به جای اعداد، رتبه های آنها در
دست باشد.
مفروضه های ضریب همبستگی پیرسون
ضریب همبستگی پیرسون که شاخص معتبری برای تعیین رابطه بین متغیرها است دارای مفروضاتی به شرح زیر است:
1- رابطه بین دو متغیر خطی باشد.
2- توزیع ها دارای شکل مشابه باشند.
3- نمودار پراکندگی یکسان باشد.
عواملی که بر ضریب همبستگی تاثیر می گذارند
هنگام
تفسیر ضریب همبستگی، لازم است ماهیت جامعه ای را که دو متغیر در آن مورد
مشاهده یا اندازه گیری شده اند، بررسی کرد. ضریب همبستگی بین دو متغیر از
جامعه ای به جامعه دیگر فرق می کند زیرا:
1- اساس رابطه، از جامعه ای به جامعه دیگر فرق می کند
2- پراکندگی متغیرها در جوامع مختلف متفاوت است
3- همبستگی بین دو متغیر می تواند تحت تاثیر همبستگی آنها با متغیر سومی قرار بگیرد
تفسیر ضریب همبستگی
ضریب
همبستگی جهت و شدت رابطه بین دو متغیر را نعیین می کند. گرچه این این ضریب
به صورت اعشاری بیان می شود اما تفسیر آن باید بر حسب درصد باشد. ضریب
همبستگی 0.7 ، هفتاد درصد
از رابطه بین متغیر ها را تبیین نمی کند. ضریب چگونه محاسبه ضریب همبستگی همبستگی را نمی توان به صورت
نسبت مورد مقایسه و تفسیر قرار داد. مثلا نمی توان گفت که ضریب همبستگی 0.9 دقیقا دو برابر ضریب 0.45 است.
ضریب تعیین
ضریب
همبستگی اندازه همبستگی بین دو متغیر را نشان می دهد اما این شاخص درباره
ماهیت این همبستگی اطلاعات زیادی به ما نمی دهد. آنچه این شاخص مشخص می
کند، وجود همبستگی بالا و یا پایین بودن نسبی آن است.
به دست آوردن اطلاعات کامل تر درباره همبستگی، وقتی امکان پذیر است که شاخص دیگری به نام “ ضریب تعیین “
محاسبه شود که چگونه محاسبه ضریب همبستگی این ضریب به صورت مجذور ضریب همبستگی ضرب در صد، محاسبه می
شود. با محاسبه این ضریب می توان تعیین کرد که چند درصد از کل واریانس یک
متغیر ناشی از واریانس متغیر دیگر است.
یک
روش دقیق برای تفسیر ضریب همبستگی ، استفاده از ضریب تعیین است. ضریب
تعیین درصدی از واریانس یک متغیر است که توسط واریانس متغیر دیگر تبیین می
شود. باری تعیین دقیق این امر که چه میزان از واریانس یک متغیر توسط
واریانس متغیر چگونه محاسبه ضریب همبستگی دیگر تبیین می شود، می بایست ضریب همبستگی محاسبه شده را
مجذور نماییم. عدد به دست آمده از این مجذور کردن، ضریب تعیین است.
کتاب “احتمالات و آمار کاربردی در روان شناسی و علوم تربیتی” نوشته “دکتر علی دلاوری”
دکتر خلیل میرزایی، پژوهش، پژوهشگری و پژوهشنامه نویسی، انتشارات جامعه شناسان، تهران،
برای انجام این آزمون، می توانید به قسمت آموزش SPSS همین وب سایت، مراجعه فرمایید.
جدول ضریب همبستگی در ایویوز
جدول ضریب همبستگی در ایویوز،جدول دیگری که علاوه بر جدول آماره های توصیفی در پروژه ها گزارش می شود جدول ضریب همبستگی در نرم افزار ایویوز است.
مفهوم همبستگی چیست؟( جدول ضریب همبستگی در نرم افزار ایویوز )
جدول ضریب همبستگی در ایویوز،همبستگی به این معناست که دو یا چند متغییر باهم وابستگی دارند،همبستگی عددی بین یک و منفی یک است و ارتباط خطی دو متغییر باهم را بیان می کند.
در صورتی که همبستگی یا کورولیشن برای دو متغییر عدد مثبت یک باشد به این معناست که دو متغیر با هم همبستگی شدید مستقیم دارند.
اگر همبستگی یا کورولیشن برای دو متغییر عدد منفی یک باشد دو متغیر با هم همبستگی شدید عکس دارند.
اگر هم بستگی عددی چگونه محاسبه ضریب همبستگی بیش تر از ۰٫۷ یا ۰٫۶ مثبت یا منفی باشد معمولا با هم خطی رو برو هستیم.
آزمونی که برای تشخیص هم خطی در آمار برای دو متغیر استفاده می شود آزمون پیرسون است.
برای بدست آوردن ضریب همبستگی از فرمول زیر استفاده می شود.
فرمول ضریب همبستگی(جدول ضریب همبستگی در ایویوز)
فرمول ضریب همبستگی
تشریح فرمول ضریب همبستگی
جدول ضریب همبستگی در ایویوز در فرمول بالا ضریب همبستگی برابر است با کوواریانس دو متغیر تقسیم بر ضرب واریانس های دو متغیر است.
بدست آوردن جدول ضریب همبستگی در نرم افزار ایویوز
ابتدا متغیرهایی که می خواهیم ضرایب همبستگی دو به دوی آن ها را بررسی کنیم را انتخاب می کنیم و به صورت گروه ی باز می کنیم
در مرحله بعد از آدرس زیر:
View/Covariance Analysis
در پنجره ی باز شده تیک گزینه ی Correlation و احتمال (Probability) را فعال می کنیم.
بررسی خروجی جدول ضریب همبستگی در ایویوز:
ضریب همبستگی هر متغیر با خودش عدد یک است.
برای مثال در تصویر بالا بین
با توجه به تعداد نمونه ها ضریب همبستگی برابر ۰٫۹۳ می باشد و در سطح ۱ درصد معنادار است.
با لینک زیر می توانید به صفحه ی آموزش نرم افزار ایویوز رایگان،جامع و گام به گام EViews بروید.
از طریق آیکون زیر برای تماس مستقیم تلفنی به منظور سفارش تحلیل و مشاوره با امور پشتیبانی اقدام نمایید.
دیدگاه شما