رگرسیون چند گانه پارامتری
اگر درباره نمرات آزمودنی ها در متغیرهای پیش بین هیچ اطلاعی نداشته باشید ( در این حالت ، بهترین حدس این است که میانگین نمره ملاک را در نظر بگیریم ) نسخه های پارامتری رگرسیون چند گانه معمولاً توانایی شما را برای پیش بینی متغیر ملاک افزایش می دهند. روش های تحلیل، این واقعیت را در نظر می گیرند که برخی پیش بین ها ممکن است با یکدیگر همبستگی داشته و اضافی باشند. بنابراین هر متغیر پیش بین معنی دار، اطلاعات منحصر به فرد و غیراضافی فراهم می کند (یعنی اطلاعاتی که با اطلاعات سایر متغیرهای پیش بین متفاوت است). می توان از پیش بینی های دو مقوله ای یا پیوسته استفاده کرد اما در نسخه های پارامتری رگرسیون چندگانه، متغیر ملاکی حتماً باید پیوسته باشد (نسخه های ناپارامتری رگرسیون شامل تحلیل لوجیت و رگرسیون لوجستیک هستند و در قسمت های بعدی توضیح داده می شوند ) . می توان متغیرهای مقوله ای را نیز که بیش استفاده کرد (کوهن و همکاران، ۲۰۰۳). حتی به کمک نسخه های پیچیده تر رگرسیون می توان آثار تعامل بین پیش بین های مختلف را سنجید ( یعنی آیا یک متغیر ، رابطه بین متغیر دوم و متغیر ملاک را تعدیل می کند) . آیکن و وست ( 1996 ) توضیح داده اند که چگونه تعامل ها را در تحلیل های رگرسیون ایجاد، تحلیل و تفسیر کنیم.
[html_block id=”4551″]
انواع مختلفی از رگرسیون وجود دارند. در بیشتر آن ها ابتدا باید متغیرهای پیش بینی را به ترتیب وارد معادله رگرسیون کنید. متغیرهای پیش بینی را می توان تک تک یا در یک یا چند گروه ، وارد معادله رگرسیون کرد . انواع مختلف رگرسیون از این نظر نیز متفاوتند که چگونه هر متغیر پیش بین را آزمون می کنند تا مشخص شود آیا این متغیر می تواند متغیر ملاک را پیش بینی کند .
در رگرسیون چند گانۀ سلسله مراتبی، بر اساس زمینه های نظری یا روش شناختی باید از پیش مشخص کنید متغیر ها به چه ترتیبی باید وارد معادله شوند. در این روش، واریانس اولین متغیر محاسبه می شود، سپس واریانس دومین متغیر محاسبه می شود و غیره . و همچنین می توانید ترتیب ورود زیرمجموعه های همه متغیرها را تک به تک مشخص کنید و سپس زیر مجموعه ها را به ترتیب وارد معادله رگرسیون کنید.
مثلاً یکی از دانشجویان ما قصد داشت بر اساس رضایت زناشویی والدین و کیفیت رابطه والد کودک، رضایت زناشویی را پیش بینی کند. متغیر ملاک او رضایت زناشویی، بود. ابتدا چندین متغیر جمعیت شناختی را (به عنوان یک مجموعه) وارد تحلیل رگرسیون چندگانه سلسله مراتبی کرد. سپس پذیرش اجتماعی را وارد معادله کرد و سرانجام رضایت زناشویی والدین و کیفیت رابطه والد – کودک را (به عنوان یک مجموعه) وارد معادله کرد. دلیل انتخاب این نوع ترتیب وارد کردن متغیرها در معادله این بود که می خواست ویژگی های جمعیت شناختی و تمایل به بهتر نشان دادن خود را در پرسشنامه ها کنترل کند. همچنین می خواست متغیرهای جمعیت شناختی و پذیرش اجتماعی را ثابت نگه دارد و رابطه بین رضایت زناشویی والدین، کیفیت رابطه والد – کودک و رضایت زناشویی را بررسی کند. نتایج نشان داد که رضایت زناشویی والدین و کیفیت رابطه والد-کودک می تواند رضایت زناشویی زوج ها را پیش بینی کند، یعنی این پیش بین ها توانستند اطلاعات بیشتری نسبت به متغیرهای جمعیت شناختی و پذیرش اجتماعی فراهم کنند. با وجود این، او برای ترتیب وارد کردن زیرمجموعه ها در معادله رگرسیون هیچ دلیل خاصی نداشت.
[html_block id=”4551″]
گاهی از رگرسیون چندگانه سلسله مراتبی برای آزمون فرضیه های واسطه ای (میانجی) استفاده می شود. فرضیه های واسطه ای فرضیه هایی هستند که بیان می کند متغیر سومی که « متغیر واسطه ای » نامیده می شود. رابطه بین دو یا چند متغیر را تبیین می کند. مثلا فرض کنید این موضوع را مطرح کرده اید که پیشرفت تحصیلی ضعیف با ترک تحصیل ارتباط دارد و این ارتباط با نگرش منفی دانش آموز نسبت به مدرسه و فقدان ارتباط با معلمان و فعالیتهای مدرسه تبیین می شود. بارون و کنی (۱۹۸۶) و هولم بک (۱۹۹۷) توضیح داده اند که چگونه می توان با استفاده از تحلیل رگرسیون این نوع فرضیه های واسطه ای را آزمون کرد . مک کینون ، لاک وود ، هافمن ، وست و شیتز ( 2002 ) این روش ها را به دلیل کم بودن توان آماری زیر سوال برده اند . با وجود این ها ، آن ها باز هم تحلیل های رگرسیون را به عنوان جایگزین پیشنهاد می کنند .
رگرسیون گام به گام می تواند جایگزین رگرسیون چند گانه سلسله مراتبی باشد . در این روش ، قواعد تصمیم گیری کاملا محاسباتی مشخص می کنند کدام متغیر پیش بین بهتر از دیگر متغیر ها می تواند متغیر ملاک را پیش بینی کند ، سپس متغیر دوم انتخاب می شود و غیره. در حالی که در رگرسیون چند گانه سلسله مراتبی از پیش باید ترتیب ورود متغیر ها را به معادله رگرسیون مشخص کرد . در رگرسیون گام به گام ، کامپیوتر ترتیب ورود متغیرها را مشخص می کند . بنابراین در مثال قبلی که مطرح کردیم دانشجو همه متغیرها را وارد معادله رگرسیون می کند و کامپیوتر مشخص می کند متغیرها به چه ترتیبی می تواند رضایت زناشویی را پیش بینی کنند .
روش های مختلفی برای ترتیب ورود متغیرها به معادله رگرسیون وجود دارند و شما باید تعیین کنید کامپیوتر از کدام روش استفاده کند. این روش ها عبارتند از: وارد کردن وارد کردن گام به گام رو به جلو، حذف روبه عقب (وارونه). بیشتر روش های گام به گام، نه همه آنها، از روش هایی استفاده می کنند که متغیرها را اضافه و حذف می کنند و بررسی می کنند هر متغیر چقدر می تواند متغیر ملاک را پیش بینی کند. نکته مهم این است که تحلیل های رگرسیون را می توان به صورت های مختلف انجام داد. گزینه ها و نیز نظر موافقان و مخالفان را بر اساس اهداف تان از تحلیل ها بررسی کنید و سپس آگاهانه تصمیم بگیرید از کدام روش استفاده کنید.
کوهن و همکاران (۲۰۰۳) عیب های متعدد روش های گام به گام را توضیح داده اند. نخست این که وقتی از پیش بین های زیادی استفاده می شود، این روش به شدت به شانس متکی می شود. دوم این که نتایجی که با استفاده از این روش ها به دست می آیند ممکن است در دومین نمونه گیری تکرار نشوند. سوم این که بسته بسته به قواعد استفاده شده برای وارد و خارج کردن متغیرهای پیش بین، نتایج ممکن است کاملا گمراه کننده باشند. چهارم این که استفاده از روش های گام به گام به این معنی است که مجبور نیستید درباره روابط منطقی بین پیش بین ها و متغیر ملاک فکر کنید. این حالت کمی شبیه به استفاده از تحلیل واریانس و آزمون های تعقیبی برای بررسی بیشتر داده هاست. در حالی که از پیش باید برنامه ریزی و مشخص شود که دقیقاً چه چیزی باید بررسی شود .
ممکن است چنین توجیه شود که روش های گام به گام در شرایط زیر به سادگی میت وانند به کار روند : ۱) هنگامی که نمونه بزرگ باشد ، 2 ) هنگامی که تکرار پژوهش ممکن باشد ( هم با نمونه گیری دوباره با هم تقسیم تصادفی نمونه به دو بخش ) ، ۳) هنگامی که هدف پژوهش بر نظریه مبتنی نیست ( مثلا در برخی پژوهش ها ی کاربردی، هدف پژوهش ممکن است صرفاً پیش بینی پدیده باشد نه تببین آن ، کوهن و همکاران، ۲۰۰۳). تا با چنیک و فیدل (۲۰۰۱) روش های گام به گام را جزء فنون مدل سازی می دانند . آن ها روش های سلسله مراتبی را جزء فنون فرضیه آزمایی می دانند. تحلیل گران زمانی از این روش ها استفاده می کنند که زمینه پژوهشی به اندازه کافی رشد کرده باشد تا بتواند پیش بینی های منطقی انجام دهند.
[html_block id=”4551″]
روش های رگرسیون ، مانند همه آزمون های پارامتری، مفروضه های خاصی دارند که اگر رعایت نشوند ممکن است مشکل به وجود آید. نخست اینکه روش های رگرسیون چندگانه فرض می کنند هم خطی چندگانه وجود ندارد. هم خطی چندگانه زمانی رخ می دهد که دو یا چند متغیر پیش بین، همبستگی بالایی باهم داشته باشند. این موقعیت باعث به وجود آمدن معادله رگرسیون ناپایدار می شود ( (یعنی وزن های هر یک از متغیرهای پیش بین احتمالا در نمونه گیری جدید تکرار نمی شوند). اگر مشکل هم خطی چندگانه وجود داشته باشد، می توانید از بین متغیرهای مرتبط، مهم ترین پیش بین را انتخاب کنید یا در صورت امکان، متغیرهای مرتبط را با هم ترکیب کنید.
دومین مفروضه ای که باید برای استفاده از رگرسیون چندگانه رعایت کنید این است که متغیرهای پیش بین نمی توانند ترکیبی از سایر متغیرهای پیش بین باشند (این موضوع، یکتایی نامیده می شود). به عبارت دیگر، نمی توانید نمرات کتک زدن، ناسزا گفتن، مشت زدن و پرخاشگری کلی را به عنوان پیش بین استفاده کنید زیرا نمره پرخاشگری کلی شامل سه مورد دیگر نیز می شود . سوم این که رگرسیون فرض می کند بین هر پیش بین و ملاک روابط خطی وجود دارد ( از رگرسیون چندگانه می توان برای آزمون تعامل های بین متغیرهای پیش بین نیز استفاده کرد ) . چهارم این که رگرسیون چندگانه فرض می کند در جامعه، توزیع نرمال چند متغیری برقرار است. یعنی نه تنها توزیع نمرات هر پیش بین نرمال است، بلکه توزیع نمرات همه ترکیب های احتمالی پیش بین ها نیز نرمال است. پنجمین مفروضه، هم واريانسى است، یعنی پیش بینی که معادله رگرسیون انجام می دهد در نقاط مختلف خط رگرسیون قابل مقایسه است. خوشبختانه سه مفروضه آخر را می توان با بررسی باقیمانده ارزیابی کرد. تحلیل باقیمانده ها در اصل تفاوت بین نمره ای را که معادله رگرسیون پیش بینی کرده است و نمره واقعی که در داده هایتان پیدا کرده اید نشان می دهد ( تفاوت بین این دو نمره را باقیمانده می نامند ) الگوهای مختلف باقیمانده در نقاط مختلف خط رگرسیون برای مفروضه های رگرسیون چندگانه کاربرد هایی دارند . برای اطلاع از الگوهایی که نشان دهنده وجود مشکل هستند به تاباچنیک و فیدل ( 2001 ) مراجعه کنید .
رعایت مفروضه های رگرسیون چند گانه که در زیر آمده اند دشوار تر است . نخست این که رگرسیون فرض می کند همه پیش بین های مرتبط را وارد معادله کرده اید و هیچ یک از پیش بین ها نامربوطن یستند ( لیچت ، 1995 ) ناتوانی در رعایت این مفروضه ، خطای مشخص سازی نامیده می شود .
هم چنین روش های رگرسیون چند گانه فرض می کنند متغیر ها بدون خطا اندازه گیری شده اند .
رعایت این مفروضه ها غیر ممکن به نظر می آیند : اگر می دانستید چه متغیرهایی با متغیر ملاک مرتبطند و چه متغیر هایی با متغیر ملاک مرتبط نیستند چرا باید پژوهش کنید ؟ ؟ چند متغیر را می توان بدون خطا اندازه گرفت؟ واقعیت این است که هرچند هیچ کس نمی تواند همه مفروضه های رگرسیون را رعایت کند پژوهشگران بازهم از رگرسیون استفاده می کنند. به جای این که مفروضه ها را نادیده بگریم باید فکر کنیم مفروضه ها تا چه حد رعایت شده اند (کلم ، ۱۹۹۵). لیچت ( ۱۹۹۵) پیشنهاد می کند که از نظریه او داده های گذشته برای انتخاب پیش بینی های مناسب استفاده شود و پایاترین و رواترین ابزارها انتخاب شوند تا خطای اندازه گیری کمیته شود.
شما می توانید برای دریافت مشاوره از کارشناسان مجموعه در فرم زیر سفارش ثبت کنید تا همکاران ما در اولین فرصت با شما تماس بگیرند :