تحلیل رگرسیون و تحلیل واریانس

دانلود پایان نامه

اطلاعات و داده های مورد نیاز این تحقیق به چند دسته طبقه بندی می شوند. اطلاعات مربوط به پیشینه تحقیقات با مراجعه به کتابخانه ها و پایگا ه های اطلاعاتی داخلی و خارجی گردآوری شد. اطلاعات مالی مربوط به شرکت ها، شامل سود حسابداری، جریان وجه نقد عملیاتی، سرمایه گذاری ها و غیره، از طریق مراجعه به صورت های مالی آنها جمع آوری گردید. اطلاعات مربوط به بازده سهام شرکت ها و بازده بازار نیز از طریق مراجعه به کتابخانه و سایت شرکت بورس اوراق بهادار تهران وپایگاه های داده ای تعبیه شده بدین منظور نظیر تدبیر و ره آورد نوین جمع آوری شد. داده های جمع آوری شده، ابتدا در قالب بانک اطلاعات ذخیره شد و سپس با انتقال این داده ها به نرم افزار EXCEL و SPSS زمینه تجزیه و تحلیل این داده ها و نتایج حاصل از آنها فراهم گردید.
3-8. روش های آماری
در این تحقیق از روش رگرسیون خطی چند متغیره برای برازش مدل ها استفاده گردید. البته در کنار این روش، آزمون هایی نیز انجام شد که در ادامه به طور مختصر توضیح داده می شود.
3-8-1. تحلیل رگرسیون و تحلیل واریانس
پس از برآورد خط رگرسیون لازم است میزان اعتماد به آن نیز محاسبه گردد. مشاهداتی که بر مبنای آن خط رگرسیون برآورد می شود، از نمونه ای به نمونه دیگر متفاوت است. اگر خط رگرسیون جامعه y = α + βx+ εباشد، در این صورت خط رگرسیونی که با توجه به نمونه برآورد می شود، به صورت y=a+bx + e خواهد بود. آماره های a وb به ترتیب برآوردکنندگان پارامترهای α و β می باشند(آذر و مؤمنی، 1385). بنابراینα و β مشخص نیستند و باید در سطح معناداری مشخصی(در این تحقیق 5%) برای هر یک از پارامترهای α و β آزمون فرض صفربودن را انجام دهیم. با استفاده از تحلیل واریانس می توان وجود رابطه خطی بین x و y را آزمون کرد. چنانچه در سطح معنی داری α ،مقدار آماره آزمون(F) از مقدار جدول برای آماره فوق بیشتر باشد، فرض صفر رد می شود و می توان نتیجه گرفت که شیب خط مخالف صفر است. در این تحقیق از تحلیل واریانس برای آزمون معناداری رگرسیون استفاده شد.
3-8-2. آزمون مناسب بودن مدل
برای آزمون مناسب بودن مدل تخمین شده، و یا به عبارتی آزمون نیکویی مدل برازش شده ابتدا این فرض را مطرح می سازیم که مدل، تغییرات y را به صورت معنی داری توجیه نمی کند. برای آزمون فرض مزبور، از آماره F و یا t استفاده می کنیم. اگر در سطح خطای αمقدار آماره F و یا t از مقدار جدول بیشتر باشد، فرض صفر رد می شود و می توان گفت تغییرات توجیه شده توسط مدل مناسب است و یا اینکه رابطه معناداری بین متغیر وابسته ومتغیر مستقل وجود دارد. همچنین اگر سطح معناداری مدل(sigt) کمتر از سطح خطای α باشد، فرض صفر رد و نتیجه بالا استنباط می شود.
3-8-3. آزمون نرمال بودن توزیع متغیرهای وابسته
با توجه به اهمیت نرمال بودن داده ها در تحلیل رگرسیون، پیش از محاسبه ضریب رگرسیون و برازش مدل رگرسیون، باید نرمال بودن متغیر های وابسته(به عنوان یک شرط استفاده از رگرسیون) مورد بررسی قرار گیرد. این کار در این تحقیق از طریق آزمون کولموگروف اسمیرنف و نمودارهای مربوطه آزمون  شد.
3-8-4. آزمون هم خطی بین متغیرها
برای آشکار کردن هم خطی چندگانه، تکنیک های متعددی وجود دارد. یکی از معیارهای تشخیص هم خطی، عامل تورم واریانس(VIF) نام دارد. به طور کلی می توان نشان داد که عامل تورم واریانس برای jامین ضریب رگرسیون عبارت است از:
VIFj=(1-Rj2)-1
که در آن، Rj2 ضریب تعیین چندگانه است. بدیهی است اگر Xj تقریباً به طور خطی با بعضی متغیرهای رگرسیونی دیگر ارتباط داشته باشد، در این صورت Rj2 نزدیک به 1 و VIFj بزرگ خواهد شد که بزرگی بیش از حد آن موجب مشکلات جدی هم خوانی چندگانه می شود. به عبارت دیگر، برای هر جمله مدل، VIF اثر مرکبی از ارتباط بین متغیرهای رگرسیونی روی واریانس آن جمله را اندازه گیری می کند. VIF بزرگ اشاره بر هم خطی چندگانه دارد. تجربیات عملی حاکی از این است که اگر VIF بزرگتر از عدد 5 باشد، معمولاً وجود یک اخطار احتمالی و اگر بزرگتر از 10 باشد، یک اخطار جدی را یادآور می شود و حکایت از آن دارند که ضرایب رگرسیونی مربوطه به علت هم خطی چندگانه به صورت ضعیفی برآورد شده اند.
3-8-5. آزمون استقلال داده ها
برای آزمون استقلال داده ها از آماره دوربین واتسون استفاده  شد. به طور کلی آزمون دوربین واتسون همبستگی سریالی بین باقیمانده های رگرسیون را آزمون می نماید. مقداراین آماره بین0 تا 4 تغییر می کند. اگر همبستگی بین مانده های متوالی وجود نداشته باشد، مقدارآماره باید نزدیک 2 شود.اگرمقدارآماره نزدیک به صفر شود، نشان دهنده همبستگی مثبت بین باقیمانده ها و اگر نزدیک به 4 شود، نشان دهنده همبستگی منفی بین باقیمانده های متوالی است. به طورکلی اگرمقدارآماره بین 1.5 تا 2.5 تغییرکند، نگرانی درمورد استقلال داده ها وجود ندارد.
3-8-6. رگرسیون کاهش یافته
به منظور بررسی همزمان تاثیر متغیرهای موجود در مدل رگرسیون از رگرسیون کاهش یافته استفاده می شود. مدل کامل شامل تمام متغیرها می باشد اما مدل کاهش یافته تنها شامل متغیرهایی است که به دنبال بررسی اثر همزمانی آنها هستیم.
جهت مقایسه دو مدل کامل(F) و کاهش یافته(R)، از مجموع توان دوم خطاها(SSE) یا ضریب تعیین دو مدل استفاده می شود. واضح است (SSE(R) ≥ SSE(F) . زیرا در مدل کامل به علت بیشتر بودن تعداد متغیرها، خطاها کمتر و یا مساوی مدل کاهش یافته است. اگر (SSE(F خیلی کوچکتر از SSE(R) نباشد، بدین معنی است که متغیرهای اضافی در مدل کامل، به کاهش SSE کمکی نمی کند. اگر SSE(F) خیلی کوچکتر از SSE(R) باشد، متغیرهای اضافی می توانند به بهبود مدل کمک کنند. بنابراین آماره ی آزمون(*F) بر مبنای تفاوت SSE(F) و SSE(R) به طریق زیر محاسبه می شود(مومنی و فعال قیومی، 1389):
SSE(F) – SSE(R)
= * F
یا
R2(F)- R2(R)
= * F
df(R)- df(F)

مطلب مشابه :  شرایط اختصاصی