بسم ال الرحمن الرحيم جامعة مؤتة كلية العلوم التربوية
بحث في التحليل الحصائي SPSSبعنوان : تحليل الحنحدار المتعدد Multiple Regression مقدم للدكتور : دوخي عبدالرحيم حنيطي مقدم من الطالب : سامي البلوي 2007/2008
تحليل النحدار المتعدد : Multiple Regression
• النحدار المتعدد أسلوب إحصائي يمكننا من التنبؤ بدرجة الرد في أحد المتغيرات بناء على درجاته في عدد من المتغيرات ,ويمكن إيضاح ذلك بمثال ,لنفرض مثل أننا نريد التنبؤ بالرضا المهني للفرد ,فبالطبع هناك عدد من المتغيرات التي تسهم في الرضا المهني مثل الراتب ,العمر ,سنوات الخبرة ,المستوى الجتماعي – القتصادي ,وعندما تتوفر البيانات عن هذه المتغيرات لمجموعة من الفراد وباستخدام تحليل النحدار فإننا نستطيع ان نحدد أي من هذه المتغيرات لمجموعة من الفراد وباستخدام تحليل النحدار فإننا نستطيع أن نحدد أي من هذه المتغيرات أكثر إسهاما في الرضا الوظيفي أو المهني للفرد ,فمن الممكن مثل أن يكون نوع الوظيفة ,الراتب سنوات الخبرة بينما ل تسهم المتغيرات الخرى بقدر يذكر في التنبؤ بالرضا ,وبالطبع نطلق على المتغيرات التي نستخدمها في التنبؤ بالمتغيرات المستقلة والمتغير الذي يراد التنبؤ به بالمتغير التابع .
ويجب التنبه إلى انه يمكننا الستخدام هذا اللسلوب في حالة توافر الشروط التالية :
إن العلةقة خطية بين المتغير المستقل والتابع ) أو المحك المراد التنبؤ به ( . المتغير التابع أو المحك المراد التنبؤ به ل بد أن تكون درجاته متصلة ) أي في مستوى المسافة على الةقل ( . المتغيرات المستقلة التي نستخدمها في التنبؤ يمكن أن تكون في المستوى الرتبي أو المسافة ,ومن الممكن إدخال متغيرات في المستوى المسمي بشرط أن تتضمن فئتين فقط مثل متغير النوع حيث يضم فئتين فقط هما الذكور والناث . تحليل النحدار المتعدد يتطلب حجم عينة كبير حيث يقترح البعض أن يكون حجم العينة عشرة أضعاف عدد المتغيرات المستقلة ,وآخرون يقترحون أن يكون الحجم أربعون ضعف عدد المتغيرات .
طرق اختيار المتغيرات : Selection Method
هناك طرق مختلفة يتم بها تقييم السهام النسبي لكل من المتغيرات المستقلة في المتغير التابع أو المحك ,ويمكن توضيح هذه الطرق على النحو التالي : (1الطريقة المتآنية ) Simultaneous :والتي يضع لها البرنامج مصطلح ( Enterيحدد الباحث فيها مجموعة المتغيرات المنبئة التي تشكل النموذج ,ويتم تقييم النموذج على هذا الساس في التنبؤ بالمتغير المحك . (2الطريقة الهرمية Hierarchical : وفيها يتم إدخال المتغيرات إلى النموذج طبقا لترتيب محدد ,وهذا الترتيب يعكس بالضرورة بعض العتبارات النظرية أو النتائج السابقة ,وإذا لم يكن هناك مثل هذه السس أو النتائج التي يستند إليها الباحث في ترتيب دخول المتغيرات فل يمكن العتماد على هذه الطريقة ,وبالطبع يتم تقييم مستوى إسهام كل متغير عند إدخاله إلى النموذج وذا لم يكن إسهامه له دللة جوهرية في زيادة تنبؤية النموذج فيتم حذفه . (3الطرق الحصائية Statistical : وفي هذه الطرق ,فان إدخال المتغيرات أو حذفها من النموذج يتحدد بناء على مقدار قوة الرتباط بينها وبين المحك أو المتغير التابع .
وهناك أكثر من نوع في هذه الطريقة يطلق عليها : الختيار المتقدم الختيار الراجعBackward Selection والختيار متعدد الخطوات .Stepwise Selection Forward Selection
وفي الختيار المتقدم : Forward يقوم البرنامج بإدخال المتغير واحد واحدا ا في كل مرة ويتحدد ترتيب إدخال المتغيرات بناء على قوة الرتباط مع المحك ويتم تقييم النموذج عند إضافة كل متغير والتي ل تسهم بشكل جوهري يتم إسقاطها أو حذفها .
وفي الختيار الراجع
Backward
:
يقوم البرنامج بإدخال كل المتغيرات إلى النموذج ثم يتم حذف اضعف المتغيرات أو اقلها إسهاما أو اقلها ويتم تقييم النموذج بعد الحذف ,وإذا أدى ذلك إلى إضعاف القدرة التنبؤية للنموذج يعاد إدخال المتغير وإذا لم يتأثر النموذج يتم حذف المتغير ويتم تكرار هذه الجراءات حتى يصل البرنامج إلى أفضل مجموعة من المتغيرات المنبئة .
وفي الختيار متعدد الخطوات
Stepwise
:
وتعتبر اعقد الطرق الحصائية ,وفيها يتم إدخال كل واحد من المتغيرات بالتتابع ويتم تقييم إسهامه ,فإذا أسهم المتغير إلى النموذج يتم الحتفاظ به ,ولكن يتم تقييم أو اختبار المتغيرات الخرى للوقوف على إسهامها في النموذج فإذا لم يعد لها السهام الجوهري يتم حذفها .ولهذا فان هذه الطريقة تنتهي بأقل مجموعة من المتغيرات التي تسهم في النموذج . بالضافة إلى الطرق المتآنية Enterوالمتعددة الخطوات والمتقدمة والراجعة فان البرنامج يقدم أيضا طريقة الحذف Removeوفيها يتم حذف المتغيرات من النموذج في شكل مجموعات . Blocks
اختيار الطريقة الملئمة :
أي هذه الطرق يمكن اختيارها ؟ بالطبع يعتمد ذلك على النظرية التي يعتمدها الباحث ,فإذا لم يكن هناك نموذج نظري في ذهن الباحث وكان حجم العينة صغير نسبيا ا فان الطريقة المتآنية Enterتكون أكثر ملئمة وفي المقابل فان الطرق الحصائية يجب استخدامها بحذر حيث يلزم أن يكون حجم العينة كبيرا .ومن ناحية أخرى توجد ميزة كبيرة للطريقة متعددة الخطوات حيث تنتهي بأقل عدد من المتغيرات الذي يحتاج إليه النموذج للتنبؤ بالمحك .
•خطوات إجراء تحليل النحدار المتعدد : تتم الخطوات على النحو التالي :
Analyze-
Regression Linear
فتظهر نافذة الحوار التالية :
وبالنافذة ما يلي : المتغير التابع المتغير أو المتغيرات المستقلة
Dependent Independent
ويمكن إدخال أكثر من مجموعة من المتغيرات المستقلة كل مجموعة تدخل ضمن Blockله رقم مسلسل ,ويمكن النتقال من مجموعة Blockإلى أخرى بالزرين التالي Nextواللحق , Previous فإذا كان لدينا نموذجين لحدهما متغير مستقل Xوالنموذج الخر له متغير مستقل Zمع متغير تابع واحد هو Yلكل النموذجين ففي هذه الحالة يتم إدخال Xفي , Block1والمتغير Zفي . Block2
: Methodنوع الطريقة المستخدمة في اجراء نموذج النحدار والطريقة المعتادة هي . Enter
:Selection Variableيستخدم في تحديد التحليل لمجموعة معينة من الحالت التي لها ةقيمة معينة لمتغير الختبار ,مثل اجراء نموذج النحدار للذكور فقط دون الناث في متغير النوع ويتم التحديد عن طريق زر ) لتحديد الرمز أو القيمة المستخدمة للذكور ( . Rule
: Case Lablesنستخدم الرموز في احد المتغيرات كعناوين في الرمسم البياني . Scatter plots
ويوجد اسفل النافذة الزرار التية نتناولها فيما يلي :
Wls , Staticstics , Plots , Save , Options
الزر : Wlsويهدف الى استخدام طريقة Wlsأي طريقة المربعات – Weighted Least squaresالصغرى الموزونة ويوضع متغيير عددي يحتوي على اوزان معينة يتم استخدامها كما سبق ايضاح ذلك :
-الزر :الحصاءات
Staticstics
وبالضغط عليه تظهر النافذة التالية :
وبها المؤشرات الحصائية التالية : معاملت النحدار وتشمل وتعرض لتقديرات معالم نموذج النحدار ,واختبار “ ت " estimates ومعاملت بيتا وغيرها . Confidence intervals مستويات الثقة أي مستوى الدللة Covariance matrix مصفوفة التغاير لمعاملت النحدار Regression Coefficients
: Descriptive احصاءات وصفية تشمل عدد الحالت ,المتوسط والنحراف المعياري لكل متغير ,وكذلك مصفوفة ارتباط بين المتغيرات ملئمة النموذج .
موائمة النموذج ) ( Model fit حيث يتم عرض معاملت او مؤشرات حسن المطابقة او الموائمة Goodness of Fitللمتغيرات التي يتم ادخالها او اخراجها من النموذج , وتعرض المؤشرات :معامل الرتباط المتعدد , Rومعامل التحديد , R2 وجدول تحليل التباين .
التغير في قيم معامل التحديد
Rsquared
التغير في قيم معامل التحديد
Part and Partial
ومعاملت الرتباط الجزئية
Correlation’s Collinearity diagnostics
يهدف اختبار احد المشكلت الهامة في تحليل النحدار ويطلق عليها التعدد الخطي أو الخطية بين المتغيرات المستقلة . البواقي
Residuals
اختبار دربن – واطسون لحساب Durbin – Watsonالرتباط التسلسليللبواقي ويعرض ملخصا ا للحصاءات عن البواقي ،والقيم المنبئة ،والبواقي المعيارية .
الزر التالي في النافذة هو الرسم البيانيتظهر النافذة التالية :
Plots
وبالضغط عليه
الرسوم البيانية تساعد في اختبار صدق الفتراضات الساسية مثل العتدالية والخطية وتجانس التباين ،وكذلك تفيد في الكشف عن الحالت أو الدرجات المتطرفة في التوزيع . وبالنافذة السابقة يوجد ما يلي : رسم بياني لمخطط شكل النتشار – Scatter plots حيث يسمح بتحديد أكثر من رسم لمخططات النتشار في الخانات X , Y ويمكن التحول بينهما بالزرين Previous , nextويمكننا من رسم شكل النتشار بين أي اثنين من التي :المتغير التابع ،القيم المنبئة ، Predicted Valuesالبواقي ،البواقي المحذوفة ،القيم المنبئة المعدلة ، Adjustedالبواقي المعيارية Standardizedويمكنك عمل رسم لشكل النتشار بين البواقي مع القيم المنبئة لختبار الخطية وتجانس التباين
عمل كل رسوم النتشار الجزئية
plots produce all partial
وتعني أنه يمكننا من عمل رسوم النتشار بين البواقي لكل متغير مستقل مع البواقي للمتغير التابع عندما يجري النحدار لهما بشكل مستقل عن المتغيرات الخرى ولكن على القل لبد من وجود متغيرين مستقلين في المعادلة حتى يمكن الحصول على شكل النتشار في هذه الحالة .
ٍ:standardized residual plots شكل النتشار للبواقي المعيارية من الممكن خلل هذا الختبار الحصول على : :Histogram مدرج تكرار حيث يمكن الحصول على مدرج تكراري للبواقي المعيارية وتخطط النتشار الجتماعي العتدالي : Normal probability plot يمكننا من مقارنة توزيع البواقي المعيارية مع التوزيع العتدالي. وتجدر الشارة إلى أن كل أشكال النتشار تكون معيارية وعند تحديد شكل النتشار المطلوب يظهر معه ملخص بالحصائات للقيم المنبئة والبواقي ويشار اليهما ويشاراليهما )وكذلك القيم المنبئة (Pred , Resid بالختصارات ( ( Zprel , Zresid
الزر التالي في نافذة الحوار هو :حفظ وبالضغط عليه تظهر النافذة التالية :
save
يمكن هذا المر المستخدم من حفظ القيم المنبئة البواقي والحصاءات الخرى المفيدة في صورة متغيرات جديدة وتتضمن ما يلي : القيم المنبئة predicted values -
وهي عبارة عن القيم التي ينبأ بها نموذج النحدار لكل قيمة أو درجة. وتشمل غير المعيارية والمعيارية المعدلة الخطأ المعياري لمتوسط المنبئات – predictions
-Unstandardized - Standardized -Adjusted S.E. of mean
*Distances وهي مقاييس تهدف إلى تحديد القيم أو الدرجات التي تشمل على تجمعات غير عادية للمتغير المستقل وكذلك الدرجات التي لها تأثير كبير على نموذج النحدار ,وتقدم الختبارات لتحديد ذلك وتشمل Mahalanobis Cooks , Leverageالفئات التنبؤية - Prediction Intervals
الفئات التنبؤية
Prediction intervals
وتقدم الحدود العليا والدنيا لكل من فئات المتوسط والدرجات الفردية المنبئة وتمكن المستخدم من تحديد مستوى الدللة أو الثقة Confidence . Interval
البواقيResiduals وهي عبارة عن الفرق بين قيم ودرجات المتغير التابع والقيم المنبئة الناتجة عن نموذج النحدار
وتوجد الختيارات التالية لشكال الحصول على البواقي: غير معيارية معيارية وفقا للتوزيع الحتمالي ستيودنت المحذوفة المحذوفة وفقا للتوزيع الحتمالي الحصاءات المؤثرة
Unstandardized Standardized Studentized Deleted Deleted Studentized Influence Statistics
وتشمل ما يلي:
التغير في معاملت النحدار )) DFBeta (sوالقيم المنبئة ) (DFFITالتي تنتج عن استبعاد درجة معينة وكذلك المعاملت المعيارية DFBetaوالقيم المنبئة المعيارية Df Fit يتيحها البرنامج وكذلك نسبة التغاير Covariance ratioوهي تمثل نسبة التحديد في مصفوفة التغاير لدرجة معينة مستبعدة إلى معامل التحديد لمصفوفة التغاير التي تضم كل الدرجات DfBeta Standardized Df Beta DfFit Standardized Df Fit Covariance ratio
* الزر الخير في النافذة الحوار هو زر الخيارات عليه تظهر النافذة التالية :
option
وبالضغط
وتحتوي النافذة على الخيارات التاليه :
Stepping Method Criteria -
محكات طريقه التخطى ويستخدم هذا الختبار عند امستخدام طريقه الختيار المتقدم forwardوطريقه الختيار الراجع back wardاو طريقه متعدد الخطوات stepwiseفي انتقاء المتغيرات حيث ان المتغيرات يتم اضافتها او حذفها من النموذج بالعتماد على دللة النسبه الغائية Fاو على ةقيمة Fذاتها .القيم المضافة او المحذوفة لبد وان تكون اكبر من الصغر وتكون اةقل من او تساوي واحد وةقيمه الدخال entryلبد ان تكون اةقل من ةقيمه الحذف use probability of F اعتمادا على مستوى دللة ف remova1 entry ويلزم تحديد الدخال والحذف use of F valueويلزم ايضأ تحديد ةقيمتى العتماد على ةقيمه ف ذاتها الدخال والحذف – entry removalويوجد بالنافذة كذلك اختيار تضمين ةقيمه الثابت في معادلة النحدار include constant in equation
ويوجد أيضا بالنافذة اختيارات خاصة بتحديد كيفيه التعامل مع القيم الناقصة missing valuesوهي تشمل على نفس الختيارين السابق الشارة إليهما في الختبارات السابقة كافة وهما: .Exclude Cases Listwise.Exclude Cases Pairwise-
بالضافة إلى اختيار إحلل المتوسط مكان القيم الناقصة 0
Replace with mean
خطوات الجراء :
أدخل البيانات الملحقه ) ( Regression Data افتح نافذة الحوار الخاصة بتحليل النحدار كما إيضاح خطوات ذلك . انقل المتغيرات ، Age ، Reading ،Score Reading ،Spelling Score إلى خانة . Independent انقل المتغير Correct Spellingإلى خانة Dependent. حدد الختيارات التي تحتاج إليها ثم اضغط على . Ok
للحصول على ) ( Regression Dataاضغط هنا الخطوات السابقه للتنفيذ
ثم اتبع
لتحصل على النتائج كما تبين النوافذ التالية : وقد تم إجراء التحليل مرتين الولى باستخدام طريقة والثانية باستخدام طريقة . Stepwise نماذج للنتائج التي يتم الحصول عليها من تحليل النحدار . Descriptive Statistics N 51 51 51 51
Std. Deviation 23.7877 7.5790 20.8194 17.4393
Mean 58.0588 92.8627 88.4118 95.5686
% correct spelling Age in month Reading age Reading score
Correlations
Pearson Correlation
Sig. (1-tailed)
N
% correct spelling Age in month % correct spelling 1.000 -.020 Age in month -.020 1.000 Reading age .625 .126 Reading score .749 -.350 % correct spelling . .445 Age in month .445 . Reading age .000 .190 Reading score .000 .006 % correct spelling 51 51 Age in month 51 51 Reading age 51 51 Reading score 51 51
Reading age .625 .126 1.000 .687 .000 .190 . .000 51 51 51 51
Reading score .749 -.350 .687 1.000 .000 .006 .000 . 51 51 51 51
Variables Entered/Removedb Model 1
Variables Entered Reading score, Age in month, Reading a age
Variables Removed
Method
.
Enter
a. All requested variables entered. b. Dependent Variable: % correct spelling
Model Summary Model 1
R R Square .792a .628
Adjusted R Square .604
Std. Error of the Estimate 14.9636
a. Predictors: (Constant), Reading score, Age in month, Reading age
ANOVAb Sum of Model Squares 1 Regression 17769.132 Residual 10523.691 Total 28292.824
df
Mean Square 3 5923.044 47 223.908 50
F 26.453
a. Predictors: (Constant), Reading score, Age in month, Reading age b. Dependent Variable: % correct spelling
Sig. .000a
Coefficientsa
Model 1
(Constant) Age in month Reading age Reading score
Unstandardized Coefficients B Std. Error -129.432 38.930 .834 .354 2.908E-02 .166 1.125 .210
a. Dependent Variable: % correct spelling
Standardi zed Coefficien ts Beta .266 .025 .824
t -3.325 2.359 .175 5.364
Sig. .002 .023 .862 .000
Descriptive Statistics % correct spelling Age in month Reading age Reading score
Mean 58.0588 92.8627 88.4118 95.5686
Std. Deviation 23.7877 7.5790 20.8194 17.4393
N 51 51 51 51
Correlations
Pearson Correlation
Sig. (1-tailed)
N
% correct spelling Age in month Reading age Reading score % correct spelling Age in month Reading age Reading score % correct spelling Age in month Reading age Reading score
% correct spelling 1.000 -.020 .625 .749 . .445 .000 .000 51 51 51 51
Age in month -.020 1.000 .126 -.350 .445 . .190 .006 51 51 51 51
Reading age .625 .126 1.000 .687 .000 .190 . .000 51 51 51 51
Reading score .749 -.350 .687 1.000 .000 .006 .000 . 51 51 51 51
a Varia bles Ente re d/Removed
Model 1
Variables Entered
Variables Removed
Reading score
.
Age in month
.
2
Method Stepwise (Criteria: Probabilit y-of-F-to-e nter <= .050, Probabilit y-of-F-to-r emove >= .100). Stepwise (Criteria: Probabilit y-of-F-to-e nter <= .050, Probabilit y-of-F-to-r emove >= .100).
a. Dependent Variable: % correct spelling
Model Summary Model 1 2
R R Square .749a .561 .792b .628
Adjusted R Square .552 .612
Std. Error of the Estimate 15.9244 14.8117
a. Predictors: (Constant), Reading score b. Predictors: (Constant), Reading score, Age in month
ANOVAc Model 1
2
Regression Residual Total Regression Residual Total
Sum of Squares 15867.101 12425.723 28292.824 17762.246 10530.578 28292.824
df
Mean Square 1 15867.101 49 253.586 50 2 8881.123 48 219.387 50
a. Predictors: (Constant), Reading score b. Predictors: (Constant), Reading score, Age in month c. Dependent Variable: % correct spelling
F 62.571
Sig. .000a
40.482
.000b
Coefficientsa
Model 1 2
(Constant) Reading score (Constant) Reading score Age in month
Unstandardized Coefficients B Std. Error -39.564 12.541 1.021 .129 -132.719 33.774 1.154 .128 .867 .295
a. Dependent Variable: % correct spelling
Standardi zed Coefficien ts Beta .749 .846 .276
t -3.155 7.910 -3.930 8.995 2.939
Sig. .003 .000 .000 .000 .005
Excluded Variablesc
Model 1 2
Age in month Reading age Reading age
Beta In .276a .209a .025b
t 2.939 1.636 .175
Sig. .005 .108 .862
Partial Correlation .391 .230 .026
a. Predictors in the Model: (Constant), Reading score b. Predictors in the Model: (Constant), Reading score, Age in month c. Dependent Variable: % correct spelling
Collinearit y Statistics Tolerance .877 .529 .376
المـــــراجـــــــع (1ابو سريع ,رضا.( 2004).تحليل البيانات باستخدام برنامج , spssدار الفكر,عمان. (2البشير ,سعد,(2003).دليلك الى البرنامج الحصائي, spssالمعهد العربي للتدريب والبحوث الحصائية ,العراق