تعريف الانحدار Regression
الإنحدار أو يسمى التنبؤ Prediction وهو تقدير القيمة المستقبلية لمتغير واحد بناءً على معرفة قيم متغير أو أكثر.
الانحدار له تطبيقات كثيرة في التعلم الآلي Machine Learning وعلوم البيانات، نقدم في هذه المقالة مقدمة بسيطة عن المفهوم الرياضي للانحدار.
أنواع الانحدار
1) الإنحدار الخطي البسيط Simple Linear Regression تشير تسمية هذا المعامل “بسيط” الى أنه يتضمن متغير تابع y يعتمد على متغير واحد مستقل x وكلمة خطي تشير إلى أن العلاقة بين المتغيرين y و x هي علاقة خطية.
2) الإنحدار المتعدد Multiple Linear Regression هذا النوع من الإنحدار يتضمن إعتماد المتغير y على أكثر من متغير مستقل مثل x1 و x2 … الخ.
3) الانحدار غير الخطي Non-Linear Regression إذا كانت العلاقة بين المتغير y والمتغيرات المستقلة غير خطية مثل علاقة أسية أو لوغاريتمية أو تربيعية … الخ. وهنالك أنواع أخرى مثل الإنحدار الهرمي Hierarchical Regression والإنحدار التدريجي Stepwise Regression وغيرها.
الإنحدار الخطي البسيط Simple Linear Regression
الانحدار الخطي البسيط هو أداة إحصائية تستعمل لبيان العلاقة بين متغيرين كميين بحيث يمكن توقع قيمة المتغير التابع (y) Dependent variable غي المسيطر عليه من المتغير المستقل (x)Independent variable المسيطر عليه. على سبيل المثال، إذا كان الباحث يعرف العلاقة بين إنفاق أسرة ما وبين عدد أفرادها في مدينة ما فإنه يمكنه التنبؤ بالاستهلاك الشهري عن طريق الإنحدار الخطي البسيط بمجرد تحديد عدد الأفراد، بصورة عامة يستعمل الإنحدار للأغراض الآتية:
1) تعد هذه الطريقة تقنية نمذجة وتحليل البيانات العددية.
2) إستغلال العلاقة بين متغيرين التنبؤ بقيم أحد المتغيرات من خلال قيم المتغير الأخر.
3) التنبؤ وتقدير وإختبار فرضية نمذجة العلاقات السببية.
هناك العديد من نماذج الانحدار قد يصل عددها الى ما يقرب من مئات النماذج ولكن النموذج الأكثر أهمية والأكثر شيوعاً في الاستعمال هو نموذج الانحدار الخطي بسيط، في هذا النموذج يوجد لدينا المتغير التابع y المعروف أيضاً باسم متغير الإستجابة والمتغير المستقل x المعروف أيضاً باسم المتغير المتنبئ، ويمكن ذكر النموذج على النحو التالي:
Y = a + bx + e
حيث:
y : المتغير التابع.
x : المتغير المستقل.
a : ثابت الإنحدار وهو الجزء المقطوع من المحور العمودي y الذي يعكس قيمة المتغير التابع y في حالة عدم وجود قيمة للمتغير المستقل x، بمعنى أخر (x = 0).
b : معامل الإنحدار (الميل) وهو مقدار التغيير في y إذا تغيرت x وحدة واحدة، ويساوي منحدر الخط المستقيم (a + b x).
e : الخطأ العشوائي الذي يشير إلى الفرق بين القيمة الفعلية للمتغير التابع y والقيمة المقدرة التي يرمز لها ỹ = a + b x، وهذا يعني أن الخطأ العشوائي يساوي e = y- (a + b x)،
ويمكن توضيح هذا الخطأ في الشكل البياني أدناه:
معامل التحديد Determination Coefficient
هو مقياس لتقدير دقة معامل الانحدار ويرمز له R2 وذلك لأنه يساوي مربع معامل الإرتباط البسيط ويأخذ هذا المعامل قيم بين 0 الى 1 أي أنه 0 ≤ r2 ≤ 1 وكلما اقتربت قيمة معامل التحديد من 1 فان ذلك يدل على قلة قيمة الخطأ العشوائي، مثال ذلك لو كانت قيمة معامل التحديد لمتغيرين تساوي 0.87 فهذا يفسر (يدل) على أن معادلة الانحدار تفسر 87% من التغير الحاصل في المتغير التابع y حدثت بسبب التغير الحاصل في المتغير المستقل x والباقي من التغير البالغ 13% حدث بسبب عوامل أخرى غير المتغير المستقل x.