يصف التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف نوعين رئيسيين من المهام في مجال التعلم الآلي. في التعلم تحت الإشراف ، يقوم الباحث بتعليم الخوارزمية الاستنتاجات أو التنبؤات التي يجب أن تقوم بها. في التعلم غير الخاضع للإشراف ، فإن نموذج لديها خوارزميات قادرة على اكتشاف ومن ثم تقديم استنتاجات حول البيانات. لا يوجد مدرس أو إجابة واحدة صحيحة. وهكذا تتعلم الآلة من نفسها.
التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف
ما هو التعلم تحت الإشراف؟
يتضمن التعلم الخاضع للإشراف تدريب آلة ببيانات جيدة التسمية. بمعنى آخر ، تم بالفعل تمييز بعض بيانات الإدخال بالإجابة الصحيحة.
ما هو التعلم غير الخاضع للرقابة؟
من ناحية أخرى ، يتضمن التعلم غير الخاضع للإشراف تدريب آلة على بيانات غير مصنفة أو مصنفة. في هذه الحالة ، تعمل الخوارزمية على المعلومات وتستخلص النتائج دون توجيه بشري.
الاختيار بين النهج الخاضع للإشراف وغير الخاضع للإشراف
يتم تدريب خوارزميات التعلم الآلي وفقًا للبيانات المتاحة وسؤال البحث المطروح. ولكن ، على أي حال ، فإن الباحثين الذين يفشلون في تحديد الهدف من خوارزمية التعلم الآلي لن يتمكنوا من بناء خوارزمية دقيقة نموذج.
في جوهرها ، القدرة على بناء ملف دقيق نموذج يتعلق الأمر بمسألة الاختيار. يمكن تدريب الخوارزميات باستخدام أحد النموذجين اللذين يساعدانها في عمل تنبؤات حول البيانات:
- التعلم الخاضع للإشراف - حيث يقوم الباحث بتعليم الخوارزمية الاستنتاجات أو التنبؤات التي يجب أن تقوم بها.
- التعلم غير الخاضع للإشراف - حيث تُترك الخوارزمية لأجهزتها الخاصة لاكتشاف ثم تقديم استنتاجات حول البيانات. لا يوجد مدرس أو في الواقع إجابة واحدة صحيحة.
ستنظر الأقسام التالية في كل منها نموذج بالتفصيل.
الإشراف على التعلم
في التعلم الخاضع للإشراف ، يقوم الباحث بتدريس الخوارزمية لاستخدام البيانات المصنفة جيدًا. أي أن بعض البيانات تم تمييزها بالفعل بالإجابة الصحيحة. بعد ذلك ، يتم تزويد الخوارزمية بمجموعة جديدة من الأمثلة تسمى بيانات التدريب التي تستخدمها لإنتاج نتيجة صحيحة بناءً على البيانات المصنفة.
يمكن تصنيف مشاكل التعلم الخاضعة للإشراف على النحو التالي:
- مشاكل التصنيف - حيث يكون متغير المخرجات فئة مثل "أخضر" و "أصفر" أو "نعم" و "لا". تشمل الأمثلة اكتشاف الرسائل غير المرغوب فيها ، واكتشاف الوجه تحليل، والتصحيح الآلي للامتحانات.
- مشاكل الانحدار - حيث يكون متغير الإخراج حقيقيًا القيمة، مثل "دولارات" أو "كيلوغرامات". تُستخدم خوارزميات الانحدار (نماذج الانحدار الخطي) في أي سيناريو يتطلب التنبؤ بالقيم العددية بناءً على الملاحظات السابقة. تشمل الأمثلة المنزل والمخزون السعر التنبؤات والتنبؤ بالطقس.
خوارزميات التعلم تحت الإشراف
لاحظ أنه يتم استخدام خوارزميات متعددة وتقنيات حسابية في عملية التعلم تحت الإشراف. ويرد أدناه وصف موجز لبعض الأساليب الأكثر شيوعًا.
الشبكات العصبية
لمعالجة بيانات التدريب ، تحاكي الشبكات العصبية الترابط بين الدماغ البشري مع طبقات مختلفة من العقد. تتكون كل من هذه العقد من مدخلات وأوزان وعتبة ومخرجات. عندما يكون الإخراج القيمة يتجاوز العتبة ، ينشط العقدة ويمرر البيانات إلى الطبقة التالية في شبكة.
تُستخدم الشبكات العصبية بشكل أساسي في خوارزميات التعلم العميق التي تحل بعض مشكلات الانحدار المذكورة أعلاه.
K- أقرب جار
تصنف خوارزمية K- الجار الأقرب (KNN) نقاط البيانات وفقًا لارتباطها وقربها من البيانات الأخرى المتاحة. وبالتالي تفترض خوارزمية KNN أن نقاط البيانات الأكثر تشابهًا هي تلك الموجودة على مقربة. يقوم أولاً بحساب المسافة بين نقاط البيانات ثم يعزو فئة بناءً على ترددها أو متوسطها.
KNN هي خوارزمية التعلم الخاضعة للإشراف المفضلة لعلماء البيانات لأنها سهلة الاستخدام وتوفر وقت حساب منخفض. ومع ذلك ، مع زيادة حجم مجموعة البيانات ، يزداد أيضًا وقت المعالجة. هذا يجعلها أقل ملاءمة لمهام التصنيف وأكثر ملاءمة للاستخدام في التعرف على الصور ومحركات التوصية.
الانحدار الخطي واللوجستي
يقوم الانحدار الخطي بعمل تنبؤات حول النتائج المستقبلية من خلال تحديد صلة بين متغير تابع واحد ومتغير واحد أو عدة متغيرات مستقلة.
يتم اختيار الانحدار اللوجستي عندما تكون المتغيرات التابعة قاطعة. هذا يعني أنها تميل إلى أن تكون أكثر ملاءمة لتصنيف مشاكل النواتج الثنائية مثل تحديد البريد العشوائي.
غابة عشوائية
يتم إنشاء غابة عشوائية من خوارزميات شجرة القرار ويمكن استخدامها لكل من مشاكل الانحدار والتصنيف. تشكل أشجار القرار أساس الغابة العشوائية وتتكون من ثلاثة مكونات: العقد الورقية وعقد القرار والعقدة الجذرية. تمثل العقد السمات المستخدمة للتنبؤ بالنتائج.
تقسم الشجرة مجموعة البيانات إلى فروع تنقسم أيضًا إلى فروع أخرى وما إلى ذلك. تستمر العملية حتى يتم الوصول إلى عقدة طرفية لا يمكن تقسيمها أكثر. تتضمن بعض التطبيقات الرئيسية ما يلي:
- المصرفية - لتحديد الجدارة الائتمانية لمقدم طلب القرض.
- الرعاية الصحية - لتشخيص المرضى بناءً على تاريخهم الطبي ، و
- التجارة الإلكترونية - للتنبؤ بما يفضله المستهلك بناءً على سلوك الاستهلاك السابق.
تعليم غير مشرف عليه
يتضمن التعلم غير الخاضع للإشراف تدريب خوارزمية بمعلومات غير مصنفة أو مصنفة. بدلاً من ذلك ، يجب أن تقوم الخوارزمية بتجميع المعلومات غير المصنفة وفقًا للأنماط أو أوجه التشابه في البيانات بدون تدريب مسبق.
تُستخدم خوارزميات التعلم غير الخاضعة للإشراف بشكل شائع في:
- تجميع المهام - حيث هدف هو اكتشاف التجمعات المتأصلة في البيانات. على سبيل المثال ، أ تسويق قد تستخدم الوكالة خوارزمية لتقسيم الجمهور المستهدف عن طريق شراء السلوك.
- مهام الأبعاد - حيث تسعى الخوارزمية إلى تقليل عدد المتغيرات أو الخصائص أو الميزات في مجموعة البيانات. نظرًا لأن بعض هذه الأبعاد مترابطة ، يمكن أن تؤدي المعلومات الزائدة عن الحاجة أو المتكررة إلى زيادة ضوضاء مجموعة البيانات والتأثير على التدريب و أداء ل نموذج. غالبًا ما تُستخدم هذه التقنية في مرحلة المعالجة المسبقة للبيانات مثل عند إزالة الضوضاء من البيانات المرئية لتحسين جودة الصورة.
- مهام الارتباط - حيث يجب أن تجد الخوارزمية قواعد الارتباط في البيانات. نفس الشيء تسويق قد تنظر الوكالة في ما يميل المستهلكون إلى شرائه أو فعله بعد شراء سلعة معينة المنتج. تشكل هذه المهام أيضًا أساس محركات التوصيات التي تعرض "العملاء الذين اشتروا هذا المنتج اشترى أيضا" رسائل.
- مهام الشذوذ - حيث تبحث الخوارزمية في البيانات عن العناصر أو الأحداث النادرة. عديدة مالي تستخدم المؤسسات خوارزميات شاذة لاكتشاف حالات الاحتيال في سجلات الحسابات المصرفية. مضاد للفيروسات نظام البرمجيات يستخدم أيضًا تقنية مشابهة لتحديد البرامج الضارة.
مهام التعلم الأخرى غير الخاضعة للإشراف
في حين أن مهام التجميع والأبعاد والارتباط والشذوذ هي بعض من أكثر خوارزمية التعلم غير الخاضعة للإشراف شيوعًا ، إلا أنه توجد أنواع أخرى.
تقدير الكثافة
تقدير الكثافة ، والتي لها جذورها الإحصائية تحليل، ويقدر كثافة توزيع من نقاط البيانات. في التعلم الآلي ، يتم استخدام تقدير الكثافة جنبًا إلى جنب مع مهام الانحراف نظرًا لأن نقاط البيانات في المناطق منخفضة الكثافة تميل إلى أن تكون متطرفة.
• توزيع تُعرف نقاط البيانات رسميًا باسم دالة كثافة الاحتمال (PDF). يمكن استخدام هذا لتحديد ما إذا كان من غير المرجح حدوث حالة خارجية معينة أو ما إذا كان من غير المحتمل حدوثها بحيث يجب إزالتها من مجموعة البيانات.
جمعية حكم التعلم
تعلم قواعد الجمعيات هو مهمة تعليمية أخرى غير خاضعة للإشراف تستخدمها الشركات بشكل أساسي لزيادة الأرباح. يحلل مجموعات البيانات لاكتشاف العلاقات بين المتغيرات غير الواضحة وتتطلب خوارزمية معقدة مثل Apriori أو FP-Growth أو Eclat.
تطبيق واحد لتعلم قواعد الجمعيات هو المنتج تحديد مستوى. فكر في سوبر ماركت يحلل مجموعة بيانات المعاملات لاكتشاف أن المستهلكين غالبًا ما يشترون الخبز بالحليب والبصل مع البطاطس.
بناءً على العلاقات التي تكتشفها الخوارزمية ، يمكن للسوبر ماركت بعد ذلك وضع العناصر بالقرب من بعضها البعض لتعظيمها إيرادات والأرباح. يمكن أيضًا استخدام الرؤى من هذه العلاقات في الترويج التسعير و تسويق الحملات.
الاختيار بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف
يعد التعلم الآلي مجالًا واسعًا ونتيجة لذلك ، قد يكون اختيار عملية التعلم الآلي الصحيحة أمرًا صعبًا ومكثفًا للموارد.
بعبارات عامة جدًا ، من المهم تقييم هذه المؤشرات:
- قيم البيانات. ربما كانت نقطة واضحة ، لكنها تستحق الذكر. هل هي مصنفة أم غير مصنفة؟ هل يمكن لاستشارة الخبراء تسهيل وضع العلامات الإضافية؟
- تحديد هدف. هل المشكلة محددة ومن المحتمل أن تتكرر؟ بدلاً من ذلك ، هل ستحظى الخوارزمية بفرصة أفضل لتحديد المشكلات غير المعروفة مسبقًا؟
- راجع الخوارزميات المتاحة. ما هي الأنسب للمشكلة من حيث عدد الميزات أو السمات أو الخصائص؟ يجب أن يكون اختيار الخوارزمية أيضًا حساسًا بشكل عام بناء وحجم البيانات المراد تحليلها.
- دراسة التطبيقات التاريخية. أين تم استخدام الخوارزمية بالفعل لتحقيق نجاح كبير؟ ضع في اعتبارك الوصول إلى المنظمات أو الأفراد الذين لديهم مهارات يمكن إثباتها في مجال مشابه.
ملخص الاختلافات الجوهرية
لاستنتاج هذه المقارنة حول التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف ، دعنا نناقش الاختلافات الأساسية وفقًا لمجموعة متنوعة من المعلمات.
- بيانات الإدخال - يتم تدريب خوارزميات التعلم الخاضع للإشراف على البيانات المصنفة ، بينما لا يتم تدريب الخوارزميات غير الخاضعة للإشراف.
- التعقيد الحسابي - التعلم الخاضع للإشراف هو طريقة أبسط لا تتطلب سوى برنامج مثل Python أو R. يعتبر النهج غير الخاضع للإشراف أكثر تعقيدًا وبالتالي يتطلب أدوات أكثر قوة.
- الدقة والفصول الدراسية - التعلم الخاضع للإشراف أكثر دقة وجدارة بالثقة وعدد الفصول معروف. عدد الفصول الدراسية غير معروف في التعلم غير الخاضع للإشراف ، ويميل إلى أن يكون أقل دقة وجدارة بالثقة.
- البيانات تحليل - بينما يحلل التعلم الخاضع للإشراف البيانات غير المتصلة بالإنترنت ، يحلل النهج غير الخاضع للإشراف البيانات في الوقت الفعلي.
- الهدف - الهدف من التعلم الخاضع للإشراف هو التنبؤ بنتائج البيانات الجديدة. الهدف من التعلم غير الخاضع للإشراف هو جمع البيانات رؤى بناء على ما نموذج يقرر أنه مثير للاهتمام أو مختلف.
- العيوب المحتملة - التعلم الخاضع للإشراف هو نهج تدريبي يستغرق وقتًا وخبرة بشرية. من ناحية أخرى ، يمكن أن يؤدي التعلم غير الخاضع للإشراف إلى نتائج غير دقيقة أو لا قيمة لها ما لم يكن هناك إنسان للتحقق من صحة متغيرات المخرجات.
الوجبات الرئيسية
- يتضمن التعلم الخاضع للإشراف تدريب الآلة على البيانات المصنفة جيدًا. بمعنى آخر ، تم بالفعل تمييز بعض بيانات الإدخال بالإجابة الصحيحة. يتضمن التعلم غير الخاضع للإشراف تدريب آلة ببيانات ليست مصنفة أو مصنفة.
- في التعلم الخاضع للإشراف ، يعلم الباحث الخوارزمية للوصول إلى إجابة مرغوبة في ضوء نقاط البيانات المعنونة. لها تطبيقات في علامات الفحص والتعرف على الوجه والتنبؤ بالطقس.
- في التعلم غير الخاضع للإشراف ، يجب أن تقوم الخوارزمية بتجميع المعلومات غير المفرزة التي لم يتم تصنيفها أو تصنيفها بدون تعليمات. التعلم غير الخاضع للإشراف له استخدامات مهمة في اكتشاف الاحتيال المصرفي والبرامج الضارة. كما أنها تستخدم لتحديد أنماط السلوك الشرائي للمستهلك.
مفاهيم الذكاء الاصطناعي المتصلة
نموذج الذكاء الاصطناعي
التعلم العميق مقابل التعلم الآلي
نموذج عمل الذكاء الاصطناعي الاستقرار
استقرار النظام البيئي للذكاء الاصطناعي
الأدلة الحرة الرئيسية: