أخبار التكنولوجيا

River للتعلم الآلي عبر الإنترنت بلغة Python



River هي مكتبة Python للتعلم الآلي عبر الإنترنت. تتيح لك المكتبة تدريب نماذج التعلم الآلي على تدفق البيانات.

مقدمة

جميع خوارزميات التعلم الآلي التقليدية سواء كانت بسيطة مثل الانحدار الخطي أو خوارزميات المتعلم القوية مثل xgboost ، تعالج جميع الخوارزميات البيانات على دفعات. هذا يعني أن هذه الخوارزميات تنظر إلى مجموعة البيانات الكاملة وتناسب النموذج. في حالة وجود بيانات جديدة متاحة ، فإنها تتطلب تركيب نموذج من نقطة الصفر مع الأخذ في الاعتبار كليهما ؛ البيانات الجديدة والقديمة.

يمكن أن يكون هناك العديد من التحديات في إعادة تدريب النموذج. في بعض الأحيان ، يتطلب الأمر مساحة كبيرة من الذاكرة للاحتفاظ بجميع البيانات التي يمكن أن تؤثر سلبًا على التدريب ويمكن أن تجعل العملية أبطأ. في بعض الحالات الأخرى ، يمكن أن يقتصر على البنية التحتية لتخزين البيانات. يكاد يكون من المستحيل استرداد البيانات القديمة في بعض التطبيقات التي تستمر في إنشاء بيانات جديدة.

أحد الحلول للتعامل مع التحديات المذكورة أعلاه هو القيام بالتدريب عبر الإنترنت باستخدام تدفق البيانات. تعتبر البيانات التي يتم إنشاؤها باستمرار بمثابة دفق مما يجعلها تتدفق التعلم أو التعلم المتزايد. هذه الطريقة مناسبة على نطاق واسع لتطبيقات إنترنت الأشياء التي يتم فيها جمع بيانات الوقت الحقيقي بواسطة أجهزة الاستشعار.

ما هو التعلم الآلي عبر الإنترنت؟

التعلم الآلي عبر الإنترنت هو أسلوب يستخدم لتدريب نماذج التعلم الآلي في تلك التطبيقات حيث يتضمن إما عمليات حسابية غير عملية لتدريب النموذج على مجموعة البيانات بأكملها أو حيث تكون البيانات متاحة من وقت لآخر بترتيب تسلسلي. نظرًا لأن البيانات تتحرك وتتغير باستمرار ، فمن الضروري التقاط سلوك تدفق البيانات حتى تتمكن من معالجتها متى توفرت. الطريقة مفيدة في الإعدادات التي تتطلب الخوارزمية للتكيف ديناميكيًا معها. الأنماط الجديدة المتاحة في البيانات على مدى فترة زمنية.

النهر: مكتبة التعلم الآلي عبر الإنترنت

نهر هي حزمة Python للتعلم الآلي عبر الإنترنت. يوفر مجموعة من خوارزميات التعلم التدريجي بما في ذلك التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. إنها حزمة مدمجة تتكون من Creme و Scikit-Multiflow.

يحتوي River like creme على واجهة برمجة تطبيقات مشابهة مثل Scikit-Learn ولهذا السبب يُعرف أيضًا باسم Scikit-Learn للتعلم الآلي عبر الإنترنت. وهو يدعم تقريبًا جميع مقدرات ومحولات ML المختلفة المصممة خصيصًا لتدفق البيانات. لديها مجموعة واسعة من النماذج المدعومة بما في ذلك النماذج الساذجة ، ونماذج مجموعات الأشجار ، وآلات التحليل ، والنماذج الخطية ، وغيرها الكثير. قائمة كاملة من الخوارزميات متاحة هنا.

فيما يلي بعض الاختلافات بين المكتبات والأطر المستخدمة للتدريب النموذجي على البيانات وتدفق البيانات:

تدريب نموذجي على البيانات في حالة الراحة تدريب نموذجي على البيانات المتحركة
  • Tensorflow
  • سكيكيت ليرن
  • PyTorch
  • كافيه
  • شرارة
  • كريمة
  • Scikit-Multiflow
  • نهر
  • الخدمية
  • شرارة الجري

بفضل River ، فقد جلبت إمكانيات التعامل مع البيانات أثناء التنقل مع التعلم عبر الإنترنت بدلاً من التعلم في وضع عدم الاتصال.



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى