Search In this Thesis
   Search In this Thesis  
العنوان
Enhanced web recommendation techniques /
المؤلف
El-Zeheiry, Salma Adel Abbass.
هيئة الاعداد
باحث / سلمي عادل عباس محمد الزهيري
مشرف / أحمد عطوان محمد
مشرف / نهى أحمد هيكل
مشرف / نغم السيد ميكي
مناقش / أميرة ياسين محمد هيكل
الموضوع
Artificial intelligence. Computational intelligence.
تاريخ النشر
2022.
عدد الصفحات
online resource (101 pages) :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
علوم الحاسب الآلي
تاريخ الإجازة
1/1/2022
مكان الإجازة
جامعة المنصورة - كلية الحاسبات والمعلومات - قسم تكنولوجيا المعلومات
الفهرس
Only 14 pages are availabe for public view

from 101

from 101

Abstract

تسبب الويب 2.0 في زيادة كبيرة في كمية وحجم البيانات المتاحة على الإنترنت. لتلقي التوجيه للمستخدم لصنع القرارالجيد ، يتم استخدام أنظمة التوصية (RS). يعمل نظام التوصية مع نوعين من البيانات: بيانات مباشرة حول شراء المستخدم للمنتج أو تقييمه وبيانات حول المنتجات أو بيانات غير مباشرة مثل معرفة الوقت الذي يستغرقه المستخدم في قراءة مقال ما. يعتبر عيب توصيات الويب هو ان النظام لايمكن ان يعطى اقتراحات للمستخدم دون ان يحصل علي بيانات كافية عنه.عندما يكون هناك نقص في معرفة تفضيلات المستخدمين يطلق عليها مشكلة البداية الباردة. ويندرج من هذه المشكلة مشكلتان فرعيتان هما مشكلة وجود عنصر جديد دون تقييم او مشكلة مستخدم جديد يدخل الي النظام لاول مرة وليه له اي ملف تعريفي باهتماماته السابقة ودون تسجيل مسبق. هناك عدة طرق لحل مشكلة البداية الباردة(CS) باستخدام المعلومات السياقية التي توفر معلومات إضافية حول المستخدم ، من خلال مطالبة المستخدم بإنشاء ملف تعريف يضيف الموقع والنوع وعمر المستخدم ، عن طريق بيانات الشبكة الاجتماعية التي تستخرج تفضيلات المستخدم من خلال السياق ، وقياس التشابه بين المستخدمين والأفلام. في هذه الرسالة ، يتم استخدام خوارزمية (ALS) لاستخراج ميزة للمنتج من خلال product feature للتعامل مع البداية الباردة. يتم استخدام ناتج ALS كمدخل للخوارزمية الثانية لتقليل عدد السمات feature vector بمقدار دمج المكون الأساسي المستنتج من خوارزمية (PCA) مع خوارزمية Logistic Regression (LR) لتقدير احتمالية رغبة المستخدم الجديد في الحصول على فيلم. احتمال التصنيف المتوقع هو نتيجة LR ثم يتم فرز الاحتمال بترتيب تنازلي بناءً على نوع الفيلم. الغرض من tag similarity هو تحديد الكلمات القابلة للمقارنة لكل علامة لمعرفة كيف درجة اتشابه لكل فيلم وخاصة عندما يكون الفيلم كوميدي باستخدام Cosine similarity لقياس تشابه العلامات. عند معرفة درجة التشابه لحساب الكلمات يمكن تحديد الفيلم ذو الاحتمال الاعلي. اظهرت النتائج بمقارنتها مع الاعمال السابقة تحسنا افضل من حيث الدقة وقيم الخطا. بخصوص مجموعة بيانات 20M Movielens ;قدمت الاعمال السلبقة لنظام التوصية اعتمادا علي تحليل خوارمية SVD لاصدارات مختلفة منه في قياس (MAE (تتراوح القيم بدءًا من 0.670 حتى 0.724 بينما حقق النهج المقترح MAE يساوي 0.5008 تتراوح قيم جذر متوسط الخطأ التربيعي (RMSE) من 0.811 إلى 0.885 لكن النهج المقترح RMSE يساوي 0.7076. علاوة على ذلك ، حقق النهج المقترح تحسناً وصل إلى 3٪ عن الأعمال السابقة. لمزيد من التاكد ، تم اختبار مجموعة بيانات 10 ملايين والتحقق منها أيضًا. أخيرًا ، من خلال الجمع بين العلامات الاكثر صلة والاحتمالية العالية سيتمكن المستخدم الجديد من العثور علي افضل افلام ذات توصيات عالية.