البحث المتقدم

المراجعات الوهمية على الإنترنت: نموذج كشف موحد باستخدام نظريات الخداع

Title Fake Online Reviews: A Unified Detection Model Using Deception Theories

الباحث الرئيس عبدالله نعمون

الباحثون المشاركون

التخصص: علوم الحاسب
التخصص الدقيق: تعلم الآلة
المستخلص: تؤثر المراجعات عبر الإنترنت على قرارات الشراء الخاصة بالمستهلكين. ومع ذلك ، فإن تحديد المراجعات المزيفة عبر الإنترنت تلقائيًا يظل مشكلة معقدة ، وأساليب الكشف الحالية غير فعالة في منع انتشار المراجعات المزيفة. تفتقر الأدبيات المتعلقة باكتشاف المراجعات المزيفة إلى نموذج شامل وقابل للتفسير قائم على النظرية مع أداء عالٍ ، مما يمكننا من فهم الظاهرة من منظور نفسي وتحليل المراجعات بناءً على المحتوى الذي ينشئه المستخدم وكذلك سلوك المستهلك. في هذا البحث ، قمنا بتجميع عشر نظريات خداع راسخة من علم النفس ، وهي نظرية التسرب ، نظرية العوامل الأربعة ، نظرية الخداع بين الأشخاص ، نظرية العرض الذاتي ، نظرية مراقبة الواقع ، تحليل المحتوى القائم على المعايير ، تحليل المحتوى العلمي ، نهج التحقق ، نظرية الحقيقة الافتراضية ، ونظرية التلاعب بالمعلومات ، واختيار تسعة تراكيب ذات صلة لتطوير نموذج موحد لاكتشاف المراجعات الوهمية عبر الإنترنت. تتضمن هذه التركيبات الخصوصية والكمية وعدم الفورية والتأثير وعدم اليقين والسمة غير الرسمية والاتساق ومصداقية المصدر والانحراف في السلوك. قمنا بتمييز التركيبات المختارة باستخدام الميزات اللفظية وغير اللفظية للتحقق من صحة النموذج المقترح تجريبيًا. بعد ذلك ، استخرجنا ميزات من مجموعات بيانات Yelp واستخدمناها لتدريب أربع خوارزميات للتعلم الآلي ، وتحديداً الانحدار اللوجستي ، و Naïve Bayes ، و Decision Tree ، و Random Forest. لقد أظهرنا أن الكمية ، وعدم الفورية ، والتأثير ، وعدم الرسمية ، والاتساق ، ومصداقية المصدر ، والانحراف في السلوك هي بنيات أساسية لاكتشاف المراجعات المزيفة. ولدهشتنا ، اكتشفنا أن الميزات غير اللفظية أكثر أهمية من الميزات اللفظية وأن الجمع بين الميزات من كلا النوعين يحسن أداء التنبؤ. لقد تفوق نموذجنا القائم على النظرية في الأداء على معظم نماذج الكشف عن المراجعة المزيفة الحديثة وأسفر عن قابلية عالية للتفسير وتعقيد منخفض.
Abstract: Online reviews influence consumers’ purchasing decisions. However, identifying fake online reviews automatically remains a complex problem, and current detection approaches are inefficient in preventing the spread of fake reviews. The literature on fake reviews detection lacks a comprehensive and interpretable theory-based model with high performance, which enables us to understand the phenomenon from a psychological perspective and analyze reviews based on user-generated content as well as consumer behavior. In this research, we synthesized ten well-founded deception theories from psychology, namely leakage theory, four-factor theory, interpersonal deception theory, self-presentational theory, reality monitoring theory, criteria-based content analysis, scientific content analysis, verifiability approach, truth-default theory, and information manipulation theory, and selected nine relevant constructs to develop a unified model for detecting fake online reviews. These constructs include specificity, quantity, non-immediacy, affect, uncertainty, informality, consistency, source credibility, and deviation in behavior. We characterized the selected constructs using verbal and non-verbal features to validate the proposed model empirically. Subsequently, we extracted features from the Yelp datasets and used them to train four machine learning algorithms, specifically Logistic Regression, Naïve Bayes, Decision Tree, and Random Forest. We demonstrated that quantity, non-immediacy, affect, informality, consistency, source credibility, and deviation in behavior are essential constructs for detecting fake reviews. To our surprise, we discovered that non-verbal features are more important than verbal features and that combining features from both types improves the prediction performance. Our theory-based model outperformed most of the state-of-the-art fake review detection models and yielded high interpretability and low complexity.
الحالة: محكم ومنشور
جهة التحكيم: IEEE Access
دار النشر: IEEE
سنة النشر: 2022
تحويل التاريخ