تعزيز نموذج الغابة العشوائية بالاعتماد على تقليل القواعد المفردة للتنبؤ بالتهرب الضريبي وفقًا لقيم K في تقنية التحقق المتقاطع K-Fold
Enhancing a Random Forest Model Based on Single Rule Reduction for Tax Evasion Depends on the Values of K in K-Fold Validation Technique
2024 1st International Conference on Emerging Technologies for Dependable Internet of Things (ICETI) · 2024 · pp. 1–9
الملخّص
طورت هذه الورقة نموذجًا جديدًا باسم Single Rule Random Forest (SrRF) يهدف إلى تحسين أداء الغابة العشوائية وتقليل القواعد، وتمت مقارنة أدائه بعدة نماذج تعلم آلي (مثل DT وRF وGPT) على بيانات مصلحة الضرائب اليمنية (1083 سجلًا) باستخدام التحقق المتقاطع K-Fold بقيمتين لـ K. تُظهر النتائج أن مصنّف GPT قد يصل إلى 100% لكنه يسبب فرط مواءمة (Overfitting)، بينما يحقق SrRF أفضل نتائج عملية (مثل 99.89% عند K=10). كما تشير النتائج إلى أن K=10 يعطي نتائج أفضل عمومًا مقارنةً بـ K=5، وأن النموذج المقترح عند K=10 كان الأفضل إجمالًا.