تعزيز نموذج الغابة العشوائية بالاعتماد على تقليل القواعد المفردة للتنبؤ بالتهرب الضريبي وفقًا لقيم K في تقنية التحقق المتقاطع K-Fold

Enhancing a Random Forest Model Based on Single Rule Reduction for Tax Evasion Depends on the Values of K in K-Fold Validation Technique

Abeer Abdullah Shujaaddeen, Fadl Mutaher Ba-Alwi, Ammar T Zahary, Ghaleb Al-Gaphari, Abdulkader M Al-Badani, Ayman Alsabry

2024 1st International Conference on Emerging Technologies for Dependable Internet of Things (ICETI) · 2024 · pp. 1–9

IEEE

الملخّص

طورت هذه الورقة نموذجًا جديدًا باسم Single Rule Random Forest (SrRF) يهدف إلى تحسين أداء الغابة العشوائية وتقليل القواعد، وتمت مقارنة أدائه بعدة نماذج تعلم آلي (مثل DT وRF وGPT) على بيانات مصلحة الضرائب اليمنية (1083 سجلًا) باستخدام التحقق المتقاطع K-Fold بقيمتين لـ K. تُظهر النتائج أن مصنّف GPT قد يصل إلى 100% لكنه يسبب فرط مواءمة (Overfitting)، بينما يحقق SrRF أفضل نتائج عملية (مثل 99.89% عند K=10). كما تشير النتائج إلى أن K=10 يعطي نتائج أفضل عمومًا مقارنةً بـ K=5، وأن النموذج المقترح عند K=10 كان الأفضل إجمالًا.

الكلمات المفتاحية

تقنيات تعلم الآلة الغابة العشوائية (RF) شجرة القرار (DT) تقنيات GPT التحقق المتقاطع K-Fold مجموعة بيانات الضرائب