تحسين نماذج التنبؤ بأمراض القلب باستخدام SMOTE: معالجة اختلال توازن البيانات

Optimizing Heart Disease Prediction Models through SMOTE: Addressing Data Imbalance

Waheeb Baddah, Hamzah Ali Qasem, Ayman Alsabry, Rana Saleh Al Gawani, Wafa Mohammed Alzuraiqi, FE Hanash

2024 4th International Conference on Emerging Smart Technologies and Applications (eSmarTA) · 2024 · pp. 1–10

IEEE

الملخّص

يمثل عدم توازن البيانات تحديًا مهمًا في التشخيص الطبي، خصوصًا في التنبؤ بأمراض القلب باستخدام تعلم الآلة. تدرس هذه الورقة تطبيق تقنية SMOTE لمعالجة عدم التوازن وتحسين الدقة التنبؤية. شملت المنهجية جمع البيانات ومعالجتها وتقييم 21 نموذجًا قبل SMOTE وبعده، مع تحليل مقاييس الأداء (الدقة، والدقة الإيجابية، والاسترجاع، وF1) واستخدام اختبارات (t) لقياس الدلالة الإحصائية للتحسينات. تُظهر النتائج تحسنًا ذا دلالة في الدقة الإيجابية وF1 (وأحيانًا الاسترجاع) عند استخدام SMOTE، مع تباين أثرها على الدقة حسب مجموعة البيانات، وبشكل ملحوظ على مجموعتي Cleveland وStatlog، ما يعزز دور SMOTE في تحسين موثوقية نماذج تشخيص أمراض القلب.

الكلمات المفتاحية

التنبؤ بأمراض القلب SMOTE تعلم الآلة مجموعات بيانات غير متوازنة