تحسين التنبؤ بسرطان الثدي باستخدام أخذ عينات اصطناعية تكيفية (Adaptive Synthetic Sampling): دراسة على مجموعة بيانات كويمبرا
Improving Breast Cancer Prediction Using Adaptive Synthetic Sampling: A Study on the Coimbra Dataset
2025 5th International Conference on Emerging Smart Technologies and Applications (eSmarTA) · 2025 · pp. 1–8
الملخّص
يُعدّ عدم توازن الفئات تحديًا كبيرًا في تصنيف سرطان الثدي، إذ يؤدي إلى نماذج متحيزة لصالح الفئة الغالبة. تبحث هذه الدراسة أثر تقنية أخذ العينات الاصطناعية التكيفية (ADASYN) على أداء نماذج تعلم آلي مختلفة للتنبؤ بسرطان الثدي باستخدام مجموعة بيانات “Coimbra”. تم تدريب وتقييم 36 نموذجًا (منها أشجار القرار و(SVM) و(KNN) والشبكات العصبية ونماذج تجميعية) قبل تطبيق ADASYN وبعده، مع اعتماد الدقة كمقياس رئيس. أظهرت النتائج أن موازنة البيانات تحسن الأداء بشكل واضح، وحقّق نموذج Subspace KNN أعلى دقة (91.7%) بعد ADASYN، بينما تراجعت نماذج أخرى مثل Linear SVM وبعض الشبكات العصبية، ما يبرز اختلاف تأثير الموازنة الاصطناعية بين الخوارزميات. تؤكد الدراسة أهمية تقنيات المعالجة المسبقة في التشخيص الطبي، وتوصي باستكشاف تقنيات هجينة للموازنة وطرق اختيار سمات لتحسين المتانة.