توصيفگر ها :
صنعت فولاد , پيشبيني سختي فولاد , دادهكاوي , مدل تركيبي , كنترل كيفيت
چكيده فارسي :
صنعت فولاد، بهعنوان يكي از اركان اصلي توليد صنعتي، نيازمند روشهاي دقيق براي پيشبيني ويژگيهاي مواد، مانند سختي، بهمنظور ارتقاي كيفيت محصولات و كاهش ضايعات است. اين پاياننامه با هدف توسعه چارچوبي كارآمد براي پيشبيني سختي فولاد با استفاده از تكنيك دادهكاوي و مدل هاي تركيبي، انجام شد. چالشهاي دادهاي، شامل عدم تعادل شديد كلاسها و 10% مقادير گمشده و محدوديتهاي محاسباتي، مانند زمان اجراي بالا، از موانع اصلي بودند. روش پيشنهادي، توسعه مدل طبقه بندي انباشته وزن دار بود كه تركيبي از پنج مدل پايه (MLP، جنگل تصادفي، اكس جي بوست، كت بوست، و تب نت) و متا-مدل يادگيري ماشين سبك تقويت گراديان با وزندهي پويا (كت بوست: 0.35 ، اكس جي بوست: 0.3) را شامل ميشد. اين مدل به دقت 0.95، امتياز F1 0.76 براي كلاس U، و AUC 0.90 دست يافت، كه عملكردي برتر نسبت به مدلهاي تكپايه داشت. براي مديريت عدم تعادل كلاسها، SMOTE تعداد نمونهها را به 7500 افزايش داد و نرخ درست پيشبيني كلاس U را به 66.7% بهبود بخشيد. MICE براي پر كردن مقادير گمشده، تابع هزينه لگاريتمي را از 0.36 به 0.20 كاهش داد. SHAP تعداد ويژگيها را از 162 به 12 كاهش داد و ويژگيهاي كليدي مانند ضخامت ورق فولاد (SHAP 0.092) و عرض ورق فولاد (SHAP 0.105) را شناسايي كرد، كه تفسيرپذيري مدل را ارتقا داد. نوآوريهاي تحقيق شامل مدل طبقه بندي انباشته وزن دار براي دادههاي نامتعادل، SHAP براي مهندسي ويژگي، و تركيب SMOTE و MICE براي مديريت دادههاي ناقص بود. اين دستاوردها شناسايي عيوب نادر را، كه براي كنترل كيفيت حياتي است، امكانپذير كردند.
چكيده انگليسي :
The steel industry, a cornerstone of industrial production, requires precise methods for predicting material properties, such as hardness, to enhance product quality and minimize waste. This thesis aimed to develop an efficient framework for predicting steel hardness using data mining techniques and hybrid models.. Data challenges, including severe class imbalance and 10% missing values, alongside computational limitations such as high execution time, posed significant obstacles.
The proposed method involved developing the Weighted Stacking Classifier, integrating five base models (MLP, Random Forest, XGBoost, CatBoost, and TabNet) and a LightGBM meta-model with dynamic weighting (CatBoost: 0.35, XGBoost: 0.30). This model achieved an accuracy of 0.95, an F1-score of 0.76 for class U, and an AUC of 0.90, outperforming single-base models. To address class imbalance, SMOTE was employed, increasing the sample size to 7,500 and improving the true prediction rate for class U to 66.7%. MICE reduced Log Loss from 0.36 to 0.20 by handling missing values. SHAP reduced features from 162 to 12, identifying key features like thick (SHAP 0.092) and width (SHAP 0.105), enhancing model interpretability.
Innovations included the Weighted Stacking Classifier for imbalanced data, SHAP for feature engineering, and the integration of SMOTE and MICE for handling incomplete data. These achievements enabled accurate detection of rare defects, critical for quality control in steel production.