توصيفگر ها :
متنكاوي , خلاصهسازي متن , تحليل جنبهمحور , صنعت فولاد , يادگيري ماشين , مدلهاي زباني بزرگ
چكيده فارسي :
صنعت فولاد، بهعنوان يكي از اصليترين صنايع پايه، نقش كليدي در تامين نيازهاي صنايع مختلف و توسعه اقتصادي دارد. پيشبيني تقاضاي محصولات فولادي، بهبود كيفيت و نوآوري در فرايندها و مواد اوليه از جنبههاي كليدي صنعت فولاد به شمار ميروند. همچنين، استفاده از فناوريهاي نوين و استراتژيهاي پايدار، به كاهش اثرات زيستمحيطي و بهبود بهرهوري كمك ميكند. اخبار مرتبط با فولاد در وبسايتهاي روز دنيا از طريق منابع خبري مختلف در حال منتشر شدن هستند. با توجه به تنوع محصولات و پيچيدگيهاي فناوري در اين صنعت، تحليل پويا و جامع روندها و موضوعات جهاني نيازمند بررسي مداوم اخبار از منابع معتبر است. در اين پژوهش، با استفاده از تكنيكهاي متنكاوي و يادگيري ماشين، يك سيستم تركيبي براي خلاصهسازي اخبار مرتبط با فولاد از منظر جنبههاي كليدي شناساييشده، در بازههاي زماني مختلف توسعه يافته است. هدف اصلي اين پژوهش، دستيابي به عملكرد بهينه مدلهاي خلاصهسازي با تأكيد بر دقت و كارايي از طريق تحليل دادههاي محدود و متمركز بر استخراج و خوشهبندي جنبههاي مرتبط با اخبار جهاني اين حوزه است. جهت تحقق اين هدف، اخبار انگليسي مرتبط با صنعت فولاد از وبسايت معتبر SteelOrbis، طي يك دورهي سهساله بهصورت متوالي جمعآوري شده و ضمن استفاده تركيبي از الگوريتمهاي استخراج موضوع، خوشهبندي و مرور ادبيات پژوهش، 16 جنبهي مؤثر بر زنجيره ارزش فولاد، شناسايي و تجميع شدهاند. نتايج نشان ميدهند كه مدل پيشنهادي اين پژوهش در طبقهبندي جنبههاي متون خبري، بهبودهايي بهطور متوسط %5 در دقت و 61% در معيار F-Measure به همراه داشته است. همچنين، مدلهاي خلاصهسازي جنبهمحور (Production-BART، Trading-BART و Environment-BART)، در مقايسه با خلاصهسازي كلي، با استفاده از دادههاي كلاسهبنديشده بر اساس جنبههاي اصلي، در معيارهاي ROUGE بهطور متوسط 4.29% در R-1، %8.5 در R-2، %7.72 درR-L و 6.63% در R-3، بهبود بخشيدهاند. اين پژوهش، با نوآوري در تلفيق تحليل جنبهمحور و خلاصهسازي، اولين تلاش جامع براي تحليل اخبار فولاد به اين شيوه است كه با توسعه داشبوردهاي تعاملي، امكان بهرهگيري از نتايج را بهصورت كاربردي در تصميمگيريهاي راهبردي و بلندمدت مديران صنعت فولاد فراهم ميسازد.
چكيده انگليسي :
The steel industry, as one of the fundamental base industries, plays a crucial role in meeting the demands of various sectors and contributing to economic development. Key aspects such as forecasting demand for steel products, improving quality, and fostering innovation in processes and raw materials are central to this industry. Moreover, the adoption of advanced technologies and sustainable strategies aids in reducing environmental impacts and enhancing efficiency. Relevant news about the steel industry is continuously published across various international news platforms. Given the diversity of products and technological complexities within this sector, dynamic and comprehensive analysis of global trends and topics requires ongoing monitoring of credible news sources. In this study, a hybrid system leveraging Text Mining and Machine Learning techniques has been developed to automatically summarize steel-related news from the perspective of key identified aspects over different time intervals. The main objective of the research is to achieve optimal performance in aspect-based summarization models with a focus on accuracy and efficiency, by leveraging limited but domain-specific data, concentrating on the extraction and clustering of relevant aspects from global steel-related news. To achieve this goal, English news articles related to the steel industry were collected from the reputable SteelOrbis website over a consecutive three-year period. Through a combination of topic modeling, clustering algorithm, and literature review, 16 key aspects affecting the steel value chain were identified and consolidated. The results indicate that the proposed model demonstrated average improvements of 5% in accuracy and 61% in F-Measure for aspect classification. Furthermore, the aspect-based summarization models (Production-BART, Trading-BART, and Environment-BART), compared to generic summarization, showed average improvements of 4.29% in ROUGE-1, 8.5% in ROUGE-2, 7.72% in ROUGE-L, and 6.63% in ROUGE-3 using data categorized by primary aspects. This research, by innovatively integrating aspect-based analysis and summarization, presents the first comprehensive effort to analyze steel industry news in this manner. At the end, by developing interactive dashboards, it enables practical utilization of the results in strategic and long-term decision-making for steel industry managers.