شماره مدرك :
20448
شماره راهنما :
17598
پديد آورنده :
هادي عابديني، فاطمه
عنوان :

توسعه سيستم متن‌كاوي تركيبي جهت خلاصه‌سازي جنبه‌محور اخبار انگليسي در صنعت فولاد (كاربرد مدل‌هاي زباني بزرگ)

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
برنامه‌ريزي سيستم‌ها و تحليل داده
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1404
صفحه شمار :
سيزده، 118ص
توصيفگر ها :
متن‌كاوي , خلاصه‌سازي متن , تحليل جنبه‌محور , صنعت فولاد , يادگيري ماشين , مدل‌هاي زباني بزرگ
تاريخ ورود اطلاعات :
1404/05/25
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي صنايع
دانشكده :
مهندسي صنايع و سيستم ها
تاريخ ويرايش اطلاعات :
1404/06/22
كد ايرانداك :
23148742
چكيده فارسي :
صنعت فولاد، به‌عنوان يكي از اصلي‌ترين صنايع پايه، نقش كليدي در تامين نيازهاي صنايع مختلف و توسعه اقتصادي دارد. پيش‌بيني تقاضاي محصولات فولادي، بهبود كيفيت و نوآوري در فرايندها و مواد اوليه از جنبه‌هاي كليدي صنعت فولاد به شمار مي‌روند. همچنين، استفاده از فناوري‌هاي نوين و استراتژي‌هاي پايدار، به كاهش اثرات زيست‌محيطي و بهبود بهره‌وري كمك مي‌كند. اخبار مرتبط با فولاد در وب‌سايت‌هاي روز دنيا از طريق منابع خبري مختلف در حال منتشر شدن هستند. با توجه به تنوع محصولات و پيچيدگي‌هاي فناوري در اين صنعت، تحليل پويا و جامع روندها و موضوعات جهاني نيازمند بررسي مداوم اخبار از منابع معتبر است. در اين پژوهش، با استفاده از تكنيك‌هاي متن‌كاوي و يادگيري ماشين، يك سيستم تركيبي براي خلاصه‌سازي اخبار مرتبط با فولاد از منظر جنبه‌هاي كليدي شناسايي‌شده، در بازه‌هاي زماني مختلف توسعه يافته است. هدف اصلي اين پژوهش، دستيابي به عملكرد بهينه مدل‌هاي خلاصه‌سازي با تأكيد بر دقت و كارايي از طريق تحليل داده‌هاي محدود و متمركز بر استخراج و خوشه‌بندي جنبه‌هاي مرتبط با اخبار جهاني اين حوزه است. جهت تحقق اين هدف، اخبار انگليسي مرتبط با صنعت فولاد از وب‌سايت معتبر SteelOrbis، طي يك دوره‌ي سه‌ساله به‌صورت متوالي جمع‌آوري شده و ضمن استفاده تركيبي از الگوريتم‌هاي استخراج موضوع، خوشه‌بندي و مرور ادبيات پژوهش، 16 جنبه‌ي مؤثر بر زنجيره ارزش فولاد، شناسايي و تجميع شده‌اند. نتايج نشان مي‌دهند كه مدل پيشنهادي اين پژوهش در طبقه‌بندي جنبه‌هاي متون خبري، بهبودهايي به‌طور متوسط %5 در دقت و 61% در معيار F-Measure به همراه داشته است. همچنين، مدل‌هاي خلاصه‌سازي جنبه‌محور (Production-BART، Trading-BART و Environment-BART)، در مقايسه با خلاصه‌سازي كلي، با استفاده از داده‌هاي كلاسه‌بندي‌شده بر اساس جنبه‌هاي اصلي، در معيارهاي ROUGE به‌طور متوسط 4.29% در R-1، %8.5 در R-2، %7.72 درR-L و 6.63% در R-3، بهبود بخشيده‌اند. اين پژوهش، با نوآوري در تلفيق تحليل جنبه‌محور و خلاصه‌سازي، اولين تلاش جامع براي تحليل اخبار فولاد به اين شيوه است كه با توسعه داشبوردهاي تعاملي، امكان بهره‌گيري از نتايج را به‌صورت كاربردي در تصميم‌گيري‌هاي راهبردي و بلندمدت مديران صنعت فولاد فراهم مي‌سازد.
چكيده انگليسي :
The steel industry, as one of the fundamental base industries, plays a crucial role in meeting the deman‎ds of various sectors an‎d contributing to economic development. Key aspects such as forecasting deman‎d for steel products, improving quality, an‎d fostering innovation in processes an‎d raw materials are central to this industry. Moreover, the adoption of advanced technologies an‎d sustainable strategies aids in reducing environmental impacts an‎d enhancing efficiency. Relevant news about the steel industry is continuously published across various international news platforms. Given the diversity of products an‎d technological complexities within this sector, dynamic an‎d comprehensive analysis of global trends an‎d topics requires ongoing monitoring of credible news sources. In this study, a hybrid system leveraging Text Mining an‎d Machine Learning techniques has been developed to automatically summarize steel-related news from the perspective of key identified aspects over different time intervals. The main objective of the research is to achieve optimal performance in aspect-based summarization models with a focus on accuracy an‎d efficiency, by leveraging limited but domain-specific data, concentrating on the extraction an‎d clustering of relevant aspects from global steel-related news. To achieve this goal, English news articles related to the steel industry were collected from the reputable SteelOrbis website over a consecutive three-year period. Through a combination of topic modeling, clustering algorithm, an‎d literature review, 16 key aspects affecting the steel value chain were identified an‎d consolidated. The results indicate that the proposed model demonstrated average improvements of 5% in accuracy an‎d 61% in F-Measure for aspect classification. Furthermore, the aspect-based summarization models (Production-BART, Trading-BART, an‎d Environment-BART), compared to generic summarization, showed average improvements of 4.29% in ROUGE-1, 8.5% in ROUGE-2, 7.72% in ROUGE-L, an‎d 6.63% in ROUGE-3 using data categorized by primary aspects. This research, by innovatively integrating aspect-based analysis an‎d summarization, presents the first comprehensive effort to analyze steel industry news in this manner. At the end, by developing interactive dashboards, it enables practical utilization of the results in strategic an‎d long-term decision-making for steel industry managers.
استاد راهنما :
صبا صارمي نيا
استاد داور :
عليرضا بصيري , حسين خسروشاهي
لينک به اين مدرک :

بازگشت