شماره مدرك :
20045
شماره راهنما :
17303
پديد آورنده :
ابراهيمي، مهديه
عنوان :

طبقه‌بندي تيكت‌هاي پشتيباني فارسي با تمركز بر شناسايي موجوديت‌هاي اسمي

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
علوم داده
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1403
صفحه شمار :
دوازده، 84ص. : مصور، جدول، نمودار
توصيفگر ها :
متن‌كاوي , تشخيص موجوديت‌هاي اسمي , يادگيري ماشين , يادگيري عميق , دسته‌بندي متن
تاريخ ورود اطلاعات :
1403/10/07
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1403/10/15
كد ايرانداك :
23093518
چكيده فارسي :
طبقه‌بندي متون، يكي از اركان مهم حوزه‌ي متن‌كاوي به‌شمار مي‌رود. در اين ميان، يكي از كاربردهاي اين موضوع، دسته‌بندي تيكت‌ها به‌منظور افزايش دقت و سرعت پاسخ‌دهي به آن‌ها مي‌باشد كه مي‌تواند امري مهم براي ارگان‌ها و شركت‌هاي بزرگ محسوب شود. يكي ديگر از وظايف قابل انجام در پردازش متن، تشخيص موجوديت‌هاي اسمي است. اين وظيفه با مشخص كردن نقش كلمات مي‌تواند در تشخيص مفهوم و موضوع متون بسيار كمك‌كننده باشد. دسته‌بندي خودكار تيكت‌هاي فارسي دانشگاهي، از جمله حوزه‌هايي است كه در پژوهش‌هاي قبلي مغفول مانده است كه انجام آن مي‌تواند سرعت پاسخگويي به درخواست كاربران دانشگاهي را افزايش داده و هزينه نيروي انساني را نيز كاهش دهد. در اين پژوهش بر آن هستيم تا بر دسته‌بندي تيكت‌هاي فارسي دانشگاهي تمركز نماييم. بر همين اساس، ابتدا به گردآوري يك مجموعه‌داده‌‌ي تيكت‌هاي دانشگاهي به منظور دسته‌بندي پرداخته‌ و روش‌هاي مختلف دسته‌بندي را روي آن انجام داده‌ايم. در اين راستا روي استفاده از شناسايي موجوديت‌هاي اسمي و ارائه‌ي يك طبقه‌بندي‌كننده‌ي تركيبي، مدل‌هايي مبتني بر يادگيري ماشين و يادگيري عميق براي طبقه‌بندي موثرتر تيكت‌ها تاكيد داشته‌ايم كه مي‌توانند با بهره‌گيري از موجوديت‌هاي اسمي شناسايي‌شده در متون، فرايند دسته‌بندي را با دقت بالاتري به انجام برسانند. نتايج حاصل از ارزيابي، نشان‌دهنده‌ي دستيابي به عملكرد بهتر در هر چهار معيار صحت، دقت، بازخواني و امتيازF1 بوده است. اين موضوع نويد عملكرد بهتر مدل ارائه شده در دسته‌بندي خودكار تيكت‌هاي حوزه دانشگاهي را مي‌دهد.
چكيده انگليسي :
Text classification is one of the important components in the field of text mining. Among its applications, one of the key purposes is ticket categorization to enhance accuracy and speed in responding to them. This can be crucial for organizations and large companies. Another achievable task in text processing is named entity recognition. By determining the roles of words, this task can significantly assist in understanding the meaning and topic of texts. Automatic categorization of university-related Persian tickets is an area that has been overlooked in previous research, but addressing it can improve response time to requests from university users and reduce human resource costs. In this study, we focus on the categorization of Persian university tickets. Accordingly, we first collect a dataset of university tickets for classification and apply various classification methods to it. We emphasize the use of identified named entities and propose combined machine learning and deep learning models for more effective ticket classification. The eva‎luation results demonstrate satisfactory performance across all four metrics: Accuracy, Precision, Recall, and F1. This suggests that the proposed model can achieve appropriate performance in automatically categorizing university-related tickets.
استاد راهنما :
عليرضا بصيري
استاد داور :
ناصر قديري مدرس , الهام محمودزاده
لينک به اين مدرک :

بازگشت