پديد آورنده :
ابراهيمي، مهديه
عنوان :
طبقهبندي تيكتهاي پشتيباني فارسي با تمركز بر شناسايي موجوديتهاي اسمي
مقطع تحصيلي :
كارشناسي ارشد
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
دوازده، 84ص. : مصور، جدول، نمودار
توصيفگر ها :
متنكاوي , تشخيص موجوديتهاي اسمي , يادگيري ماشين , يادگيري عميق , دستهبندي متن
تاريخ ورود اطلاعات :
1403/10/07
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1403/10/15
چكيده فارسي :
طبقهبندي متون، يكي از اركان مهم حوزهي متنكاوي بهشمار ميرود. در اين ميان، يكي از كاربردهاي اين موضوع، دستهبندي تيكتها بهمنظور افزايش دقت و سرعت پاسخدهي به آنها ميباشد كه ميتواند امري مهم براي ارگانها و شركتهاي بزرگ محسوب شود. يكي ديگر از وظايف قابل انجام در پردازش متن، تشخيص موجوديتهاي اسمي است. اين وظيفه با مشخص كردن نقش كلمات ميتواند در تشخيص مفهوم و موضوع متون بسيار كمككننده باشد. دستهبندي خودكار تيكتهاي فارسي دانشگاهي، از جمله حوزههايي است كه در پژوهشهاي قبلي مغفول مانده است كه انجام آن ميتواند سرعت پاسخگويي به درخواست كاربران دانشگاهي را افزايش داده و هزينه نيروي انساني را نيز كاهش دهد. در اين پژوهش بر آن هستيم تا بر دستهبندي تيكتهاي فارسي دانشگاهي تمركز نماييم. بر همين اساس، ابتدا به گردآوري يك مجموعهدادهي تيكتهاي دانشگاهي به منظور دستهبندي پرداخته و روشهاي مختلف دستهبندي را روي آن انجام دادهايم. در اين راستا روي استفاده از شناسايي موجوديتهاي اسمي و ارائهي يك طبقهبنديكنندهي تركيبي، مدلهايي مبتني بر يادگيري ماشين و يادگيري عميق براي طبقهبندي موثرتر تيكتها تاكيد داشتهايم كه ميتوانند با بهرهگيري از موجوديتهاي اسمي شناساييشده در متون، فرايند دستهبندي را با دقت بالاتري به انجام برسانند. نتايج حاصل از ارزيابي، نشاندهندهي دستيابي به عملكرد بهتر در هر چهار معيار صحت، دقت، بازخواني و امتيازF1 بوده است. اين موضوع نويد عملكرد بهتر مدل ارائه شده در دستهبندي خودكار تيكتهاي حوزه دانشگاهي را ميدهد.
چكيده انگليسي :
Text classification is one of the important components in the field of text mining. Among its applications, one of the key purposes is ticket categorization to enhance accuracy and speed in responding to them. This can be crucial for organizations and large companies. Another achievable task in text processing is named entity recognition. By determining the roles of words, this task can significantly assist in understanding the meaning and topic of texts. Automatic categorization of university-related Persian tickets is an area that has been overlooked in previous research, but addressing it can improve response time to requests from university users and reduce human resource costs. In this study, we focus on the categorization of Persian university tickets. Accordingly, we first collect a dataset of university tickets for classification and apply various classification methods to it. We emphasize the use of identified named entities and propose combined machine learning and deep learning models for more effective ticket classification. The evaluation results demonstrate satisfactory performance across all four metrics: Accuracy, Precision, Recall, and F1. This suggests that the proposed model can achieve appropriate performance in automatically categorizing university-related tickets.
استاد راهنما :
عليرضا بصيري
استاد داور :
ناصر قديري مدرس , الهام محمودزاده