شماره مدرك :
13848
شماره راهنما :
12586
پديد آورنده :
باقري، عمادالدين
عنوان :

استفاده از روش‌هاي يادگيري عميق و خوشه بندي در خلاصه‌سازي متن

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
هوش مصنوعي ورباتيك
محل تحصيل :
اصفهان: دانشگاه صنعتي اصفهان، دانشكده برق و كامپيوتر
سال دفاع :
۱۳۹۷
صفحه شمار :
دوازده، ۹۰ص.: مصور، جدول، نمودار
استاد راهنما :
محمدرضا احمدزاده
توصيفگر ها :
خلاصه‌سازي متن , يادگيري عميق , يادگيري خوشه‌بندي , ماشين بولتزمن محدود , شبكه باور عميق
استاد داور :
عبدالرضا ميرزايي
تاريخ ورود اطلاعات :
1397/06/25
كتابنامه :
كتابنامه
رشته تحصيلي :
برق و كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
كد ايرانداك :
ID12586
چكيده فارسي :
چكيده در دنياي كنوني با پيشپرفتهاي شپگرف فناوري الالعاتت دادههاي متني با سرعت ديلي زيادي روبه افزيش است و افراد براي دستيابي پژوهشهايي براي توسعه به الالعات در حوزههاي گوناگون با حجم انبوهي از اسپناد و متون از منابع مختلف روبهرو ميشوندت برايناسا و ارائه روشهاي دالصپهسازي متن وهت دسترسي سريعتر و سادهتر به محتواي اسناد آغاز گرديد در ميان روشهاي ارائهشده كه اغلب با ددالت انسپان عمل دالصپهسپازي متن را انجا ميدهندت روشهاي يادگيري ماشپين سعي دارند بر روي بهبود كيفيت ويژگيها و كمتر كردن ددالت انسپپپان در فرآيند انتخاب ويژگيهاي ومله براي توليد دالصپپپه متن تمركز كنند ازآنجاكه روشهاي يادگيري عميق در مواردي همهون پردازش تصپپويرت پردازش زبان لبيعي و غيره باعث بهبود عملكرد كارهاي مرتبط با اين موضپپوعات شپپدندت ازاينرو اين روشها براي بهبود عملكرد كارهاي مرتبط با پردازش متن نيز به كار گرفته شپپدند ما در اين پژوهش يك مد وديد براي توليد دالصپپه متن اسپپتخراوي با بهرهگيري از روشهاي يادگيري عميق و دوشپپهبندي ارائه كرديم مد پيشپپنهادي ما مبتني بر ماشپپين بولتزمن محدود گوسپپي برنوليت شپپبكه باور عميق و الگوريتم دوشپپهبندي k means اسپپت در اين روش ما ابتدا ويژگيهاي متنوعي براي ومالت متن تعيين ميكنيمت سپپس با ايجاد يك ماتريس ويژگي و اعما آن بر ماشپين بولتزمن محدود و شبكه باور عميقي كه براي اعما وروديهاي حقيقي تغيير پيدا كرده است و همهنين با تغييراتي كه در الگوريتم دوشهبندي k means بهعنوان روش مكمل روش هاي يادگيري عميق براي انتخاب ومالت بااهميت متن داديمت باعث بهبود كيفيت و فرآيند انتخاب ومالت و به لبع آن باعث توليد دالصپپههاي باكيفيت كه دربرگيرنده ومالت كليدي و بيانكننده مفهو اصپپلي سپپند متني هسپپتندت شپپديم در ارزيابي دالصپپههاي توليدي روش پيشپپنهادي با دالصههاي انساني داده هاي متني 2002 DUC كه با استفاده از معيار ارزيابي ROUGE صورت پذيرفتت روش پيشنهادي مبتني بر شبكه باور عميق و دوشپهبندي براي معيار 1 ROUGE به لور ميانگين مقدار 08 75 درصد و براي معيار ارزيابي 2 ROUGE مقدار 23 02 درصد را بهدست آوردكه با تووه به پژوهشهاي كه در حوزه دالصهسازي متن با استفاده از روشهاي يادگيري ماشين ويادگيري عميق صپپورت گرفته اسپپتت دالصپپههاي توليد شپپده با اسپپتفاده از رويكرد پيشپپنهادي در اين پژوهش از كيفيت مناسپپبي بردوردار بوده و از روشهاي دالصهسازي متن مشابه عملكرد بهتري دارد كلمات كليدي دالصهسازي متنت يادگيري عميقت يادگيري ماشينت دوشهبنديت ماشين بولتزمن محدودت شبكه باور عميق
چكيده انگليسي :
3 بههمپيوسپپته متن اتكا ميكرد 1 ازومله روشهاي ايجادي ميتوان يكي سپپنجش ارتباط بهمنظور رتبهدهي به ومالت مرتبط و ديگري اسپپتفاده از تحليل معاني پنهان براي شپپناسپپايي ومالت مهم را نا برد 2 از نظر معنايي بهتدريج و از اوايل سپا 3332 بحث دالصپهسپازي مبتني بركاربر يا دالصپهسپازي شپخصيسازيشده7 مطرح 1 و تا به امروز نيز مقاالت بسپياري در اين زمينه منتشپرشپده اسپت ايده اصپلي دالصهسازي شخصيسازيشده و يا مبتني بركاربر ناشي از ديدگاههاي متفاوت كاربران كه مبتني بر دانش و پيشزمينه الالعاتي اسپت كه دارند بر روي اسناد يكسان است اكثر مقاالتي كه وديدا در دالصهسازي متن ارائه ميشوندت سعي ميكنند بهنوعي بحث شخصيسازي را در نظر بگيرند روشهاي خالصهسازي متن بهلوركلي دو روش متفاوت براي دالصهسازي متن ووود دارد دالصهسازي استخراوي2 و دالصهسازي چكيدهاي0 7 دالصهسازي استخراوي در روش دالصپپپهسپپپازي اسپپپتخراويت گزيدهاي از مجموعه قطعات متن اوليه بدون تغيير بهعنوان دالصپپپه برگردانده ميشود اغلب ومله بهعنوان واحد گزينش انتخاب ميگردد و دالصه با انتخاب يك زيرمجموعه از ومالت متن اصلي ترتيب قرارگيري در متن اصپپلي مرتبسپپازي ميگردند اين دالصپپه شپپامل بخش توليد ميشپپود و ومالت بر اسپپا زيادي از ومالت مهم سپند متن اصپلي است زمان محاسباتي كه اين روش براي توليد دالصه الز دارد نسبت به روش ديگر كمتر اسپپت همهنين اين روش قابليت انعطاف باالتري نسپپبت به روش ديگر دارد به علت محدوديت روشهاي توليد زبان كنونيت روشهاي دالصهسازي استخراوي بهواي نوشتن مفهو يك سند متني وملههاي بااهميت بخشهاي مرتبط را در نظر ميگيرند و اينيك وريان اصلي در اين حوزه است 77 2 دالصهسازي چكيدهاي روشهاي پردازش زبان لبيعي براي تجزيه0ت كاهش محتوا و ايجاد دالصپپه در دالصپپهسپپازي چكيدهاي مورداسپپتفاده قرار ميگيرند آنها شپامل فرموله سپازي پوياي5 محتواي استخراجشدهت فهميدن دقيقتر متن ورودي و محدودسازي به حوزههاي كوچكتر هسپپتند در دالصپپهسپپازي چكيدهاي ومالت متن اوليه تغيير ميكند و درواقع برگرفتهاي از متن اوليه را دواهيم داشپپت دالصپپهسپپازي كه اين روش انجا ميدهد مشپپابه با دالصپپهاي اسپپت كه انسپپان توليد ميكند دالصپهسپازي چكيدهاي به دو نوع دستهبندي ميشود روشهاي مبتني بر سادتار و روشهاي مبتني بر مبنا روشهاي 1 Summary of Customized 2 Extraction 3 Abstractive 4 Parse 5 Dynamic Formulation
استاد راهنما :
محمدرضا احمدزاده
استاد داور :
عبدالرضا ميرزايي
لينک به اين مدرک :

بازگشت