پديد آورنده :
باقري، ايوب
عنوان :
تجزيه و تحليل مبتني بر سطح ويژگي احساسات بر روي نظرات بر خط با استفاده از روش هاي با نظارت بسيار ضعيف
گرايش تحصيلي :
مهندسي كامپيوتر
محل تحصيل :
اصفهان: دانشگاه صنعتي اصفهان، دانشكده برق و كامپيوتر
صفحه شمار :
يازده،147ص.: جدول،نمودار
يادداشت :
ص.ع.به فارسي و انگليسي
استاد راهنما :
محمد حسين سرايي
استاد مشاور :
فرانسيسكا دي يانگ
توصيفگر ها :
پردازش زبان طبيعي , كاوش احساسات , داده كاوي , مدل با نظارت بسيار ضعيف
تاريخ نمايه سازي :
8/6/93
استاد داور :
شادرخ سماوي، حميد بيگي، محمدعلي نعمت بخش
دانشكده :
مهندسي برق و كامپيوتر
كد ايرانداك :
ID657 دكتري
چكيده فارسي :
چكيده با رشد روز فزون طلاعات متني توليد شده توسط كاربر ن در ينترنت تجزيه و تحليل حساسات در متون زمينه كاري جذ بي در بين محققان علوم د دهكاوي و پرد زش زبان طبيعي شده ست تجزيه و تحليل يا كاوش حساسات مطالعه محاسباتي حساسات نظر ت گر يش ها و تمايلات كاربر ن بر روي موضوعات شيا خصوصيات و ويژگيهاي آنها در سناد متني مي باشد يكي ز مهمترين مسائل در تجزيه و تحليل حساسات تجزيه و تحليل مبتني بر سطح ويژگي ست كه هدف آن ستخر ج ويژگيها و كلمات حساس ر ئه شده بر روي آنها ميباشد با فز يش نظر ت برخط كاربر ن بر روي محصولات يا سرويسها نياز به مدلهايي خودكار در جهت تجزيه و تحليل حساسات مبتني بر سطح ويژگي پديد ر ميشود تا به حال روشهاي مختلفي در زمينه تجزيه و تحليل حساسات در سطح ويژگي در دو دسته روشهاي مبتني بر تكر ر و ر بطه و روش هاي مدلگر ر ئه شده ند بسياري ز روشهاي ر ئه شده و بسته به د منه موضوع هستند و ويژگيهاي زيادي ر توليد مي كنند با وجود د منه وسيع و تنوع زياد محصولات و سرويسها ستفاده ز روشهاي و بسته به د منه موضوع ر ه حل مناسبي نخو هد بود علاوه بر ين با فقد ن مجموعه د ده آموزشي برچسب خورده تهيه مجموعه د ده مناسب برچسب خورده در د منههاي موضوعي مختلف مري طاقت فرسا هزينه بر و وقتگير ست در نتيجه نياز به مجموعه د ده بر چسب خورده موجب و بستگي به د منه موضوع خو هد شد علاوه بر د شتن ين چالشها كاستيهاي ديگري كه در روشهاي موجود در حل مسئله تجزيه و تحليل حساسات در سطح ويژگي وجود د رند ستخر ج همزمان ويژگي و حساس يافتن ويژگيهاي پنهان ستخر ج ويژگيهاي چند كلمه ي و و بستگي روشهاي معرفي شده به زبان ميباشند ين رساله با هدف بهبود مدلهاي پيشين و ر ئه ر هكارهايي در جهت رفع چالشهاي موجود به دنبال مدلي ست كه بتو ند با نظارت بسيار ضعيف و بدون نياز به مجموعه د ده برچسب خورده تجزيه و تحليل حساسات در سطح ويژگي ر نجام دهد در ين ر ستا در ين رساله دو مدل با نظارت بسيار ضعيف و با حد قل و بستگي به د منه بر ي تجزيه و تحليل حساسات در سطح ويژگي بر روي نظر ت برخط كاربر ن ر ئه شده ست مدل بدون ناظر تشخيص ويژگي و حساس مدل پبشنهادي ول ست كه نياز به مجموعه د ده برچسب خورده ند رد و علاوه بر ويژگيهاي بارز ويژگيهاي پنهان ر نيز ستخر ج ميكند مدل تشخيص همزمان ويژگي و حساس JASE به عنو ن مدل پيشنهادي دوم ر ئه شده ست كه بر ساس مدلسازي موضوعي سعي در تشخيص همزمان كلمات حساس و ويژگيها د رد ين مدل پيشنهادي علاوه بر ستفاده ز مز ياي روشهاي مبتني بر تكر ر و خصوصيات مفهومي متن ساختار متن ر نيز بر ي كاوش حساسات در نظر ميگيرد در بخش آزمايشها رزيابي مدلهاي 1 Labeled training data
چكيده انگليسي :
Aspect based Sentiment Analysis for Online Reviews Based on Weakly Supervised Approaches Ayoub Bagheri Supervisor Dr Mohamad Saraee Advisor Professor Dr Franciska de JongAbstractWith the rapid growth of user generated content on the internet automatic sentiment anal ysis of textual reviews has become a hot research topic recently among researchers of datamining and natural language processing Sentiment analysis or opinion mining is the com putational study of people s opinions appraisals attitudes and emotions toward entities individuals issues events topics and their attributes One of the main problems in senti ment analysis is aspect based sentiment analysis which its aim is to detect aspects and thesentiments expressed on the aspects As the number of product and service reviews ex pands it is essential to develop an efficient sentiment analysis model that is capable of ex tracting aspects and determining the sentiments for these aspects Up to now different aspect based sentiment analysis approaches have been developed inthe field of relation and frequency based and model based approaches Most of presentedmethods are domain dependent and produce many unrelated aspects But due to varietyand wide range of products and services being reviewed on the internet the supervised anddomain specific models are often not practical Additionally with the lack of labeled train ing dataset building sufficient labeled data is often expensive time consuming and needsmuch human labor Hence a model trained on labeled data in one domain often performspoorly in another domain Other main challenges in aspect based sentiment analysis arejointly detecting aspects and sentiments discovering implicit aspects detecting multi wordaspects and language dependency of models This thesis follows aiming to improve previous works to overcome these challenges to pre sent unsupervised and weakly supervised models in that they require no labeled trainingdata for the aspect based sentiment analysis To this matter in this thesis we proposed twodomain independent weakly supervised models for the aspect based sentiment analysis ononline customer reviews Unsupervised aspect sentiment detection model is the first pro posed model which requires no training data and detects both explicit and implicit aspects Joint aspect sentiment detection model JASE is the second proposed model which is pre sented based on topic modeling and tries to detect sentiment and aspect words simultane ously To mine sentiments the JASE model uses advantages of both frequency based ap proaches and semantic features of text In experiment section the proposed models are evaluated based on standard measures ofinformation retrieval on English and Persian review datasets in document and sentencelevel In the experiments the proposed models have been compared with other approachessuch as frequency and relation based and supervised approaches Experimental resultsshow considerable improvements of the proposed models over conventional models in
استاد راهنما :
محمد حسين سرايي
استاد مشاور :
فرانسيسكا دي يانگ
استاد داور :
شادرخ سماوي، حميد بيگي، محمدعلي نعمت بخش