شماره مدرك :
9654
شماره راهنما :
8898
پديد آورنده :
موحدي، محمد حامد
عنوان :

پالايش داده هاي پرت براي يافتن اطلاعات مفيد در مجموعه داده هاي غير گسترش يافته

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
كامپيوتر - هوش مصنوعي
محل تحصيل :
اصفهان: دانشگاه صنعتي اصفهان، دانشكده برق و كامپيوتر
سال دفاع :
1393
صفحه شمار :
ده،148ص.: مصور،جدول،نمودار
يادداشت :
ص.ع.به فارسي و انگليسي
استاد راهنما :
محمدعلي منتظري، علي زينل همداني
تاريخ نمايه سازي :
93/12/20
استاد داور :
مهران صفاياني
دانشكده :
مهندسي برق و كامپيوتر
كد ايرانداك :
ID8898
چكيده فارسي :
چكيده كشف دادهپرت مرحله مهمي در پيشپردازش دادهها است و نتايج دادهكاوي وابسته به انجام صحيح آن ميباشد در كشف دادهپرت دادههايي كه با ساير دادهها تفاوت زيادي دارند و رفتار دادههاي معمولي را نشان نميدهند شناسايي شده و حذف ميگردند مراحل بعدي دادهكاوي تنها بر روي دادههاي معمولي انجام ميشوند چنانچه دادههاي پرت حذف نشوند و همراه با دادههاي معمولي پردازش شوند ممكن است مدل ناصحيحي ايجاد كنند و مدل نهايي بيانگر رفتار معمول نمونهها نباشد حذف اين دادهها در حالي صورت ميگيرد كه در برخي موارد تعداد دادههاي پرت زياد است يا اين دادهها داراي ارزش و مفهوم خاصي هستند در اين تحقيق به بررسي استفاده از دادههاي پرت در چنين مواردي پرداخته خواهد شد تا مشخص شود كه آيا پردازش جداگانه اين دادهها ميتواند سودمند باشد يا خير به اين منظور روشهاي دادهكاوي به طور جداگانه بر روي دادههاي معمولي و پرت اعمال ميشوند تا مدل يا مدلهايي براي بيان رفتار هر گروه حاصل شود براي ارزيابي نتايج از دقت استفاده ميشود و دقت روش پيشنهادي كه پردازش جداگانه دادههاي معمولي و پرت است با روش معمول كه همان حذف دادههاي پرت است مقايسه ميگردد در اين راستا از چهار مجموعه داده استاندارد كه معموال در كشف دادهپرت استفاده ميشوند يعني Pima Indian Diabetes WDBC German credit و BCW يك مجموعه داده ساختگي بهره برده ميشود بر طبق پيادهسازيهاي انجام شده پردازش اين دادهها حداقل به روشي كه در اين تحقيق مورد استفاده قرار گرفته است به عنوان يك روش معمول مناسب نيست
چكيده انگليسي :
Refining outliers for finding useful information in unextended datasets Mohammad Hamed Movahedi Mh movahedi email@gmail com 12 30 2014 Department of Electrical and Computer Engineering Isfahan University of Technology Isfahan 84156 83111 Iran Degree M sc Language Farsi Mohammad Ali Montazeri montazeri@cc iut ac irAbstractOutlier detection is considered as a critical and crucial stage in data pre processing What adds to theimportance of this stage is that the results of data mining depend on it In outlier detection data that are totallydifferent from other data and do not show the normal data s behavior are detected and deleted Data miningwill be continued by using normal data If the outliers will not be deleted and be processed accompanying withthe normal data it may lead to getting incorrect model that does not show the normal behavior of data Thesedata are deleted while either their numbers are high in some cases or they have special meanings and values This study investigates the usage of outlier in these cases in order to examine whether the separate processingof these data is advantageous or not For this purpose the data processing approaches will be separately doneon outliers and normal data in order to achieve model models of expressing each group s behavior In analyzingthe results will use accuracy and the accuracy of suggested approach which is the separate analysis of normaldata and outlier is compared with the normal approach which is outlier deletion In this regard four standarddata set which are usually applied in outlier detection that are German credit WDBC Pima Indian Diabetesand BCW and one set of dummy data will be utilized Based on the accomplished implementations processingof these data at least according to the approach that was used in this study is not suitable as a common method Key words outlier outlier detection using outlier
استاد راهنما :
محمدعلي منتظري، علي زينل همداني
استاد داور :
مهران صفاياني
لينک به اين مدرک :

بازگشت