پديد آورنده :
معنوي فر، علي
عنوان :
طبقه بندي: رويكرد جديد يادگيري در مدل رگرسيون لجستك بر مبناي تابع هدف گسسته
مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
بهينه سازي سيستم ها
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
سيزده، 102ص. :مصور، جدول، نمودار
توصيفگر ها :
هوش مصنوعي , طبقه بندي , رگرسيون لجستيك , لجيت , يادگيري ماشين , باينري , دودويي , داده كاوي , تصميمگيري
تاريخ ورود اطلاعات :
1402/08/28
رشته تحصيلي :
مهندسي صنايع
دانشكده :
مهندسي صنايع و سيستم ها
تاريخ ويرايش اطلاعات :
1402/08/28
چكيده فارسي :
طبقه¬بندي يكي از شناختهشدهترين شاخههاي دادهكاوي است كه به طور گسترده در حوزههاي مختلف بكار گرفته شده است. امروزه طبقهبندي داده جايگاه بسيار ويژهاي در تصميم¬گيري، تصميمسازي و فرايندهاي تشخيص دارد و از آن در بسياري از صنايع و علوم مختلف استفاده مي¬شود. چندين رويكرد طبقه¬بندي مختلف در ادبيات موضوع براي افزايش دقت نتايج توسعه داده شده است. بااينحال، تنها تعداد كمي از آنها را ميتوان به طور مؤثر براي مديريت مجموعه¬هايي استفاده كرد كه شامل مجموعه¬اي بزرگ از داده¬ها مي¬باشند. دليل اصلي، مربوط به زمان محاسباتي و هزينه بالاي چنين طبقهبنديكنندههايي است كه آنها را ناكارآمد ميكند. طبقهبنديكنندههاي خطي و آماري، عليرغم دقت پايينتري كه دارند، به دليل هزينه پايين براي محاسبات و زمان مطلوب، از شناختهشدهترين طبقهبنديكنندهها براي مجموعهدادههاي بزرگ هستند. يكي از روشهاي طبقهبندي كه بسيار در تحقيقات مختلف در ادبيات موضوع بهصورت منفرد يا تركيبي از آن استفاده شده است روش رگرسيون لجستيك براي داده¬ها و فضاهاي دودويي است. در اين پژوهش، يك روش يادگيري جديد براي افزايش دقت طبقهبنديكنندههاي رگرسيون لجستيك پيشنهاد شده است. روشي كه در اكثر تحقيقات از آن براي آموزش ضرايب تابع رگرسيون لجستيك استفاده مي¬شود روش حداكثر درستنمايي است كه بر مبناي تابع هدفي پيوستهكار ميكند. ما در اين تحقيق براي آموزش ضرايب در تابع رگرسيون لجستيك برخلاف عادت مرسوم تابع هدفي گسسته را ارائه مي¬دهيم. اين روش از مدلسازي رياضي عدد صحيح مختلط استفاده كرده و بهمنظور ارزيابي جامع آن از بيست و سه مجموعهداده محك براي طبقهبندي استفاده ميشود و عملكرد آن با طبقهبنديكننده رگرسيون لجستيك متداول مقايسه ميگردد. نتايج تجربي نشان ميدهد كه مدل با رويكرد تابع هدف گسسته پيشنهادي به نرخ طبقهبندي بالاتري نسبت به مدل رگرسيون لجستيك متداول در تمام مجموعههاي داده دست مييابد. علاوه بر اين، طبقهبنديكننده پيشنهادي توانست ميانگين نرخ طبقهبندي را در بيست و سه مجموعه داده محك 91٫57 درصد به دست آورد كه تقريباً 9 درصد بيشتر از مدل كلاسيك است. مدل كلاسيك ميانگين نرخ طبقهبندي را تنها 82٫50 درصد بدست آورد. باتوجهبه اين موضوع، روش پيشنهادي ميتواند جايگزين مناسب و مؤثري براي رويكرد طبقهبندي خطي در مجموعهدادههاي دوگانه باشد. اين موضوع بهويژه در شرايطي كه با دادههاي بزرگ سروكار داريم بسيار موثر و حائز اهميت است.
چكيده انگليسي :
Classification is one of the most well-known branches of data mining, which has been widely used in various fields. Today, data classification has a very special place in decision-making, decision-making and diagnosis processes, and it is used in many different industries and sciences. Several different classification approaches have been developed in the literature to increase the accuracy of the results. However, only a few of them can be effectively used to manage collections that contain large sets of data. The main reason is related to the computational time and high cost of such classifiers, which makes them inefficient. Despite their lower accuracy, linear and statistical classifiers are the most popular classifiers for large datasets due to their low computational cost and favorable time. One of the classification methods that has been used in various researches in the subject literature individually or in combination is the logistic regression method for binary data and spaces. In this research, a new learning method is proposed to increase the accuracy of logistic regression classifiers. The method that is used in most researches to train the coefficients of the logistic regression function is the maximum likelihood method, which works based on a continuous objective function. In this research, we present a discrete objective function for training the coefficients in the logistic regression function, contrary to the usual practice. This method uses mixed integer mathematical modeling, and in order to evaluate it comprehensively, twenty-three benchmark datasets are used for classification, and its performance is compared with the conventional logistic regression classifier. Experimental results show that the model with the proposed discrete objective function approach achieves a higher classification rate than the conventional logistic regression model in all datasets. In addition, the proposed classifier can achieve an average classification rate of 91.57% on twenty-three benchmark datasets, which is approximately 9% higher than the classical model. The classical model obtained an average classification rate of only 82.50%. Considering this issue, the proposed method can be a suitable and effective alternative to the linear classification approach in dual datasets. This issue is very effective and important especially when we are dealing with big data.
استاد راهنما :
مهدي خاشعي آشياني
استاد مشاور :
علي زينل همداني
استاد داور :
نادر شتاب بوشهري , صبا صارمي نيا