طبقه بندي: رويكرد جديد يادگيري در مدل رگرسيون لجستك بر مبناي تابع هدف گسسته

شماره مدرك :

19038

شماره راهنما :

16516

پديد آورنده :

معنوي فر، علي

عنوان :

طبقه بندي: رويكرد جديد يادگيري در مدل رگرسيون لجستك بر مبناي تابع هدف گسسته

مقطع تحصيلي :

كارشناسي ارشد

گرايش تحصيلي :

بهينه سازي سيستم ها

محل تحصيل :

اصفهان : دانشگاه صنعتي اصفهان

سال دفاع :

1402

صفحه شمار :

سيزده، 102ص. :مصور، جدول، نمودار

توصيفگر ها :

هوش مصنوعي , طبقه بندي , رگرسيون لجستيك , لجيت , يادگيري ماشين , باينري , دودويي , داده كاوي , تصميم‌گيري

تاريخ ورود اطلاعات :

1402/08/28

كتابنامه :

كتابنامه

رشته تحصيلي :

مهندسي صنايع

دانشكده :

مهندسي صنايع و سيستم ها

تاريخ ويرايش اطلاعات :

1402/08/28

كد ايرانداك :

2986028

چكيده فارسي :

طبقه¬بندي يكي از شناخته‌شده‌ترين شاخه‌هاي داده‌كاوي است كه به طور گسترده در حوزه‌هاي مختلف بكار گرفته شده است. امروزه طبقه‌بندي داده جايگاه بسيار ويژه‌اي در تصميم¬گيري، تصميم‌سازي و فرايندهاي تشخيص دارد و از آن در بسياري از صنايع و علوم مختلف استفاده مي¬شود. چندين رويكرد طبقه¬بندي مختلف در ادبيات موضوع براي افزايش دقت نتايج توسعه داده شده است. بااين‌حال، تنها تعداد كمي از آنها را مي‌توان به طور مؤثر براي مديريت مجموعه¬هايي استفاده كرد كه شامل مجموعه¬اي بزرگ از داده¬ها مي¬باشند. دليل اصلي، مربوط به زمان محاسباتي و هزينه بالاي چنين طبقه‌بندي‌كننده‌هايي است كه آنها را ناكارآمد مي‌كند. طبقه‌بندي‌كننده‌هاي خطي و آماري، علي‌رغم دقت پايين‌تري كه دارند، به دليل هزينه پايين براي محاسبات و زمان مطلوب، از شناخته‌شده‌ترين طبقه‌بندي‌كننده‌ها براي مجموعه‌داده‌هاي بزرگ هستند. يكي از روش‌هاي طبقه‌بندي كه بسيار در تحقيقات مختلف در ادبيات موضوع به‌صورت منفرد يا تركيبي از آن استفاده شده است روش رگرسيون لجستيك براي داده¬ها و فضاهاي دودويي است. در اين پژوهش، يك روش يادگيري جديد براي افزايش دقت طبقه‌بندي‌كننده‌هاي رگرسيون لجستيك پيشنهاد شده است. روشي كه در اكثر تحقيقات از آن براي آموزش ضرايب تابع رگرسيون لجستيك استفاده مي¬شود روش حداكثر درست‌نمايي است كه بر مبناي تابع هدفي پيوسته‌كار مي‌كند. ما در اين تحقيق براي آموزش ضرايب در تابع رگرسيون لجستيك برخلاف عادت مرسوم تابع هدفي گسسته را ارائه مي¬دهيم. اين روش از مدل‌سازي رياضي عدد صحيح مختلط استفاده كرده و به‌منظور ارزيابي جامع آن از بيست و سه مجموعه‌داده محك براي طبقه‌بندي استفاده مي‌شود و عملكرد آن با طبقه‌بندي‌كننده رگرسيون لجستيك متداول مقايسه مي‌گردد. نتايج تجربي نشان مي‌دهد كه مدل با رويكرد تابع هدف گسسته پيشنهادي به نرخ طبقه‌بندي بالاتري نسبت به مدل رگرسيون لجستيك متداول در تمام مجموعه‌هاي داده دست مي‌يابد. علاوه بر اين، طبقه‌بندي‌كننده پيشنهادي توانست ميانگين نرخ طبقه‌بندي را در بيست و سه مجموعه داده محك 91٫57 درصد به دست آورد كه تقريباً 9 درصد بيشتر از مدل كلاسيك است. مدل كلاسيك ميانگين نرخ طبقه‌بندي را تنها 82٫50 درصد بدست آورد. باتوجه‌به اين موضوع، روش پيشنهادي مي‌تواند جايگزين مناسب و مؤثري براي رويكرد طبقه‌بندي خطي در مجموعه‌داده‌هاي دوگانه باشد. اين موضوع به‌ويژه در شرايطي كه با داده‌هاي بزرگ سروكار داريم بسيار موثر و حائز اهميت است.

چكيده انگليسي :

Classification is one of the most well-known branches of data mining, which has been widely used in various fields. Today, data classification has a very special place in decision-making, decision-making and diagnosis processes, and it is used in many different industries and sciences. Several different classification approaches have been developed in the literature to increase the accuracy of the results. However, only a few of them can be effectively used to manage collections that contain large sets of data. The main reason is related to the computational time and high cost of such classifiers, which makes them inefficient. Despite their lower accuracy, linear and statistical classifiers are the most popular classifiers for large datasets due to their low computational cost and favorable time. One of the classification methods that has been used in various researches in the subject literature individually or in combination is the logistic regression method for binary data and spaces. In this research, a new learning method is proposed to increase the accuracy of logistic regression classifiers. The method that is used in most researches to train the coefficients of the logistic regression function is the maximum likelihood method, which works based on a continuous objective function. In this research, we present a discrete objective function for training the coefficients in the logistic regression function, contrary to the usual practice. This method uses mixed integer mathematical modeling, and in order to eva‎luate it comprehensively, twenty-three benchmark datasets are used for classification, and its performance is compared with the conventional logistic regression classifier. Experimental results show that the model with the proposed discrete objective function approach achieves a higher classification rate than the conventional logistic regression model in all datasets. In addition, the proposed classifier can achieve an average classification rate of 91.57% on twenty-three benchmark datasets, which is approximately 9% higher than the classical model. The classical model obtained an average classification rate of only 82.50%. Considering this issue, the proposed method can be a suitable and effective alternative to the linear classification approach in dual datasets. This issue is very effective and important especially when we are dealing with big data.

استاد راهنما :

مهدي خاشعي آشياني

استاد مشاور :

علي زينل همداني

استاد داور :

نادر شتاب بوشهري , صبا صارمي نيا

لينک به اين مدرک :

https://library.iut.ac.ir/dL/search/default.aspx?Term=19038&Field=0&DTC=107

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد