توصيفگر ها :
داده كاوي , مدل سازي , طبقه بندي , الگوريتم هاي يادگيري گسسته و پيوسته
چكيده فارسي :
طبقه بندي يكي از مهمترين شاخه هاي داده كاوي است كه در طيف وسيعي از مسائل بطور موفقيت آميزي مورد استفاده قرار گرفته است. در ادبيات موضوع، تلاش هاي زيادي به منظور ارائه مدلهاي طبقه بندي كارآمدتر و دقيق تر صورت گرفته است. مدل هاي طبقه بندي ارائه شده را مي توان از منظر ابعاد مختلف در دسته بندي هاي متفاوتي قرار داد كه از جمله مهمترين اين دسته بندي ها، دسته بندي آنها به انواع مدل هاي آماري، هوشمند و عميق ميباشد. عليرغم تنوع گسترده مدل هاي طبقه بندي ارائه شده در ادبيات موضوع، همه آنها بر اساس متدولوژي مشابهي توسعه يافته اند و يك مسئله اساسي در ارتباط با فرآيند يادگيري اين مدل ها ناديده گرفته شده است. در واقع، در فرآيند يادگيري همه مدل هاي طبقه بندي موجود در ادبيات موضوع، يك تابع هزينه پيوسته مبتني بر فاصله به منظور تخمين پارامترهاي ناشناخته مدل استفاده مي شود و اين در حالي است كه مسئله طبقه بندي داراي ماهيتي گسسته است. در واقع، در فرآيندهاي يادگيري معمول كه آموزش مدل طبقه بندي براساس توابع هزينه پيوسته مبتني بر فاصله صورت ميگيرد، مقادير برازش به صورت پيوسته به مقدار واقعي نزديك مي شوند. به عبارت ديگر، در هر تكرار از آموزش، فاصله بين مقادير واقعي و برازش پيوسته كاهش مي يابد. بنابراين، در مسائل
مدل سازي پيوسته مانند پيش بيني هاي علّي يا تحليل سريهاي زماني پيوسته، ميتوان به طور كلي تضمين كرد كه عملكرد مدل به طور مداوم بهبود مي يابد. با اين حال، اين موضوع در مدل سازي هاي گسسته مانند مسائل طبقه بندي صادق نيست. در واقع خروجي هاي نهايي يك فرآيند يادگيري پيوسته لازم است قبل از گزارش به عنوان خروجي مدل طبقه بندي گسسته شوند. در نتيجه، اگر فرايندهاي يادگيري و گسسته سازي همسو باشد، فرآيند يادگيري ممكن است منجر به بهبود عملكرد شود. در غير اين صورت، اثر فرايند يادگيري تحت تأثير گسسته سازي از بين خواهد رفت. بنابراين روند يادگيري در چنين شرايطي ميتواند بي فايده و بي تأثير باشد. بدين ترتيب بكارگيري يك تابع هزينه پيوسته براي مسئله طبقه بندي كه خود داراي تابع هدفي گسسته است، ميتواند دقت نتايج حاصله را تحت تأثير قرار دهد. در مقابل، بكارگيري يك فرايند يادگيري كه براساس توابع گسسته عمل نمايد، به دليل سازگاري بيشتر با ذات گسسته مسأله طبقه بندي مي تواند به نتايج مطلوب تري منتهي گردد. در اين رساله يك متدولوژي طبقه بندي متفاوت كه از يك تابع گسسته در فرآيند يادگيري استفاده مي كند، پيشنهاد و اجرا شده است. بدين منظور، از سه مدل طبقه بندي رگرسيون لجستيك، شبكه عصبي پرسپترون چندلايه و شبكه عصبي پرسپترون چندلايه عميق كه به ترتيب از محبوب ترين مدل هاي طبقه بندي آماري، هوشمند و عميق هستند، به عنوان نمونه براي اجراي متدولوژي پيشنهادي استفاده مي گردد. جهت ارزيابي جامع رويكرد طبقه بندي پيشنهادي، مدل هاي پيشنهادي و نسخه كلاسيك نها بر روي چندين مجموعه داده محك پياده سازي شده و عملكرد آنها با يكديگر مقايسه شده است. نتايج حاصل از اين رساله نشانگر برتري مدل هاي طبقه بندي مبتني بر يادگيري گسسته جهت محور نسبت به نسخه هاي كلاسيك آن ها ميباشد. بنابراين، رويكرد طبقه بندي مبتني بر يادگيري گسسته جهت محور پيشنهادي مي تواند به عنوان يك روش جايگزين مفيد در فرايندهاي يادگيري مدل هاي طبقه بندي مختلف بكار گرفته شود.
چكيده انگليسي :
Classification is one of the most important branches of data mining, which has been successfully used in a wide range of problems. In the literature, many efforts have been made to provide more efficient and accurate classification models. The presented classification models can be classified into different categories from the perspective of different dimensions, the most important of which are the categories, their classification into various statistical, intelligent and deep models. Despite the wide variety of classification models presented in the literature, all of them have been developed based on a similar methodology, and a fundamental issue related to the learning process of these models has been ignored. In fact, in the learning process of all existing classification models in the literature, a distance-based continuous cost function is used to estimate the unknown parameters of the model, even though the classification problem has a discrete nature. In other words, in the usual learning processes where the training of the classification model is based on distance-based continuous cost functions, the fitting values continuously approach the real value. In other words, in each iteration of the training, the distance between the actual and fitted values decrease continuously. Therefore, in continuous modeling problems such as causal predictions or continuous time series analysis, it can generally be guaranteed that the performance of the model is continuously improved. However, this issue is not true in discrete modeling such as classification problems. In fact, the final outputs a continuous learning process need to be discrete before reporting as the output of the classification model. As a result, if the learning and discretization processes are aligned, the learning process may lead to improved performance. Otherwise, the effect of the learning process will be lost under the influence of discretization. Therefore, the learning process in such conditions can be useless and ineffective. Thus, using a continuous cost function for the classification problem, which itself has a discrete objective function, can affect the accuracy of the results. On the other hand, using a learning process based on discrete functions can lead to better results due to its greater compatibility with the discrete nature of the classification problem. In this thesis, a different classification methodology that uses a discrete function in the learning process has been proposed and implemented. For this purpose, three logistic regression classification models, multilayer perceptron neural network and deep multilayer perceptron neural network, which are among the most popular statistical, intelligent and deep classification models respectively, are used as examples to implement the proposed methodology. In order to comprehensively evaluate the proposed classification approach, the proposed models and their classic version have been implemented on several benchmark datasets and their performance has been compared. The results of this thesis indicate the superiority of the classification models based on discrete direction-based learning compared to their classical versions. Therefore, the proposed classification approach based on discrete learning can be used as a useful alternative method in learning processes of different classification models.