توصيفگر ها :
دسته بندي تصاوير برگ , يادگيري با دادهي اندك , يادگيري انتقالي , يادگيري عميق كارآمد , جستجوي معماري عصبي , كوانتيزه سازي مدل
چكيده فارسي :
تشخيص گونههاي گياهان مسئلهاي است كه از ديرباز تا به امروز توسط روشهاي مختلف بررسي شدهاست. علاوه بر اين هر گونهي گياهي خود به ارقام (زيرگونهها) مختلف دستهبندي ميشوند. با توجه به اينكه ارقام مختلف از يك گونه گياهي، هم خانواده هستند، شباهت زيادي به يكديگر دارند و تشخيص ارقام بسيار سختتر از تشخيص گونهها است. به همين دليل در پژوهشهاي اخير مسئلهي تشخيص ارقام همچنان يكي از مسائل مورد توجه است. در اين پژوهش به طور خاص تشخيص ارقام مختلف گياهچهي سيبزميني بررسي ميشود. هر رقم از اين گياهچهها، از شرايط كشت تا نوع مصرف، با ساير ارقام متفاوت است، بنابراين از اولين مرحلهي توليد و تكثير بذر تا توليد محصول در مزارع سراسر كشور، بايد ارقام گياهچههاي سيبزميني مشخص وقابل تفكيك باشند، در غير اين صورت ممكن است به توليدكنندگان بذر و مزرعهداران خسارت وارد شود. ابتدا مجموعه دادهاي از تصاوير برگ ارقام مختلف گياهچهي سيبزميني تهيه كرديم. اين مجموعه داده شامل برگهاي مركب گياهچهي سيبزميني و نيز برگچههاي رأس آن ميشوند. همچنين تصويربرداري از دو سمت پشت و روي همهي برگها انجام گرفته است. با توجه به اينكه فرايند جمعآوري داده، فرايندي زمانبر و پرهزينه است، مجموعه دادهي تهيه شده براي استفاده از يادگيري عميق، اندك است، به همين علت روشهاي پيشنهادي در اين پژوهش بر اساس يادگيري با دادهي اندك بنا نهاده شدهاست. براي بررسي دقيقتر، مجموعه دادهها را بر اساس تعداد نمونههاي هر دسته، در دو طبقهي اندك و بسيار اندك طبقهبندي كرديم. مجموعه دادههاي اندك شامل 6 رقم است كه بين 24 تا 75 نمونه برگ براي هر رقم تهيه شدهاست و مجموعه دادهي بسيار اندك شامل 19 رقم است كه شامل 10 تا 12 نمونه برگ براي هر رقم ميشود. در اين پژوهش دو روش پيشنهادي ارائه شده است. روش اول مبتني بر افزونسازي دادهها به همراه يادگيري انتقالي است. در اين روش با بررسي عملكرد مدلهاي مختلف شبكههاي عصبي پيچشي از پيش آموزش ديده، بهترين آنها را براي مجموعه دادههاي مدنظر خود انتخاب كرده و با يك روش تنظيم دقيق، دقت عملكرد آنها را بهبود داديم. روش دوم يك توسعه از روش اول است كه در آن نسبت به روش اول، علاوه بر استفاده از معماري كارآمد، مراحل خودكارسازي با الگوريتم NAS و كوانتيزهسازي نيز اضافه شده است تا نتيجهي آن ايجاد يك مدل كارآمد باشد، به اين معني كه مدل نهايي علاوه بر دقت بالا در دستهبندي ارقام، حجم حافظهاي و بار محاسباتي كمي داشته باشد تا زمان اجرا و هزينهي استنتاج كاهش يابد. اين مزيت با توجه به كاربردي بودن مسئلهي تشخيص ارقام، براي استفاده در دستگاههاي تعبيه شده و تلفن همراه، يك امتياز مثبت محسوب ميشود. در بررسي نتايج مشخص گرديد كه دستهبندي ارقام با استفاده از تصاوير پشت برگها با دقت بهتر صورت ميپذيرد. همچنين بهترين نتايج براي مجموعه دادههاي متشكل از برگهاي مركب و با استفاده از روش پيشنهادي دوم حاصل شدهاست. اين نتايج براي دستهبندي ارقام مجموعه دادهي اندك از تصاوير پشت برگ مركب با دقت 100 درصد و براي مجموعه دادهي بسيار اندك از تصاوير پشت برگ مركب با دقت 47/89 بدست آمدهاست. روش برتر را با توجه به مراحل اصلي آن تحت عنوان روش يادگيري انتقالي خودكار كارآمد نام نهاديم.
چكيده انگليسي :
The recognition of plant species is an issue that has been examined through various methods from ancient times to the present day. In addition, each plant species is further categorized into different cultivars/varieties. Since different cultivars/varieties of a plant species belong to the same family, they share many similarities, and identifying cultivars/varieties is much harder than identifying species. For this reason, the issue of recognizing cultivars/varieties continues to be a subject of interest in recent research. In this study, the specific recognition of different cultivars/varieties of potato seedlings is investigated. Each cultivar of these seedlings is different in terms of cultivation conditions and usage, so from the first stage of seed production and propagation to the production of crops in farms across the country, the cultivars/varieties of potato seedlings must be identified and distinguishable; otherwise, it may cause damage to seed producers and farmers. Initially, we prepared a dataset of images of leaves from different cultivars/varieties of potato seedlings. This dataset includes compound leaves of potato seedlings as well as leaflets of their heads. Furthermore, imaging was done from both the back and front sides of all the leaves. Since the data collection process is time-consuming and costly, the dataset we obtained for deep learning is small. Therefore, our proposed methods are based on few shot learning. For a more detailed examination, we categorized the datasets into two classes: small and very small, based on the number of samples in each category. The small dataset includes 6 cultivars/varieties with 24 to 75 leaf samples for each cultivar, while the very small dataset consists of 19 cultivars/varieties with only 10 to 12 leaf samples for each cultivar. In this study, two proposed methods are presented. The first method is based on data augmentation along with transfer learning. In this method, we selected the best-performing pre-trained convolutional neural network models for our target datasets by examining the performance of various models and improved their performance with a fine-tuning method. The second method is an extension of the first method, in which, in addition to using an efficient architecture, automation steps using the NAS algorithm and quantization are added to create an efficient model. This means that the final model not only has high accuracy in classifying cultivars/varieties but also has lower memory footprint and computational load to reduce inference time and cost. This advantage, considering the practicality of the cultivars/varieties recognition problem, is considered a positive point for use in embedded devices and mobile phones. The results showed that classifying cultivars/varieties using images of the backside of the leaves is more accurate. Furthermore, the best results were obtained for datasets consisting of compound leaf images using the second proposed method. These results include 100% accuracy for classifying cultivars/varieties in the small dataset of compound leaf backside images and 89.47% accuracy for the very small dataset of compound leaf backside images. Based on its key steps, we named the superior method "Efficient Automated Transfer Learning".