توصيفگر ها :
انتخاب طبقهبند , انتخاب معماري , فرايادگيري , فراويژگي , فرامدل , توصيف پايگاه داده , استخراج ويژگي , انتخاب ويژگي
چكيده فارسي :
با توجه به اصل ناهار رايگان و تنوع ساختاري پايگاهدادههاي تصويري، هيچ طبقهبندي بهطور يكنواخت بهترين عملكرد را بر روي همهي مسائل ارائه نميدهد؛ ازاينرو، انتخاب مدل مناسب نيازمند بهرهگيري از رويكردهاي فرايادگيري است تا بتوان بر اساس شناخت ويژگيهاي داده، رفتار طبقهبندها را پيشبيني و مدل مطلوب را توصيه كرد. تاكنون روشهاي فرايادگيري مختلفي براي پايگاهدادههاي جدولي ارائه شده است. اما براي پايگاهدادههاي تصويري و دادههاي سري زماني به دليل مشكلات و تفاوتهاي موجود در پايگاهدادهها كارهاي كمتري انجام شده است. در پايگاهدادههاي تصويري به دليل بُعد بالا از شبكههاي عصبي عميق براي كاهش بُِعد استفاده ميشود. اين حالت تفسيرپذيري را كم ميكند. بر اين اساس در اين پژوهش، يك روش فرايادگيري مبتني بر فراويژگيها براي پايگاهدادههاي تصويري ارائه شده است كه در آن ابتدا مجموعهاي از ويژگيها بهمنظور توصيف جنبههاي مختلف پايگاهداده گردآوري شده و اين ويژگيها با رويكرد عملكردمحور دستهبندي شدهاند تا امكان انتخاب هدفمند و كارآمد ويژگيها بر اساس نوع مسئله و روش استخراج فراهم گردد. در بخش پاياني پژوهش، از اين ويژگيها براي توصيف پايگاهدادههاي تصويري استفاده شده است. نتايج حاصل از تحليل مجموعهاي از پايگاهدادههاي تصويري و انتخاب طبقهبند مناسب براي هر يك ارائه شده است. اين بررسيها نشان داد كه با شناخت دقيق ويژگيهاي داده ميتوان اجزاي كليدي مسئله را بهتر شناسايي كرده و مسير حل مناسب را ترسيم نمود. با استفاده از ويژگيهاي انتخابشده در اين پژوهش و 56 پايگاهدادهي تصويري، نتايج بهدستآمده مورد ارزيابي قرار گرفت و دقت انتخاب طبقهبند براي پايگاهدادههاي تست %15/86 بوده است. همچنين تأثير ويژگيها بهطور جداگانه مورد بررسي قرار گرفت و نتايج اين تحليل نشان داد كه برخي ويژگيها، بهويژه آنهايي كه به توزيع و پراكندگي دادهها از نظر تعداد نمونهها اشاره دارند، تأثير بيشتري بر دقت طبقهبندي نسبت به ساير ويژگيهايي كه بر معيارهايي مانند فاصله متكي هستند، دارند. بر همين اساس، ماتريس توصيفگر فضاي توزيع براي هر پايگاهداده در نظر گرفته شد و ويژگيهايي با اين رويكرد از آن استخراج گرديد. نتايج آزمايشها نشان داد كه سه ويژگي از ويژگيهاي استخراجشده، همبستگي بالاي 7/0 با دقت طبقهبندها دارند. از اين ويژگيها براي انتخاب طبقهبند نيز استفاده شد و با استفاده از 5 ويژگي، دقت %56/86 به دست آمده است كه در مقايسه با 5 ويژگي برتر انتخابشده توسط روش انتخاب همبستگي، %1 افزايش دقت داشته است. علاوه بر اين، نتايج بررسيها نشان داد كه استفاده از يادگيري انتقالي براي استخراج ويژگي از تصاوير، نسبت به استفاده از مدلهاي از پيش آموزشديده، عملكرد بهتري دارد و براي كاهش ابعاد نيز ضروري است كه انتخاب ابعاد بر اساس نوع دادهها انجام شود و نه اينكه يك انتخاب ثابت براي تمامي دادهها اعمال گردد. افزون بر اين، استفاده از ويژگيهاي بررسيشده در اين پژوهش نسبت به ويژگيهاي ارائهشده براي دادههاي برداري، موجب افزايش دقت كار به ميزان %2 گرديده است. در مجموع، اين روش فرايادگيريمحور نشان ميدهد كه با توصيف دقيق پايگاهداده در فضاي فراويژگيها ميتوان رفتار مدلها را در سطح فراداده آموخت و فرآيند انتخاب طبقهبند را به يك مسئلهي فرايادگيري تبديل كرد كه دقت، تفسيرپذيري و كارايي تصميمگيري را در مسائل تصويري بهطور قابل توجهي افزايش ميدهد. با توجه به نقش كليدي استخراج و انتخاب ويژگي در مسئله فرايادگيري، اين مراحل با هدف طبقهبندي و انتخاب تنظيمات مناسب بر روي سه پايگاه داده مورد بررسي قرار گرفتند. نتايج اين آزمايشها اهميت اين مراحل و همچنين لزوم انتخاب روشها و تنظيمات متناسب با هر پايگاه داده را بهخوبي نشان داد.
چكيده انگليسي :
Grounded in the No Free Lunch theorem, no single classifier can achieve optimal performance across all image classification
tasks due to the structural diversity of image datasets. Consequently, model selection benefits from meta-learning
approaches, which predict classifier performance and recommend suitable models based on data characteristics. While
meta-learning has been extensively studied for tabular data, comparatively little research addresses image and time-series
datasets, largely due to their high dimensionality and structural complexity. In image analysis, this challenge has led to
the widespread adoption of deep neural networks for dimensionality reduction, often at the expense of model interpretability.
Based on these observations, this research proposes a meta-learning approach using meta-features for image datasets.
A comprehensive set of features is extracted to describe dataset characteristics and organized using a performance-driven
strategy to enable efficient, problem-specific feature selection. The selected features are used to characterize image datasets
and guide classifier selection, demonstrating that a precise understanding of data properties supports effective problem
identification and solution design. Using the features selected in this study and 56 image datasets, the obtained results
were evaluated, yielding a classifier selection accuracy of 86.15% on the test datasets. Furthermore, the impact of individual
features was examined separately, revealing that features related to the distribution and dispersion of data in terms of
sample counts have a greater influence on classification accuracy than distance-based features. Accordingly, a descriptive
matrix representing the distribution space of each dataset was constructed, and features were extracted from this perspective.
Experimental results showed that three of the extracted features exhibited a high correlation (greater than 0.7) with
classifier accuracy. These features were subsequently used for classifier selection, achieving an accuracy of 86.56% using
only five features, which represents a 1% improvement over the five best features selected using a correlation-based feature
selection method. In addition, the results indicate that employing transfer learning for image feature extraction yields better
performance than relying solely on pre-trained models. For dimensionality reduction, it is also essential that the number
of selected dimensions be determined based on data characteristics rather than applying a fixed choice across all datasets.
Moreover, the features investigated in this research led to a 2% improvement in accuracy compared to features designed
for vector-based data. Overall, the proposed meta-learning approach demonstrates that effective dataset characterization in
the meta-feature space enables learning model behavior and reframes classifier selection as a meta-learning task, improving
accuracy, interpretability, and efficiency. Experiments on three datasets further highlight the importance of tailored feature
extraction, selection methods, and parameter settings for each dataset.