پديد آورنده :
سپهري، سارا
عنوان :
بهبود كارايي محاسباتي هستهي چند مقياسي كوتاهترين مسير واسراشتاين براي دسته بندي گرافها
مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
گراف و تركيبيات
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
توصيفگر ها :
شباهتسنجي گراف , هستههاي گراف , كوتاهترين مسير , فاصلهي واسرشتاين , نمايش تُنُك , يادگيري ماشين بر دادههاي ساختاريافته
تاريخ ورود اطلاعات :
1404/07/30
تاريخ ويرايش اطلاعات :
1404/09/01
چكيده فارسي :
يكي از مسائل بنيادي در يادگيري ماشين بر روي دادههاي ساختاريافته، {مقايسه و شباهتسنجي ميان گرافها} است. اين مسئله در بسياري از كاربردهاي عملي همچون دستهبندي شبكههاي زيستي، تحليل شبكههاي اجتماعي و تشخيص ناهنجاريها اهميت دارد. يكي از رويكردهاي موفق در اين حوزه، استفاده از هستههاي گرافي است كه با نگاشت ساختار گراف به فضاي ويژگي و تعريف يك تابع شباهت، امكان بهرهگيري از الگوريتمهاي يادگيري ماشين را فراهم ميسازند.
هدف اين پاياننامه مطالعه و ارزيابي هستهي گراف كوتاهترين مسير واسراشتاين چند مقياسي ({MWSP}) بوده است كه با بهرهگيري از اطلاعات ساختاري در سطوح مختلف و استفاده از فاصلهي واسراشتاين براي مقايسهي گرهها، توانايي بالايي در تمايز ميان گرافها ايجاد ميكند. در پايان، با پيشنهاد {نمايش تُنُك براي ماتريسهاي محاسباتي}، كارايي محاسباتي اين هسته بهطور چشمگيري بهبود يافته است؛ بهگونهاي كه مصرف حافظه به ميزان قابل توجهي كاهش يافته و امكان اجراي آن بر روي مجموعهدادههاي بزرگتر فراهم گرديده است.
چكيده انگليسي :
Graph-structured data have become increasingly important in modern machine learning, as many real-world systems—such as biological networks, social interactions, and molecular structures—are naturally represented as graphs.
A fundamental challenge in this field is to measure the similarity between graphs, which is crucial for tasks such as classification, clustering, and pattern recognition.
Graph kernels provide a powerful framework for this purpose by mapping graphs into a high-dimensional feature space, where similarity can be efficiently computed through kernel-based learning algorithms.
This thesis focuses on the study and evaluation of the {Multi-scale Wasserstein Shortest-Path (MWSP)} graph kernel,
a recently proposed method that combines the advantages of multi-scale structural representation and optimal transport theory.
The MWSP kernel constructs truncated breadth-first search (BFS) trees rooted at each node to capture shortest-path patterns across multiple scales.
Then, it employs the Wasserstein distance to measure the similarity between distributions of node-level embeddings, providing a fine-grained representation of both local and global graph structures.
This approach enhances the expressive power of graph kernels and achieves high classification accuracy on a variety of benchmark datasets.
In addition to reproducing and analyzing the MWSP kernel, this thesis proposes an {optimized sparse matrix representation} for its computational components.
The proposed modification significantly reduces memory consumption without compromising classification accuracy, thereby improving scalability and enabling the kernel to be applied to larger graph datasets.
Comprehensive experiments confirm that the sparse implementation maintains the effectiveness of the original MWSP kernel while achieving more efficient resource utilization.
استاد راهنما :
بهناز عمومي
استاد داور :
حسين فلسفين , نيلوفر احمدي پور