توصيفگر ها :
مدل هاي عميق مولد گراف , توليد گراف , شبكه هاي عصبي گراف , يادگيري عميق
چكيده فارسي :
در دهه اخير، يادگيري عميق به شكل گستردهاي در زمينه پردازش و تحليل دادههاي گرافي مورد توجه قرار گرفته است. به دليل پيچيدگي و چالشهاي موجود در توليد و تحليل دادههاي گرافي، نياز به روشهاي پيشرفتهتري براي مدلسازي و توليد گرافهاي دقيق و با كيفيت بالا احساس ميشود. در اين پژوهش، جديدترين پيشرفتها در حوزه سيستمهاي منطقي و شبكههاي عصبي به كار گرفته شده تا روشي نوآورانه براي بهبود مدلهاي مولد عميق با استفاده از دانش حوزهاي ارائه شود. اين روش با استفاده از منطق مرتبه اول، توانايي ارائه دانشي دقيق و قابل تفسير در مورد ساختارهاي رابطهاي را دارد كه در نهايت به بهبود كيفيت و صحت گرافهاي توليد شده منجر ميشود. اين پژوهش مبتني بر ايدههايي از يادگيري آماري-رابطهاي (SRL) است كه تركيبي از يادگيري آماري و مدلسازي روابط ساختاري بين موجوديتها است. در اين رويكرد، از دادههاي رابطهاي براي استخراج الگوها و پيشبيني استفاده ميشود، بهويژه وقتي كه دادهها به صورت گراف يا شبكه نمايش داده شوند. ادغام منطق و مدلهاي آماري در اين حوزه كمك ميكند قوانين منطقي در تحليل گرافها به كار برده شود. يكي از مفاهيم كليدي اين حوزه، انطباق ممانهاي قوانين (Rule Moment Matching) است كه به معني تلاش مدل براي شبيهسازي الگوهاي روابط بين موجوديتها بهصورت مشابه با دادههاي واقعي است. هدف اين روش، درك درست مدل از نحوه ارتباط موجوديتها با يكديگراست؛ همانند آنچه در دادههاي واقعي مشاهده ميكنيم. در اين پژوهش، موضوع مطرح شده به اين صورت اجرا شده كه تعداد مورد انتظار هر قانون بايد با تعداد مشاهده شده آن در دادهها مطابقت داشته باشد. در اين پژوهش، از خودرمزگذارهاي گراف متغير (VGAE) استفاده شده است. اين خودرمزگذارها نوعي مدل مولد احتمالاتي هستند كه از شبكههاي عصبي گرافي (GNN) براي يادگيري نمايش گرهها در گراف استفاده ميكنند. ابتدا با استفاده از يك سيستم منطقي، قوانين موجود در داده گرافي به دست ميآيد و سپس شمارش قوانين با استفاده از يك الگوريتم مشتقپذير كه از ضرب ماتريسها استفاده ميكند، به صورت خودكار انجام ميشود. اين الگوريتم ميتواند پس از دريافت اطلاعات مناسب، قوانين را به طور خودكار بشمارد. علاوه بر ارزيابي كيفيت گراف توليدي، در اين پژوهش ارزيابيهايي براساس معيارهاي پيشبيني يال و طبقهبندي گره نيز انجام شده و نشان داده شده كه اين مدل به پيشرفت قابل توجهي در حوزه طبقهبندي گره دست يافته است. همچنين يك ارزيابي ديگر به نام منحني يادگيري انجام شده كه نشاندهنده تاثير انطباق ممان قوانين در شرايط مختلف، با تغيير ميزان داده، است. ارزيابيهاي تجربي كه بر روي پنج مجموعه داده مرجع انجام شده، نشاندهنده بهبود قابل توجهي در كيفيت گرافهاي توليدي است. اين بهبود به دليل دقت بيشتر در تطابق قوانين و كاهش خطاهاي مدلسازي حاصل شده است. در نهايت، اين پژوهش نشان ميدهد كه ادغام دانش منطقي با تكنيكهاي يادگيري ماشيني ميتواند به توسعه مدلهاي مولد گرافي كمك كند. اين دستاوردها ميتوانند در زمينههاي مختلفي مانند شبكههاي اجتماعي، بيوانفورماتيك و تحليل ترافيك كاربرد داشته باشند.
چكيده انگليسي :
Over the past decade, deep learning has gained significant attention in processing and analyzing graph data. The complexity and challenges of generating and analyzing graph data have created a need for advanced methods to model and produce accurate, high-quality graphs. In this research, the latest advancements in logical systems and neural networks have been utilized to present an innovative method for improving deep generative models using domain knowledge. This method leverages first-order logic to provide precise, interpretable insights into relational structures, ultimately improving the quality and accuracy of generated graphs. This research builds on concepts from Statistical Relational Learning (SRL), which integrates statistical learning with the modeling of structural relationships between entities. In this approach, relational data is utilized to identify patterns and make predictions, particularly when the data is represented as graphs or networks. In this field, combining logic with statistical models enables the application of logical rules in graph analysis. A key concept in this area is Rule Moment Matching, where the model aims to replicate patterns of relationships between entities, mirroring those found in real data. The aim of this method is for the model to accurately grasp how entities relate to one another, as observed in real data. In this research, the proposed concept is implemented so that the expected count of each rule aligns with its observed count in the data. Variational Graph Autoencoders (VGAEs) are used in this study as a type of probabilistic generative model that leverages Graph Neural Networks (GNNs) to learn node representations within a graph. Initially, a logical system extracts the rules from the graph data, and rule counting is then performed automatically using a differentiable algorithm based on matrix multiplication. This algorithm can autonomously count the rules after receiving the necessary information. Beyond evaluating the quality of the generated graphs, this research also includes assessments based on edge prediction and node classification metrics, showing that the model has made significant advances in node classification. Additionally, a learning curve evaluation was conducted to demonstrate the effect of rule moment matching under different conditions by varying the amount of data. Experimental evaluations on five benchmark datasets reveal a significant improvement in the quality of generated graphs, attributed to greater accuracy in rule matching and reduced modeling errors. Ultimately, this research demonstrates that integrating logical knowledge with machine learning techniques can support the development of generative graph models. These advancements have potential applications in diverse fields, including social networks, bioinformatics, and traffic analysis.