شماره مدرك
20934
شماره راهنما
2444 دكتري
پديد آورنده
رضوي، معصومه سادات
عنوان
مدل مولد گرافي عميق سلسله مراتبي و آگاه از جامعه
مقطع تحصيلي
دكتري
گرايش تحصيلي
هوش مصنوعي
محل تحصيل
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع
1404
صفحه شمار
ده، 59ص. : مرور، جدول، نمودار
توصيفگر ها
مدل مولد عميق گراف , مدل مولد سلسله مراتبي گراف , ايجاد گراف با آگاهي از جوامع , تنوع ساختاري در گراف , مدل مولد مقياسپذير گراف
تاريخ ورود اطلاعات
1404/11/28
كتابنامه
كتابنامه
رشته تحصيلي
مهندسي كامپيوتر
دانشكده
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات
1404/11/29
كد ايرانداك
23156871
چكيده فارسي
توليد گرافهاي واقعگرايانه و نمونهبرداري كارآمد از توزيع احتمالاتي آنها بهدليل بعد بسيار بالاي فضا و وابستگيهاي پيچيده ميان يالها، يكي از دشوارترين مسائل در يادگيري عميق مولد بهشمار ميرود. مدلهاي سنتي با تكيه بر فرضيات ساختاري ساده و از پيشتعيينشده، نميتوانند الگوهاي پيچيده دنياي واقعي را بهخوبي ثبت كنند. در مقابل، مدلهاي عميق موجود نيز با محدوديتهاي جدي مواجهاند: رويكردهاي يكباره با فرض استقلال يالها در گرافهاي ناهمگن كيفيت پاييني ارائه ميدهند، در حالي كه رويكردهاي خودبازگشتي هرچند وابستگيها را بهتر مدلسازي ميكنند، در گرافهاي بزرگمقياس با مشكلات مقياسپذيري شديدي روبهرو ميشوند و هنگام مواجهه با جوامع داراي توزيعهاي ساختاري متفاوت، كيفيت خروجيشان بهطور چشمگيري افت ميكند. در اين رساله، چارچوب سلسلهمراتبي آگاه از جامعه به نام HiCGG پيشنهاد شده است كه بهطور همزمان سه چالش اصلي يعني مدلسازي ناهمگني ساختاري، مقياسپذيري محاسباتي و انعطافپذيري در توليد توپولوژيهاي تركيبي را برطرف ميكند. اين چارچوب با بهرهگيري از راهبرد «تقسيم و غلبه»، گراف را بهصورت بازگشتي به جوامع همگن تقسيم كرده، هر جامعه را بهطور مستقل با مدلهاي مولد عميق خودبازگشتي توليد مينمايد و سپس با ماژول تجميع يالهاي بينجوامعي را دقيقاً بازسازي ميكند؛ نسخهي پيشرفتهي پايانبهپايان نيز با ادغام تشخيص جامعه مبتني بر يادگيري عميق ارائه شده است. در ارزيابيهاي گسترده روي مجموعهدادههاي مصنوعي و واقعي، مدل HiCGGبهطور چشمگيري از بهترين روشهاي موجود پيشي گرفت: در گرافهاي ناهمگن، بهطور ميانگين 65% بهبود در معيارهاي آماري كلاسيك و 30%-40% بهبود در معيارهاي مبتني بر شبكههاي عصبي گراف بهدست آورد، ضمن اينكه در گرافهاي بزرگمقياس نيز با حفظ برتري قابلتوجه در همه معيارها، بالاترين كيفيت را ارائه كرد؛ اين مدل زمان توليد گراف را با افزايش عمق سلسلهمراتب تا 75% كاهش داد و بهكمك ساختار مدولار، قابلگسترش و جامعهآگاه خود، محدوديتهاي اساسي مدلهاي پيشين را برطرف نمود و افقهاي جديدي در حوزههايي مانند كشف دارو، مدلسازي پروتئين و توليد دادههاي مصنوعي كاملاً واقعگرايانه گشود.
چكيده انگليسي
Generating realistic graphs and efficiently sampling from their probability distributions is considered one of the most challenging problems in deep generative learning, due to the high dimensionality of the space and the complex dependencies among edges. Traditional models, relying on simple, predefined structural assumptions, fail to adequately capture the intricate patterns of the real world. In contrast, existing deep models also face significant limitations: one-shot approaches, assuming edge independence in heterogeneous graphs, yield low-quality results, while autoregressive approaches, though better at modeling dependencies, encounter severe scalability issues in large-scale graphs and suffer a significant drop in output quality when confronted with communities exhibiting diverse structural distributions.
In this dissertation, a community-aware hierarchical framework named HiCGG is proposed, which simultaneously addresses three key challenges: modeling structural heterogeneity, computational scalability, and flexibility in generating hybrid topologies. Leveraging a divide-and-conquer strategy, this framework recursively partitions the graph into homogeneous communities, independently generates each community using deep autoregressive generative models, and then accurately reconstructs inter-community edges through an aggregation module; an advanced end-to-end version is also introduced, integrating deep learning-based community detection.
In extensive evaluations on both synthetic and real-world datasets, the HiCGG model significantly outperformed state-of-the-art methods: in heterogeneous graphs, it achieved an average improvement of 65% in classical statistical metrics and 30–40% in graph neural network-based metrics, while in large-scale graphs it delivered the highest quality while maintaining a substantial advantage across all metrics. The model reduced graph generation time by up to 75% with increasing hierarchy depth and, thanks to its modular, scalable, and community-aware architecture, overcame fundamental limitations of prior models, opening new horizons in fields such as drug discovery, protein modeling, and fully realistic synthetic data generation
استاد راهنما
عبدالرضا ميرزايي
استاد مشاور
مهران صفاياني
استاد داور
زينب مالكي , محمدرضا احمدزاده , عماد فاطمي زاده