پديد آورنده :
صادقي، حميدرضا
عنوان :
پيشبيني بقاي بيماران مبتلا به سرطان با دادههاي ژنتيك
مقطع تحصيلي :
كارشناسي ارشد
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
نه،63ص مصور جدول نمودار
توصيفگر ها :
پيشبيني بقا , شبكه عصبي گرافي , اطلس جامع سرطان , سرطان , دادههاي چنداُميكي , بيوانفورماتيك
تاريخ ورود اطلاعات :
1404/03/04
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1404/03/12
چكيده فارسي :
پيشبيني بقاي بيماران سرطاني يكي از چالشهاي اصلي در بيوانفورماتيك است كه تأثير زيادي بر تصميمات درماني و كيفيت زندگي بيماران دارد. پيشرفتهاي اخير در فناوريهاي توالييابي ژنوم به محققان اين امكان را داده است تا با استفاده از دادههاي چنداُميكي (Multi-omics) به پيشبيني دقيقتري دست يابند. اين دادهها، شامل اطلاعات RNA-seq، متيلاسيون DNA و تغييرات تعداد كپي ژنها (CNA)، منابع غني و پيچيدهاي از اطلاعات زيستي فراهم ميآورند كه ميتوانند براي تحليل و پيشبيني بقا مفيد باشند. در اين پژوهش، هدف پيشبيني بقاي بيماران مبتلا به سرطان با استفاده از دادههاي ژنتيكي است. براي اين منظور، از مدل شبكه عصبي گرافي هندسي (GGNN) استفاده شده است كه بر مبناي مفاهيم رياضي پيچيدهاي چون انحناي اليوير ريچي (ORC) و فرآيندهاي زنجيره ماركوف عمل ميكند. اين مدل قادر است ويژگيهاي مهم ساختارهاي گرافي را از دادههاي چنداُميكي استخراج كرده و به پيشبيني دقيقتر بقا كمك كند. دادههاي مربوط به سرطان از پايگاهداده جامع سرطان (TCGA) جمعآوري و به گرافهايي تبديل ميشوند كه در اين گرافها ژنها بهعنوان گرهها و تعاملات بين آنها بهعنوان يالها عمل ميكنند. در اين تحقيق، روشي جديد براي نرمالسازي دادهها پيشنهاد شده است كه منجر به بهبود دقت مدل گرديده است. نتايج نشان ميدهد كه اين روش نرمالسازي، دقت پيشبيني بقا را بهطور قابلملاحظهاي افزايش داده و ميانگين شاخص C-index را تا 785 /0 ارتقا داده است. اين دستاورد ميتواند به پزشكان و محققان در طراحي استراتژيهاي درماني دقيقتر براي بيماران سرطاني كمك كند.
چكيده انگليسي :
The prediction of cancer patient survival is one of the most significant challenges in bioinformatics, with considerable implications for treatment strategies and improving patients' quality of life. With the advancement of genome sequencing technologies, multi-omics data have emerged as a valuable resource for predicting patient survival. The Geometric Graph Neural Network (GGNN) model, utilizing geometric concepts such as Ollivier Ricci curvature (ORC) and the Markov chain constant, is capable of extracting essential features from the graph structures of these data. In this study, the GGNN model was enhanced using normalization techniques based on the nature of the data. Multi-omics data, including RNA-seq, DNA methylation, and copy number alterations (CNA), were collected from the TCGA database and transformed into graphs where nodes represent genes and edges represent interactions between genes. Three normalization methods, including max scaling, logarithmic transformation, and the FPKM method, were applied and compared on the RNA-seq data. The results showed that the improved model with these methods significantly increased the accuracy of patient survival predictions. The best performance was achieved with a mean C-index of 0.785. This enhanced model can assist clinicians and researchers in determining optimal treatment strategies and improving the accuracy of cancer patient survival predictions.
استاد راهنما :
زينب مالكي
استاد داور :
فرزانه شايق بروجني , عليرضا بصيري