شماره مدرك :
19653
شماره راهنما :
16981
پديد آورنده :
رادفر، محمدصادق
عنوان :

ارائه و پياده سازي يك روش پيش بيني يال در شبكه هاي بيولوژيكي دوبخشي مبتني بر يادگيري عميق

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
كنترل
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1403
صفحه شمار :
دوازده، 74 ص.، مصور، جدول، نمودار
توصيفگر ها :
پيش بيني يال , سيستم توصيه گر , تركيب سطوح اميكس , شبكه پيچشي گراف
تاريخ ورود اطلاعات :
1403/06/17
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي برق
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1403/06/19
كد ايرانداك :
23061081
چكيده فارسي :
به كمك مهندسي كنترل مي¬توان با مدل¬سازي به درك بهتري از ديناميك¬هاي سيستم¬هاي بيولوژي و پيش¬بيني رفتار آن¬ها رسيد. تحقيقات بيولوژيكي در دو دهه گذشته از پيشرفت فناوري و تركيب داده¬هاي اميكس در سطوح مختلف، از جمله ژنوميكس، ترنسكريپتوميكس، پروتئوميكس بهره¬مند شده است. هدف اين پايان¬نامه، طراحي مدلي است كه با استفاده از آن بتوان به ادغام داده-هاي اميكس و هم¬چنين به پيش¬بيني ارتباطات ميان لايه¬هاي اميكس پرداخت و هم¬چنين ابزاري طراحي شود تا با استفاده از آن بتوان از نتايج بدست آمده توسط مدل، استفاده نمود. چرا كه علت برخي از بيماري¬ها مانند سرطان و ديابت تنها يك ژن نيست و براي تشخيص و درمان آن نياز به ارتباط ميان لايه¬ها و شبكه¬هاي مولكولي وجود دارد. سيستم¬هاي توصيه¬گر نيز فعاليتي مشابه با هدف اين پژوهش، كه پيش¬بيني ارتباطات جديد مي¬باشد، دارند و به همين دليل مدل¬هايي كه در اين زمينه طراحي شده¬اند مورد بررسي قرار گرفتند. از طرفي چون با نمايش داده¬هاي مورد بررسي در اين پايان¬نامه به صورت گراف، كمك زيادي به فهم داده¬ها مي¬كند، مدل LightGCN كه مدلي مبتني بر شبكه پيچشي گراف و يادگيري عميق است، انتخاب شده است. چرا كه اين مدل نسبت به ساير مدل¬هاي موجود در اين زمينه از سرعت و دقت بالاتري برخوردار است. تغييرات موردنياز براي رفع نياز به خصوص اين پژوهش در اين مدل صورت گرفت. پياده¬سازي و برنامه¬نويسي مدل طراحي شده در اين پژوهش، بر بستر كتابخانه پاي¬تورچ و زبان برنامه¬نويسي پايتون بوده است. چرا كه به نسبت ساير كتابخانه¬هاي موجود در اين زمينه از سرعت بالاتري برخوردار بود. هم¬چنين براي افزايش سرعت آن و كاهش حجم محاسبات تا مقدار زياد، از فرمت COO براي نمايش ماتريس¬هاي به¬كار رفته شده در اين پژوهش استفاده شد. در اين پايان¬نامه از دو دسته داده متفاوت استفاده شده است، كه شامل ارتباطات در دو دسته، miRNA و mRNA و دارو و پروتئين مي¬باشند. اين مجموعه داده¬ها تنها بيان¬گر وجود يال هستند و براي آموزش مدل نياز به داده¬هايي كه عدم وجود يال را نيز بيان كنند، وجود دارد كه براي اين كار از روش نمونه برداري منفي استفاده شده است. به گونه¬اي كه وجود يال ميان هر جفت پارامتر، به معناي توانايي تاثيرگذاري هر دو پارامتر بر روي يك¬ديگر است؛ كه به كمك دانش بدست آمده از كشف يال¬ها و ارتباطات موجود، با مدل طراحي شده مي¬توان به پيش¬بيني يال¬هاي ديگر پرداخت؛ كه اطلاعات مفيدي در اختيار پژوهشگران و پزشكان مي¬گذارد. عملكرد مدل براي پيش¬بيني يال در مجموعه داده¬هاي در دسترس توسط معيارهاي AUC، F1 score، حساسيت و صحت مورد ارزيابي قرار گرفته شده است. براي اين كه بتوان از نتايج بدست آمده توسط مدل و ارتباطات جديد پيش-بيني شده استفاده نمود، يك ابزار آنلاين براي تشخيص و پيش¬بيني ارتباط بين miRNA و mRNA در سه قسمت مجزا، كه تمامي نيازها را بتواند پوشش بدهد، به كمك فريمورك جنگو طراحي شده است تا كمكي بر نظارت روي پيشرفت و كمك به درمان بيماري¬ها و قابل استفاده براي پزشكان و بيماران براي نياز به خصوص آن¬ها باشد. هم¬چنين سعي شد تا اين ابزار از رابط كاربري مناسبي برخوردار باشد و با كمك تكنيك¬هاي خاص جست¬جو تا مقدار زيادي سرعت پاسخ¬دهي ابزار را افزايش داد.
چكيده انگليسي :
With the help of control engineering, it is possible to achieve a better understanding of the dynamics of biological systems and predict their behavior through modeling. In the last two decades, biological research has greatly benefited from the advancement of technology and integration in Omics data at different levels, including genomics, transcriptomics, and proteomics. The purpose of this thesis is to design a model for integrate Omics data and also to predict communication between Omics layers and also, a tool should be designed to use the results obtained by the model. Because the cause of some diseases such as cancer and diabetes is not only one gene, and for its diagnosis and treatment, there is a need for communication between layers and molecular networks. Recommender systems also have an activity similar to the purpose of this research, which is to predict new connections, and for this reason, the models designed in this field were examined. On the other hand, because by displaying the data examined in this thesis in the form of a graph, it helps a lot to understand the data, the LightGCN model, which is based on the graph convolutional network and deep learning, was chosen because this model has higher speed and accuracy than other models in this field. The changes needed to meet the needs of this research were made in this model. The implementation and programming of the model designed in this research was based on the PyTorch library and the Python programming language. Because it had a higher speed compared to other existing libraries in this field. Also, to increase its speed and reduce the volume of calculations to a large extent, the COO format was used to display the matrices used in this research. In this thesis, two different categories of data are used, which include relationships in two categories, miRNA and mRNA, Drug and Target. These data sets only express the existence of edges, and for training the model, there is a need for data that also express the absence of edges, for which the negative sampling method was used. With the help of the knowledge obtained from the discovery of edges and existing connections, with the designed model, it is possible to predict other edges; which provides useful information to researchers and doctors. The performance of the model for ridge prediction in the available data set has been eva‎luated by the criteria of AUC, F1 score, sensitivity and accuracy. In order to be able to use the results obtained by the model and new predicted connections, an online tool for detecting and predicting the connection between miRNA and mRNA in three separate parts, which able to cover all the needs, with the help of the Django framework is designed to help monitor progress and help treat diseases and can be used by doctors and patients for their specific needs. It was also tried to make this tool have a suitable user interface and with the help of special search techniques, the response speed of the tool increased a lot.
استاد راهنما :
جعفر قيصري
استاد مشاور :
يوسف قيصري
استاد داور :
ايمان ايزدي نجف آبادي , حامد جلالي بيدگلي
لينک به اين مدرک :

بازگشت