شماره مدرك :
19813
شماره راهنما :
17116
پديد آورنده :
پيري سهلواني, فاطمه
عنوان :

بخش بندي تصاوير اندام‌هاي شكمي با استفاده از روش‌هاي يادگيري عميق

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
هوش مصنوعي و رباتيكز
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1403
صفحه شمار :
شانزده, 104ص. : مصور, جدول, نمودار
توصيفگر ها :
تصاوير پزشكي , بخش‌بندي تصاوير پزشكي , تبديل‌كننده , شبكه عصبي پيچشي
تاريخ ورود اطلاعات :
1403/07/21
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1403/07/25
كد ايرانداك :
23070827
چكيده فارسي :
بخش‌بندي تصاوير پزشكي يكي از حوزه‌هاي كليدي در پردازش تصوير است كه با هدف تفكيك و مرزبندي قسمت‌هاي مختلف تصوير براي كاربردهاي پزشكي انجام مي‌شود. نتايج فرآيند بخش‌بندي پزشكي اهميت بالايي دارد زيرا مي‌تواند منجر به تشخيص دقيق‌تر بيماري‌ها و بهبود فرآيندهاي درماني شود. اگرچه در طي سال‌ها, مدل‌هاي متعددي براي بخش‌بندي با دقت بالا ارائه شده‌اند، اما چالش‌هايي همچون پيچيدگي و تنوع ساختاري تصاوير پزشكي، تنوع زياد اندام‌ها، و عدم توازن ميان اندام‌ها در مجموعه داده‌هاي چند اندامي همچنان باعث كاهش دقت مدل‌ها مي‌شوند. اين چالش‌ها نيازمند راه‌حل‌هاي پيشرفته‌تري براي بهبود عملكرد مدل‌هاي بخش‌بندي هستند. هدف ما در اين تحقيق ارائه روشي براي بهبود عملكرد عمليات بخش‌بندي بر روي تصاوير پزشكي اندام‌هاي شكمي است. با توجه به اينكه در سال‌هاي اخير استفاده از تبديل‌كننده در كنار شبكه‌هاي عصبي پيچشي براي بخش‌بندي دقيق‌تر تصاوير پزشكي متداول شده است, در اين پژوهش مدل HiFormer كه مدلي مبتني بر شبكه عصبي پيچشي و تبديل‌كننده است را به عنوان مدل پايه خود انتخاب كرديم. در اين تحقيق, بهبود عملكرد روش HiFormer از دو ديدگاه مورد بررسي قرار گرفت. در ديدگاه اول, تاثير تغيير داده ورودي به مدل بر عملكرد مدل تحليل شد. در اين ديدگاه, اطلاعاتي كه از تصوير اوليه استخراج مي‌شود, با تصوير اوليه بر روي بعد كانال تركيب شده و به عنوان ورودي به مدل تزريق مي‌شود. اين اطلاعات شامل لبه‌هاي اندام‌ها و يا تصوير بهبود كانتراست‌يافته است. در ديدگاه دوم, تاثير تغيير معماري مدل پايه بر عملكرد آن مدنظر قرار گرفت. روش پيشنهادي ما در اين پژوهش بر اساس رويكرد دوم شكل گرفته است. در اين روش ما با به كارگيري تبديل‌كننده XCiT و نيز تابع هزينه DiceTopK به جاي تابع هزينه پيش‌فرض عمليات بخش‌بندي تصاوير پزشكي موفق به ايجاد مدلي شديم كه توانست با دقت بالاتري تصاوير اندام‌هاي شكمي را بر روي مجموعه داده Synapse بخش‌بندي كند. اين مدل به دليل توانايي در استخراج وابستگي‌هاي دور برد بين اجزاي تصوير, كه منظور ارتباط بين اندام‌هايي است كه به يك ديگر نزديك نيستند, در كنار توجه به ويژگي‌هاي محلي و نيز تمركز بر روي نواحي چالش‌برانگيزتر براي بخش‌بندي, مانند اندام‌هايي با اندازه كوچكتر مثل كليه‌ها, توانسته است منجر به ايجاد بهبود به ميزان دو درصد بر اساس معيار DSC در عملكرد مدل پايه شود؛ به اين صورت كه معيار DSC براي مدل پايه برابر با 79/78 % و براي مدل پيشنهادي برابر با 81/15 % است.
چكيده انگليسي :
Medical image segmentation is one of the key areas in image processing, aiming to separate and delineate different parts of an image for medical applications. The results of the medical segmentation process are of high importance as they can lead to more accurate disease diagnosis and improve treatment processes. Although numerous models with high accuracy have been proposed for segmentation over the years, challenges such as the complexity and structural diversity of medical images, the vast variability of organs, and the imbalance among organs in multi-organ datasets still reduce the accuracy of these models. These challenges require more advanced solutions to enhance the performance of segmentation models. The aim of this study is to propose a method to improve the performance of segmentation operations on abdominal medical images. Considering that in recent years, the use of transformers alongside convolutional neural networks (CNNs) for more accurate medical image segmentation has become common, we have selected the HiFormer model, which is based on both CNNs and transformers, as our baseline model in this research. In this study, the performance improvement of the HiFormer method is examined from two perspectives. In the first perspective, the impact of changing the input data to the model on its performance was analyzed. In this view, information extracted from the original image is combined with the original image in the channel dimension and fed into the model as input. This information includes organ edges or contrast-enhanced images. In the second perspective, the effect of altering the baseline model’s architecture on its performance was considered. Our proposed method in this research is based on the second approach. In this method, by employing the XCiT transformer and the DiceTopK loss function instead of the default loss function, we successfully developed a model that could segment abdominal organs on the Synapse dataset with higher accuracy. This model, due to its ability to capture long-range dependencies between image components—specifically the relationships between organs that are not close to each other—alongside focusing on local features and challenging areas for segmentation, such as smaller organs like the kidneys, has resulted in a 2 % improvement in the DSC metric compared to the baseline model. The DSC metric for the baseline model is 79.78 %, while for the proposed model, it is 81.15 %.
استاد راهنما :
نادر كريمي
استاد مشاور :
شادرخ سماوي
استاد داور :
محمدرضا احمدزاده , محمدعلي خسروي فرد
لينک به اين مدرک :

بازگشت