پديد آورنده :
پيري سهلواني, فاطمه
عنوان :
بخش بندي تصاوير اندامهاي شكمي با استفاده از روشهاي يادگيري عميق
مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
هوش مصنوعي و رباتيكز
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
شانزده, 104ص. : مصور, جدول, نمودار
توصيفگر ها :
تصاوير پزشكي , بخشبندي تصاوير پزشكي , تبديلكننده , شبكه عصبي پيچشي
تاريخ ورود اطلاعات :
1403/07/21
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1403/07/25
چكيده فارسي :
بخشبندي تصاوير پزشكي يكي از حوزههاي كليدي در پردازش تصوير است كه با هدف تفكيك و مرزبندي قسمتهاي مختلف تصوير براي كاربردهاي پزشكي انجام ميشود. نتايج فرآيند بخشبندي پزشكي اهميت بالايي دارد زيرا ميتواند منجر به تشخيص دقيقتر بيماريها و بهبود فرآيندهاي درماني شود. اگرچه در طي سالها, مدلهاي متعددي براي بخشبندي با دقت بالا ارائه شدهاند، اما چالشهايي همچون پيچيدگي و تنوع ساختاري تصاوير پزشكي، تنوع زياد اندامها، و عدم توازن ميان اندامها در مجموعه دادههاي چند اندامي همچنان باعث كاهش دقت مدلها ميشوند. اين چالشها نيازمند راهحلهاي پيشرفتهتري براي بهبود عملكرد مدلهاي بخشبندي هستند. هدف ما در اين تحقيق ارائه روشي براي بهبود عملكرد عمليات بخشبندي بر روي تصاوير پزشكي اندامهاي شكمي است. با توجه به اينكه در سالهاي اخير استفاده از تبديلكننده در كنار شبكههاي عصبي پيچشي براي بخشبندي دقيقتر تصاوير پزشكي متداول شده است, در اين پژوهش مدل HiFormer كه مدلي مبتني بر شبكه عصبي پيچشي و تبديلكننده است را به عنوان مدل پايه خود انتخاب كرديم. در اين تحقيق, بهبود عملكرد روش HiFormer از دو ديدگاه مورد بررسي قرار گرفت. در ديدگاه اول, تاثير تغيير داده ورودي به مدل بر عملكرد مدل تحليل شد. در اين ديدگاه, اطلاعاتي كه از تصوير اوليه استخراج ميشود, با تصوير اوليه بر روي بعد كانال تركيب شده و به عنوان ورودي به مدل تزريق ميشود. اين اطلاعات شامل لبههاي اندامها و يا تصوير بهبود كانتراستيافته است. در ديدگاه دوم, تاثير تغيير معماري مدل پايه بر عملكرد آن مدنظر قرار گرفت. روش پيشنهادي ما در اين پژوهش بر اساس رويكرد دوم شكل گرفته است. در اين روش ما با به كارگيري تبديلكننده XCiT و نيز تابع هزينه DiceTopK به جاي تابع هزينه پيشفرض عمليات بخشبندي تصاوير پزشكي موفق به ايجاد مدلي شديم كه توانست با دقت بالاتري تصاوير اندامهاي شكمي را بر روي مجموعه داده Synapse بخشبندي كند. اين مدل به دليل توانايي در استخراج وابستگيهاي دور برد بين اجزاي تصوير, كه منظور ارتباط بين اندامهايي است كه به يك ديگر نزديك نيستند, در كنار توجه به ويژگيهاي محلي و نيز تمركز بر روي نواحي چالشبرانگيزتر براي بخشبندي, مانند اندامهايي با اندازه كوچكتر مثل كليهها, توانسته است منجر به ايجاد بهبود به ميزان دو درصد بر اساس معيار DSC در عملكرد مدل پايه شود؛ به اين صورت كه معيار DSC براي مدل پايه برابر با 79/78 % و براي مدل پيشنهادي برابر با 81/15 % است.
چكيده انگليسي :
Medical image segmentation is one of the key areas in image processing, aiming to separate and delineate different parts of an image for medical applications. The results of the medical segmentation process are of high importance as they can lead to more accurate disease diagnosis and improve treatment processes. Although numerous models with high accuracy have been proposed for segmentation over the years, challenges such as the complexity and structural diversity of medical images, the vast variability of organs, and the imbalance among organs in multi-organ datasets still reduce the accuracy of these models. These challenges require more advanced solutions to enhance the performance of segmentation models. The aim of this study is to propose a method to improve the performance of segmentation operations on abdominal medical images. Considering that in recent years, the use of transformers alongside convolutional neural networks (CNNs) for more accurate medical image segmentation has become common, we have selected the HiFormer model, which is based on both CNNs and transformers, as our baseline model in this research. In this study, the performance improvement of the HiFormer method is examined from two perspectives. In the first perspective, the impact of changing the input data to the model on its performance was analyzed. In this view, information extracted from the original image is combined with the original image in the channel dimension and fed into the model as input. This information includes organ edges or contrast-enhanced images. In the second perspective, the effect of altering the baseline model’s architecture on its performance was considered. Our proposed method in this research is based on the second approach. In this method, by employing the XCiT transformer and the DiceTopK loss function instead of the default loss function, we successfully developed a model that could segment abdominal organs on the Synapse dataset with higher accuracy. This model, due to its ability to capture long-range dependencies between image components—specifically the relationships between organs that are not close to each other—alongside focusing on local features and challenging areas for segmentation, such as smaller organs like the kidneys, has resulted in a 2 % improvement in the DSC metric compared to the baseline model. The DSC metric for the baseline model is 79.78 %, while for the proposed model, it is 81.15 %.
استاد راهنما :
نادر كريمي
استاد مشاور :
شادرخ سماوي
استاد داور :
محمدرضا احمدزاده , محمدعلي خسروي فرد