شماره مدرك
20946
شماره راهنما
17992
پديد آورنده
ملكي مطلق، محمدرضا
عنوان
تشخيص آپنه خواب از روي صداي ناي مبتني بر يادگيري عميق
مقطع تحصيلي
كارشناسي ارشد
گرايش تحصيلي
نرم افزار
محل تحصيل
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع
1404
صفحه شمار
يازده، 87ص
توصيفگر ها
آپنه انسدادي خواب , صداي ناي , يادگيري انتقالي , يادگيري نمايش
تاريخ ورود اطلاعات
1404/12/05
كتابنامه
كتابنامه
رشته تحصيلي
مهندسي كامپيوتر
دانشكده
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات
1404/12/05
كد ايرانداك
23210557
چكيده فارسي
آپنه خواب از اختلالات شايع تنفسي در خواب است كه ميتواند پيامدهاي جدي قلبي–عروقي، شناختي و كيفيتزندگي به همراه داشته باشد. با وجود دقت بالاي پليسومنوگرافي، هزينه و پيچيدگي آن سبب شده است روشهاي كمهزينه براي غربالگري و پشتيباني از فرآيند تشخيص مورد توجه قرار گيرند. اين پاياننامه به تشخيص رخدادهاي تنفسي مبتني بر صوت ميپردازد و هدف آن شناسايي قطعات سيگنال صوتي و برچسب گذاري آنها به صورت دودويي(آپنه/غيرآپنه) است. به بيان ديگر تمركز بر تشخيص رخداد در سطح قطعه هست و نه تصميمگيري نهايي دربارهي ابتلاي فرد. براي دستيابي به اين هدف، دو رويكرد مكمل ارائه و ارزيابي ميشود: (1) روش اصلي مبتني بر يادگيري نمايش با معماري SiameseM2D و تصميمگيري در فضاي بردار نهفته، و (2) روش جايگزين مبتني بر طبقهبندي مستقيم با AnisotropicResNet18 و استفاده از وروديهاي چندنمايي زمان–فركانس. در ارزيابي تجربي، دو مجموعهداده شامل يك مجموعهداده داخلي از صوت نايِ ثبتشده در شرايط باليني و يك مجموعهداده عمومي PSG-Audio بهكار گرفته شد. همچنين سه سناريو شامل ارزيابي درونمجموعهداده روي هر مجموعه و ارزيابي بينمجموعهداده براي سنجش تعميمپذيري طراحي گرديد. نتايج نشان داد در مجموعهداده داخلي، Siamese-M2D (با پيكربندي مناسب تصميمگيري) بهترين توازن بين دقت و حساسيت را ارائه ميدهد (F1=0.80)، در حاليكه در مجموعهداده عمومي، AnisotropicResNet18 عملكرد برتر داشته است (F1=0.86). در سناريوي بينمجموعهداده نيز افت عملكرد، بيانگر وجود اختلاف توزيع ميان شرايط ثبت، نويزهاي محيطي و شيوهي برچسبگذاري رخدادها بود؛ با اين حال، مشاهده شد برخي تنظيمات مدلها ميتوانند براي كاربردهاي غربالگري (حساسيت بالا و كاهش منفي كاذب) مناسب باشند. در مجموع، يافتههاي اين پژوهش نشان ميدهد رويكردهاي مبتني بر صوت، با وجود چالشهاي تعميمپذيري بين دامنهها، ظرفيت بالايي براي توسعهي ابزارهاي كمهزينه و غيرتهاجمي در غربالگري و كمكتشخيص رخدادهاي تنفسي در خواب دارند.
چكيده انگليسي
Sleep apnea is a common sleep-related breathing disorder that can lead to serious cardiovascular and cognitive consequences and reduced quality of life. Although polysomnography provides high diagnostic accuracy, its cost and complexity have driven interest in low-cost methods for screening and supporting the diagnostic process. This thesis addresses audio-based respiratory event detection, with the goal of identifying short audio segments and assigning binary labels (apnea vs. non-apnea). In other words, the focus is on segment-level event detection rather than making a final decision about whether an individual has sleep apnea.To achieve this goal, two complementary approaches are proposed and evaluated: (1) a primary representation-learning method based on the Siamese-M2D architecture with decision-making in an embedding space, and (2) an alternative direct-classification method using Anisotropic-ResNet18 with multi-view time–frequency inputs. Experimental evaluation was conducted on two datasets: an in-house tracheal sound dataset recorded in a clinical setting and the public PSG-Audio dataset. Three scenarios were designed, including within-dataset evaluation on each dataset and a cross-dataset evaluation to examine generalizability. The results showed that on the in-house dataset, Siamese-M2D (with an appropriate decision configuration) achieved the best balance between precision and recall (F1-score = 0.80), whereas on the public dataset, Anisotropic-ResNet18 achieved superior performance (F1-score = 0.86). In the cross-dataset scenario, the observed performance drop indicated a distribution shift due to differences in recording conditions, environmental noise, and event labeling protocols; nevertheless, certain model configurations were found to be suitable for screening purposes (high recall and reduced false negatives). Overall, the findings suggest that audio-based approaches, despite cross-domain generalization challenges, have strong potential for developing low-cost, non-invasive tools for screening and assisting in the detection of sleep-related respiratory events.
استاد راهنما
زينب زالي
استاد مشاور
فرزانه شايق بروجني
استاد داور
عليرضا بصيري , هدي صفائي پور