• شماره مدرك
    20946
  • شماره راهنما
    17992
  • پديد آورنده

    ملكي مطلق، محمدرضا

  • عنوان

    تشخيص آپنه خواب از روي صداي ناي مبتني بر يادگيري عميق

  • مقطع تحصيلي
    كارشناسي ارشد
  • گرايش تحصيلي
    نرم افزار
  • محل تحصيل
    اصفهان : دانشگاه صنعتي اصفهان
  • سال دفاع
    1404
  • صفحه شمار
    يازده، 87ص
  • توصيفگر ها

    آپنه انسدادي خواب , صداي ناي , يادگيري انتقالي , يادگيري نمايش

  • تاريخ ورود اطلاعات
    1404/12/05
  • كتابنامه
    كتابنامه
  • رشته تحصيلي
    مهندسي كامپيوتر
  • دانشكده
    مهندسي برق و كامپيوتر
  • تاريخ ويرايش اطلاعات
    1404/12/05
  • كد ايرانداك
    23210557
  • چكيده فارسي
    آپنه خواب از اختلالات شايع تنفسي در خواب است كه مي‌تواند پيامدهاي جدي قلبي–عروقي، شناختي و كيفيت‌زندگي به همراه داشته باشد. با وجود دقت بالاي پلي‌سومنوگرافي، هزينه و پيچيدگي آن سبب شده است روش‌هاي كم‌هزينه براي غربالگري و پشتيباني از فرآيند تشخيص مورد توجه قرار گيرند. اين پايان‌نامه به تشخيص رخداد‌هاي تنفسي مبتني بر صوت مي‌پردازد و هدف آن شناسايي قطعات سيگنال صوتي و برچسب گذاري آن‌ها به صورت دودويي(آپنه/غيرآپنه) است. به بيان ديگر تمركز بر تشخيص رخداد در سطح قطعه هست و نه تصميم‌‌گيري نهايي درباره‌ي ابتلاي فرد. براي دستيابي به اين هدف، دو رويكرد مكمل ارائه و ارزيابي مي‌شود: (1) روش اصلي مبتني بر يادگيري نمايش با معماري SiameseM2D و تصميم‌گيري در فضاي بردار نهفته، و (2) روش جايگزين مبتني بر طبقه‌بندي مستقيم با AnisotropicResNet18 و استفاده از ورودي‌هاي چندنمايي زمان–فركانس. در ارزيابي تجربي، دو مجموعه‌داده شامل يك مجموعه‌داده داخلي از صوت نايِ ثبت‌شده در شرايط باليني و يك مجموعه‌داده عمومي PSG-Audio به‌كار گرفته شد. همچنين سه سناريو شامل ارزيابي درون‌مجموعه‌داده روي هر مجموعه و ارزيابي بين‌مجموعه‌داده براي سنجش تعميم‌پذيري طراحي گرديد. نتايج نشان داد در مجموعه‌داده داخلي، Siamese-M2D (با پيكربندي مناسب تصميم‌گيري) بهترين توازن بين دقت و حساسيت را ارائه مي‌دهد (F1=0.80)، در حالي‌كه در مجموعه‌داده عمومي، AnisotropicResNet18 عملكرد برتر داشته است (F1=0.86). در سناريوي بين‌مجموعه‌داده نيز افت عملكرد، بيانگر وجود اختلاف توزيع ميان شرايط ثبت، نويزهاي محيطي و شيوه‌ي برچسب‌گذاري رخدادها بود؛ با اين حال، مشاهده شد برخي تنظيمات مدل‌ها مي‌توانند براي كاربردهاي غربالگري (حساسيت بالا و كاهش منفي كاذب) مناسب باشند. در مجموع، يافته‌هاي اين پژوهش نشان مي‌دهد رويكردهاي مبتني بر صوت، با وجود چالش‌هاي تعميم‌پذيري بين دامنه‌ها، ظرفيت بالايي براي توسعه‌ي ابزارهاي كم‌هزينه و غيرتهاجمي در غربالگري و كمك‌تشخيص رخدادهاي تنفسي در خواب دارند.
  • چكيده انگليسي
    Sleep apnea is a common sleep-related breathing disorder that can lead to serious cardiovascular an‎d cognitive consequences an‎d reduced quality of life. Although polysomnography provides high diagnostic accuracy, its cost an‎d complexity have driven interest in low-cost methods for screening an‎d supporting the diagnostic process. This thesis addresses audio-based respiratory event detection, with the goal of identifying short audio segments an‎d assigning binary labels (apnea vs. non-apnea). In other words, the focus is on segment-level event detection rather than making a final decision about whether an individual has sleep apnea.To achieve this goal, two complementary approaches are proposed an‎d eva‎luated: (1) a primary representation-learning method based on the Siamese-M2D architecture with decision-making in an embedding space, an‎d (2) an alternative direct-classification method using Anisotropic-ResNet18 with multi-view time–frequency inputs. Experimental eva‎luation was conducted on two datasets: an in-house tracheal sound dataset recorded in a clinical setting an‎d the public PSG-Audio dataset. Three scenarios were designed, including within-dataset eva‎luation on each dataset an‎d a cross-dataset eva‎luation to examine generalizability. The results showed that on the in-house dataset, Siamese-M2D (with an appropriate decision configuration) achieved the best balance between precision an‎d recall (F1-score = 0.80), whereas on the public dataset, Anisotropic-ResNet18 achieved superior performance (F1-score = 0.86). In the cross-dataset scenario, the observed performance dro‎p indicated a distribution shift due to differences in recording conditions, environmental noise, an‎d event labeling protocols; nevertheless, certain model configurations were found to be suitable for screening purposes (high recall an‎d reduced false negatives). Overall, the findings suggest that audio-based approaches, despite cross-domain generalization challenges, have strong potential for developing low-cost, non-invasive tools for screening an‎d assisting in the detection of sleep-related respiratory events.
  • استاد راهنما
    زينب زالي
  • استاد مشاور
    فرزانه شايق بروجني
  • استاد داور
    عليرضا بصيري , هدي صفائي پور