شماره مدرك :
17408
شماره راهنما :
15239
پديد آورنده :
نخعي زينلي، فرشيد
عنوان :

طبقه‌بندي سيگنال‌هاي EEG براي تشخيص گفتار تصور شده در سيستم‌هاي واسط مغز-رايانه با استفاده از آناليزهاي منحني بازگشتي

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
بيوالكتريك
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1400
صفحه شمار :
سيزده، 96ص. : مصور، جدول، نمودار
استاد راهنما :
رسول امير فتاحي، احسان روحاني
توصيفگر ها :
واسط مغز-رايانه , گفتار تصور شده , الكتروانسفالوگرافي , نقشه بازگشت , شبكه عصبي كانولوشني
استاد داور :
امير اخوان، جلال ذهبي
تاريخ ورود اطلاعات :
1401/01/17
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي پزشكي
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1401/01/17
كد ايرانداك :
2821161
چكيده فارسي :
سيستم واسط مغز-رايانه قابليت ارائه نسل جديدي از كاربردها كه مستقل از فعاليت عضلاني و كنترل‌شده توسط مغز انسان هستند، را دارا است. براي بيماران مبتلا به سندروم قفل‌شدگي كه در بدترين حالت فقط با پلك‌زدن مي‌توانند خواسته‌هاي خود را بيان كنند، يك سيستم ارتباطي ايده‌آل، واسط مغز-رايانه مبتني بر گفتار تصورشده است. يعني فرد با تصور گفتاري كه قادر به بيان آن نيست، دستوري به اين سيستم بدهد. فناوري الكتروانسفالوگرافي (EEG) به‌عنوان رايج‌ترين راه‌حل غيرتهاجمي موجود براي استخراج سيگنال‌هاي مغزي براي واسط مغز-رايانه عمل مي‌كند. بر اين اساس اين پژوهش هدف دارد تصور گفتاري مبتني بر EEG‌ را در سيستم‌هاي واسط مغز-رايانه توسعه دهد. بسياري از پژوهش‌هاي اين حوزه، طبقه‌بندي انواع مختلفي از گفتار تصورشده اعم از آواها، سيلاب‌ها و كلمات را از طريق سيگنال‌هاي EEG مورد تحقيق قرار داده‌اند. با علم بر اينكه سيگنال EEG يك سري زماني ناايستا است و در طول زمان مشخصات آن پايدار نيستند، مي‌توان رويكردي نو در استخراج ويژگي را در اين پژوهش مشاهده كرد. از اين‌رو سيگنال‌هاي EEG 8 فرد نمونه غيرفارسي زبان به هنگام تصور گفتاري 7 واج/سيلاب و 4 واژه به‌كار گرفته شده‌اند. با توجه به ديناميكي‌بودن و غيرخطي‌بودن سيستم اعصاب مركزي، آشوب به‌عنوان بستري براي تحليل سيگنال EEG معرفي شد. بدين ترتيب، سيگنال يك‌بُعدي EEG‌ به‌عنوان نماينده‌اي از اين سيستم آشوب‌گونه مي‌تواند فضاي حالت چندبُعدي را كه توصيفي از سيستم اعصاب مركزي است، بسازد. اين پژوهش هركدام از نقاط اين فضاي حالت را بررسي مي‌كند و از بازگشت هر نقطه به مكان قبلي خودش تحت عنوان نقشه بازگشت بهره مي‌برد. نقشه‌هاي بازگشت دوبُعدي كه هنگام تصور هر كدام از 11 نويسه مورد نظر استخراج شدند، به‌عنوان ورودي به شبكه از پيش‌آموزش‌ديده VGG-16، MLP و SVM براي دسته‌بندي وارد مي‌شوند. درنهايت، بالاترين نتايج طبقه‌بندي با كمك شبكه عميق VGG-16 در سه بخش حاصل شد: 1. طبقه‌بندي دو كلاسي كه به‌طور متوسط در ميان 8 فرد شركت‌كننده به بالاترين نرخ طبقه‌بندي 48/98 درصد منجر شد، 2. طبقه‌بندي چند كلاسي كه به‌طور ميانگين در بين 8 فرد نمونه، دقت 18/86 درصد در طبقه‌بندي 11 نوع گفتار حاصل شد، 3. طبقه‌بندي چند كلاسي با رويكرد هر فرد به‌عنوان داده آزمون كه به دقت متوسط 59/83 درصد در ميان 8 فرد نمونه رسيد. اين نتايج همگي با مطالعات مرتبط و به‌روز مقايسه شدند و برتري روش پيشنهادي را تأييد كردند.
چكيده انگليسي :
The brain-computer interface (BCI) system has the ability to provide a new generation of applications that are independent of muscle activity and controlled by the human brain. For patients with lock-in syndrome, who in the worst case can only express their desires by blinking, an ideal communication system is imagined speech-based BCI. That is, a person gives instructions to this system by imagining a speech that he is not able to express. Electroencephalography (EEG) is the most common non-invasive solution available for the extraction of brain signals for the BCI. Therefore, this study aims to develop EEG-based imagined speech decoding in BCI systems. Many studies in this field have investigated the classification of various types of imagined speech, including vowels, syllables, and words, through EEG signals. Knowing that the EEG signal is a non-stationary time series and its properties are not stable over time, a new approach to feature extraction can be observed in this study. Hence, the EEG signals of 8 non-Persian persons are used when imagining 7 phonemes/syllables and 4 words. Due to the dynamics and nonlinearity of the central nervous system, chaos was introduced as a platform for EEG signal analysis. Thus, the one-dimensional EEG signal as a representative of this chaotic system can create a multidimensional state space that is a description of the central nervous system. This study examines each point of this state space and uses the return of each point to its previous location as a recurrence plot. The two-dimensional recurrence plots extracted when imaging each of the 11 pro‎mp‎ts, are entered as input to the VGG-16 pre-trained network, MLP and SVM for classification. Finally, the highest classification results were obtained using the VGG-16 in three sections: 1. Classification of two classes, which resulted in an average classification performance of 98.48% among the 8 participants, 2. Classification multi-class, which averaged among 8 sample individuals, accuracy 86.18% was obtained in the classification of 11 types of speech, 3. Multi-class classification with the approach of each person as a test data that reached an average accuracy of 83.59% among the 8 sample people. These results were all compared with relevant and up-to-date studies and confirmed the superiority of the proposed method.
استاد راهنما :
رسول امير فتاحي، احسان روحاني
استاد داور :
امير اخوان، جلال ذهبي
لينک به اين مدرک :

بازگشت