پديد آورنده :
حاجي هاشمي، بهاره
عنوان :
تشخيص افراد در معرض ريسك مشكلات سلامت روان با تحليل احساسات از روي متون شبكههاي اجتماعي
مقطع تحصيلي :
كارشناسي ارشد
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
يازده،96ص:مصور، جدول، نمودار
توصيفگر ها :
مشكلات سلامت روان , افسردگي , شبكه هاي اجتماعي , مدل هاي يادگيري ماشين , BERT , استخراج ويژگي
تاريخ ورود اطلاعات :
1402/10/16
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1402/10/17
چكيده فارسي :
افسردگي يك مشكل جهاني است كه ميليونها نفر در سراسر جهان را تحت تأثير قرار داده است. تخمين زده شده است كه بيش از 264 ميليون نفر در سراسر جهان از افسردگي رنج ميبرند، به همين دليل اين بيماري را به عنوان يكي از شايعترين اختلالهاي رواني ميشناسند. افسردگي افراد از هر سن و جنسيت و پيشزمينهاي را تحت تأثير قرار داده است. اين اختلال علت اصلي بيماري و ناتواني در بسياري از موارد است و تأثير قابل توجهي بر كيفيت زندگي فرد ميگذارد.
الگوريتمهاي يادگيري ماشين و روشهاي پردازش زبان طبيعي براي تحليل پستهاي رسانههاي اجتماعي و شناسايي الگوهايي كه ممكن است نشاندهندهي افسردگي باشند، توسعه يافتهاند. با اين حال، اين روشها با محدوديتهايي همراه است كه شامل مسائل مربوط به رعايت حريم شخصي فرد است. توسعهي تشخيص افسردگي در رسانههاي اجتماعي، پتانسيل بهبود تشخيص و مداخلهي زودهنگام را براي كساني كه با مشكلات سلامت رواني دست و پنجه نرم ميكنند، دارد.
هدف اين پژوهش، توسعهي يك روش جديد با استفاده از روشهاي يادگيري ماشين و يادگيري عميق است كه به منظور تشخيص و پيشبيني افسردگي كاربران در بستر رسانههاي اجتماعي طراحي شده است. اين مدل حتي اگر كاربر در پستهاي خود به صورت مستقيم اشارهاي به مبتلا شدن به افسردگي نكرده باشد، به شناسايي يك كاربر افسرده كمك ميكند. در اين مدل، از پستهاي ارسال شدهي كاربر در يك بازهي زماني، الگوي تعامل در رسانههاي اجتماعي (توييتر)، رفتار مشاهده شده در توييتها و همچنين مفاهيم منحصربهفردي تحت عنوان مهندسي ويژگيها براي پيشبيني افسردگي كاربر استفاده ميكند.
در اين پژوهش، ويژگيهاي استخراج شده براي طبقهبندي كاربران افسرده و غيرافسرده به خوبي عمل ميكنند. همچنين بر روي متن توييتها مدلهاي زباني مختلفي مانند BERT اجرا شدهاست. مدل سلسله مراتبي توجه نيز پيادهسازي شده است. سپس خروجي BERT با خروجيهاي به دست آمده در روشهاي يادگيري ماشين و ويژگيهاي استخراج شده بعد از چند لايه شبكه عصبي، با يكديگر تركيب شدند. در نهايت، بيشترين دقت و صحت براي روش ما به ترتيب 88% و 87% به دستآمد.
چكيده انگليسي :
Depression is a global issue that has impacted millions of people worldwide. With an estimated over 264 million individuals across the globe suffering from depression, this condition is recognized as one of the most prevalent mental disorders. Depression affects people of all ages, genders, and backgrounds, serving as a significant cause of illness and disability in numerous cases and significantly impacting an individual's quality of life.
The diagnosis of depression on social media has become an intriguing topic in the field of mental health research. With the increasing use of social media, researchers have become interested in using data from these platforms for efficient and cost-effective depression detection. Several studies have shown that the language used in social media posts can indicate an individual's mental state and the likelihood of experiencing depression.
Machine learning algorithms and natural language processing techniques have been developed to analyze social media posts and identify patterns that could indicate depression. However, this approach comes with limitations, including privacy concerns and accuracy issues. Developing depression detection on social media has the potential to improve early diagnosis and intervention for individuals struggling with mental health issues.
In essence, the goal of this research is to develop a novel method using machine learning and deep learning approaches for the purpose of detecting and predicting depression in users within the context of social media. This model assists in identifying a depressed user, even if the user hasn't directly mentioned being depressed in their posts. The model leverages the user's posted tweets within a specific time frame, the interaction pattern on social media (Twitter), observed emotional behaviors in tweets, and unique engineered concepts to predict user depression.
The extracted features for classifying depressed and non-depressed users work well and provide an accuracy of 80% to 90%, which is a very good accuracy for the classification task. Additionally, various language models such as BERT have been applied to the tweet text. A hierarchical attention model has also been implemented. Finally, the outputs of BERT were combined with the outputs obtained from machine learning methods and the extracted features after several neural network layers. Ultimately, the achieved highest accuracy and precision metrics were 88.0% and 87.0%, respectively.
استاد راهنما :
ناصر قديري مدرس
استاد داور :
عليرضا بصيري , مازيار پالهنگ