توصيفگر ها :
پيش بيني سري زماني , مدل همه گيري SIS , الگوريتم Gibbs Sampling , مدل مخفي ماركوف متصل CHMM
چكيده فارسي :
بيماريهاي همهگير هر ساله تلفات جاني و مالي بسياريرا به جوامع تحميل ميكنند. براي كاهش اين تلفات، پيشبيني وضعيت همهگيري امري مهم و ضروي است. بيماريهايي كه واگيري بالايي دارند اگر كنترل نشوند، ميتوانند منجر به همهگيري شوند. بيماري آنفولانزا يكي از اين بيماريها است كه در فصل سرما شيوع پيداميكند. در سالهاي اخير نمونههاي جديدي از اين بيماري پيدا شدهاست كه نسبت به نمونههاي قبل، واگيري بيشتري دارند و خطرناكتر هستند. علاوه بر اين اخيراً بيماريهاي ويروسي ديگري ظاهرشدهاند كه همهگيري آنها ميتواند منجر به مرگ تعداد زيادي از بيماران شود. بهعنوان مثال ابولا در آفريقا قبل از اينكه كاملاً كنترل شود، گسترش پيداكرد و منجر به تلفات انساني زيادي شد. بهعنوان يك مثال ديگر، همهگيري كرونا مسئلهاي است كه طي حدود دو سال اخير، كل كشورهاي دنيا را درگير خود كردهاست. پيشبيني وضعيت اين همهگيري امري مهم و لازم، در تصميمگيريهاي مربوطه براي كنترل شيوع اين ويروس است. اين امر انگيزهاي شد كه به بررسي مسئلهي پيشبيني روند همهگيري و چالشهاي آن بپردازيم. اكثر كارهاي انجام شدهي قبلي در اين زمينه، يا به بررسي روند شيوع بيماري همهگير در سطح جمعيت ميپردازند و يا اگر به بررسي شيوع بيماري در سطح فردي تمركز دارند، علاوهبر بهرهگرفتن از طيف وسيعي از داده، معمولاً به همكاري افراد تحت بررسي، در جمعآوري بخشي از داده نيازمند هستند. در شرايط همهگيري براي غربالگري سريع افراد، پيش از گسترش وسيع بيماري، به روشهاي تشخيصي آزمايشگاهي دقيق نياز است. در ابتدا اين روشها علاوهبر هزينه، در مقايسه با سرعت شيوع بيماري زمانبر هستند. يك راهكار براي تسريع در امر تشخيص آزمايشگاهي استفاده از آزمايش گروهي است. به منظورگروهبندي لازم براي آزمايش گروهي، افراد هماتاقي يا افرادي كه در يك خانه باهم زندگي ميكنند را بهعنوان گروه در نظر ميگيريم. باتوجه به شرايط همهگيري و دردسترس بودن امكانات آزمايشگاهي لازم، آزمايش گروهي در فواصل زماني متفاوتي انجام ميشود. اين امر منجر به وجود گمشدگي در دادههاي مربوط به نتايج آزمايش گروهي ميگردد. در اين پژوهش تنها با داشتن دادههاي خلوت، شامل نتيجهي آزمايش گروهي بيماري، با درنظرگرفتن خانواده بهعنوان گروه و همچنين داشتن اطلاعات تماسهاي بين افراد، بهارائهي تخميني از احتمال ابتلاي هر يك از افراد جامعهي تحت بررسي در هر زمان، بااستفاده از الگوريتم نمونهگيري گيبز (Gibbs sampling) ميپردازيم. باتوجه به اين امر كه تخمين ابتلا به بيماري براي يك زمان مشخص، يك مسئلهي بررسي سريهاي زماني است، پس از مروري بر مدلهاي مطرح در بررسي سريهاي زماني و مروري بر دو روش پايهي SIS و SIR در بررسي همهگيري به مطالعهي مدلهاي ماركوف ميپردازيم. در روش پيشنهادي، بااستفاده از مدلهاي مخفي ماركوف متصل(CHMM) ارتباطات بين افراد را مدل ميكنيم و از نتايج آزمايش گروهي بهعنوان مشاهدات مدل استفاده ميكنيم. در ادامه باانجام آزمايشات گوناگون بر روي دادهي شبيهسازي، برگرفته از مجموعهدادهي تغييرات اجتماعي(Social Evolution) بهبررسي عملكرد روش پيشنهادي ميپردازيم. نتايج حاصل از اين آزمايشات حاكي از آن استكه باوجود گمشدگي زياد در داده، روش پيشنهادي در مقايسه با مدلهاي پايه همچون SVM عملكرد بهتري دارد. بهعنوان كاربرد، روش پيشنهادي براي افزايش دقت نتايج آزمايش گروهي و همچنين روشي براي غربالگري اوليهي افراد جهت استفادهي بهينه از روشهاي تشخيص آزمايشگاهي ميتواند مورد استفاده قرار گيرد.
چكيده انگليسي :
Epidemic diseases cause many human and financial losses to societies every year. To reduce these losses, predicting the epidemic situation is important. Diseases that are highly contagious can lead to epidemics if not controlled. This motivated us to investigate the problem of predicting the epidemic process and its challenges. Most of the previous works in this field, either examine the trend of epidemic disease at the population level or if they focus on the examination of the disease outbreak at the individual level, in addition to using a wide range of data, usually need the cooperation of the people under investigation, in collecting a part of data. In epidemic conditions, accurate laboratory diagnostic methods are needed for rapid screening of people before the disease spreads widely. At first, in addition to the cost, these methods are time-consuming compared to the speed of disease outbreak. One way to speed up laboratory diagnosis is to use group testing. For the purpose of grouping in the group testing, we consider roommates or people who live together in the same house as a group. According to the conditions of the epidemic and the availability of necessary laboratory facilities, group testing is done at different time intervals. This leads to missing data related to group test results. In this research, by considering the family as a group and also having contact information between people, we propose a method to estimate the probability of each individual in the community under the investigation at each timestamp, using the Gibbs sampling algorithm. Since disease estimation for a specific time is a problem of time series analysis, to reviewing the models proposed in time series analysis, after reviewing the two basic methods of SIS and SIR in epidemic analysis, we study Markov models. In the proposed method, we model the communication between people by using Coupled Hidden Markov Models (CHMMs) and having the results of the group testing as the observations of the model. In the following, we will examine the performance of the proposed method by performing various experiments on the simulation data, taken from the Social Evolution dataset. The results of these tests indicate that despite the high missingness in the data, the proposed method performs better in comparison with basic models such as SVM. As an application, the proposed method can be used to increase the accuracy of group testing results, as well as a method for initial screening of people for optimal use of laboratory diagnosis methods.