شماره مدرك :
17546
شماره راهنما :
15350
پديد آورنده :
علي نيان، پويا
عنوان :

مطالعه‌اي بر درخت بقا و بهينه‌سازي آن

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
آمار اقتصادي و اجتماعي
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1400
صفحه شمار :
چهارده، 95 ص. : مصور، جدول، نمودار
استاد راهنما :
ساره گلي
توصيفگر ها :
درخت بقا , مدل نسبت بخت زمان گسسته , بيشينه‌ي اختلاف بقا , بيشينه‌ي درستنمايي , سانسور , منحني ROC , بيماري سرطان , ICON
استاد داور :
افشيني پرورده، مريم كلكين نما
تاريخ ورود اطلاعات :
1401/02/25
كتابنامه :
كتابنامه
رشته تحصيلي :
رياضي
دانشكده :
رياضي
تاريخ ويرايش اطلاعات :
1401/02/28
كد ايرانداك :
2829774
چكيده فارسي :
تحليل بقا مجموعه‌اي از روش‌هاي آماري براي تحليل داده‌ها است كه متغير مورد نظر مدت زمان سپري شده تا وقوع يك رويداد يا يك حادثه را نشان مي‌دهد. در جمع آوري داده‌هاي بقا معمولا سانسور اتفاق مي‌افتد، از اين رو براي تحليل اين داده‌ها از روش‌هاي متداول آماري نمي‌توان استفاده كرد. در تحليل داده‌هاي بقا روش‌هاي پارامتري و ناپارامتري متعددي وجود دارد كه مدل‌هاي رگرسيوني و درخت بقا از جمله‌ي اين روش‌ها است. درخت بقا تركيبي از درخت تصميم و كميت‌هاي بقا است كه در آن براي هر گره‌ي پاياني درخت، كميت‌هاي بقا برآورد مي‌گردد. معيار‌هاي متعددي براي برازش و هرس كردن درخت بقا وجود دارد كه در اين پايان نامه به بررسي آن‌ها با استفاده از شبيه‌سازي پرداخته و يك معيار جديد كه از معيارهاي موجود بهتر عمل مي‌كند، معرفي شده است. همچنين مطالعه‌اي مختصري بر مدل نسبت بخت زمان گسسته كه يكي از مدل‌هاي رگرسيون متداول در تحليل داده‌هاي بقا است انجام شده است. با مطالعه و مقايسه‌ي نتايج شبيه‌سازي، داده‌هاي واقعي مربوط به بيماران سرطاني يازده سال اخير يكي از بيمارستان‌هاي شهر اصفهان، متغيرهاي موثر اساسي بر بيماري سرطان شناسايي و درخت بقاي مربوطه برازش داده شد. با استفاده از اين روش احتمال مرگ افراد به علت سرطان پيش‌بيني شده است.
چكيده انگليسي :
Tree-based methods are popular nonparametric tools in studying time-to-event outcomes and are frequently used in studies with censored survival time. Interval-censored data, in which the event time is only known to lie in sometime interval, arise commonly in practice, for example, in a medical study in which patients visit clinics or hospitals at prescheduled times and the events of interest occur between visits.Such data are appropriately analyzed using methods that account for this uncertainty in event time measurement. In this thesis, we propose a survival tree method for interval-censored data based on the conditional inference framework. Using Monte Carlo simulations, we find that the tree is effective in uncovering underlying tree structure, performs similarly to an interval-censored Cox proportional hazardsmodel fitwhen the true relationship is linear, and performs at least as well as (and in the presence of right-censoring outperforms) the Cox model when the true relationship is not linear. Further, the interval-censored tree outperforms survival trees based on imputing the event time as an endpoint or the midpoint of the censoring interval. In this thesis, we introduce a novel framework for survival trees and ensembles, where the trees partition the dynamic survivor population and can handle timedependent covariates. Using the idea of randomized tests, we develop generalized time-dependent receiver operating characteristic (ROC) curves for eva‎luating the performance of survival trees. The tree-building algorithm is guided by decisiontheoretic criteria based on ROC, targeting specifically for prediction accuracy. Extensive simulation studies are conducted to examine the performance of the proposed methods. We apply the methods to a study on AIDS for illustration. Their structure and ease of interpretability make them useful to identify prognostic factors and to predict conditional survival probabilities given an individual’s covariates. The existing methods are tailor-made to deal with a survival time variable that is measured continuously. However, survival variables measured on a discrete scale are often encountered in practice. The authors propose a new tree construction method specifically adapted to such discrete-time survival variables. The splitting procedure can be seen as an extension, to the case of right-censored data, of the entropy criterion for a categorical outcome. The selection of the final tree is made through a pruning algorithm combined with a bootstrap correction. The authors also present a simple way of potentially improving the predictive performance of a single tree through bagging. A simulation study shows that single trees and bagged-trees perform well compared to a parametric model. A real data example investigating the usefulness of personality dimensions in predicting early onset of cigarette smoking is presented.
استاد راهنما :
ساره گلي
استاد داور :
افشيني پرورده، مريم كلكين نما
لينک به اين مدرک :

بازگشت