پديد آورنده :
علي نيان، پويا
عنوان :
مطالعهاي بر درخت بقا و بهينهسازي آن
مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
آمار اقتصادي و اجتماعي
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
چهارده، 95 ص. : مصور، جدول، نمودار
توصيفگر ها :
درخت بقا , مدل نسبت بخت زمان گسسته , بيشينهي اختلاف بقا , بيشينهي درستنمايي , سانسور , منحني ROC , بيماري سرطان , ICON
استاد داور :
افشيني پرورده، مريم كلكين نما
تاريخ ورود اطلاعات :
1401/02/25
تاريخ ويرايش اطلاعات :
1401/02/28
چكيده فارسي :
تحليل بقا مجموعهاي از روشهاي آماري براي تحليل دادهها است كه متغير مورد نظر مدت زمان سپري شده تا وقوع يك رويداد يا يك حادثه را نشان ميدهد. در جمع آوري دادههاي بقا معمولا سانسور اتفاق ميافتد، از اين رو براي تحليل اين دادهها از روشهاي متداول آماري نميتوان استفاده كرد. در تحليل دادههاي بقا روشهاي پارامتري و ناپارامتري متعددي وجود دارد كه مدلهاي رگرسيوني و درخت بقا از جملهي اين روشها است.
درخت بقا تركيبي از درخت تصميم و كميتهاي بقا است كه در آن براي هر گرهي پاياني درخت، كميتهاي بقا برآورد ميگردد. معيارهاي متعددي براي برازش و هرس كردن درخت بقا وجود دارد كه در اين پايان نامه به بررسي آنها با استفاده از شبيهسازي پرداخته و يك معيار جديد كه از معيارهاي موجود بهتر عمل ميكند، معرفي شده است. همچنين مطالعهاي مختصري بر مدل نسبت بخت زمان گسسته كه يكي از مدلهاي رگرسيون متداول در تحليل دادههاي بقا است انجام شده است.
با مطالعه و مقايسهي نتايج شبيهسازي، دادههاي واقعي مربوط به بيماران سرطاني يازده سال اخير يكي از بيمارستانهاي شهر اصفهان، متغيرهاي موثر اساسي بر بيماري سرطان شناسايي و درخت بقاي مربوطه برازش داده شد. با استفاده از اين روش احتمال مرگ افراد به علت سرطان پيشبيني شده است.
چكيده انگليسي :
Tree-based methods are popular nonparametric tools in studying time-to-event outcomes and are frequently used in studies with censored survival time. Interval-censored data, in which the event time is only known to lie in sometime interval, arise commonly in practice, for example, in a medical study in which patients visit clinics or hospitals at prescheduled times and the events of
interest occur between visits.Such data are appropriately analyzed using methods that account for this uncertainty in event time measurement. In this thesis, we propose a survival tree method for interval-censored data based on the conditional inference framework. Using Monte Carlo simulations, we find that the tree is effective in uncovering underlying tree structure, performs similarly to an
interval-censored Cox proportional hazardsmodel fitwhen the true relationship is linear, and performs at least as well as (and in the presence of right-censoring outperforms) the Cox model when the true relationship is not linear. Further, the interval-censored tree outperforms survival trees based on imputing the event time as an endpoint or the midpoint of the censoring interval. In this thesis, we introduce a novel framework for survival trees and ensembles, where the trees partition the dynamic survivor population and can handle timedependent covariates. Using the idea of randomized tests, we develop generalized time-dependent receiver operating characteristic (ROC) curves for evaluating the performance of survival trees. The tree-building algorithm is guided by decisiontheoretic
criteria based on ROC, targeting specifically for prediction accuracy. Extensive simulation studies are conducted to examine the performance of the proposed methods. We apply the methods to a study on AIDS for illustration. Their structure and ease of interpretability make them useful to identify prognostic factors and to predict conditional survival probabilities given an individual’s covariates. The existing methods are tailor-made to deal with a survival time variable that is measured continuously. However, survival variables measured on a discrete scale are often encountered in practice. The authors propose a new tree construction method specifically adapted to such discrete-time survival variables. The splitting procedure can be seen as an extension, to the case of right-censored data, of the entropy criterion for a categorical outcome. The selection of the final tree is made through a pruning algorithm combined with a bootstrap correction. The authors also present a simple way of potentially improving the predictive performance of a single tree through bagging. A simulation study shows that single trees and bagged-trees perform well compared to a parametric model. A real data example investigating the usefulness of personality dimensions in predicting early onset of cigarette smoking is presented.
استاد داور :
افشيني پرورده، مريم كلكين نما