چكيده فارسي :
ايمني عابر پياده در گذرگاههاي بدون علامت يك موضوع مهم در حمل و نقل شهري است. با توجه به توسعه سيستمهاي خودران نظير ربات¬ها و اتومبيل¬هاي خودران، پيشبيني قصد عبور عابر پياده در مسيرهاي حركت اين سيستم¬ها مانند گذرگاه¬ها و مسيرهاي خط¬كشي شده بسيار ضروري است. پيشرفت¬هاي اخير درمدل¬هاي پيشبيني كننده مبتني بر الگوريتم¬هاي يادگيري عميق، توسعه مدل¬هاي پيشبيني براي عبور عابر پياده را امكان¬پذير كرده است. در اين پاياننامه، امكان پيشبيني رفتار عبور عابر پياده در گذرگاههاي بدون علامت با استفاده از مجموعه داده JAAD و مدلهاي مبتني بر دادههاي بصري مانند فريمهاي ويديو و دادههاي غيربصري مانند مختصات نقاط كليدي بدن عابر پياده مورد بررسي قرار گرفته است. مجموعه داده JAAD يك مجموعه داده ويدئويي در مقياس بزرگ است كه شامل مسيرهاي مشروح عابر پياده و وسايل نقليه در گذرگاههاي كنترل نشده است كه براي آموزش و ارزيابي مدلهاي طراحي شده در اين پژوهش استفاده شده است. اين مجموعه داده شامل عوامل محيطي، ويژگيهاي عابر پياده از جمله مختصات نقاط كليدي بدن عابر پياده، مختصات كادر محصوركننده عابر پياده و شرايط ترافيكي از جمله سرعت خودروي در حال حركت است. مدل¬هاي طراحي شده در اين تحقيق با استفاده از معيارهاي مختلف عملكرد پيشبيني عبور عابر پياده از گذرگاه مورد ارزيابي قرار گرفتهاند و با ساير مدل¬هاي طراحي شده در اين زمينه مقايسه شدهاند. اين مدلها در دو دسته مدلهاي پيشبيني رويداد عبور عابر پياده مبتني بر تركيب ويژگيهاي غيربصري و مدل پيشبيني رويداد عبور عابر پياده براساس پيشبيني مسير حركت عابر پياده مبتني بر دادههاي بصري دسته بندي ميشوند. مدلهاي مبتني بر ويژگيهاي غيربصري با تركيب و پردازش ويژگيهاي غيربصري مانند مختصات نقاط كليدي بدن عابر پياده، مختصات كادر محصوركننده عابر پياده و سرعت خودروي در حال حركت، عبور عابر پياده از گذرگاه را پيشبيني ميكنند. مدل مبتني بر مسير تحت عنوان BaseGAN با دريافت يك دنباله از فريمهاي ورودي، ويژگيهاي مهم و كليدي را از آنها استخراج ميكند و سپس توزيع مسير حركت عابر پياده را در فريمهاي آينده توليد ميكند و براساس مسير توليد شده، عبور عابر پياده از گذرگاه را پيشبيني ميكند. نتايج نشان ميدهد كه مدلهاي طراحي شده از نظر دقت پيشبيني بهتر از ساير مدلهاي ارائه شده هستند به طوري كه مدل BaseGAN با دستيابي به امتياز F1 برابر 83% در مجموعه داده JAAD از تمامي روشيهاي پيشبيني رويداد عبور عابر پياده بهتر عمل ميكند. در پايان اين پژوهش نتيجهگيري ميشود كه مدل يادگيري عميق baseGAN مي¬تواند براي افزايش ايمني عابران پياده با ارائه هشدارهاي اوليه به رانندگان به منظور جلوگيري از برخورد با عابر پياده استفاده شود. اين پاياننامه همچنين محدوديتهاي تحقيق را مورد بحث قرار ميدهد و راهكارهايي را براي پژوهشهاي آينده ارائه ميدهد. يافته¬هاي اين پژوهش بينشهاي ارزشمندي را در مورد توسعه ايمني اتومبيلهاي خودران ارائه ميكند و به آينده حمل¬ونقل خودران و توسعه يك رويكرد جديد براي ايمني عابر پياده كمك ميكند.
چكيده انگليسي :
Pedestrian safety at unmarked crosswalks is a significant concern in urban transportation. With the advancement of self-driving technologies like autonomous robots and self-driving cars, accurately predicting pedestrian intentions along their pathways, including crossings and designated paths, becomes imperative. Recent strides in predictive models rooted in deep learning algorithms have facilitated the development of predictive systems for pedestrian crossings. In this thesis, we explore the feasibility of forecasting pedestrian crossing behavior at unmarked crosswalks employing the JAAD dataset and models that leverage both visual data, such as video frames, and non-visual data, such as the coordinates of key points on the pedestrian's body. The JAAD dataset, a comprehensive video dataset comprising annotated pedestrian and vehicle trajectories at unregulated crossings, serves as the foundation for training and evaluating the models devised in this study. This dataset encompasses environmental variables, pedestrian attributes, encompassing the coordinates of key points on the pedestrian's body and bounding box, as well as traffic conditions, including vehicle speed. The models developed in this research are subjected to diverse performance metrics for predicting pedestrian crossings and are benchmarked against other models in the field. These models fall into two primary categories: pedestrian crossing event prediction models relying on a fusion of non-visual features and pedestrian crossing event prediction models predicated on the prediction of pedestrian movement paths, utilizing visual data. Models grounded in non-visual features predict pedestrian crossings through the amalgamation and processing of non-visual attributes, such as key points on the pedestrian's body, bounding box coordinates, and vehicle speed. Meanwhile, the path-based model, known as BaseGAN, processes a sequence of input frames to extract crucial features. Subsequently, it generates the distribution of the pedestrian's movement path in future frames and predicts pedestrian crossings based on this generated path. The results affirm the superiority of the designed models in terms of predictive accuracy. Notably, the BaseGAN model outperforms all other pedestrian crossing event prediction methods, achieving an F1 score of 83% on the JAAD dataset. This research concludes that the BaseGAN deep learning model holds potential for enhancing pedestrian safety by issuing early warnings to drivers, thus mitigating potential collisions with pedestrians. The thesis also delves into the research's limitations and presents avenues for future investigations. The findings gleaned from this research offer valuable insights into advancing self-driving car safety and contribute to shaping the future of autonomous transportation while pioneering innovative approaches to pedestrian safety.