شماره مدرك :
19614
شماره راهنما :
16949
پديد آورنده :
خان محمد زاده، دانيال
عنوان :

طرح‌ريزي حركت ربات در ميان عابران پياده با استفاده از پيش‌بيني حركت در محيط پرجمعيت با كمك يادگيري تقويتي عميق

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
هوش مصنوعي و رباتيكز
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1402
صفحه شمار :
سيزده، 94ص
توصيفگر ها :
اجتناب از برخورد , طرح‌ريزي حركت , رباتيك , ربات سيار , يادگيري تقويتي عميق
تاريخ ورود اطلاعات :
1403/06/06
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1403/06/07
كد ايرانداك :
23058531
چكيده فارسي :
يكي از مهم‌ترين دستاورد‌هاي بشر، علم رباتيك است، كه به‌تدريج با پيشرفت خود در مسائل مختلف با چالش‌هاي بسياري مواجه شده است. يكي از مهم‌ترين اين مسائل، طرح‌ريزي حركت ربات بوده كه پركاربردترين آن در بخش طرح‌ريزي حركت ربات‌هاي سيار است. امروزه ربات‌هاي متحرك در محيط‌هاي استاتيك با پيچيدگي كم مانند محيط‌هاي صنعتي به‌طور قابل‌اطميناني عمل مي‌كنند، اما در محيط‌هاي ديناميك پيچيده مانند فرودگاه‌ها يا مراكز خريد شكست مي‌خورند. اين محيط‌ها نسبت به محيط‌هاي صنعتي، شلوغ‌تر و فضاي باريك‌تري دارند و حاوي اشيا متحركي با پيچيدگي حركت بالا مي‌باشند كه عمدتاً انسان‌ها هستند. با افزايش پيچيدگي در محيط‌هايي كه اين‌گونه ربات‌ها در آن انجام‌وظيفه مي‌كنند، نياز مبرم به الگوريتم‌هايي كه بتوانند در اين محيط‌ها به‌درستي عمل كنند حس شده است. ربات‌هاي زميني بايد بتوانند درمقابل اشيا پويا و همچنين جمعيت پويا برخورد مناسب انجام دهند. براي بهبود عملكرد در چنين مسائلي الگوريتم‌هاي بر پايه يادگيري نظير يادگيري تقويتي عميق معرفي‌شده‌اند. در اين پايان‌نامه روش پيشنهادي به نام RMPMP+TG معرفي مي‌شود. الگوريتم RMPMP+TG يك الگوريتم طرح‌ريزي حركت با استفاده از يادگيري تقويتي عميق بدون نقشه است كه هدف اصلي آن كاهش برخورد با ربات‌هاي محيطي است. در RMPMP+TG سعي شده از روش پيش‌بيني كه انسان‌ها از حركت بعدي ديگر عابران براي طرح‌ريزي حركت خود ميان جمعيت استفاده مي‌كنند بهره برداري شود. همچنين، براي بهبود كارايي روش‌ پيشنهادي در مواقعي كه ربات‌ متوقف شده و امكان حركت ندارد مكانيزمي به الگوريتم اوليه اضافه شده كه توانايي بالايي در رفع اين مشكل دارد. آزمايش‌هاي انجام شده براي روش پيشنهادي(RMPMP+TG) با به‌روزترين روش‌هاي موجود نظير CADRL، RVO وGA3C-CADRL در سناريو‌هاي پايه و خاص نشان مي‌دهد كه RMPMP+TG از روش‌هاي CADRL، RVO وGA3C-CADRL در زمينه بهبود امنيت در سناريو‌هاي پايه به ترتيب حداقل 19 درصد، 14 درصد و 4 درصد بهبود حاصل كرده است. همچنين، از لحاظ امنيت در سناريو‌هاي خاص نسبت به GA3C-CADRL حداقل 9 درصد بهبود داشته است.
چكيده انگليسي :
In the past few years, robotics has been one of the most important achievements of humanity, which has gradually faced many challenges with its advancement in different areas. It is important to note that robot motion planning is one of the most important of these issues, with the most practical application being in the area of motion planning for mobile robots. Today, mobile robots perform reliably in static environments with low complexity, such as industrial environments, but fail in dynamic and complex environments, such as airports and shopping centers. Typically, these environments are more crowded and have narrower spaces, as well as moving objects with a high degree of complexity. As environments where robots perform their tasks become more complex, algorithms that can function correctly in such environments are becoming increasingly important. As well as interacting with dynamic objects, mobile robots should be capable of interacting with dynamic populations as well. In order to improve performance in such issues, learning-based algorithms have been introduced, such as deep reinforcement learning. It is presented in this thesis that a new method called RMPMP+TG is proposed. RMPMP+TG is a motion planning algorithm that uses mapless deep reinforcement learning to reduce collisions with environment robots. A prediction method similar to that used by humans to plan their own movements among populations has been applied to RMPMP+TG. Furthermore, a mechanism has been added to the initial algorithm which has a high capability of resolving this issue when the robot is stopped and unable to move. In comparison to state-of-the-art methods such as CADRL, RVO, and GA3C-CADRL, experiments conducted with the proposed method (RMPMP+TG) in basic and specific scenarios have demonstrated that RMPMP+TG provides a minimum improvement of 19%, 14 percent, and 4 percent in enhancing security in basic scenarios in comparison with CADRL, RVO, and GA3C-CADRL. Additionally, RMPMP+TG has demonstrated at least a 9% improvement in security when compared to GA3C-CADRL in specific scenarios.
استاد راهنما :
سمانه حسيني
استاد داور :
مازيار پالهنگ , محمدعلي خسروي فرد
لينک به اين مدرک :

بازگشت