توصيفگر ها :
اجتناب از برخورد , طرحريزي حركت , رباتيك , ربات سيار , يادگيري تقويتي عميق
چكيده فارسي :
يكي از مهمترين دستاوردهاي بشر، علم رباتيك است، كه بهتدريج با پيشرفت خود در مسائل مختلف با چالشهاي بسياري مواجه شده است. يكي از مهمترين اين مسائل، طرحريزي حركت ربات بوده كه پركاربردترين آن در بخش طرحريزي حركت رباتهاي سيار است. امروزه رباتهاي متحرك در محيطهاي استاتيك با پيچيدگي كم مانند محيطهاي صنعتي بهطور قابلاطميناني عمل ميكنند، اما در محيطهاي ديناميك پيچيده مانند فرودگاهها يا مراكز خريد شكست ميخورند. اين محيطها نسبت به محيطهاي صنعتي، شلوغتر و فضاي باريكتري دارند و حاوي اشيا متحركي با پيچيدگي حركت بالا ميباشند كه عمدتاً انسانها هستند. با افزايش پيچيدگي در محيطهايي كه اينگونه رباتها در آن انجاموظيفه ميكنند، نياز مبرم به الگوريتمهايي كه بتوانند در اين محيطها بهدرستي عمل كنند حس شده است. رباتهاي زميني بايد بتوانند درمقابل اشيا پويا و همچنين جمعيت پويا برخورد مناسب انجام دهند. براي بهبود عملكرد در چنين مسائلي الگوريتمهاي بر پايه يادگيري نظير يادگيري تقويتي عميق معرفيشدهاند. در اين پاياننامه روش پيشنهادي به نام RMPMP+TG معرفي ميشود. الگوريتم RMPMP+TG يك الگوريتم طرحريزي حركت با استفاده از يادگيري تقويتي عميق بدون نقشه است كه هدف اصلي آن كاهش برخورد با رباتهاي محيطي است. در RMPMP+TG سعي شده از روش پيشبيني كه انسانها از حركت بعدي ديگر عابران براي طرحريزي حركت خود ميان جمعيت استفاده ميكنند بهره برداري شود. همچنين، براي بهبود كارايي روش پيشنهادي در مواقعي كه ربات متوقف شده و امكان حركت ندارد مكانيزمي به الگوريتم اوليه اضافه شده كه توانايي بالايي در رفع اين مشكل دارد. آزمايشهاي انجام شده براي روش پيشنهادي(RMPMP+TG) با بهروزترين روشهاي موجود نظير CADRL، RVO وGA3C-CADRL در سناريوهاي پايه و خاص نشان ميدهد كه RMPMP+TG از روشهاي CADRL، RVO وGA3C-CADRL در زمينه بهبود امنيت در سناريوهاي پايه به ترتيب حداقل 19 درصد، 14 درصد و 4 درصد بهبود حاصل كرده است. همچنين، از لحاظ امنيت در سناريوهاي خاص نسبت به GA3C-CADRL حداقل 9 درصد بهبود داشته است.
چكيده انگليسي :
In the past few years, robotics has been one of the most important achievements of humanity, which has gradually faced many challenges with its advancement in different areas. It is important to note that robot motion planning is one of the most important of these issues, with the most practical application being in the area of motion planning for mobile robots. Today, mobile robots perform reliably in static environments with low complexity, such as industrial environments, but fail in dynamic and complex environments, such as airports and shopping centers. Typically, these environments are more crowded and have narrower spaces, as well as moving objects with a high degree of complexity. As environments where robots perform their tasks become more complex, algorithms that can function correctly in such environments are becoming increasingly important. As well as interacting with dynamic objects, mobile robots should be capable of interacting with dynamic populations as well. In order to improve performance in such issues, learning-based algorithms have been introduced, such as deep reinforcement learning. It is presented in this thesis that a new method called RMPMP+TG is proposed. RMPMP+TG is a motion planning algorithm that uses mapless deep reinforcement learning to reduce collisions with environment robots. A prediction method similar to that used by humans to plan their own movements among populations has been applied to RMPMP+TG. Furthermore, a mechanism has been added to the initial algorithm which has a high capability of resolving this issue when the robot is stopped and unable to move. In comparison to state-of-the-art methods such as CADRL, RVO, and GA3C-CADRL, experiments conducted with the proposed method (RMPMP+TG) in basic and specific scenarios have demonstrated that RMPMP+TG provides a minimum improvement of 19%, 14 percent, and 4 percent in enhancing security in basic scenarios in comparison with CADRL, RVO, and GA3C-CADRL. Additionally, RMPMP+TG has demonstrated at least a 9% improvement in security when compared to GA3C-CADRL in specific scenarios.