توصيفگر ها :
سيستمهاي چندعاملي غيرخطي , آرايشبندي , كنترل توزيعشده , كنترلكننده مد لغزشي تطبيقي , الگوريتم فراپيچشي , يادگيري تقويتي
چكيده فارسي :
سيستمهاي چندعاملي، با تقسيمبندي مسائل پيچيده به وظايف كوچكتر و واگذاري آنها به عاملهاي مستقل، رويكردي نوين و كارآمد در حل مسائل پيچيده ارائه ميدهند. اين سيستمها به دليل مزايايي چون قابليت توسعه، انعطافپذيري، پردازش موازي و قابليت اطمينان، در حوزههاي مختلفي از جمله هوش مصنوعي، رباتيك و سيستمهاي خودكار، حمل و نقل، هوشمندسازي كنترل ترافيك، ماهوارهها، شناسايي، نظارت، سيستمهاي كنترل شبكهاي، مديريت اكوسيستم، پايش محيط زيست و غيره مورد توجه قرار گرفتهاند. با جايگزيني يك سيستم پيچيده با چندين سيستم سادهتر، اين سيستمها امكان دستيابي به راهكارهاي بهينه، تطبيقپذيري با تغييرات محيطي و افزايش كارايي را فراهم ميآورند. در برخي از سيستمهاي چندعاملي، رفتار پيچيده عوامل و تعاملات بين آنها مستلزم مدلسازي غيرخطي است. اين مدلها، با انعطافپذيري بيشتر، قادر به توصيف دقيقتر طيف گستردهاي از پديدهها و روابط بين عوامل هستند. وجود تأخيرهاي زماني در ارتباطات، ناهمگني در ديناميك داخلي عاملها و همچنين حضور عدمقطعيتها و اغتشاشات با كران نامشخص، چالشهاي قابل توجهي را در طراحي و كنترل اين سيستمها ايجاد ميكنند. در اين پژوهش، طراحي كنترلكنندههاي توزيعشده براي دستيابي همه عوامل به اجماع يا آرايشبندي با رهبر، در سيستمهاي چندعاملي مرتبه بالاي غيرخطي و ناهمگن با تأخير ارتباطي، تحت عدمقطعيتها و اغتشاشات با كران نامشخص، مورد مطالعه قرار گرفته است. براي حل اين مسئله، از رويكرد كنترل مد لغزشي تطبيقي بهره گرفته شده است. اين روش، با مكانيسم تطبيقي خود، قادر به مقابله با طيف وسيعي از عدمقطعيتها و اغتشاشات متغير و ناشناخته است و نيازي به اطلاعات دقيق و قبلي در مورد كرانهاي آنها ندارد. جهت غلبه بر چالشهاي ذاتي كنترلكنندههاي مد لغزشي سنتي همچون پديده چترينگ و محدوديتهاي ناشي از درجه نسبي سيستم، از الگوريتم كنترل فراپيچشي بهره گرفته شده است. همچنين در اين پژوهش با تمركز بر دستيابي به اجماع يا آرايشبندي بهينه در سيستمهاي توزيعشده، يك روش كنترل مد لغزشي تطبيقي توزيعشده مبتني بر يادگيري تقويتي ارائه شده است. اين رويكرد، علاوه بر تضمين پايداري و استحكام قوي سيستم در برابر عدمقطعيتها و اغتشاشات، امكان بهينهسازي عملكرد را نيز فراهم ميكند. در نهايت براي ارزيابي كارايي روش پيشنهادي، يك مثال شبيهسازي ارائه شده است.
چكيده انگليسي :
Multi-agent systems, by dividing complex problems into smaller tasks and assigning them to independent agents, provide an innovative and efficient approach to solving intricate issues. Due to advantages such as scalability, flexibility, parallel processing, and reliability, these systems have gained significant attention in various domains, including artificial intelligence, robotics, autonomous systems, transportation, intelligent traffic control, satellites, detection, surveillance, networked control systems, ecosystem management, environmental monitoring, and more. By replacing a complex system with multiple simpler systems, these frameworks enable the achievement of optimal solutions, adaptability to environmental changes, and enhanced efficiency. In some multi-agent systems, the complex behavior of agents and their interactions require nonlinear modeling. These models, with greater flexibility, are capable of accurately describing a wide range of phenomena and relationships among agents. The presence of time delays in communication, heterogeneity in agents’ internal dynamics, as well as uncertainties and disturbances with unknown bounds, poses significant challenges in the design and control of such systems. This thesis investigates the design of distributed controllers to achieve consensus or formation with a leader in high-order nonlinear and heterogeneous multi-agent systems with communication delays, under uncertainties and disturbances with unknown bounds. An adaptive sliding mode control approach is employed to address this issue. This method, with its adaptive mechanism, can handle a broad range of variable and unknown uncertainties and disturbances without requiring precise prior information about their bounds. To overcome the inherent challenges of traditional sliding mode controllers, such as chattering and constraints due to system relative degree, a super-twisting control algorithm is utilized. Additionally, this research focuses on achieving optimal consensus or formation in distributed systems by proposing a distributed adaptive sliding mode control method based on reinforcement learning. This approach not only ensures system stability and strong robustness against uncertainties and disturbances but also facilitates performance optimization. Finally, to evaluate the efficiency of the proposed method, a simulation example is presented.