شماره مدرك :
11455
شماره راهنما :
10531
پديد آورنده :
ميرزايي باديزي، محمدعلي
عنوان :

تسريع يادگيري مشاركتي در سيستم هاي چندعاملي با بهره گيري از كوتاهترين مسير تجربه شده

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
هوش مصنوعي و رباتيك
محل تحصيل :
اصفهان: دانشگاه صنعتي اصفهان، دانشكده برق و كامپيوتر
سال دفاع :
1395
صفحه شمار :
دوازده، 60ص.: مصور
استاد راهنما :
مازيار پالهنگ
توصيفگر ها :
يادگيري تقويتي
استاد داور :
مهران صفاياني
تاريخ ورود اطلاعات :
1395/07/10
دانشكده :
مهندسي برق و كامپيوتر
كد ايرانداك :
ID10531
چكيده فارسي :
1 چكيده ميتوان گفت بشر از ساخت اولين سيستم كامپيوتري به دنبال سيستمهاي هوشمند بود اين رويا با فعاليت در شاخه هوش مصنوعي روزبهروز به واقعيت نزديكتر شده است اصليترين معيار هوشمندي قابليت يادگيري است كه بر همين اساس در هوش مصنوعي زيرشاخه يادگيري ماشين پديد آمد و روزبهروز بيشتر موردتوجه قرار گرفت بعدها با تركيب يادگيري ماشين با سيستمهاي توزيعشده يادگيري در سيستمهاي چند عاملي باهدف افزايش سرعت و كيفيت مورد بررسي قرار گرفت يادگيري در سيستمهاي چندعاملي ميتواند بهصورت رقابتي و يا مشاركتي باشد در سيستمهاي چندعاملي مشاركتي عاملها سعي دارند با همكاري پاداش گروهي خود را افزايش دهند بر خالف آن در سيستمهاي رقابتي عاملهاي خودخواه در تالش براي افزايش سود فردي خود بوده كه اين افزايش ممكن است به قيمت كاهش سود ديگران باشد تركيب اطالعات را ميتوان بزرگترين چالش در روشهاي يادگيري مشاركتي دانست كه از يادگيري تقويتي استفاده مينمايند در پژوهش پيش رو باهدف بهبود يادگيري مشاركتي در سيستمهاي چندعاملي روشهاي ارائهشده موردبررسي قرار گرفت كه نتيجه اين بررسي شناسايي سه نقطه بحراني بود اولين نقطه بحراني كه بررسي شد انتخاب عمل در يادگيري مستقل بود كه با ارائۀ معياري به نام كوتاهترين فاصلۀ تجربهشده و بهرهگيري از اين معيار بهعنوان يك مكاشفه در انتخاب عمل منجر به بهبود يادگيري تقويتي شد نقطه بحراني دوم بخش تركيب دادههاي عاملها است در جهت بهبود اين تركيب دادهها ابتدا معيار جديدي به نام شوك ارائهشده سپس با تركيب اين معيار با معيار حداقل فاصله تجربهشده تركيب مؤثري ايجاد شده است در آخر موضوعي كه كمتر مورد بررسي قرارگرفته تقسيمكار بين عاملها باهدف كاهش اعمال تكراري و افزايش سرعت است انجام آزمايشها نشان داد اين سه عمل در كنار هم ميتواند بهبود چشمگيري در يادگيري مشاركتي ايجاد نمايد كلمات كليدي 1 سيستمهاي چندعاملي 2 يادگيري مشاركتي 9 يادگيري تقويتي
چكيده انگليسي :
speed up cooperative learning in multi agent systems using shortest experimented path Mohammad ali mirzaei badizi ma mirzaei@ec iut ac ir Department of Electrical and Computer Engineering Isfahan University of Technology Isfahan 84156 83111 Iran Degree M Sc Language Farsi Supervisor Prof Maziyar palhang palhang@cc iut ac ir Abstract Intelligent world and systems were a dream in the past but by growing artificial intelligencefield it in becoming a reality the main factor in a intelligent system is learning and artificialintelligence makes it possible mutiagent system learning becomes more accurate and faster bycombining machine learning methods with them multi agent learning include Cooperative andCompetitive methods In Competitive learning agents try to increase their utility however other sutility may be decreased In cooperative learning agents try to increase utility of all agentssimultaneously In recent years many works have been performed in cooperative learning Most of thesemethods used reinforcement learning for learning While these methods have a main challenge inhow to combine the knowledge of agents In this thesis we have addressed some of those challenges to improve Cooperative learningmethods to achieve this objective some main points of cooperative learning have been detected the first point is action selection in reinforcement learning which we used a new heuristic functionto select actions the second and third points are combining knowledge and task division by twocriteria shortest experienced path and Shock By using these two criteria combine theknowledge has been improved Overall experiments showed improve in quality and learning speed Key Words Cooperative learning Multi agent system Reinforcement learning
استاد راهنما :
مازيار پالهنگ
استاد داور :
مهران صفاياني
لينک به اين مدرک :

بازگشت