شماره راهنما :
1612 دكتري
پديد آورنده :
روشن ضمير، محمد
عنوان :
ارائه يك الگوريتم برنامهنويسي شبكهاي براي تصميمگيري در محيطهاي قطعي و غيرقطعي
گرايش تحصيلي :
هوش مصنوعي
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
صفحه شمار :
هشت، 153ص: مصور، جدول، نمودار
استاد راهنما :
مازيار پالهنگ
استاد مشاور :
عبدالرضا ميرزايي، حسين فلسفين
توصيفگر ها :
برنامهنويسي ژنتيك شبكهاي , مسأله كنترل رفتار عاملها , زيرگراف مشترك بيشينه , بهينهسازي ازدحام ذرات
استاد داور :
مرجان كائدي، فريد شيخ الاسلام، محمدرضا احمدزاده
تاريخ ورود اطلاعات :
1399/06/16
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1399/06/16
چكيده فارسي :
چكيده يكي از انواع الگوريتمهاي تكاملي كه قابليتهاي بسيار خوبي در حل مسأله بهينهسازي فرآيند تصميمگيري در مسأله كنترل رفتار عاملها از خود نشان داده الگوريتم برنامهنويسي ژنتيك شبكهاي است ساختار افراد در اين الگوريتم به صورت يك گراف جهتدار است اين گراف جهتدار كه در واقع يك روندنما را نمايش ميدهد مشخص ميكند كه در هر گام ميبايست به چه ترتيبي چه شرايطي بررسي شده و چه كارهايي انجام شود بدين صورت ميتوان روش حل بسياري از مسائل پيچيده را مدلسازي كرد در اين تحقيق به بررسي نحوه انجام فرآيند تكامل اين نوع ساختار ميپردازيم بهگونهاي كه علاوه بر بهبود كارآيي و همگرايي به جوابهاي بهينه بتواند خود را با شرايط ايجاد شده در محيطهاي غيرقطعي نيز منطبق كند چنانچه عاملها بخواهند فرآيند تصميمگيري را در يك محيط غيرقطعي انجام دهند با مشكل عمدهاي مواجه خواهند شد و آن وجود عدم قطعيت در تابع ارزيابي است بدين معني كه هر بار ارزيابي افراد منجر به نتايج متفاوتي خواهد شد ويژگي عدم قطعيت باعث ميشود كه در دنيايي كه عامل در آن قرار دارد پس از انجام يك عمل توسط عامل آن عامل الزاما به وضعيت از پيش مشخص شدهاي وارد نشود در اين شرايط براي ارزيابي دقيق افراد ميبايست هر فرد در جمعيت چندين بار مورد ارزيابي قرار گيرد و ميزان مورد انتظار ارزش افراد محاسبه شود در اين حالت با توجه به جمعيت مبنا بودن فرآيند تكامل سرعت اين فرآيند متناسب با تعداد دفعات ارزيابي يك فرد به شدت كاهش پيدا ميكند در صورتي كه هر فرد به تعداد ناكافي مورد ارزيابي قرار گيرد مقدار حاصل به عنوان ميزان كارآيي آن فرد دقيق نبوده و در صورتي كه بر اساس اين مقدار نادقيق فرآيند بازتركيبي و جهش انجام گيرد نميتوان انتظار داشت فرآيند تكامل در جهت صحيح پيش رود زيرا عمل انتخاب افراد شايسته جهت شركت در فرآيند بازتركيبي و جهش به صورت صحيح انجام نميگيرد در ضمن در الگوريتم استاندارد برنامهنويسي ژنتيك شبكهاي عملگرهاي بازتركيبي و جهش ساختارهاي ايجاد شده را به صورت مكرر شكسته و مجدد ساختار جديدي ايجاد ميكنند اگرچه اين كار ميتواند به ايجاد ساختارهاي بهتري منجر شود اما ممكن است افراد مناسب ايجاد شده را نيز از بين ببرد و مدت زمان دستيابي به راهكارهاي مطلوب را افزايش دهد روش ارائه شده در اين تحقيق هر دو مشكل فوقالذكر را به خوبي مديريت ميكند اين كار در دو مرحله صورت ميگيرد كه مرحله اول را ميتوان به دو صورت انجام داد در راهكار اول به كمك توزيع هدفمند و متناسب پاداشهاي بدست آمده در فرآيند تكامل ارزش ايجاد اتصالات در ساختار افراد محاسبه و با توجه به اين ارزشدهي مقدار اتصالات مشخص ميشود در واقع در اين مرحله تجربه انباشته افراد برتر در جمعيت محاسبه و از آن جهت توليد نسل جديد استفاده ميشود اين راهكار تا حدودي مشكل شكسته شدن مكرر ساختارها را كاهش ميدهد در مرحله دوم به منظور كاهش بيشتر مشكل شكسته شدن مكرر ساختارها و نيز ارزيابي دقيقتر ميزان كارآيي افراد به جاي ارزيابي چند باره آنها ميتوان از تجربيات مجموعهاي از افراد جهت تقريب ميزان كارآيي آنها و نيز تقريب ارزش زيرساختارهاي مشترك بكار رفته در آنها استفاده كرد بدين شكل هم ميتوان با كمك محاسبه ارزش دقيقتر كارآيي افراد فرآيند تكامل را با كيفيت بهتري پيش برد و هم ميتوان زيرساختارهاي مفيدتر را جهت ايجاد افراد نسل بعد استفاده كرد بدين صورت مشكل ارزيابي چندباره افراد حل ميشود روش ارائه شده در اين تحقيق به خوبي توانايي حفظ و مديريت زيرساختارهاي مفيد در فرآيند تكامل را دارد اين زير ساختارها به كمك روش پيشنهادي ميتوانند به صورت بسيار كارآمد از نسلي به نسل بعد منتقل شوند از اين الگوريتم براي حل مسأله كنترل رفتار عاملها در دو محيط آزمايش دنياي كاشي و دامنه تعقيب در شرايط وجود عدم قطعيت در محيط استفاده شده است نتايج بدست آمده نشان ميدهد روش پيشنهادي در ايجاد يك روندنماي كارآمد جهت انجام فرآيند تصميمگيري از توانايي بسيار بالايي برخوردار است نتيجه آزمايشهاي انجام شده روي اين دو محيط نشان ميدهد الگوريتم پيشنهادي در اين شرايط هم از لحاظ سرعت يافتن پاسخهاي مناسب و هم از جهت كيفيت اين راهحلها توانسته الگوريتم برنامهنويسي ژنتيك شبكهاي و ويرايشهاي مختلف آن را پشت سر بگذارد به خصوص در محيطي نظير دامنه تعقيب كه پويايي بالايي دارد تفاوت ميزان كارآيي الگوريتم پيشنهادي نسبت به ساير الگوريتمهاي مورد مقايسه وضوح بيشتري دارد كلمات كليدي برنامهنويسي ژنتيك شبكهاي مسأله كنترل رفتار عاملها زيرگراف مشترك بيشينه بهينهسازي ازدحام ذرات
چكيده انگليسي :
Developing a Network Programming Algorithm for Decision Making in Deterministic and Stochastic Environments Mohamad Roshanzamir mohamad roshanzamir@ec iut ac ir February 5 2020 Department of Electrical and Computer EngineeringIsfahan University of Technology 84156 83111 Isfahan IranDr Maziar Palhang palhang@iut ac ir Dr Abdolreza Mirzaei Dr Hossein Falsafain Dr GholamrezaYousefiAbstractEvolutionary and swarm intelligence algorithms are among the successful approaches insolving optimization problems Genetic Network Programming GNP is one of these types ofalgorithms which is used in decision making optimization in agent control problems It isknown as an extension of Genetic Programming GP but its individuals are made of graphsinstead of trees This way they could better represent model decision making process Themain goal of this research is the improvement of the evolution process in GNP so that it can beused in both deterministic and stochastic environments For this purpose in each iteration promising individuals save their experience proportional to their fitness in an experience table This mechanism is adapted from Ant Colony Optimization ACO The experience table is thenused for the production of the next generation To improve this mechanism in each generationof the algorithm the maximal common substructures of promising individuals are also extractedand transferred to the next generation directly Applying the proposed algorithm on twobenchmarks suggests that our proposed approach outperforms other algorithms in this fieldespecially when the environment is stochastic Key WordsGenetic Programming Genetic Network Programming Maximal Common Subgraph AntColony Optimization Agent Control ProblemIntroductionNowadays evolutionary and swarm intelligence algorithms have received much attention dueto their high capabilities to solve optimization problems So far considerable research has beenperformed on evolutionary optimization methods However according to Wolpert andMacready 1997 different evolutionary algorithms can handle specific types of problems Itmeans it is not possible to guarantee that one of them will be able to perform better than otherson all problems Therefore it cannot be claimed that an algorithm always performs better thanthe others So different types of evolutionary algorithms are presented which often havedifferent structures For example in GA the individuals are encoded as strings while in Genetic Department of Electrical and Computer Engineering Isfahan University of Technology 84156 83111 Isfahan Iran
استاد راهنما :
مازيار پالهنگ
استاد مشاور :
عبدالرضا ميرزايي، حسين فلسفين
استاد داور :
مرجان كائدي، فريد شيخ الاسلام، محمدرضا احمدزاده