جلسه دفاع پایان نامه: عفیفه ملکی قلقاچی، گروه کامپیوتر
خلاصه خبر:
عنوان پایان نامه: بهبود الگوریتم بهینهسازی گرگ خاکستری با استفاده از یادگیری تقویتی چندعاملی
ارائهکننده: عفیفه ملکی قلقاچی استاد راهنما: دکتر مهدی رعایائی اردکانی استاد مشاور اول: دکتر محمد صنیعی آباده استاد ناظر داخلی: دکتر نصراله مقدم چرکری استاد ناظر خارج از دانشگاه: دکتر علیرضا رضوانیان (دانشگاه علم و فرهنگ) تاریخ: 1403/06/26 ساعت: 14 مکان: اتاق ۳۵۱
چکیده: الگوریتمهای فراابتکاری به دلیل ساختار انعطافپذیر و توانایی حل مسائل پیچیده، کاربرد گستردهای در بهینهسازی دارند. با این حال، این الگوریتمها اغلب در بهینههای محلی گیر میکنند و از پتانسیل کامل دادههای تولید شده توسط خود برای بهبود عملکردشان استفاده نمیکنند. بهطور خاص، الگوریتم گرگ خاکستری علیرغم سادگی و کارایی بالا، به دلیل جستجوی محدود اطراف سه گرگ رهبر و اختصاص وزنهای یکسان به آنها، عملکرد اکتشاف و همگرایی مناسبی در برخی مسائل ندارد. علاوه بر این، چون مقداردهی اولیه جمعیت به صورت تصادفی میباشد، به شدت بر پاسخ نهایی تأثیر میگذارد. در این تحقیق، برای رفع این مشکلات و بهبود عملکرد الگوریتم گرگ خاکستری، از یادگیری تقویتی استفاده شده است تا دادههای تولید شده توسط الگوریتم به نحو موثرتری به کار گرفته شده و الگوریتم با دریافت بازخوردهای مناسب هدایت شود. ابتدا، مقداردهی اولیه جمعیت به عنوان یک مسئله تصمیمگیری مارکوف مدلسازی شده و با بهرهگیری از یادگیری تقویتی، گرگها در موقعیتهای بهینهتری قرار گرفتهاند. همچنین، به منظور بهبود توازن بین اکتشاف و بهرهبرداری، از الگوریتمهای چندعاملی یادگیری تقویتی برای اشتراکگذاری تجربیات استفاده شده است، به گونهای که هر عامل بتواند از تجربیات سایر گرگها بهرهمند شود. علاوه بر این، تابع بهروزرسانی گرگهای رهبر نیز به عنوان یک مسئله یادگیری تقویتی مدلسازی شده تا از گیر افتادن در بهینههای محلی جلوگیری شود. نتایج ارزیابیها بر روی ۲۳ تابع محک استاندارد، نشاندهنده بهبود قابل توجه روش پیشنهادی در معیارهای مختلف مانند دقت، پایداری، سرعت همگرایی و توانایی در فرار از بهینههای محلی در مقایسه با نسخه استاندارد گرگ خاکستری و سایر الگوریتمهای گرگ خاکستری بهبودیافته است. روش پیشنهادی با ۸ الگوریتم مقایسه شده است. نتایج نشان میدهند که در ۱۵ مورد از ۲۳ تابع، روش پیشنهادی برای مقداردهی اولیه جمعیت و توازن اکتشاف و بهرهبرداری نسبت به الگوریتم پایه عملکرد بهتری داشتهاست. در ۱۷ مورد برای توابع بهروزرسانی گرگهای رهبر نسبت به الگوریتم پایه عملکرد بهتری داشتهاست. روش پیشنهادی تجمیع شده در ۲۱ مورد به نتایج بهتری نسبت به نسخه پایه دست یافته است. همچنین الگوریتم پیشنهادی در مقایسه با سایر روشها در معیارهای مختلف پایداری، سرعت همگرایی و زمان بهتر عمل کرده است. در پایان ارزیابیها، به این نتیجه رسیدیم که الگوریتم پیشنهادی برای حل مسائل پیچیده و مسائل با ابعاد بالا میتواند عملکرد مناسبی داشته باشد. نتایج بهدستآمده از توابع ارزیابی نشان داد که الگوریتم پیشنهادی پایدارتر بوده و قابلیت اطمینان بالاتری در مقایسه با سایر روشها دارد.