از گروه مهندسی مکانیک

جلسه دفاع ازرساله دکترا آقای پیمان نوروزی باغکمه

جلسه با موضوع توسعه کنترلر مبتنی بر یادگیری تقویتی عمیق عاطفی، یک مطالعه موردی برای ربات پرنده کوادروتور، در تاریخ سه شنبه 30 دی1404، برگزار می گردد.

جلسه دفاع ازرساله دکترا آقای پیمان نوروزی باغکمه با موضوع توسعه کنترلر مبتنی بر یادگیری تقویتی عمیق عاطفی، یک مطالعه موردی برای ربات پرنده کوادروتور، از گروه مهندسی مکانیک در تاریخ سه شنبه 30 دی1404، ساعت 13 دراتاق شورا ساختمان انصاری برگزار می گردد.

استادان راهنما: دکتر حامد شهبازی و دکتر کیوان ترابی
 
چکیده: در دهه‌های اخیر، پیشرفت‌های چشمگیری در حوزه‌ی هوش مصنوعی و یادگیری ماشین، به‌ویژه درزمینه‌ی یادگیری تقویتی عمیق حاصل‌شده است. این الگوریتم‌ها با بهره‌گیری از شبکه‌های عصبی عمیق و داده‌های حاصل از تعامل با محیط، قادرند رفتار سیستم‌های پیچیده را در محیط‌های پویا و نامعین به‌صورت بهینه فراگیرند.با توجه به زمان‌بر بودن فرآیند آموزش در الگوریتم‌های یادگیری تقویتی عمیق برای سامانه‌های دینامیکی پیچیده‌ای همچون کوادروتور، در این پژوهش از ترکیب هوش عاطفی انسان با هوش منطقی الگوریتم‌های یادگیری تقویتی به‌منظور تسریع فرآیند آموزش و یادگیری کنترلی استفاده‌شده است. برای ارزیابی روش پیشنهادی، بستر شبیه‌سازی کنترل کوادروتور در محیط شبیه‌سازی نرم افزار متلب طراحی گردید. در این بستر، مدل یادگیری تقویتی عمیق مبتنی بر عاطفه توسعه داده‌شده است تا بتواند در مواجهه با ورودی‌های متنوع و شرایط محیطی گوناگون، پاسخ‌های کنترلی متناسب و سازگار ارائه دهد. ازجمله چالش‌های اصلی در کنترلرهای مبتنی بر یادگیری عمیق می‌توان به نیاز به حجم وسیعی از داده‌ها برای آموزش، سرعت‌پایین همگرایی و ثابت بودن تابع پاداش اشاره کرد. در این پژوهش با الهام از فرآیند یادگیری تدریجی انسان و ادغام مؤلفه‌های عاطفی در طراحی کنترلر، تلاش شده است تا پاسخ سیستم متناسب با شرایط محیطی و اهداف کنترلی، بهینه گردد. در این راستا، تابع پاداش پیشنهادی بر اساس حالات عاطفی خشم و رضایت طراحی‌شده است تا سیستم بتواند نسبت به شرایط مطلوب یا نامطلوب محیط، رفتار تطبیق‌پذیر و هوشمندانه از خود نشان دهد. ازآنجاییکه تعریف یک تابع پاداش ثابت و جامع برای تمام جنبه‌های کنترلی بسیار دشوار است، ترکیبی از پاداش منطقی و پاداش عاطفی پویا به کار گرفته‌شده است. افزودن مؤلفه‌های عاطفی به تابع پاداش و حالت‌های سیستم منجر به ایجاد یک ساختار متغیر و انعطاف‌پذیر می‌شود که توان یادگیری و سرعت تصمیم‌گیری کنترلر را افزایش می‌دهد. علاوه براین، در این تحقیق تابع فعال‌ساز انسانی و شبکه‌ی القا به‌عنوان مسیرهای پردازش مکمل در کنار الگوریتم یادگیری تقویتی عمیق معرفی‌شده‌است تا علاوه بر سرعت یادگیری، پایداری و دقت تصمیم‌گیری در محیط‌های پیچیده‌ای همچون کوادروتور بهبود یابد.
تاریخ:
1404/10/28
تعداد بازدید:
80
منبع:
دانشگاه اصفهان

آدرس: اصفهان، میدان آزادی، دانشگاه اصفهان،میدان خوارزمی، ابتدای بلوار سلامت، ساختمان انصاری
کدپستی: 8174673441
تلفن: 37932685 تلفکس: 36682887
راهنمای جامع تلفن های دانشگاه اصفهان

Powered by DorsaPortal