Sharif MLL
Language Informed RL by Negin Hashemi 1401/Azar/23 @sutmll
کارآمدی نمونه و تعمیم پذیری ترکیبی از جمله چالشهای بازی هستند که از دیرباز در مسائل تصمیم گیری ترتیبی و بویژه یادگیری تقویتی مطرح شدەاند. طبق ادبیات این حوزه، از جایی که جملات زبان طبیعی نامحدود و ترکیبی هستند و اطلاعات را نیز با تراکم بالاتری نسبت به پیمانەهای دیگر، مانند بصری، انتقال میدهند، میتوانند در کنار پیمانەهای دیگر این دو معیار را در محیطهای تعاملی بهبود بخشند. با استفاده از اطلاعات نهفته در زبان و ساختار ترکیبی آن میتوان به درکی انتزاعی و تفکیکشده از محیط و وظیفەی موردنظر رسید. برای رسیدن به این منظور، ضرورت دارد که بتوانیم ارتباط بین اجزای معنیدار دادگان پیمانەهای مختلف ورودی، اعم از بصری و زبانی را درک کنیم. مطالعات حوزهی یادگیری تقویتی مبتنی بر زبان راهکارهایی برای حل این چالشها و هدایت عاملهای تصمیمگیری به کمک زبان را ارائه میدهند. در این ارائه، پس از معرفی مقالات مروری در این حوزه، محیطهای پیشنهادی در ادبیات موضوع و چالشهای آنها را بررسی میکنیم (BabyAI-BabyAI++-NetHack-ALFWorld). سپس مصادیقی از روشهای مبتنی بر ایجاد پاداش کمکی (ELLA-LEARN) و سوگیریهای استقرایی در تابع سیاست (LM-Nav) را مطرح میکنیم.
با سلام،
جلسه چهارم علیت در یادگیری ماشین فردا ساعت ۱۴:۳۰ در اتاق مجازی دستیار آموزشی دکتر سلیمانی تشکیل خواهد شد.
@sutmll
جلسه چهارم علیت در یادگیری ماشین فردا ساعت ۱۴:۳۰ در اتاق مجازی دستیار آموزشی دکتر سلیمانی تشکیل خواهد شد.
@sutmll
Media is too big
VIEW IN TELEGRAM
ارائهی دکتر سلیمانی - سوی تعمیمپذیری خارج از توزیع
https://www.aparat.com/v/DaALO?playlist=2595605
@sutmll
https://www.aparat.com/v/DaALO?playlist=2595605
@sutmll
با سلام،
جلسه پنجم علیت در یادگیری ماشین فردا ساعت ۱۴:۳۰ در اتاق مجازی دستیار آموزشی دکتر سلیمانی تشکیل خواهد شد.
@sutmll
جلسه پنجم علیت در یادگیری ماشین فردا ساعت ۱۴:۳۰ در اتاق مجازی دستیار آموزشی دکتر سلیمانی تشکیل خواهد شد.
@sutmll