از پارسکدرز بیشترین بهره را ببرید و رویای کاری خود را زندگی کنید.
یک ماه پیش منتشر شده
تعداد بازدید: 46
کد پروژه: 525138
شرح پروژه
:
سلام وقت بخیر
من یه پروژه یادگیری تقویتی داشتم
من یه پروژه دارم، که قراره با یادگیری تقویتی انجام بشه، مساله ای که داریم با استفاده از فرایند تصمیم گیری مارکوف پیاده سازی شده ، در متلب هم پیاده سازی شده و آپتیمال پالیسی ها و لانگ ران اورج ولیو هم از الگوریم value iteration بدست امده، من الان میخوام تو مرحله اول شبیه سازی رو در پایتون انجام بدم، بدین صورت که پالیسی هایی که از متلب بدست امده را به پایتون بدم و اون برام لانگ ران اورج ولیو حساب کنه، بعد مقایسه کنم با اون لانگ ران اورج ولیو که از متلب دارم و وقتی این مرحله اوکی شد این قسمت به عنوان بخشی از الگوریتم یادگیری تقویتی استفاده بشه، ولی فعلا هدفم مرحله اول یعنی شبیه سازی در پایتون هست
من خودم وقت گذاشتم و نتونستم هنوز جواب درست بگیرم، زمان اجرای کد خیلی طولانیه و در نهایت هم جواب درست نمیده، که احتمالا مشکل از کد باشه
پروژه توسط کسی باید انجام بشه تخصص تو زمینه ی فرایندهای مارکوف پیوسته،شبیه سازی و یادکیری تقویتی و کار با متلب و پایتون را داشته باشه، چون مساله ساده نیست
در حد تقریبا خوبی خودم بلد هستم ولی نتوتستم پروژه را پیش ببرم، پس نیاز به کسی هست که متخصص باشه
اگر متخصص تو این زمینه دارید بهم اطلاع بدین لطفا
این فایل متلب هست که مساله توسط این کد به روش value iteration algorithm حل شده و به جواب رسیده، در واقع خروجی های این کد که ما با اون کار داریم policy1, policy2 و Leasing R هست که optimal policy های ما هستند و همچنین LRAV که سود نهایی را نشون میده. من میخواهم این را در پایتون شبیه سازی کنم در واقع یه جورایی شبیه سازی رویدادها هست، البته هدف این است که با یادگیری عمیق ما این مساله را حل کنی ولی فعلا مرحله اول مربوط به شبیه سازی در پایتون است که پالیسی هایی که از متلب بدست آمده را به پایتون بدیم و هدف بدست آوردن LRAV است. LRAV که از متلب بدست آمده در واقع theoretical LRAV هست و ما می توانیم خروجی پایتون را با ان مقایسه کنیم
این کد پایتونی هست که خودم کار کردم، ولی اگر خروجی ها را ببیند تا زمان شبیه سازی 1000000 بیشتر اجرا نشد، زمان اجرا هم خیلی زیاد هست شاید نزدیک 9 ساعت طول کشید و متوقف شد، و حتی تا ان زمان هم جواب لانگ LRAV نزدیک 8 است که با LRAV متلب فاصله دارد، من از لایبری simpy استفاده کردم که شاید همون مشکل ساز شده یا محاسبه ی لانگ ران اورج ولیو اشتبه است یا ...
یک مقاله هم هست که اگر نیاز باشه میتونم بفرستم، اینجا مساله ساده تر شده و یا یک سری اطلاعات که مهم هست را از ان بیرون بیارم و براتون بفرستم
این پروژه شامل 2 فایل مهم است، لطفا قبل از ارسال پیشنهاد حتما نسبت به بررسی این فایل اقدام فرمایید.
مهارت ها و تخصص های مورد نیاز
بودجه
100,000 تومان تا 300,000 تومان
مهلت برای انجام
7روز
وضعیت مناقصه
بسته
درباره کارفرما
عضویت دو سال پیش
قادر به انجام این پروژه هستید؟
مهلت ارسال پیشنهاد قیمت برای این پروژه تمام شده است
به رایگان یک حساب کاربری بسازید
مهارتها و تخصصهای خود را ثبت کنید، رزومه و نمونهکارهای خود را نشان دهید و سوابق کاری خود را شرح دهید.
به شیوهای که دوست دارید کار کنید
برای پروژههای دلخواه در زمان دلخواه پیشنهاد قیمت خود را ثبت کنید و به فرصتهای شغلی منحصر به فرد دسترسی پیدا کنید.
با اطمینان دستمزد دریافت کنید
از زمان شروع کار تا انتهای کار به امنیت مالی شما کمک خواهیم کرد. وجه پروژه را از ابتدای کار به امانت در سایت نگه خواهیم داشت تا تضمین شودکه بعد از تحویل کار دستمزد شما پرداخت خواهد شد.
میخواهید شروع به کار کنید؟
یک حساب کاربری بسازید
بهترین مشاغل فریلنسری را پیدا کنید
رشد شغلی شما به راحتی ایجاد یک حساب کاربری رایگان و یافتن کار (پروژه) متناسب با مهارتهای شما
است.
پیدا کردن کار (پروژه)
تماشای دمو روش کار