از پارسکدرز بیشترین بهره را ببرید و رویای کاری خود را زندگی کنید.
سه سال پیش منتشر شده
تعداد بازدید: 285
کد پروژه: 304694
شرح پروژه
سلام
برای یک پروژه یادگیری تقویتی من یک محیط کاستوم دارم که تعداد اکشن ها خیلی زیاد هست. خودم با dqn حل کردم که زمان حل خیلی بالاست. یک مقاله ای پیدا کردم که یک الگوریتم برای حل این مشکل گفته که کدش هم هست. من میخوام این الگوریتم روی محیط من اجرا بشه
این خود مقاله
https://arxiv.org/abs/1512.07679
و کد الگوریتم مقاله هم در زیر میباشد:
https://github.com/nikhil3456/Deep-Reinforcement-Learning-in-Large-Discrete-Action-Spaces
پایتون
با استفاده از gym و tensorflow
زودترین تایمی که میتونید بدید کی هست؟ و شرایط به چه صورت هست؟
مهارت ها و تخصص های مورد نیاز
مهلت برای انجام
5روز
وضعیت مناقصه
بسته
درباره کارفرما
عضویت چهار سال پیش
نیاز به استخدام فریلنسر یا سفارش پروژه مشابه دارید؟
قادر به انجام این پروژه هستید؟
متأسفانه مهلت ارسال پیشنهاد این پروژه به پایان رسیده و پروژه بسته شده است؛ اما فرصتهای متعددی در سایت موجود میباشد.
به رایگان یک حساب کاربری بسازید
مهارتها و تخصصهای خود را ثبت کنید، رزومه و نمونهکارهای خود را نشان دهید و سوابق کاری خود را شرح دهید.
به شیوهای که دوست دارید کار کنید
برای پروژههای دلخواه در زمان دلخواه پیشنهاد قیمت خود را ثبت کنید و به فرصتهای شغلی منحصر به فرد دسترسی پیدا کنید.
با اطمینان دستمزد دریافت کنید
از زمان شروع کار تا انتهای کار به امنیت مالی شما کمک خواهیم کرد. وجه پروژه را از ابتدای کار به امانت در سایت نگه خواهیم داشت تا تضمین شودکه بعد از تحویل کار دستمزد شما پرداخت خواهد شد.
میخواهید شروع به کار کنید؟
یک حساب کاربری بسازید
بهترین مشاغل فریلنسری را پیدا کنید
رشد شغلی شما به راحتی ایجاد یک حساب کاربری رایگان و یافتن کار (پروژه) متناسب با مهارتهای شما
است.
پیدا کردن کار (پروژه)
تماشای دمو روش کار