از پارسکدرز بیشترین بهره را ببرید و رویای کاری خود را زندگی کنید.
سه سال پیش منتشر شده
تعداد بازدید: 484
کد پروژه: 195171
شرح پروژه
با سلام.
این پروژه از دو بخش تشکیل شده است، پیش نیاز است و تمرکز اصلی برای انتخاب فریلنسر بر بخش اصلی پروژه است. بنابراین اگر به هر دلیلی قادر به انجام بخش اول نیستید اما تمایل به انجام بخش دوم دارید باز هم پیشنهاد بدهید اما اگر نمی توانید بخش دوم را انجام دهید پیشنهاد ندهید.
بخش اول - پیش نیاز: استخراج لیست آدرس وبسایت دانشگاه های برتر
بیان مساله:
استخراج لیست آدرس وبسایت ترکیبی از ۵۰۰ دانشگاه برتر (https://drive.google.com/file/d/15l1HNTMGZEQLg6Dak-pgu-foL8C50tXC/view?usp=sharing
) دانشگاه های برتر آمریکا (https://drive.google.com/file/d/16SKQZ8rFlbj8iv4riezvXgHL-rgtEjMN/view?usp=sharing) و دانشگاه های برتر در هر موضوع (https://drive.google.com/file/d/1bPKcPirC8mgVNJukdBoWSPXrUJwVKX4W/view?usp=sharing).
دقت کنید که بعضی از دانشگاه ها در چند لیست هستند.
روش پیشنهادی: یک اسکریپت که با استفاده از وبسایت https://univ.cc/ و لیست دانشگاه ها در فایل های pdf فوق سایت دانشگاه را پیدا کند.
خروجی: یک فایل اکسل یا csv داده شود که شامل دو ستون نام دانشگاه و لینک سایت دانشگاه باشد.
بخش دوم - خزشگر مجهز به machine learning برای به دست آوردن لینک صفحات اعضای هیات علمی دانشگاه های بالا
یاز به یک اسکریپت خزشگر (در یکی از زبان های python، go، rust) داریم که در صفحات سایت های دانشگاهی جستجو کند و لیستی از صفحات مربوط به اعضای هیات علمی دانشگاه (Faculty) را ذخیره کند. مثلا باید از سایت دانشگاه ویکتوریا: https://www.uvic.ca/ به صفحاتی نظیر https://www.uvic.ca/gustavson/faculty/faculty/faculty/index.php برسد و همه لینک های اعضای هیات علمی را برگرداند.
به موارد زیر دقت کنید :
۱) صفحات دانشگاه ها از بخش اول به دست می آید.
۲) برای هر دانشگاه چندین صفحه شبیه صفحه بالا مربوط به دانشکده های مختلف و دپارتمان های مختلف وجود دارد.
۳) تعداد صفحات وبسایت بسیار زیاد است بنابراین نیاز است از طریق هوش مصنوعی تشخیص داده شود که خرش به صورت هوشمند انجام شود.
۴) ما فقط به صفحات اعضای هیات علمی که در آن ها فرد در مورد بیوگرافی و علاقه های پژوهشی اش نوشته است نیاز داریم.
۵) فریلنسر می تواند بر حسب تخصص و مهارت خودش از هر روشی برای رسیدن به راه حل این مساله استفاده کند. اما در این لینک یک روش برای پروژه ای مشابه استفاده شده است:
https://www.semantics3.com/blog/ai-for-automated-web-crawling/
۶) هدف فعلا فقط استخراج لینک صفحات اعضای هیات علمی است. بنابراین چالش سوم که در لینک به سایت semantics3 مطرح شده است مد نظر نیست. فقط چالش اول و دوم.
۷) لطفا توضیح بدهید به چه روشی می خواهید کار را انجام بدهید یا لینک و فایل پروژه های قبلی یادگیری ماشین را بفرستید.
۸) خروجی اسکریپت باید به صورت یک فایل اکسل یا csv باشد شامل ستون های زیر، خروجی json نیز قابل قبول است. اما اگر پیشنهاد دیگری در مورد خروجی دارید بفرمایید.
University
Faculty
Department
Faculty Name
Url
که مربوط به موارد زیر است.
دانشگاه
دانشکده
دپارتمان
نام عضو هیات علمی
آدرس صفحه
با آرزوی یک همکاری خوب
مهارت ها و تخصص های مورد نیاز
بودجه
750,000 تومان تا 5,000,000 تومان
مهلت برای انجام
10روز
وضعیت مناقصه
بسته
درباره کارفرما
عضویت شش سال پیش
قادر به انجام این پروژه هستید؟
مهلت ارسال پیشنهاد قیمت برای این پروژه تمام شده است
به رایگان یک حساب کاربری بسازید
مهارتها و تخصصهای خود را ثبت کنید، رزومه و نمونهکارهای خود را نشان دهید و سوابق کاری خود را شرح دهید.
به شیوهای که دوست دارید کار کنید
برای پروژههای دلخواه در زمان دلخواه پیشنهاد قیمت خود را ثبت کنید و به فرصتهای شغلی منحصر به فرد دسترسی پیدا کنید.
با اطمینان دستمزد دریافت کنید
از زمان شروع کار تا انتهای کار به امنیت مالی شما کمک خواهیم کرد. وجه پروژه را از ابتدای کار به امانت در سایت نگه خواهیم داشت تا تضمین شودکه بعد از تحویل کار دستمزد شما پرداخت خواهد شد.
میخواهید شروع به کار کنید؟
یک حساب کاربری بسازید
بهترین مشاغل فریلنسری را پیدا کنید
رشد شغلی شما به راحتی ایجاد یک حساب کاربری رایگان و یافتن کار (پروژه) متناسب با مهارتهای شما
است.
پیدا کردن کار (پروژه)
تماشای دمو روش کار