از پارسکدرز بیشترین بهره را ببرید و رویای کاری خود را زندگی کنید.
نه سال پیش منتشر شده
تعداد بازدید: 2113
کد پروژه: 24709
شرح پروژه
فايل متني داريم که به ترتيب file 1 تا file 5 نامگذاري شده است(هر کدام فقط دو جمله به زبان انگليسي است). ابتدا در برنامه بازيابي اطلاعات فايل متني را انتخاب مي کنيم، برنامه بازيابي اطلاعات شامل ۲ قسمت است، ، در بخش اول indexer که بر اساس inverted index يا فهرست معکوس يک index ايجاد مي کند که indexer خود شامل دو بخش است:
يک- Tokenization که براي توکن بندي متن استفاده مي شود(کاراکتر به کاراکتر ميخواند به اسپيس که رسيديم توکن يا همان کلمه را تشخيص مي دهد)
نکته: stopwordهاي متن يا همان حروف اضافه که مثل . an a the then of , ; ) ( هستند نيازي به توکن بندي ندارند و آن ها را جدا کرده و درون stop-word.txt ميريزد.
دو- normalization که براي نرمال سازي از الگوريتم Porter stemmer استفاده مي کند.(کد اين الگوريتم در سايت ها هست و فقط بايد کپي کنين)
توضيح کامل تر در فايل آپلود شده
زیرساخت:
ويندوز ۷ هوم اديشن :)
c# 2013
قابل تحویل:
این پروژه شامل 1 فایل مهم است، لطفا قبل از ارسال پیشنهاد حتما نسبت به بررسی این فایل اقدام فرمایید.
مهارت ها و تخصص های مورد نیاز
بودجه
5,000 تومان تا 100,000 تومان
مهلت برای انجام
6روز
وضعیت مناقصه
بسته
درباره کارفرما
عضویت ده سال پیش
قادر به انجام این پروژه هستید؟
مهلت ارسال پیشنهاد قیمت برای این پروژه تمام شده است
به رایگان یک حساب کاربری بسازید
مهارتها و تخصصهای خود را ثبت کنید، رزومه و نمونهکارهای خود را نشان دهید و سوابق کاری خود را شرح دهید.
به شیوهای که دوست دارید کار کنید
برای پروژههای دلخواه در زمان دلخواه پیشنهاد قیمت خود را ثبت کنید و به فرصتهای شغلی منحصر به فرد دسترسی پیدا کنید.
با اطمینان دستمزد دریافت کنید
از زمان شروع کار تا انتهای کار به امنیت مالی شما کمک خواهیم کرد. وجه پروژه را از ابتدای کار به امانت در سایت نگه خواهیم داشت تا تضمین شودکه بعد از تحویل کار دستمزد شما پرداخت خواهد شد.
میخواهید شروع به کار کنید؟
یک حساب کاربری بسازید
بهترین مشاغل فریلنسری را پیدا کنید
رشد شغلی شما به راحتی ایجاد یک حساب کاربری رایگان و یافتن کار (پروژه) متناسب با مهارتهای شما
است.
پیدا کردن کار (پروژه)
تماشای دمو روش کار