از پارسکدرز بیشترین بهره را ببرید و رویای کاری خود را زندگی کنید.
یک ماه پیش منتشر شده
تعداد بازدید: 383
کد پروژه: 582777
شرح پروژه
شرح پروژه:
ما مجموعهای شامل حدود ۵۰۰۰ فایل PDF از قبوض مصرفی مشترکان به زبان فارسی داریم که این قبوض در ۷ قالب و فرمت متفاوت صادر میشوند. هدف پروژه، استخراج اطلاعات کلیدی از جداول این قبوض (شناسه قبض، تاریخ، میزان مصرف، مبلغ و ...) و ذخیره ساختیافتهی آنها در یک پایگاه داده محلی است.
مهارتهای مورد نیاز:
تسلط کامل به Python
تسلط به کتابخانههای pdfplumber، PyMuPDF، pdfminer.six
آشنایی با pytesseract برای OCR فارسی
توانایی استخراج و نرمالسازی دادهها از چند نوع قالب PDF
تسلط به SQL یا MongoDB برای ذخیره دادهها
تجربهی عملی در کار با دادههای فارسی و جداول PDF
مهارت در Regex و پاکسازی داده
آشنایی با Pandas و خروجی Excel یا CSV
مهارت ها و تخصص های مورد نیاز
مهلت برای انجام
5روز
وضعیت مناقصه
در حال انجام
درباره کارفرما
عضویت چهار ماه پیش
نیاز به استخدام فریلنسر یا سفارش پروژه مشابه دارید؟
قادر به انجام این پروژه هستید؟
متأسفانه مهلت ارسال پیشنهاد این پروژه به پایان رسیده و پروژه بسته شده است؛ اما فرصتهای متعددی در سایت موجود میباشد.
به رایگان یک حساب کاربری بسازید
مهارتها و تخصصهای خود را ثبت کنید، رزومه و نمونهکارهای خود را نشان دهید و سوابق کاری خود را شرح دهید.
به شیوهای که دوست دارید کار کنید
برای پروژههای دلخواه در زمان دلخواه پیشنهاد قیمت خود را ثبت کنید و به فرصتهای شغلی منحصر به فرد دسترسی پیدا کنید.
با اطمینان دستمزد دریافت کنید
از زمان شروع کار تا انتهای کار به امنیت مالی شما کمک خواهیم کرد. وجه پروژه را از ابتدای کار به امانت در سایت نگه خواهیم داشت تا تضمین شودکه بعد از تحویل کار دستمزد شما پرداخت خواهد شد.
میخواهید شروع به کار کنید؟
یک حساب کاربری بسازید
بهترین مشاغل فریلنسری را پیدا کنید
رشد شغلی شما به راحتی ایجاد یک حساب کاربری رایگان و یافتن کار (پروژه) متناسب با مهارتهای شما
است.
پیدا کردن کار (پروژه)
تماشای دمو روش کار