NLP - Persian News Categorization

NLP - Persian News Categorization
در این پروژه، با استفاده از تکنیکهای پردازش زبان طبیعی (NLP) و یادگیری ماشین، یک مدل برای دستهبندی اخبار فارسی به شش دسته اصلی (اجتماعی، اقتصادی، اخبار استانهای ایران، بینالمللی، سیاسی، و علمی-فرهنگی-ورزشی) توسعه دادم. دادههای پروژه شامل عنوان، توضیحات و برچسب هر خبر بود که نیاز به پیشپردازش و یکسانسازی برچسبها داشت. از روشهای مختلفی مانند بردارهای کلمات (Word Embeddings) و الگوریتمهای طبقهبندی مانند شبکههای عصبی چندلایه (MLP) استفاده کردم. برای ارزیابی مدل، از معیار F1-Score استفاده شد و دقت مدل نهایی بیش از ۷۰٪ بود. همچنین، به عنوان بخش اختیاری، یک شبکه عصبی چندلایه (MLP) بدون استفاده از کتابخانههای آماده مانند MLPClassifier از sklearn پیادهسازی کردم که به دقت بیش از ۸۵٪ دست یافت.
3 فروردین 1404
مهارتهای استفاده شده
3 فروردین 1404
پروژهها
