امروز 13 تیر 1404

NLP - Persian News Categorization

ٌٌYaas

NLP - Persian News Categorization

ٌٌYaas

NLP - Persian News Categorization

در این پروژه، با استفاده از تکنیک‌های پردازش زبان طبیعی (NLP) و یادگیری ماشین، یک مدل برای دسته‌بندی اخبار فارسی به شش دسته اصلی (اجتماعی، اقتصادی، اخبار استان‌های ایران، بین‌المللی، سیاسی، و علمی-فرهنگی-ورزشی) توسعه دادم. داده‌های پروژه شامل عنوان، توضیحات و برچسب هر خبر بود که نیاز به پیش‌پردازش و یکسان‌سازی برچسب‌ها داشت. از روش‌های مختلفی مانند بردارهای کلمات (Word Embeddings) و الگوریتم‌های طبقه‌بندی مانند شبکه‌های عصبی چندلایه (MLP) استفاده کردم. برای ارزیابی مدل، از معیار F1-Score استفاده شد و دقت مدل نهایی بیش از ۷۰٪ بود. همچنین، به عنوان بخش اختیاری، یک شبکه عصبی چندلایه (MLP) بدون استفاده از کتابخانه‌های آماده مانند MLPClassifier از sklearn پیاده‌سازی کردم که به دقت بیش از ۸۵٪ دست یافت.

3 فروردین 1404

مهارت‌های استفاده شده

یادگیری ماشین

3 فروردین 1404