امروز 10 خرداد 1404

Image Captioning Using CNN and LSTM

ٌٌYaas

Image Captioning Using CNN and LSTM

ٌٌYaas

Image Captioning Using CNN and LSTM

در این پروژه، یک مدل تولید توضیحات تصاویر (Image Captioning) با ترکیب شبکه‌های عصبی کانولوشن (CNN) و LSTM توسعه دادم. از مدل پیش‌آموخته‌ی InceptionV3 برای استخراج ویژگی‌های تصاویر و از یک شبکه‌ی LSTM برای تولید توضیحات متنی استفاده شد. داده‌های پروژه شامل مجموعه‌ی Flickr8k بود که شامل تصاویر و توضیحات متنی مرتبط با هر تصویر می‌شد. پیش‌پردازش داده‌ها شامل تمیز کردن متن، ایجاد واژگان، و تبدیل توضیحات به دنباله‌های عددی بود. مدل نهایی با استفاده از تکنیک‌هایی مانند Dropout و Batch Normalization بهینه‌سازی شد و با معیارهای ارزیابی مانند BLEU، METEOR و CIDEr ارزیابی گردید.

3 فروردین 1404

مهارت‌های استفاده شده

پایتون یادگیری ماشین

3 فروردین 1404