Image Captioning Using CNN and LSTM

Image Captioning Using CNN and LSTM
در این پروژه، یک مدل تولید توضیحات تصاویر (Image Captioning) با ترکیب شبکههای عصبی کانولوشن (CNN) و LSTM توسعه دادم. از مدل پیشآموختهی InceptionV3 برای استخراج ویژگیهای تصاویر و از یک شبکهی LSTM برای تولید توضیحات متنی استفاده شد. دادههای پروژه شامل مجموعهی Flickr8k بود که شامل تصاویر و توضیحات متنی مرتبط با هر تصویر میشد. پیشپردازش دادهها شامل تمیز کردن متن، ایجاد واژگان، و تبدیل توضیحات به دنبالههای عددی بود. مدل نهایی با استفاده از تکنیکهایی مانند Dropout و Batch Normalization بهینهسازی شد و با معیارهای ارزیابی مانند BLEU، METEOR و CIDEr ارزیابی گردید.
3 فروردین 1404
مهارتهای استفاده شده
3 فروردین 1404
پروژهها
