امروز 23 آذر 1404

طراحی و پیاده‌سازی سیستم هوشمند بازیابی تصاویر پزشکی (CBIR) با معماری Swin Transformer و یادگیری متریک پیشرفته

alidev

طراحی و پیاده‌سازی سیستم هوشمند بازیابی تصاویر پزشکی (CBIR) با معماری Swin Transformer و یادگیری متریک پیشرفته

alidev

طراحی و پیاده‌سازی سیستم هوشمند بازیابی تصاویر پزشکی (CBIR) با معماری Swin Transformer و یادگیری متریک پیشرفته

این پروژه با هدف ارتقای دقت و کارایی در سیستم‌های کمک‌تشخیصی (CAD)، یک موتور جستجوی محتوایی برای تصاویر X-Ray قفسه سینه را توسعه داده است. با عبور از محدودیت‌های مدل‌های CNN سنتی، در این طرح از معماری مدرن Vision Transformer برای استخراج ویژگی‌های بافت‌محور و تابع هزینه Quadruplet Loss برای بهینه‌سازی فضای برداری استفاده شده است. نتیجه نهایی، دستیابی به دقت SOTA (State-of-the-Art) با مدلی ۵ برابر سبک‌تر از راهکارهای پیشین است
تکنولوژی‌های مورد استفاده:
Framework: PyTorch
Model: Swin Transformer (ViT)
Loss Function: Quadruplet Loss (Metric Learning)
Optimization: Mixed Precision Training (AMP), OneCycleLR
Visualization: t-SNE, EigenCAM (Grad-CAM)

13 آذر 1404

13 آذر 1404