طراحی و پیادهسازی سیستم هوشمند بازیابی تصاویر پزشکی (CBIR) با معماری Swin Transformer و یادگیری متریک پیشرفته
طراحی و پیادهسازی سیستم هوشمند بازیابی تصاویر پزشکی (CBIR) با معماری Swin Transformer و یادگیری متریک پیشرفته
alidev
طراحی و پیادهسازی سیستم هوشمند بازیابی تصاویر پزشکی (CBIR) با معماری Swin Transformer و یادگیری متریک پیشرفته
این پروژه با هدف ارتقای دقت و کارایی در سیستمهای کمکتشخیصی (CAD)، یک موتور جستجوی محتوایی برای تصاویر X-Ray قفسه سینه را توسعه داده است. با عبور از محدودیتهای مدلهای CNN سنتی، در این طرح از معماری مدرن Vision Transformer برای استخراج ویژگیهای بافتمحور و تابع هزینه Quadruplet Loss برای بهینهسازی فضای برداری استفاده شده است. نتیجه نهایی، دستیابی به دقت SOTA (State-of-the-Art) با مدلی ۵ برابر سبکتر از راهکارهای پیشین است
تکنولوژیهای مورد استفاده:
Framework: PyTorch
Model: Swin Transformer (ViT)
Loss Function: Quadruplet Loss (Metric Learning)
Optimization: Mixed Precision Training (AMP), OneCycleLR
Visualization: t-SNE, EigenCAM (Grad-CAM)
13 آذر 1404
مهارتهای استفاده شده
13 آذر 1404