"چطور Vision Transformers (ViTs) تصاویر را درک میکنند؟" مقالهی ما در #NeurIPS2024 یک چارچوب برای تجزیه و تحلیل و تفسیر نمایشهای آنها معرفی میکند، حتی برای ViTs فراتر از CLIP.
این روش نشان میدهد که چگونه ViTs ویژگیهایی مانند shape، color و texture را کدگذاری میکنند و برای feature-based image retrieval، token heatmaps و کاهش spurious correlations مفید است.
Paper :https://arxiv.org/abs/2406.01583
code:https://github.com/SriramB-98/vit-decompose
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این روش نشان میدهد که چگونه ViTs ویژگیهایی مانند shape، color و texture را کدگذاری میکنند و برای feature-based image retrieval، token heatmaps و کاهش spurious correlations مفید است.
Paper :https://arxiv.org/abs/2406.01583
code:https://github.com/SriramB-98/vit-decompose
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
This media is not supported in your browser
VIEW IN TELEGRAM
📚 کنفرانس #NeurIPS2024 یکی از معتبرترین رویدادهای هوش مصنوعی و یادگیری ماشین در جهان برگزار شده است!
🔍 امسال، بیش از ۴,۵۰۰ مقاله پژوهشی ارزشمند ارائه شده که شما میتوانید آنها را بهصورت تعاملی در یک بصریسازی جذاب بررسی کنید.
✨ اگر به حوزههای مختلف هوش مصنوعی علاقه دارید، این ابزار میتواند بهترین راه برای یافتن موضوعات مورد علاقهتان باشد، مثل:
شبکههای عصبی عمیق 🧠
مدلهای زبانی بزرگ (LLMs) ✍️
بینایی کامپیوتر 👁
بهینهسازی و الگوریتمها 📈
https://jalammar.github.io/assets/neurips_2024.html
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔍 امسال، بیش از ۴,۵۰۰ مقاله پژوهشی ارزشمند ارائه شده که شما میتوانید آنها را بهصورت تعاملی در یک بصریسازی جذاب بررسی کنید.
✨ اگر به حوزههای مختلف هوش مصنوعی علاقه دارید، این ابزار میتواند بهترین راه برای یافتن موضوعات مورد علاقهتان باشد، مثل:
شبکههای عصبی عمیق 🧠
مدلهای زبانی بزرگ (LLMs) ✍️
بینایی کامپیوتر 👁
بهینهسازی و الگوریتمها 📈
https://jalammar.github.io/assets/neurips_2024.html
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer