Forwarded from کانال آموزشی لاراول (PapiDon)
🧐 یه مدل که هم با چشم میبینه، هم با مغز میفهمه، هم با زبون جواب میده؟!
چطوری؟
با ترکیب یه Vision Encoder، یه Language Encoder، و یه مغزِ Fusion!
ویدیو رو ببین تا بفهمی چطور مدلهای VLM کار میکنند! 💥😱
https://youtube.com/shorts/SoFfv35tvnQ?si=FxqiFijMXxtGUJMc
چطوری؟
با ترکیب یه Vision Encoder، یه Language Encoder، و یه مغزِ Fusion!
ویدیو رو ببین تا بفهمی چطور مدلهای VLM کار میکنند! 💥😱
https://youtube.com/shorts/SoFfv35tvnQ?si=FxqiFijMXxtGUJMc
YouTube
چطور یه مدل هم عکسو میبینه، هم متنشو میفهمه؟!
چطور یه مدل هوش مصنوعی میتونه هم تصویر رو ببینه، هم متنش رو بخونه، و بعد هم ربط بینشون رو بفهمه؟!تا همین چند سال پیش، فقط انسانها بودن که میتونستن یه عکس ...
❤1
PHP & MYSQL pinned «🧐 یه مدل که هم با چشم میبینه، هم با مغز میفهمه، هم با زبون جواب میده؟! چطوری؟ با ترکیب یه Vision Encoder، یه Language Encoder، و یه مغزِ Fusion! ویدیو رو ببین تا بفهمی چطور مدلهای VLM کار میکنند! 💥😱 https://youtube.com/shorts/SoFfv35tvnQ?si=FxqiFijMXxtGUJMc»