آموزش LLM و VLM
1.85K subscribers
20 photos
14 videos
11 files
51 links
آموزش تخصصی LLM و Hugging face

گروه مباحثه:

@llm_group
Download Telegram
امروزه LLMها دیگر فقط متن نمی‌فهمند؛ آن‌ها می‌توانند داده‌های چندرسانه‌ای مثل صدا، تصویر و متن را پردازش کنند و عملکردی فراتر از مدل‌های تخصصی ارائه دهند. ولی هنوز مشکل بزرگشان این است که نمی‌توانند سری‌های زمانی (Time Series) را به‌خوبی تحلیل کنند.

حالا OpenTSLM این محدودیت را رفع می‌کند: این مدل زبان بزرگ، سری‌های زمانی پزشکی چندمتغیره را به‌عنوان ورودی می‌پذیرد و می‌تواند روی آن‌ها استدلال کند، توضیح بدهد و نتایج را به زبان طبیعی ارائه کند، برای مثال در تشخیص فعالیت انسانی، تحلیل خواب، پاسخ به سؤالات ECG و تولید توضیحات سری‌های زمانی.

خلاصه: OpenTSLM، LLM مخصوص سری‌های زمانی پزشکی است که همزمان چند سری را پردازش و نتایج قابل فهم برای انسان تولید می‌کند. قاعدتا توقع میره روی داده های بورس و کریپتو و ... هم بشه فاین تیون کرد

این مدل توسط تیمی بین‌رشته‌ای از دانشگاه استنفورد، ETH زوریخ، گوگل ریسرچ توسعه داده شده است.

https://github.com/StanfordBDHG/OpenTSLM
👍63
برای استفاده از کدهای تحفیف مکتب خونه، این تیکو حتما بردارید
1
آموزش LLM و VLM
به درخواست همراهان کانال، بات کد تخفیف 100 درصد خرید برای مدت محدودی دوباره فعال شده است. لطفاً حتماً: - از همان نام کامل استفاده کنید که در مکتب‌خونه ثبت کرده‌اید و فیش به نام شما صادر شده است. - فیش پرداخت را دقیقاً مثل نمونه‌ی بالا ارسال کنید. …
دوستانی که دوره LLM را قبلا تهیه کردند؛ بات فقط تا دوشنبه پیش رو فعال است. بعد اون مجدد فعال نخواهد شد

* اسم و ایمیل و شماره باید حتما درست و مطابق اطلاعات اکانت و فاکتور باشد

* حتما هر اطلاعاتی (مثلا نام) وارد کردید، صبر کنید بات پاسخ بده بعد مرحله بعد برید، اگر جواب نداد مجدد بفرستید و تا مرحله آخر برید.

@llm_vlm_bot
Forwarded from آموزش LLM و VLM
برای استفاده از کدهای تحفیف مکتب خونه، این تیکو حتما بردارید
نوت بوک جدید Unsloth برای GRPO روی Qwen3vl نسخه 8 میلیارد پارامتری

Qwen3_VL_(8B)-Vision-GRPO.ipynb
👍8
Forwarded from Shenasa-ai.ir
📚 دوستان سلام

سایت کتابفروشی بوکروم کار بچه‌های برنامه‌نویسی گروه شناسا هست 👩🏻‍💻👨🏻‍💻

با کسب اجازه از تیم بوکروم، دیتاست تصاویر جلد کتاب‌های فارسی همراه با عنوان‌ها رو منتشر کردیم که به‌صورت رایگان روی هاگینگ‌فیس در دسترسه:

🔗 Bookroom Persian Book Covers and Titles

#دیتاست #فارسی #ocr #vlm

@shenasa_ai
👍94🔥3
bookroom_persian_book_covers_and_titles_Qwen3_VL_8B_Vision.ipynb
755.2 KB
کد ساده‌ای که finetune کردن مدل Qwen3Vl را روی دیتاست بالا نشون میده
6
دوره MCP هاگینگ فیس منتشر شد

https://huggingface.co/learn/mcp-course/
👍7
تیم DeepSeek دوباره ترکوند! این‌بار با مدل متن‌باز DeepSeek-OCR که نه‌تنها OCR فوق‌دقیقیه، بلکه با فناوری جدیدش به نام Context Optical Compression می‌تونه ورودی‌ها رو تا ۱۰ برابر فشرده‌تر به مدل‌های زبانی بده — بدون افت دقت! 🔥

کاربردها:

استخراج متن از عکس، اسکرین‌شات و PDF

تبدیل PDF به Markdown یا HTML با حفظ جداول و ساختار

خلاصه‌سازی و تحلیل اسناد طولانی

استخراج داده از فاکتورها و فرم‌ها

پرسش‌وپاسخ درباره محتوای تصویر یا سند


🏆 دستاوردهای کلیدی:

فشرده‌سازی هوشمند زمینه (Context Compression)

دقت بالاتر از Donut و TrOCR

پشتیبانی از رزولوشن پویا برای اسناد بزرگ



🔗 deepseek.ai/blog/deepseek-ocr-context-compression


🔗https://huggingface.co/deepseek-ai/DeepSeek-OCR


#AI #OCR #DeepSeek #LLM #OpenSource
10👍3
مدل‌های Vision-Language (VLM) مثل DeepSeek-OCR و Qwen3-VL نشون دادن که مرز بین «دیدن» و «فهمیدن» توسط هوش مصنوعی داره از بین میره.

🔹 این مدل‌ها تصاویر، PDFها، نمودارها و اسناد رو می‌بینن، متن رو استخراج می‌کنن و حتی ساختار پیچیده رو حفظ می‌کنن.

🔹 با تکنیک انقلابی Context Optical Compression، می‌تونن محتوای طولانی رو تا ۱۰ برابر فشرده‌تر برای مدل‌های زبانی ارسال کنن — بدون افت دقت!

🔹 از تبدیل PDF به Markdown گرفته تا پرسش‌وپاسخ دربارهٔ محتوا، خلاصه‌سازی و استخراج داده‌ها، همه در یک مدل واحد ممکن شده.

این یعنی VLMها دارن هوش مصنوعی رو از «فقط خواندن متن» به درک واقعی جهان چندوجهی ارتقا میدن — یک انقلاب واقعی در مسیر AGI!

📚 میخوای خودت استاد VLM بشی و با این تکنولوژی انقلاب‌آفرین کار کنی؟
دوره تخصصی Vision-Language Modelsکلاس ویژن رو ببین و قدم به قدم با پروژه‌ها و مثال‌های عملی یاد بگیر: [لینک دوره]
👌9👍1
DeepSeek-OCR:

https://colab.research.google.com/drive/1Fjzv3UYNoOt28HpM0RMUc8kG34EFgvuu?usp=sharing

با این مدل جدید دیپ سیک که قبلا توضیح دادیم
محتوای screenshots, PDF, form, table و handwritten یا متن نویزی را به markdown تمیز تبدیل کنید.
👍5