آموزش LLM و VLM
1.89K subscribers
23 photos
14 videos
11 files
54 links
آموزش تخصصی LLM و Hugging face

گروه مباحثه:

@llm_group
Download Telegram
رو اعداد مشکل داره، اما متنش قابل قبوله،
قاعدتا رو انگلیسی اصلا قابل قیاس نیست و خیلی بهتره...
👍63
📢 از اونجایی که VRAM نسخه رایگان کولب برای لود مدل Deepseek-OCR کافی نیست و مشکل OOM میخورید، بعضی از همراهان گفتن نوت‌بوک روی Colab اجرا نمی‌شه ...

برای تست راحت مدل من مدلو با 4 بیت لود کردم که برای GPUهای T4 بی دردسر اجرا شه 👇

https://colab.research.google.com/github/Alireza-Akhavan/LLM/blob/main/deepseek_ocr_inference_4bit.ipynb

فقط کافیه عکس خودتونو کنارش بزارید و آدرسشو تو متغیر image_file بنویسید...
👍112
آموزش LLM و VLM
📢 از اونجایی که VRAM نسخه رایگان کولب برای لود مدل Deepseek-OCR کافی نیست و مشکل OOM میخورید، بعضی از همراهان گفتن نوت‌بوک روی Colab اجرا نمی‌شه ... برای تست راحت مدل من مدلو با 4 بیت لود کردم که برای GPUهای T4 بی دردسر اجرا شه 👇 https://colab.rese…
سایز عکس ورودی قابل تنظیمه


    Native resolution:
Tiny: 512×512 (64 vision tokens)
Small: 640×640 (100 vision tokens)
Base: 1024×1024 (256 vision tokens)
Large: 1280×1280 (400 vision tokens)
Dynamic resolution
Gundam: n×640×640 + 1×1024×1024
👍4
Forwarded from Tensorflow(@CVision)
تبدیل PDF از اسلایدها (عکس) به PowerPoint با هوش مصنوعی
یه اسکریپت جالب نوشتم که هنوز کامل نیست ولی خیلی به دردم خورد! 💡
🎯 چیکار میکنه؟
یه فایل PDF از اسلایدها میگیره و با کمک DeepSeek-OCR با حفظ مکان عنوان‌ها، عکس‌ها و بقیه المان‌ها، یه PowerPoint کامل بهتون تحویل میده!
🔗 گیت‌هاب: github.com/Alireza-Akhavan/pdf_to_ppt_with_deepseekocr

📹 یه کیس واقعی ازش استفاده کردم:
کل ویدیوهای کورس Agentic از Andrew Ng رو پردازش کردم:
با ffmpeg فقط فریم‌هایی که تغییر داشتن رو سیو کردم
با OpenCV فریم‌هایی که چهره Andrew بود رو حذف کردم
اسلایدهایی که مرحله به مرحله کامل میشدن رو یکی کردم
همه رو تبدیل به یه PDF کردم
با DeepSeek-OCR تبدیل به Markdown و JSON (موقعیت‌ها) شد
با python-pptx همه چیز رو سر جاش گذاشتم و یه PPT درست کردم

📦 چی تو گیت‌هاب هست؟
فرآیند از PDF به بعد رو آپلود کردم. اگه علاقه دارید کاملش کنید یا ایده بدید، خوشحال میشم! 🙌

من میخواستم کار خودمو راه بندازم و خیلی روش وقت نذاشتم. اما با صرف وقت و سلیقه، قشنگ میشه یه محصول خفن ازش ساخت...

https://github.com/Alireza-Akhavan/pdf_to_ppt_with_deepseekocr
6👍6
پروژه یکی از دوستان عضو کانال:

https://github.com/amirhoseinnaderali-pixel/AutoTune-Research-Assistan


لازم نیست دیگه وقتت رو صرف خواندن راجب مدل بکنی و دیتاست و پیچیدگی‌های کار،Auto tuneهوش مصنوعی که برای فاین‌تیونینگ فکر می‌کنه!

یه دستیار هوشمند مخصوص پژوهشگرها، دولوپرها و علاقه‌مندان هوش مصنوعی‌ه که بهت کمک می‌کنه بهترین مدل‌ها، دیتاست‌ها و استراتژی‌ها رو برای پروژه‌ فاین‌تیونینگت پیدا کنی.
کافیه فقط توضیح بدی چی می‌خوای انجام بدی — AutoTune خودش همه‌چی رو برات پیدا می‌کنه:

🔍 می‌گرده توی HuggingFace، ArXiv و Kaggle
🧠 نیازت رو با تحلیل هوشمند تشخیص می‌ده
📊 یه گزارش پژوهشی کامل با پیشنهاد مدل و دیتاست برات می‌سازه
🎯 و حتی مسیر اجرای پروژه‌ت رو قدم‌به‌قدم مشخص می‌کنه!

با AutoTune، فقط حرف بزن… و بقیه‌ش رو بسپار به هوش مصنوعی 💬🤖
3👍2