رو اعداد مشکل داره، اما متنش قابل قبوله،
قاعدتا رو انگلیسی اصلا قابل قیاس نیست و خیلی بهتره...
قاعدتا رو انگلیسی اصلا قابل قیاس نیست و خیلی بهتره...
👍6❤3
📢 از اونجایی که VRAM نسخه رایگان کولب برای لود مدل Deepseek-OCR کافی نیست و مشکل OOM میخورید، بعضی از همراهان گفتن نوتبوک روی Colab اجرا نمیشه ...
برای تست راحت مدل من مدلو با 4 بیت لود کردم که برای GPUهای T4 بی دردسر اجرا شه 👇
https://colab.research.google.com/github/Alireza-Akhavan/LLM/blob/main/deepseek_ocr_inference_4bit.ipynb
فقط کافیه عکس خودتونو کنارش بزارید و آدرسشو تو متغیر image_file بنویسید...
برای تست راحت مدل من مدلو با 4 بیت لود کردم که برای GPUهای T4 بی دردسر اجرا شه 👇
https://colab.research.google.com/github/Alireza-Akhavan/LLM/blob/main/deepseek_ocr_inference_4bit.ipynb
فقط کافیه عکس خودتونو کنارش بزارید و آدرسشو تو متغیر image_file بنویسید...
👍11❤2
آموزش LLM و VLM
📢 از اونجایی که VRAM نسخه رایگان کولب برای لود مدل Deepseek-OCR کافی نیست و مشکل OOM میخورید، بعضی از همراهان گفتن نوتبوک روی Colab اجرا نمیشه ... برای تست راحت مدل من مدلو با 4 بیت لود کردم که برای GPUهای T4 بی دردسر اجرا شه 👇 https://colab.rese…
سایز عکس ورودی قابل تنظیمه
Native resolution:
Tiny: 512×512 (64 vision tokens)✅
Small: 640×640 (100 vision tokens)✅
Base: 1024×1024 (256 vision tokens)✅
Large: 1280×1280 (400 vision tokens)✅
Dynamic resolution
Gundam: n×640×640 + 1×1024×1024 ✅
👍4
Forwarded from Tensorflow(@CVision)
تبدیل PDF از اسلایدها (عکس) به PowerPoint با هوش مصنوعی
یه اسکریپت جالب نوشتم که هنوز کامل نیست ولی خیلی به دردم خورد! 💡
🎯 چیکار میکنه؟
یه فایل PDF از اسلایدها میگیره و با کمک DeepSeek-OCR با حفظ مکان عنوانها، عکسها و بقیه المانها، یه PowerPoint کامل بهتون تحویل میده!
🔗 گیتهاب: github.com/Alireza-Akhavan/pdf_to_ppt_with_deepseekocr
📹 یه کیس واقعی ازش استفاده کردم:
کل ویدیوهای کورس Agentic از Andrew Ng رو پردازش کردم:
✅ با ffmpeg فقط فریمهایی که تغییر داشتن رو سیو کردم
✅ با OpenCV فریمهایی که چهره Andrew بود رو حذف کردم
✅ اسلایدهایی که مرحله به مرحله کامل میشدن رو یکی کردم
✅ همه رو تبدیل به یه PDF کردم
✅ با DeepSeek-OCR تبدیل به Markdown و JSON (موقعیتها) شد
✅ با python-pptx همه چیز رو سر جاش گذاشتم و یه PPT درست کردم
📦 چی تو گیتهاب هست؟
فرآیند از PDF به بعد رو آپلود کردم. اگه علاقه دارید کاملش کنید یا ایده بدید، خوشحال میشم! 🙌
من میخواستم کار خودمو راه بندازم و خیلی روش وقت نذاشتم. اما با صرف وقت و سلیقه، قشنگ میشه یه محصول خفن ازش ساخت...
https://github.com/Alireza-Akhavan/pdf_to_ppt_with_deepseekocr
یه اسکریپت جالب نوشتم که هنوز کامل نیست ولی خیلی به دردم خورد! 💡
🎯 چیکار میکنه؟
یه فایل PDF از اسلایدها میگیره و با کمک DeepSeek-OCR با حفظ مکان عنوانها، عکسها و بقیه المانها، یه PowerPoint کامل بهتون تحویل میده!
🔗 گیتهاب: github.com/Alireza-Akhavan/pdf_to_ppt_with_deepseekocr
📹 یه کیس واقعی ازش استفاده کردم:
کل ویدیوهای کورس Agentic از Andrew Ng رو پردازش کردم:
✅ با ffmpeg فقط فریمهایی که تغییر داشتن رو سیو کردم
✅ با OpenCV فریمهایی که چهره Andrew بود رو حذف کردم
✅ اسلایدهایی که مرحله به مرحله کامل میشدن رو یکی کردم
✅ همه رو تبدیل به یه PDF کردم
✅ با DeepSeek-OCR تبدیل به Markdown و JSON (موقعیتها) شد
✅ با python-pptx همه چیز رو سر جاش گذاشتم و یه PPT درست کردم
📦 چی تو گیتهاب هست؟
فرآیند از PDF به بعد رو آپلود کردم. اگه علاقه دارید کاملش کنید یا ایده بدید، خوشحال میشم! 🙌
من میخواستم کار خودمو راه بندازم و خیلی روش وقت نذاشتم. اما با صرف وقت و سلیقه، قشنگ میشه یه محصول خفن ازش ساخت...
https://github.com/Alireza-Akhavan/pdf_to_ppt_with_deepseekocr
❤6👍6
پروژه یکی از دوستان عضو کانال:
https://github.com/amirhoseinnaderali-pixel/AutoTune-Research-Assistan
https://github.com/amirhoseinnaderali-pixel/AutoTune-Research-Assistan
لازم نیست دیگه وقتت رو صرف خواندن راجب مدل بکنی و دیتاست و پیچیدگیهای کار،Auto tuneهوش مصنوعی که برای فاینتیونینگ فکر میکنه!
یه دستیار هوشمند مخصوص پژوهشگرها، دولوپرها و علاقهمندان هوش مصنوعیه که بهت کمک میکنه بهترین مدلها، دیتاستها و استراتژیها رو برای پروژه فاینتیونینگت پیدا کنی.
کافیه فقط توضیح بدی چی میخوای انجام بدی — AutoTune خودش همهچی رو برات پیدا میکنه:
🔍 میگرده توی HuggingFace، ArXiv و Kaggle
🧠 نیازت رو با تحلیل هوشمند تشخیص میده
📊 یه گزارش پژوهشی کامل با پیشنهاد مدل و دیتاست برات میسازه
🎯 و حتی مسیر اجرای پروژهت رو قدمبهقدم مشخص میکنه!
با AutoTune، فقط حرف بزن… و بقیهش رو بسپار به هوش مصنوعی 💬🤖
❤3👍2