🚀 مدل Qwen علیبابا رکوردها را شکست!
✅مدل متنباز Qwen که توسط تیم هوش مصنوعی علیبابا توسعه داده شده، توانسته در جدیدترین نسخه خود تحت عنوان Qwen2 و مدل تخصصی Qwen3-Coder, در بسیاری از بنچمارکهای استدلال، تحلیل زبانی و برنامهنویسی از رقبای مطرح جهانی مثل DeepSeek-V3، Claude Sonnet و حتی GPT-4.1 پیشی بگیرد! 💥
📊 نکات برجسته مدل جدید Qwen:
✅ معماری Mixture-of-Experts (MoE):
مدل از مجموعاً 480 میلیارد پارامتر تشکیل شده، اما تنها 35 میلیارد پارامتر فعال در هر بار پیشبینی استفاده میشود؛ این یعنی قدرت بالا در کنار بهرهوری محاسباتی! ⚙️
✅ توانایی پردازش متن بسیار طولانی:
مدل بهصورت بومی از کانتکست 256K توکن پشتیبانی میکند و تا 1 میلیون توکن نیز مقیاسپذیر است! برای مقالات، کد، یا تحلیلهای مالی بسیار کاربردی است. 📚📈
✅ پرفورمنس بینظیر در برنامهنویسی:
مدل Qwen3-Coder در بسیاری از بنچمارکهای تخصصی برنامهنویسی از مدلهایی مانند CodeGemma، DeepSeekCoder و حتی GPT-4 Code Interpreter عملکرد بهتری داشته است. 👨🏻💻
✅ قابلیت Open Source و قابل استفاده برای همه:
این مدل بهصورت رایگان در HuggingFace قابل دانلود است و از طریق OpenRouter نیز برای استفاده ابری با هزینهای کمتر از GPT و Claude در دسترس است.
📌 کاربردها:
🔹 اتوماسیون سازمانی (Business Automation)
🔹 تحلیل پیشرفته دادههای متنی و جدولی
🔹 برنامهنویسی، دیباگ و تولید کد
🔹 ساخت Agentها و ابزارهای پژوهشی سفارشی
📣 تحلیل:
ورود چین به عرصه رقابت LLMها با چنین قدرت و دقتی، نشاندهندهی آغاز دور جدیدی از رقابت جهانی در حوزه هوش مصنوعی است.
با در دسترس بودن Qwen به صورت open-source، محققان، برنامهنویسان و شرکتها میتوانند از مدلهای پرقدرت بدون نیاز به هزینههای بالا استفاده کنند.
📎 منبع رسمی:
🔗 Reuters - Alibaba claims its new AI model outperforms DeepSeek-V3
#هوش_مصنوعی #LLM #Qwen #علیبابا #مدل_متن_باز #OpenSource #AI_China #GPT4 #DeepSeek #OpenAI
🆔 @rss_ai_ir
✅مدل متنباز Qwen که توسط تیم هوش مصنوعی علیبابا توسعه داده شده، توانسته در جدیدترین نسخه خود تحت عنوان Qwen2 و مدل تخصصی Qwen3-Coder, در بسیاری از بنچمارکهای استدلال، تحلیل زبانی و برنامهنویسی از رقبای مطرح جهانی مثل DeepSeek-V3، Claude Sonnet و حتی GPT-4.1 پیشی بگیرد! 💥
📊 نکات برجسته مدل جدید Qwen:
✅ معماری Mixture-of-Experts (MoE):
مدل از مجموعاً 480 میلیارد پارامتر تشکیل شده، اما تنها 35 میلیارد پارامتر فعال در هر بار پیشبینی استفاده میشود؛ این یعنی قدرت بالا در کنار بهرهوری محاسباتی! ⚙️
✅ توانایی پردازش متن بسیار طولانی:
مدل بهصورت بومی از کانتکست 256K توکن پشتیبانی میکند و تا 1 میلیون توکن نیز مقیاسپذیر است! برای مقالات، کد، یا تحلیلهای مالی بسیار کاربردی است. 📚📈
✅ پرفورمنس بینظیر در برنامهنویسی:
مدل Qwen3-Coder در بسیاری از بنچمارکهای تخصصی برنامهنویسی از مدلهایی مانند CodeGemma، DeepSeekCoder و حتی GPT-4 Code Interpreter عملکرد بهتری داشته است. 👨🏻💻
✅ قابلیت Open Source و قابل استفاده برای همه:
این مدل بهصورت رایگان در HuggingFace قابل دانلود است و از طریق OpenRouter نیز برای استفاده ابری با هزینهای کمتر از GPT و Claude در دسترس است.
📌 کاربردها:
🔹 اتوماسیون سازمانی (Business Automation)
🔹 تحلیل پیشرفته دادههای متنی و جدولی
🔹 برنامهنویسی، دیباگ و تولید کد
🔹 ساخت Agentها و ابزارهای پژوهشی سفارشی
📣 تحلیل:
ورود چین به عرصه رقابت LLMها با چنین قدرت و دقتی، نشاندهندهی آغاز دور جدیدی از رقابت جهانی در حوزه هوش مصنوعی است.
با در دسترس بودن Qwen به صورت open-source، محققان، برنامهنویسان و شرکتها میتوانند از مدلهای پرقدرت بدون نیاز به هزینههای بالا استفاده کنند.
📎 منبع رسمی:
🔗 Reuters - Alibaba claims its new AI model outperforms DeepSeek-V3
#هوش_مصنوعی #LLM #Qwen #علیبابا #مدل_متن_باز #OpenSource #AI_China #GPT4 #DeepSeek #OpenAI
🆔 @rss_ai_ir
❤3👍1🙏1
⚡️ مدل جدید Qwen3-Coder-30B-A3B-Instruct معرفی شد!
نسخهای قدرتمند و بهینهشده از خانواده Qwen3-Coder برای تولید هوشمندانه کد:
🔹 دقت بالا در تولید کد + سرعت رعدآسا
🔹 حافظه کانتکست: 256K (و تا 1M با تکنیک YaRN)
🔹 ترکیب آموزش اولیه و پسآموزش
🔹 ۳۰.۵ میلیارد پارامتر (با ۳.۳ میلیارد پارامتر فعال)
🔹 مدل Mixture of Experts با ۱۲۸ متخصص (فقط ۸ فعال در هر مرحله → کارایی بیشتر)
🔹 بهینهشده برای زبانهای Qwen Code, Cline, Roo Code, Kilo Code و...
🔹 پشتیبانی از فراخوانی توابع (function calling) و اجرای Agentها
🔐 لایسنس: Apache 2.0 (کاملاً متنباز)
---
🎯 نسخهای عالی برای توسعهدهندگان، پروژههای LLM و کاربردهای برنامهنویسی حرفهای.
📥 لینکها:
💬 گفتوگو با مدل: [chat.qwen.ai](https://chat.qwen.ai)
🤗 HuggingFace: (https://hf.co/Qwen/Qwen3-Coder-30B-A3B-Instruct)
🔧 سورس کد: (https://github.com/QwenLM/qwen-code)
🌐 ModelScope: (https://modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct)
📡 @rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #Qwen #opensource #LLM #کدژنراتور #AI
نسخهای قدرتمند و بهینهشده از خانواده Qwen3-Coder برای تولید هوشمندانه کد:
🔹 دقت بالا در تولید کد + سرعت رعدآسا
🔹 حافظه کانتکست: 256K (و تا 1M با تکنیک YaRN)
🔹 ترکیب آموزش اولیه و پسآموزش
🔹 ۳۰.۵ میلیارد پارامتر (با ۳.۳ میلیارد پارامتر فعال)
🔹 مدل Mixture of Experts با ۱۲۸ متخصص (فقط ۸ فعال در هر مرحله → کارایی بیشتر)
🔹 بهینهشده برای زبانهای Qwen Code, Cline, Roo Code, Kilo Code و...
🔹 پشتیبانی از فراخوانی توابع (function calling) و اجرای Agentها
🔐 لایسنس: Apache 2.0 (کاملاً متنباز)
---
🎯 نسخهای عالی برای توسعهدهندگان، پروژههای LLM و کاربردهای برنامهنویسی حرفهای.
📥 لینکها:
💬 گفتوگو با مدل: [chat.qwen.ai](https://chat.qwen.ai)
🤗 HuggingFace: (https://hf.co/Qwen/Qwen3-Coder-30B-A3B-Instruct)
🔧 سورس کد: (https://github.com/QwenLM/qwen-code)
🌐 ModelScope: (https://modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct)
📡 @rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #Qwen #opensource #LLM #کدژنراتور #AI
🔥4👍1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 دستیار هوشمند دسکتاپ با قدرت AI: Neural Agent
یک پروژه متنباز فوقالعاده که کنترل کامل سیستم شما را به یک عامل هوشمند میسپارد!
✨ امکانات برجسته:
🔹 جستجوی فایلها، وبگردی، پر کردن فرمها، ارسال ایمیل و دهها وظیفهی دیگر
🔹 پشتیبانی از مدلهای قدرتمند مانند Claude، GPT-4، Azure OpenAI و Bedrock
🔹 رابط کاربری مینیمال و یک نوار فرمان ساده برای اجرای سریع دستورات
🔹 نصب آسان با API کاربردی و راهنمای گامبهگام
📦 در حین کدنویسی، طراحی یا تفکر، کارهای روتین را به عامل هوشمند بسپارید.
📥 دریافت از گیتهاب:
👉 [github.com/withneural/neuralagent](github)
📡 @rss_ai_ir
\#هوش_مصنوعی #عامل_هوشمند #NeuralAgent #کامپیوتر #دستیار_دیجیتال #opensource
یک پروژه متنباز فوقالعاده که کنترل کامل سیستم شما را به یک عامل هوشمند میسپارد!
✨ امکانات برجسته:
🔹 جستجوی فایلها، وبگردی، پر کردن فرمها، ارسال ایمیل و دهها وظیفهی دیگر
🔹 پشتیبانی از مدلهای قدرتمند مانند Claude، GPT-4، Azure OpenAI و Bedrock
🔹 رابط کاربری مینیمال و یک نوار فرمان ساده برای اجرای سریع دستورات
🔹 نصب آسان با API کاربردی و راهنمای گامبهگام
📦 در حین کدنویسی، طراحی یا تفکر، کارهای روتین را به عامل هوشمند بسپارید.
📥 دریافت از گیتهاب:
👉 [github.com/withneural/neuralagent](github)
📡 @rss_ai_ir
\#هوش_مصنوعی #عامل_هوشمند #NeuralAgent #کامپیوتر #دستیار_دیجیتال #opensource
👍2🔥2🙏1
🔍 ۵۰۰ پروژه عاملمحور هوش مصنوعی در GitHub!
اگه دنبال پروژههای واقعی، عملیاتی و آیندهمحور در زمینه Agent AI هستی، این گنج رو از دست نده 👇
📦 GitHub:
https://github.com/ashishpatel26/500-AI-Agents-Projects
📌 چی داخلشه؟
✅ بیش از ۵۰۰ پروژه متنباز هوش مصنوعی در صنایع مختلف (پزشکی، مالی، آموزش، فروش و...)
✅ بر پایهی فریمورکهایی مثل CrewAI، AutoGen، LangGraph و Agno
✅ طبقهبندیشده، با لینک مستقیم به کد، توضیحات کامل و بهروز
✅ مناسب برای توسعهدهندگان، پژوهشگران، مدرسان و حتی سرمایهگذاران AI
📊 فقط یه لیست نیست — یه نقشه راه برای آیندهی عاملهای هوشمند!
🧠 اگه میخوای بفهمی هوش مصنوعی در سال ۲۰۲۵ چجوری در صنعت استفاده میشه، این پروژهها نقطه شروع فوقالعادهای هستن.
📡 @rss_ai_ir
#هوش_مصنوعی #AI_agents #GitHub #هوش_عاملمحور #پروژه_AI #OpenSource #AI2025
اگه دنبال پروژههای واقعی، عملیاتی و آیندهمحور در زمینه Agent AI هستی، این گنج رو از دست نده 👇
📦 GitHub:
https://github.com/ashishpatel26/500-AI-Agents-Projects
📌 چی داخلشه؟
✅ بیش از ۵۰۰ پروژه متنباز هوش مصنوعی در صنایع مختلف (پزشکی، مالی، آموزش، فروش و...)
✅ بر پایهی فریمورکهایی مثل CrewAI، AutoGen، LangGraph و Agno
✅ طبقهبندیشده، با لینک مستقیم به کد، توضیحات کامل و بهروز
✅ مناسب برای توسعهدهندگان، پژوهشگران، مدرسان و حتی سرمایهگذاران AI
📊 فقط یه لیست نیست — یه نقشه راه برای آیندهی عاملهای هوشمند!
🧠 اگه میخوای بفهمی هوش مصنوعی در سال ۲۰۲۵ چجوری در صنعت استفاده میشه، این پروژهها نقطه شروع فوقالعادهای هستن.
📡 @rss_ai_ir
#هوش_مصنوعی #AI_agents #GitHub #هوش_عاملمحور #پروژه_AI #OpenSource #AI2025
❤21🎉21👍17🔥15😁12🥰10👏9
🚀 عرضه عمومی مدلهای فشرده Hunyuan از سوی Tencent!
@rss_ai_ir
📣 شرکت Tencent چهار مدل سبکوزن از خانواده Hunyuan LLM را بهصورت متنباز منتشر کرد:
🔹 Hunyuan-0.5B
🔹 Hunyuan-1.8B
🔹 Hunyuan-4B
🔹 Hunyuan-7B
📱 این مدلها برای اجرا روی دستگاههای کممصرف طراحی شدهاند:
🖥 کامپیوترهای شخصی | 📱 تلفنهای هوشمند | 🚗 خودروها | 🏠 خانههای هوشمند | 🎮 کارتهای GPU مصرفی
---
💡 ویژگیهای برجسته: ✅ پشتیبانی از حالتهای fast/slow thinking (پاسخهای سریع یا تحلیلی)
✅ کانتکست طولانی تا ۲۵۶ هزار توکن!
✅ تواناییهای عاملمحور پیشرفته (مانند reasoning، برنامهریزی، tool use)
✅ عملکرد قوی در تستهای زبان، منطق و ریاضی
✅ پشتیبانی از زیرساختهای حرفهای مانند SGLang، vLLM و TensorRT-LLM
---
📦 لینکها برای دانلود و تست مدلها:
🧠 GitHub:
Hunyuan-0.5B
Hunyuan-1.8B
Hunyuan-4B
Hunyuan-7B
🤗 Hugging Face:
Hunyuan-0.5B-Instruct
Hunyuan-1.8B-Instruct
Hunyuan-4B-Instruct
Hunyuan-7B-Instruct
📎 اطلاعات بیشتر:
🔗 https://hunyuan.tencent.com/modelSquare/home/list
---
#Tencent #Hunyuan #هوش_مصنوعی #مدل_زبان #opensource #LLM #AI
@rss_ai_ir
📣 شرکت Tencent چهار مدل سبکوزن از خانواده Hunyuan LLM را بهصورت متنباز منتشر کرد:
🔹 Hunyuan-0.5B
🔹 Hunyuan-1.8B
🔹 Hunyuan-4B
🔹 Hunyuan-7B
📱 این مدلها برای اجرا روی دستگاههای کممصرف طراحی شدهاند:
🖥 کامپیوترهای شخصی | 📱 تلفنهای هوشمند | 🚗 خودروها | 🏠 خانههای هوشمند | 🎮 کارتهای GPU مصرفی
---
💡 ویژگیهای برجسته: ✅ پشتیبانی از حالتهای fast/slow thinking (پاسخهای سریع یا تحلیلی)
✅ کانتکست طولانی تا ۲۵۶ هزار توکن!
✅ تواناییهای عاملمحور پیشرفته (مانند reasoning، برنامهریزی، tool use)
✅ عملکرد قوی در تستهای زبان، منطق و ریاضی
✅ پشتیبانی از زیرساختهای حرفهای مانند SGLang، vLLM و TensorRT-LLM
---
📦 لینکها برای دانلود و تست مدلها:
🧠 GitHub:
Hunyuan-0.5B
Hunyuan-1.8B
Hunyuan-4B
Hunyuan-7B
🤗 Hugging Face:
Hunyuan-0.5B-Instruct
Hunyuan-1.8B-Instruct
Hunyuan-4B-Instruct
Hunyuan-7B-Instruct
📎 اطلاعات بیشتر:
🔗 https://hunyuan.tencent.com/modelSquare/home/list
---
#Tencent #Hunyuan #هوش_مصنوعی #مدل_زبان #opensource #LLM #AI
🔥20❤17👍15👏14🥰13😁13🎉13
🔒 شتاب چشمگیر در متنباز شدن مدلهای هوش مصنوعی
در ادامه موج متنبازسازی مدلهای بزرگ، ایلان ماسک تأیید کرد که نسخهی Grok 2 هفته آینده بهصورت رسمی متنباز (Open-Source) خواهد شد.
🧠 البته این تصمیم کمی دیر گرفته شده، چرا که در حال حاضر Grok 4 نیز معرفی شده است. اما انتظار میرود تا پایان سال، نسخهی Grok 3 نیز از سوی xAI بهصورت متنباز منتشر شود.
📌 این اقدام میتواند نقشی کلیدی در رقابت با مدلهایی مثل GPT-OSS، LLaMA، و Claude در حوزه ابزارهای مستقل و قابل اجرا روی سختافزارهای محلی (on-device) ایفا کند.
#Grok #xAI #OpenSource #هوش_مصنوعی #AI
@rss_ai_ir 🔧
در ادامه موج متنبازسازی مدلهای بزرگ، ایلان ماسک تأیید کرد که نسخهی Grok 2 هفته آینده بهصورت رسمی متنباز (Open-Source) خواهد شد.
🧠 البته این تصمیم کمی دیر گرفته شده، چرا که در حال حاضر Grok 4 نیز معرفی شده است. اما انتظار میرود تا پایان سال، نسخهی Grok 3 نیز از سوی xAI بهصورت متنباز منتشر شود.
📌 این اقدام میتواند نقشی کلیدی در رقابت با مدلهایی مثل GPT-OSS، LLaMA، و Claude در حوزه ابزارهای مستقل و قابل اجرا روی سختافزارهای محلی (on-device) ایفا کند.
#Grok #xAI #OpenSource #هوش_مصنوعی #AI
@rss_ai_ir 🔧
😁22🔥19🥰18👍14🎉12❤11👏10🙏1
🤖 ایجنت جدید گوگل با نام MLE-STAR، دنیای مهندسی مدلهای یادگیری ماشین را متحول کرده است
@rss_ai_ir
⛓️ بدون نیاز به حتی یک خط کدنویسی دستی، این سیستم میتواند بهصورت خودکار مدل بسازد، آموزش دهد، تست کند و بهینهسازی انجام دهد. عملکرد آن در رقابتهای واقعی پلتفرم Kaggle بیسابقه بوده است.
📈 ترکیب MLE-STAR با Gemini-2.5-Pro توانسته در ۶۳٪ رقابتها مدال بگیرد و در بیش از ۸۰٪ موارد، عملکردی بالاتر از میانه رقبا داشته باشد. این نتایج نسبت به روشهایی مانند GPT-4o یا نسخههای دیگر بهمراتب بهتر بودهاند.
🔍 مدلهای جدید مانند EfficientNet یا ViT بهصورت خودکار از طریق جستوجوی وب انتخاب میشوند؛ دیگر خبری از استفاده از مدلهای قدیمی و ایستا نیست.
🛡 سه ماژول ایمنی درونساخت برای جلوگیری از اشتباهات رایج مانند نشت داده، خطاهای کدنویسی یا توهمات مدل تعبیه شدهاند تا نتیجهای پایدار، دقیق و ایمن حاصل شود.
🧠 تمرکز این ایجنت بهجای آزمونوخطای کور، روی انتخابهای هوشمند، ترکیب مدلها و اصلاح دقیق کدهاست. این یعنی هوش مصنوعی در حال نوشتن هوش مصنوعی است.
🛠 دسترسی کامل به کد این سیستم از طریق ابزار ADK برای توسعهدهندگان فراهم شده و بهصورت متنباز قابل استفاده است.
#هوش_مصنوعی #گوگل #MLESTAR #AutoML #AIagents #یادگیری_ماشین #خودکارسازی #AI4Industry #Kaggle #MachineLearning #OpenSource #مهندسی_هوش_مصنوعی #گوگل_جمینی
@rss_ai_ir
@rss_ai_ir
⛓️ بدون نیاز به حتی یک خط کدنویسی دستی، این سیستم میتواند بهصورت خودکار مدل بسازد، آموزش دهد، تست کند و بهینهسازی انجام دهد. عملکرد آن در رقابتهای واقعی پلتفرم Kaggle بیسابقه بوده است.
📈 ترکیب MLE-STAR با Gemini-2.5-Pro توانسته در ۶۳٪ رقابتها مدال بگیرد و در بیش از ۸۰٪ موارد، عملکردی بالاتر از میانه رقبا داشته باشد. این نتایج نسبت به روشهایی مانند GPT-4o یا نسخههای دیگر بهمراتب بهتر بودهاند.
🔍 مدلهای جدید مانند EfficientNet یا ViT بهصورت خودکار از طریق جستوجوی وب انتخاب میشوند؛ دیگر خبری از استفاده از مدلهای قدیمی و ایستا نیست.
🛡 سه ماژول ایمنی درونساخت برای جلوگیری از اشتباهات رایج مانند نشت داده، خطاهای کدنویسی یا توهمات مدل تعبیه شدهاند تا نتیجهای پایدار، دقیق و ایمن حاصل شود.
🧠 تمرکز این ایجنت بهجای آزمونوخطای کور، روی انتخابهای هوشمند، ترکیب مدلها و اصلاح دقیق کدهاست. این یعنی هوش مصنوعی در حال نوشتن هوش مصنوعی است.
🛠 دسترسی کامل به کد این سیستم از طریق ابزار ADK برای توسعهدهندگان فراهم شده و بهصورت متنباز قابل استفاده است.
#هوش_مصنوعی #گوگل #MLESTAR #AutoML #AIagents #یادگیری_ماشین #خودکارسازی #AI4Industry #Kaggle #MachineLearning #OpenSource #مهندسی_هوش_مصنوعی #گوگل_جمینی
@rss_ai_ir
🎉21❤17👍17🥰16👏12😁12🔥11🙏1
🖼️ دیتاست GPT-Image-Edit-1.5M بهعنوان بزرگترین مجموعهی متنمحور برای ویرایش تصویر
این مجموعه شامل ۱.۵ میلیون نمونه است که هر نمونه از دستور متنی، تصویر اصلی و تصویر ویرایششده تشکیل شده و برای بهبود کیفیت ویرایش تصویر بر اساس متن طراحی شده است.
🔍 روش تولید:
سه دیتاست شناختهشده OmniEdit، HQ-Edit و UltraEdit با بهرهگیری از GPT-Image API بازطراحی و ارتقا یافتهاند.
📊 نتایج مدل FluxKontext آموزشدیده روی این مجموعه:
امتیاز ۷.۲۴ در GEdit-EN
امتیاز ۳.۸۰ در ImgEdit-Full
امتیاز ۸.۷۸ در Complex-Edit
این نتایج همسطح با مدلهای انحصاری پیشرفته است.
💡 ویژگیهای کلیدی:
♻️دقت بالا در اجرای دستورهای متنی
♻️تولید تصاویر با واقعگرایی بالا
♻️کاهش فاصله بین سیستمهای متنباز
♻️مدلهای بسته در ویرایش تصویر
🔗 لینکهای مرتبط:
🌐 پروژه: ucsc-vlaa.github.io/GPT-Image-Edit
💻 کد: github.com/wyhlovecpp/GPT-Image-Edit
📦 دیتاست: huggingface.co/datasets/UCSC-VLAA/GPT-Image-Edit-1.5M
🤖 مدل: huggingface.co/UCSC-VLAA/gpt-image-edit-training
📄 مقاله: arxiv.org/abs/2507.21033
#هوش_مصنوعی #پردازش_تصویر #چندوجهی #OpenSource #GPT4V
این مجموعه شامل ۱.۵ میلیون نمونه است که هر نمونه از دستور متنی، تصویر اصلی و تصویر ویرایششده تشکیل شده و برای بهبود کیفیت ویرایش تصویر بر اساس متن طراحی شده است.
🔍 روش تولید:
سه دیتاست شناختهشده OmniEdit، HQ-Edit و UltraEdit با بهرهگیری از GPT-Image API بازطراحی و ارتقا یافتهاند.
📊 نتایج مدل FluxKontext آموزشدیده روی این مجموعه:
امتیاز ۷.۲۴ در GEdit-EN
امتیاز ۳.۸۰ در ImgEdit-Full
امتیاز ۸.۷۸ در Complex-Edit
این نتایج همسطح با مدلهای انحصاری پیشرفته است.
💡 ویژگیهای کلیدی:
♻️دقت بالا در اجرای دستورهای متنی
♻️تولید تصاویر با واقعگرایی بالا
♻️کاهش فاصله بین سیستمهای متنباز
♻️مدلهای بسته در ویرایش تصویر
🔗 لینکهای مرتبط:
🌐 پروژه: ucsc-vlaa.github.io/GPT-Image-Edit
💻 کد: github.com/wyhlovecpp/GPT-Image-Edit
📦 دیتاست: huggingface.co/datasets/UCSC-VLAA/GPT-Image-Edit-1.5M
🤖 مدل: huggingface.co/UCSC-VLAA/gpt-image-edit-training
📄 مقاله: arxiv.org/abs/2507.21033
#هوش_مصنوعی #پردازش_تصویر #چندوجهی #OpenSource #GPT4V
🔥27😁19👍17👏16🎉16❤14🥰14