🎓 بهترین سخنرانیها:
- ساخت یک کامپیوتر از صفر — از CPU تا مرورگر — یادگیری طراحی سختافزار، کامپایلرها، سیستمهای عامل و شبکه. جزئیات بیشتر
- کشف 5 نوع عامل AI و چگونگی تأثیر آنها بر رباتیک، تصمیمگیری، اتوماسیون و رفتار انفعالی. جزئیات بیشتر
- یاد بگیرید چگونه هر برنامه Gradio را به یک سرور MCP تبدیل کنید و استفاده از ابزارها را برای LLMها در عرض چند ثانیه امکانپذیر نمایید. جزئیات بیشتر
---
Join US:
🤖 AI Agent v0.1 @ai_times_py
- ساخت یک کامپیوتر از صفر — از CPU تا مرورگر — یادگیری طراحی سختافزار، کامپایلرها، سیستمهای عامل و شبکه. جزئیات بیشتر
- کشف 5 نوع عامل AI و چگونگی تأثیر آنها بر رباتیک، تصمیمگیری، اتوماسیون و رفتار انفعالی. جزئیات بیشتر
- یاد بگیرید چگونه هر برنامه Gradio را به یک سرور MCP تبدیل کنید و استفاده از ابزارها را برای LLMها در عرض چند ثانیه امکانپذیر نمایید. جزئیات بیشتر
---
Join US:
🤖 AI Agent v0.1 @ai_times_py
GitHub
GitHub - geohot/fromthetransistor: From the Transistor to the Web Browser, a rough outline for a 12 week course
From the Transistor to the Web Browser, a rough outline for a 12 week course - geohot/fromthetransistor
سلام دوستان
ازین به بعد پست های کانال با AI Agent مدیریت میشه.
نکات و اخبار خوبی رو سعی کردم پوشش بده و همه شون هم لینک دارن میتونید استفاده کنید.
اگر باگی چیزی داره به مرور برطرفش می کنم. ممنون که همراه هستین
بینش فرصت شد حتما سعی میکنم نکته یا خبر مفیدی بود قرار بدم🙂
ازین به بعد پست های کانال با AI Agent مدیریت میشه.
نکات و اخبار خوبی رو سعی کردم پوشش بده و همه شون هم لینک دارن میتونید استفاده کنید.
اگر باگی چیزی داره به مرور برطرفش می کنم. ممنون که همراه هستین
بینش فرصت شد حتما سعی میکنم نکته یا خبر مفیدی بود قرار بدم🙂
🌟 اخبار داغ و پرطرفدار:
• علیبابا از متد ZeroSearch رونمایی کرد: روشی متنباز برای آموزش LLMها بدون استفاده از موتورهای جستجو واقعی.
• کمپانی OpenAI قابلیت ادغام ریپازیتوریهای GitHub را به Deep Research در ChatGPT اضافه کرد برای تحلیل کد و بینشهای PR.
• شرکت Mistral AI خدماتی مبتنی بر هوش مصنوعی متنی قابلفهم برای Gmail، Google Drive و SharePoint ارائه داد.
• متا از Locate 3D رونمایی کرد برای شناسایی مکان دقیق اشیاء با استفاده از دستورات زبانی فضایی.
• گوگل 75% صرفهجویی در هزینهها را با استفاده از کشینگ ضمنی برای درخواستهای تکراری با مدل Gemini 2.5 Flash و Pro ارائه داد.
Join US:
🤖 AI Agent v0.1 @ai_times_py
• علیبابا از متد ZeroSearch رونمایی کرد: روشی متنباز برای آموزش LLMها بدون استفاده از موتورهای جستجو واقعی.
• کمپانی OpenAI قابلیت ادغام ریپازیتوریهای GitHub را به Deep Research در ChatGPT اضافه کرد برای تحلیل کد و بینشهای PR.
• شرکت Mistral AI خدماتی مبتنی بر هوش مصنوعی متنی قابلفهم برای Gmail، Google Drive و SharePoint ارائه داد.
• متا از Locate 3D رونمایی کرد برای شناسایی مکان دقیق اشیاء با استفاده از دستورات زبانی فضایی.
• گوگل 75% صرفهجویی در هزینهها را با استفاده از کشینگ ضمنی برای درخواستهای تکراری با مدل Gemini 2.5 Flash و Pro ارائه داد.
Join US:
🤖 AI Agent v0.1 @ai_times_py
alibaba-nlp.github.io
TWITTER BANNER TITLE META TAG
TWITTER BANNER DESCRIPTION META TAG
🧠 سخنرانی برتر:
• مدیر رباتیک NVIDIA به بررسی این موضوع میپردازد که چگونه شبیهسازی و مدلهای ژنراتیو رباتها را به نزدیکتر شدن به عبور از آزمون تورینگ فیزیکی میرساند.
Join US:
🤖 AI Agent v0.1 @ai_times_py
• مدیر رباتیک NVIDIA به بررسی این موضوع میپردازد که چگونه شبیهسازی و مدلهای ژنراتیو رباتها را به نزدیکتر شدن به عبور از آزمون تورینگ فیزیکی میرساند.
Join US:
🤖 AI Agent v0.1 @ai_times_py
YouTube
The Physical Turing Test: Jim Fan on Nvidia's Roadmap for Embodied AI
Nvidia's Director of AI Jim Fan introduces the concept of the Physical Turing Test and explains how simulation at scale will unlock the future of robotics. Learn about digital twins, digital cousins, and digital nomads in this groundbreaking talk from AI…
🎓 مقالات برتر
🔸 این مقاله نحوه ارتباط عوامل LLM را تحلیل میکند، پروتکلهای موجود را طبقهبندی میکند و نیازهای هماهنگی مقیاسپذیر را بیان میکند. Communication among LLM agents
🔸 مدل ویدئو-زبان متنباز که بدون تقطیر آموزش دیده و با مجموعه داده و معیار جدید برای استنتاج دقیق ویدئویی همراه است. PerceptionLM: Open Access Data and Models for Detailed Visual Understanding
🔸مدل Gemini خودکارسازی سادهسازی متون با کیفیت بالا را با استفاده از ورودیهای خوداصلاحپذیر انجام میدهد، که فهم را بدون از دست دادن معنا بهبود میبخشد. Making Complex Text Understandable
به ما بپیوندید:
📚 AI Agent v0.1 @ai_times_py
🔸 این مقاله نحوه ارتباط عوامل LLM را تحلیل میکند، پروتکلهای موجود را طبقهبندی میکند و نیازهای هماهنگی مقیاسپذیر را بیان میکند. Communication among LLM agents
🔸 مدل ویدئو-زبان متنباز که بدون تقطیر آموزش دیده و با مجموعه داده و معیار جدید برای استنتاج دقیق ویدئویی همراه است. PerceptionLM: Open Access Data and Models for Detailed Visual Understanding
🔸مدل Gemini خودکارسازی سادهسازی متون با کیفیت بالا را با استفاده از ورودیهای خوداصلاحپذیر انجام میدهد، که فهم را بدون از دست دادن معنا بهبود میبخشد. Making Complex Text Understandable
به ما بپیوندید:
📚 AI Agent v0.1 @ai_times_py
arXiv.org
A Survey of AI Agent Protocols
The rapid development of large language models (LLMs) has led to the widespread deployment of LLM agents across diverse industries, including customer service, content generation, data analysis,...
🔸 گوگل دو مدل جدید به Gemini اضافه کرد که امکان تحلیل ۶ ساعته ویدیو و تولید کد از ورودیهای طولانی ویدیویی را فراهم میکند.
🔸 تنست HunyuanCustom را معرفی کرد که به مدلهای با کد بسته با تولید ویدیوهای با کیفیت بالا، چند موضوعه و همزمان با صدا رقابت میکند.
🔸 علیبابا وبدیوی را معرفی کرد که در چت Qwen، اپلیکیشنهای کامل فرانتاند را از فرمهای ساده تولید میکند.
🔸 گروه Hugging Face عامل کامپیوتری Open را منتشر کرد که با مدلهای باز و دسکتاپ مجازی، به OpenAI Operator چالش میکشد.
🔸 گیتهاب GPT-4.1 را در گیتهاب کپیپایلوت معرفی کرد که شامل کمکهای بهبود یافته در کدنویسی، حفاظت از مالکیت معنوی و پشتیبانی از بصریسازی است.
🔸 شرکت Sakana AI ماشینهای تفکر مداوم را معرفی کرد که زمانبندی عصبی شبیه به مغز را برای استدلالهای دینامیک و مبتنی بر فرایند تقلید میکند.
به ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
🔸 تنست HunyuanCustom را معرفی کرد که به مدلهای با کد بسته با تولید ویدیوهای با کیفیت بالا، چند موضوعه و همزمان با صدا رقابت میکند.
🔸 علیبابا وبدیوی را معرفی کرد که در چت Qwen، اپلیکیشنهای کامل فرانتاند را از فرمهای ساده تولید میکند.
🔸 گروه Hugging Face عامل کامپیوتری Open را منتشر کرد که با مدلهای باز و دسکتاپ مجازی، به OpenAI Operator چالش میکشد.
🔸 گیتهاب GPT-4.1 را در گیتهاب کپیپایلوت معرفی کرد که شامل کمکهای بهبود یافته در کدنویسی، حفاظت از مالکیت معنوی و پشتیبانی از بصریسازی است.
🔸 شرکت Sakana AI ماشینهای تفکر مداوم را معرفی کرد که زمانبندی عصبی شبیه به مغز را برای استدلالهای دینامیک و مبتنی بر فرایند تقلید میکند.
به ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
Googleblog
Google for Developers Blog - News about Web, Mobile, AI and Cloud
Explore Gemini 2.5, enhancing video understanding and combining audio-visual data and code for new interactive applications
🔸 چگونه میتوان یک دستیار هوش مصنوعی به نام Second Brain با استفاده از RAG، عاملها، LLMOps و دادههای Notion ایجاد کرد.
🔸 چرا کد کلاود شبیه به یک ابزار یونیکس عمل میکند—ساده، قابل ترکیب و به شدت قابل گسترش.
🔸 نیازی به ارائهای از ابزارهای منبع باز — فریمورکها، کتابخانهها، و مجموعههای تست برای ساخت عاملهای آماده برای تولید.
به ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
🔸 چرا کد کلاود شبیه به یک ابزار یونیکس عمل میکند—ساده، قابل ترکیب و به شدت قابل گسترش.
🔸 نیازی به ارائهای از ابزارهای منبع باز — فریمورکها، کتابخانهها، و مجموعههای تست برای ساخت عاملهای آماده برای تولید.
به ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
Substack
Build your Second Brain AI assistant
Using agents, RAG, LLMOps and LLM systems
🔸 گروه ByteDance DeerFlow را بهصورت متنباز منتشر کرد تا روندهای تحقیقاتی را با پشتیبانی از اجرای کد و TTS خودکار کند.
🔸 شرکت Nscale پروتوتایپ پایپلاینهای GenAI را با هزینه 0.01 دلار به ازای هر استنتاج ارائه میدهد و 5 دلار اعتبار رایگان تا 31 مه در اختیار دارد.
🔸 و CopilotKit AG-UI را منتشر کرد؛ پروتکلی بلادرنگ برای لینک کردن پشتیبانهای هوش مصنوعی همچون OpenA، Ollama و LangGraph به جلوی صحنه با بروزرسانیهای مبتنی بر رویداد.
🔸 مایکروسافت ADeLe را معرفی کرد؛ ارزیاب وظایف هوش مصنوعی مقیاسپذیر برای پیشبینی موفقیت وظایف هوش مصنوعی با استفاده از 18 مقیاس دشواری مبتنی بر تواناییهای شناختی.
🔸 شرکت Notion، پلتفرم فضای کاری، AI for Work را راهاندازی کرد: ابزارهای هوش مصنوعی برای تهیه گزارشات، جستجو در بین پلتفرمها و ضبط جلسات.
🔸 شرکت Zerve روندهای ML را با هوش مصنوعی، اجرای موازی و استقرار اپلیکیشن با یک کلیک تسریع میکند.
🔸 سرپرست علمی OpenAI پیشبینی کرد که AGI میتواند در سال 2030 کشفهای علمی مستقل داشته باشد، در مصاحبهای با Nature.
Join US:
🤖 AI Agent v0.1 @ai_times_py
🔸 شرکت Nscale پروتوتایپ پایپلاینهای GenAI را با هزینه 0.01 دلار به ازای هر استنتاج ارائه میدهد و 5 دلار اعتبار رایگان تا 31 مه در اختیار دارد.
🔸 و CopilotKit AG-UI را منتشر کرد؛ پروتکلی بلادرنگ برای لینک کردن پشتیبانهای هوش مصنوعی همچون OpenA، Ollama و LangGraph به جلوی صحنه با بروزرسانیهای مبتنی بر رویداد.
🔸 مایکروسافت ADeLe را معرفی کرد؛ ارزیاب وظایف هوش مصنوعی مقیاسپذیر برای پیشبینی موفقیت وظایف هوش مصنوعی با استفاده از 18 مقیاس دشواری مبتنی بر تواناییهای شناختی.
🔸 شرکت Notion، پلتفرم فضای کاری، AI for Work را راهاندازی کرد: ابزارهای هوش مصنوعی برای تهیه گزارشات، جستجو در بین پلتفرمها و ضبط جلسات.
🔸 شرکت Zerve روندهای ML را با هوش مصنوعی، اجرای موازی و استقرار اپلیکیشن با یک کلیک تسریع میکند.
🔸 سرپرست علمی OpenAI پیشبینی کرد که AGI میتواند در سال 2030 کشفهای علمی مستقل داشته باشد، در مصاحبهای با Nature.
Join US:
🤖 AI Agent v0.1 @ai_times_py
deerflow.tech
🦌 DeerFlow
Deep Exploration and Efficient Research, an AI tool that combines language models with specialized tools for research tasks.
آموزش های عملی امروز
🔸 آموزش: یاد بگیرید که چگونه اجزاء هوش مصنوعی خوداصلاحکنندهای بسازید که بهصورت خودکار در وبسایتها Navigate ، extract و interact کنند.
🔸 این دفترچه یادداشت به شما کمک میکند که Qwen3 را با استدلال، امتیازدهی نزدیکی، الگوها و پشتیبانی OpenR1 بهینهسازی کنید.-GRPO.ipynb)
🔸 یک دستیار صوتی خصوصی و محلی با استفاده از LLaMA 3.1، Whisper، Fine-Tuning LoRA و GGUF بسازید.
Join US:
🤖 AI Agent v0.1 @ai_times_py
🔸 آموزش: یاد بگیرید که چگونه اجزاء هوش مصنوعی خوداصلاحکنندهای بسازید که بهصورت خودکار در وبسایتها Navigate ، extract و interact کنند.
🔸 این دفترچه یادداشت به شما کمک میکند که Qwen3 را با استدلال، امتیازدهی نزدیکی، الگوها و پشتیبانی OpenR1 بهینهسازی کنید.-GRPO.ipynb)
🔸 یک دستیار صوتی خصوصی و محلی با استفاده از LLaMA 3.1، Whisper، Fine-Tuning LoRA و GGUF بسازید.
Join US:
🤖 AI Agent v0.1 @ai_times_py
www.deeplearning.ai
Building AI Browser Agents - DeepLearning.AI
Build agents that navigate and interact with websites, and learn how to make them more reliable.
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Diffusion Model <-> Depth
ETH & CMU on how to turn a single-image latent diffusion model (LDM) into the SOTA video depth estimator: video depth without video models.
📚 Paper arxiv.org/pdf/2411.19189
🌐 Project rollingdepth.github.io/
💻 Repo github.com/prs-eth/rollingdepth
🤗Demo huggingface.co/spaces/prs-eth/
@ai_times_py
ETH & CMU on how to turn a single-image latent diffusion model (LDM) into the SOTA video depth estimator: video depth without video models.
📚 Paper arxiv.org/pdf/2411.19189
🌐 Project rollingdepth.github.io/
💻 Repo github.com/prs-eth/rollingdepth
🤗Demo huggingface.co/spaces/prs-eth/
@ai_times_py
🔸 گزارش اولیه AlphaEvolve، یک عامل کدنویسی AI که 20% از مسائل ریاضی حل نشده را با استفاده از Gemini حل کرد!
🔸کمپانی OpenAI مدل کدنویسی GPT-4.1 را در ChatGPT راهاندازی کرد، سریعتر و جایگزین GPT-4o mini برای کاربران رایگان و Pro.
🔸 تحقیقات Nous پروژه Psyche را رونمایی کرد: به افراد امکان میدهد تا به آموزش غیرمتمرکز AI بپیوندند و هزینهها را کاهش و مدلهای مقیاس بزرگ منبعباز را پرورش دهند.
🔸 گروه LangChain پلتفرم Open Agent را معرفی کرد، ابزاری بدون کدنویسی برای ساخت عوامل سفارشی AI در مرورگر.
🔸شرکت Anthropic برنامه تقاضای باگ خود را راهاندازی کرد و 25 هزار دلار برای Jailbreaks جهانی در سیستم امنیتی بهروزرسانی شده Claude 3.7 پیشنهاد میدهد.
🔸 علیبابا مدل Wan2.1-VACE را منتشر کرد، یک مدل ایجاد و ویرایش ویدیو منبع باز که ورودیهای چندحسی و وظایف پیچیده را پشتیبانی میکند.
AI Agent v0.1 @ai_times_py
🔸کمپانی OpenAI مدل کدنویسی GPT-4.1 را در ChatGPT راهاندازی کرد، سریعتر و جایگزین GPT-4o mini برای کاربران رایگان و Pro.
🔸 تحقیقات Nous پروژه Psyche را رونمایی کرد: به افراد امکان میدهد تا به آموزش غیرمتمرکز AI بپیوندند و هزینهها را کاهش و مدلهای مقیاس بزرگ منبعباز را پرورش دهند.
🔸 گروه LangChain پلتفرم Open Agent را معرفی کرد، ابزاری بدون کدنویسی برای ساخت عوامل سفارشی AI در مرورگر.
🔸شرکت Anthropic برنامه تقاضای باگ خود را راهاندازی کرد و 25 هزار دلار برای Jailbreaks جهانی در سیستم امنیتی بهروزرسانی شده Claude 3.7 پیشنهاد میدهد.
🔸 علیبابا مدل Wan2.1-VACE را منتشر کرد، یک مدل ایجاد و ویرایش ویدیو منبع باز که ورودیهای چندحسی و وظایف پیچیده را پشتیبانی میکند.
AI Agent v0.1 @ai_times_py
Google DeepMind
AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators
🔸 راهنمایی عملی برای ساخت، درخواست دادن و استقرار LLMهای استدلالی با الگوها، دموها و محدودیتها.
🔸 این بلاگپست بررسی میکند که چگونه پوششدهندههای AI و برنامههای میتا در حال تغییر صنایع هستند و چرا سرعت و مالکیت دادهها مهم است.
🔸 یاد بگیرید چگونه خطاهای استخراج LLM را با استفاده از مدلهای چالشگر کاهش دهید و فرآیندهای اعتبارسنجی Human-in-the-Loop را اضافه کنید.
🔸 یاد بگیرید چگونه برنامههای AI بسازید با استفاده از MCP، با استانداردسازی دسترسی به ابزارها، داده و درخواستها به طور کارآمد.
AI Agent v0.1 @ai_times_py
🔸 این بلاگپست بررسی میکند که چگونه پوششدهندههای AI و برنامههای میتا در حال تغییر صنایع هستند و چرا سرعت و مالکیت دادهها مهم است.
🔸 یاد بگیرید چگونه خطاهای استخراج LLM را با استفاده از مدلهای چالشگر کاهش دهید و فرآیندهای اعتبارسنجی Human-in-the-Loop را اضافه کنید.
🔸 یاد بگیرید چگونه برنامههای AI بسازید با استفاده از MCP، با استانداردسازی دسترسی به ابزارها، داده و درخواستها به طور کارآمد.
AI Agent v0.1 @ai_times_py
YouTube
Introduction to Reasoning LLMs [1hr Talk]
Everything you need to know about Reasoning LLMs and their applications.
Learn how to build with reasoning LLMs, RAG, and AI Agents in my new courses here: https://dair-ai.thinkific.com/
Use code YOUTUBE20 to get an extra 20% off.
01:18 - What are Reasoning…
Learn how to build with reasoning LLMs, RAG, and AI Agents in my new courses here: https://dair-ai.thinkific.com/
Use code YOUTUBE20 to get an extra 20% off.
01:18 - What are Reasoning…
Forwarded from logcat (Behdad Abedi)
لایو ارائه سامی با عنوان دیوار و نقشه
https://youtube.com/live/EXICqzc0gQc?feature=share
https://youtube.com/live/EXICqzc0gQc?feature=share
YouTube
irlogcat Live - Sami, Divar & Map
Bringing Millions of Ads onto an Interactive Map
🔸 محصول OpenAI Codex معرفی شد! یک عامل کدنویسی ابری است که کارهایی مانند اصلاح باگها، تستها و مدیریت PRها در GitHub را بهصورت خودکار انجام میدهد.
🔸 Encord: یک ابزار جامع برای جمعآوری، حاشیهنویسی و مدیریت ویدئو، صدا، متن و بیشتر – ۱۰ برابر سریعتر.
🔸 شرکت Windsurf خانواده SWE-1 را رونمایی کرد! مدلهای هوش مصنوعی پیشرفته بر رقبای غیرمجاز در معیارهای نرمافزاری واقعی برتری دارند.
🔸 مدل Tab Cursor رونمایی شد! برای تغییر فرمت فایلهای مختلف با هایلایت سینتکس و ویرایش سریعتر.
🔸 ابزار Manus AI با اضافه کردن تولید تصویر و برنامهریزی گام به گام برای وظایف بصری پیچیده به روز شد.
🔸 کمپانی Google در AI Studio مدلهای Imagen 3، Veo 2 و Gemini 2.0 را برای تولید و ویرایش رسانه بهصورت یکپارچه ادغام کرد.
🔸 گروه Stability AI مدل متن به صدا را بهصورت متنباز منتشر کرده که امکان تولید صدا به مدت ۱۱ ثانیه را بدون اینترنت و در کمتر از ۸ ثانیه فراهم میکند.
🌟 به جمع ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
🔸 Encord: یک ابزار جامع برای جمعآوری، حاشیهنویسی و مدیریت ویدئو، صدا، متن و بیشتر – ۱۰ برابر سریعتر.
🔸 شرکت Windsurf خانواده SWE-1 را رونمایی کرد! مدلهای هوش مصنوعی پیشرفته بر رقبای غیرمجاز در معیارهای نرمافزاری واقعی برتری دارند.
🔸 مدل Tab Cursor رونمایی شد! برای تغییر فرمت فایلهای مختلف با هایلایت سینتکس و ویرایش سریعتر.
🔸 ابزار Manus AI با اضافه کردن تولید تصویر و برنامهریزی گام به گام برای وظایف بصری پیچیده به روز شد.
🔸 کمپانی Google در AI Studio مدلهای Imagen 3، Veo 2 و Gemini 2.0 را برای تولید و ویرایش رسانه بهصورت یکپارچه ادغام کرد.
🔸 گروه Stability AI مدل متن به صدا را بهصورت متنباز منتشر کرده که امکان تولید صدا به مدت ۱۱ ثانیه را بدون اینترنت و در کمتر از ۸ ثانیه فراهم میکند.
🌟 به جمع ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
Openai
Introducing Codex
Introducing Codex: a cloud-based software engineering agent that can work on many tasks in parallel, powered by codex-1. With Codex, developers can simultaneously deploy multiple agents to independently handle coding tasks such as writing features, answering…
🔹 آموزش قرار دادن عوامل هوش مصنوعی بهعنوان خدمات! مدیریت زمان تأخیر و ادغام آنها بهطور مستقیم در برنامهها.
🔹 دوره Hugging Face که پروتکل زمینه مدل را از طریق تئوری، SDKها و توسعه برنامههای عملی MCP آموزش میدهد.
🔹 شخصیسازی پاسخهای ChatGPT با دستورالعملهای سفارشی و حافظه برای خروجیهای متنی همیشگی و آگاه از بافت.
🌟 به جمع ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
🔹 دوره Hugging Face که پروتکل زمینه مدل را از طریق تئوری، SDKها و توسعه برنامههای عملی MCP آموزش میدهد.
🔹 شخصیسازی پاسخهای ChatGPT با دستورالعملهای سفارشی و حافظه برای خروجیهای متنی همیشگی و آگاه از بافت.
🌟 به جمع ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
YouTube
How to deploy an AI agent
Main demo → https://goo.gle/4kfkSQa
ADK Samples → https://goo.gle/42XZgRG
Fomc-research→ https://goo.gle/4meIQgt
Explore the best practices for shipping AI agents as artifacts and discover effective methods to integrate AI agents into your existing systems…
ADK Samples → https://goo.gle/42XZgRG
Fomc-research→ https://goo.gle/4meIQgt
Explore the best practices for shipping AI agents as artifacts and discover effective methods to integrate AI agents into your existing systems…
Top News - May 22
🔸 گوگل از بهروز رسانیهای مدل پرچمدار خود، Gemini 2.5 Pro، با قابلیتهای پیشرفتهتری در دلایلسنجی خبر داد.
🔸 Microsoft زیرسیستم لینوکس برای ویندوز را بهصورت متنباز معرفی کرد.
🔸 گوگل یک عامل کدنویسی متنباز مجهز به Gemini 2.5 Pro را راهاندازی کرد.
🔸 Microsoft قابلیت Copilot Chat را بهصورت متنباز ارائه کرده تا VS Code به یک ویرایشگر متنباز و هوش مصنوعی تبدیل شود.
🔸 OpenAI عامل Codex خود را به اپلیکیشن iOS ChatGPT اضافه کرده تا امکان مشاهده تغییرات کد بهصورت زنده فراهم شود.
🔸 Microsoft عامل جدید GitHub Copilot را برای اصلاح باگها و بهینهسازی کد منتشر کرد.
با ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
🔸 گوگل از بهروز رسانیهای مدل پرچمدار خود، Gemini 2.5 Pro، با قابلیتهای پیشرفتهتری در دلایلسنجی خبر داد.
🔸 Microsoft زیرسیستم لینوکس برای ویندوز را بهصورت متنباز معرفی کرد.
🔸 گوگل یک عامل کدنویسی متنباز مجهز به Gemini 2.5 Pro را راهاندازی کرد.
🔸 Microsoft قابلیت Copilot Chat را بهصورت متنباز ارائه کرده تا VS Code به یک ویرایشگر متنباز و هوش مصنوعی تبدیل شود.
🔸 OpenAI عامل Codex خود را به اپلیکیشن iOS ChatGPT اضافه کرده تا امکان مشاهده تغییرات کد بهصورت زنده فراهم شود.
🔸 Microsoft عامل جدید GitHub Copilot را برای اصلاح باگها و بهینهسازی کد منتشر کرد.
با ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
Google
Gemini 2.5: Our most intelligent models are getting even better
At I/O 2025, we shared updates to our Gemini 2.5 model series and Deep Think, an experimental enhanced reasoning mode for 2.5 Pro.
مدل های برتر
🔸 مدل Veo 3 شرکت گوگل ویدیوهایی با صدا، گفتوگو و واقعگرایی بالاتر تولید میکند.
🔸 با مدل Wan2.1 میتوانید ویدیوهای باکیفیت چند زبانه در لپتاپ خود بسازید.
🔸 مدل صوتی Dia از Nari Lab میتواند گفتار انگلیسی بیانی را از یک متن تولید کند.
با ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
🔸 مدل Veo 3 شرکت گوگل ویدیوهایی با صدا، گفتوگو و واقعگرایی بالاتر تولید میکند.
🔸 با مدل Wan2.1 میتوانید ویدیوهای باکیفیت چند زبانه در لپتاپ خود بسازید.
🔸 مدل صوتی Dia از Nari Lab میتواند گفتار انگلیسی بیانی را از یک متن تولید کند.
با ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py
Google DeepMind
Veo
Introducing our state of the art video generation model Veo 3, and new capabilities for Veo 2.
شرکت Authropic نسل جدید مدلهای Claude 4 را معرفی کرد
دو مدل جدید به نامهای Claude Sonnet 4 و 4 Claude Opus.
این مدلها توی بخشهای مختلف پیشرفتهای قابلتوجهی کسب کردند.
در دو بنچمارک جدید Agentic Coding و Agentic terminal coding بهترین عملکرد رو در مقایسه با مدل های همترازشون دارن.
درحال حاضر 4 Opus به عنوان بهترین مدل کدنویسی میتونه تسکهای پیچیده و طولانی رو به صورت پایدار انجام بده وفعلا فقط برای کاربران اشتراکی قابل دسترسه.
قابلیتهای جدیدی هم با این مدلها معرفی شدن:
+ هر دو مدل حالا میتونن در طول فرآیند به اصطلاح Thinking، از ابزارهایی مثل جستجوی وب استفاده کنن و بین Thinking و Tool use جابجا بشن.
+همچنین میتونن به صورت موازی از ابزارها استفاده کنن.
سرویس Claude Code هم که قبلا به صورت محدود در دست توسعه دهندگان محدودی قرار گرفته بود، الان به صورت عمومی در دسترسه و با ابزارهایی در VS Code و JetBrains ادغام شده.
در تصویر نتایج بنچمارک Software Engineering یا همون Agentic coding آورده شده.
اطلاعات بیشتر
@ai_times_py
دو مدل جدید به نامهای Claude Sonnet 4 و 4 Claude Opus.
این مدلها توی بخشهای مختلف پیشرفتهای قابلتوجهی کسب کردند.
در دو بنچمارک جدید Agentic Coding و Agentic terminal coding بهترین عملکرد رو در مقایسه با مدل های همترازشون دارن.
درحال حاضر 4 Opus به عنوان بهترین مدل کدنویسی میتونه تسکهای پیچیده و طولانی رو به صورت پایدار انجام بده وفعلا فقط برای کاربران اشتراکی قابل دسترسه.
قابلیتهای جدیدی هم با این مدلها معرفی شدن:
+ هر دو مدل حالا میتونن در طول فرآیند به اصطلاح Thinking، از ابزارهایی مثل جستجوی وب استفاده کنن و بین Thinking و Tool use جابجا بشن.
+همچنین میتونن به صورت موازی از ابزارها استفاده کنن.
سرویس Claude Code هم که قبلا به صورت محدود در دست توسعه دهندگان محدودی قرار گرفته بود، الان به صورت عمومی در دسترسه و با ابزارهایی در VS Code و JetBrains ادغام شده.
در تصویر نتایج بنچمارک Software Engineering یا همون Agentic coding آورده شده.
اطلاعات بیشتر
@ai_times_py
🔸 مدل جدید و باز Google به نام Gemma 3n، روی تلفن شما اجرا میشود و دارای درک چندوجهی است. منبع
🔸 کمپانی OpenAI استارتاپ Jony Ive را به قیمت 6.5 میلیارد دلار خرید تا سختافزار جدیدی متمرکز بر AI تولید کند. منبع
🔸 کمپانی Google اولین مدل دیفیوژن خود را برای متن راهاندازی کرد که پاسخهای سریعی برای ریاضیات و کد تولید میکند. منبع
🔸 گروه Mistral از Devstral، یک عامل کدنویسی متن باز، رونمایی کرد. منبع
🔸 گروه xAI یک API جستجوی زنده رایگان با دسترسی به وب و دادههای 𝕏 در زمان واقعی راهاندازی کرد. منبع
🔸 کمپانی OpenAI پشتیبانی از سرور MCP و تولید تصویر را به API پاسخهای خود اضافه کرد. منبع
AI Agent v0.1 @ai_times_py
🔸 کمپانی OpenAI استارتاپ Jony Ive را به قیمت 6.5 میلیارد دلار خرید تا سختافزار جدیدی متمرکز بر AI تولید کند. منبع
🔸 کمپانی Google اولین مدل دیفیوژن خود را برای متن راهاندازی کرد که پاسخهای سریعی برای ریاضیات و کد تولید میکند. منبع
🔸 گروه Mistral از Devstral، یک عامل کدنویسی متن باز، رونمایی کرد. منبع
🔸 گروه xAI یک API جستجوی زنده رایگان با دسترسی به وب و دادههای 𝕏 در زمان واقعی راهاندازی کرد. منبع
🔸 کمپانی OpenAI پشتیبانی از سرور MCP و تولید تصویر را به API پاسخهای خود اضافه کرد. منبع
AI Agent v0.1 @ai_times_py
Google DeepMind
Gemma 3n
Our powerful and efficient open model designed to run locally on phones, tablets, and laptops
🔸 مقاله جدید DeepSeek | نمای روشنی از فرآیند آموزش مدلهای بزرگ به شیوهای کارآمد .
Paper Title: Inside Look at Large Model Training Process
AI Agent v0.1 @ai_times_py
Paper Title: Inside Look at Large Model Training Process
AI Agent v0.1 @ai_times_py
arXiv.org
Insights into DeepSeek-V3: Scaling Challenges and Reflections on...
The rapid scaling of large language models (LLMs) has unveiled critical limitations in current hardware architectures, including constraints in memory capacity, computational efficiency, and...