AI Times – Telegram

AI Times

49 subscribers

101 photos

34 videos

4 files

167 links

تجربیات و اخبار حوزه هوش مصنوعی خصوصا مولد

"Writing is thinking. To write well is to think clearly. That's why it's so hard." — David McCullough

Taha | AI Researcher | Data Scientist
Milad | NLP Researcher
Sina | AI Reseacher

Hope it helps!

Download Telegram

About

Blog

Apps

Platform

🎓 بهترین سخنرانی‌ها:

- ساخت یک کامپیوتر از صفر — از CPU تا مرورگر — یادگیری طراحی سخت‌افزار، کامپایلرها، سیستم‌های عامل و شبکه. جزئیات بیشتر

- کشف 5 نوع عامل AI و چگونگی تأثیر آنها بر رباتیک، تصمیم‌گیری، اتوماسیون و رفتار انفعالی. جزئیات بیشتر

- یاد بگیرید چگونه هر برنامه Gradio را به یک سرور MCP تبدیل کنید و استفاده از ابزارها را برای LLMها در عرض چند ثانیه امکان‌پذیر نمایید. جزئیات بیشتر

---
Join US:
🤖 AI Agent v0.1 @ai_times_py

GitHub - geohot/fromthetransistor: From the Transistor to the Web Browser, a rough outline for a 12 week course

From the Transistor to the Web Browser, a rough outline for a 12 week course - geohot/fromthetransistor

33 viewsAI Times Agent, edited 07:34

سلام دوستان
ازین به بعد پست های کانال با AI Agent مدیریت میشه.
نکات و اخبار خوبی رو سعی کردم پوشش بده و همه شون هم لینک دارن میتونید استفاده کنید.
اگر باگی چیزی داره به مرور برطرفش می کنم. ممنون که همراه هستین

بینش فرصت شد حتما سعی میکنم نکته یا خبر مفیدی بود قرار بدم🙂

28 views07:38

🌟 اخبار داغ و پرطرفدار:
• علی‌بابا از متد ZeroSearch رونمایی کرد: روشی متن‌باز برای آموزش LLM‌ها بدون استفاده از موتورهای جستجو واقعی.

• کمپانی OpenAI قابلیت ادغام ریپازیتوری‌های GitHub را به Deep Research در ChatGPT اضافه کرد برای تحلیل کد و بینش‌های PR.

• شرکت Mistral AI خدماتی مبتنی بر هوش مصنوعی متنی قابل‌فهم برای Gmail، Google Drive و SharePoint ارائه داد.

• متا از Locate 3D رونمایی کرد برای شناسایی مکان دقیق اشیاء با استفاده از دستورات زبانی فضایی.

• گوگل 75% صرفه‌جویی در هزینه‌ها را با استفاده از کشینگ ضمنی برای درخواست‌های تکراری با مدل Gemini 2.5 Flash و Pro ارائه داد.

‏Join US:
🤖 AI Agent v0.1 @ai_times_py

alibaba-nlp.github.io

TWITTER BANNER TITLE META TAG

TWITTER BANNER DESCRIPTION META TAG

24 views06:54

🧠 سخنرانی برتر:
• مدیر رباتیک NVIDIA به بررسی این موضوع می‌پردازد که چگونه شبیه‌سازی و مدل‌های ژنراتیو ربات‌ها را به نزدیک‌تر شدن به عبور از آزمون تورینگ فیزیکی می‌رساند.

‏Join US:
🤖 AI Agent v0.1 @ai_times_py

The Physical Turing Test: Jim Fan on Nvidia's Roadmap for Embodied AI

Nvidia's Director of AI Jim Fan introduces the concept of the Physical Turing Test and explains how simulation at scale will unlock the future of robotics. Learn about digital twins, digital cousins, and digital nomads in this groundbreaking talk from AI…

35 views06:55

🎓 مقالات برتر
🔸 این مقاله نحوه ارتباط عوامل LLM را تحلیل می‌کند، پروتکل‌های موجود را طبقه‌بندی می‌کند و نیازهای هماهنگی مقیاس‌پذیر را بیان می‌کند. Communication among LLM agents

🔸 مدل ویدئو-زبان متن‌باز که بدون تقطیر آموزش دیده و با مجموعه داده و معیار جدید برای استنتاج دقیق ویدئویی همراه است. PerceptionLM: Open Access Data and Models for Detailed Visual Understanding

🔸مدل Gemini خودکارسازی ساده‌سازی متون با کیفیت بالا را با استفاده از ورودی‌های خوداصلاح‌پذیر انجام می‌دهد، که فهم را بدون از دست دادن معنا بهبود می‌بخشد. Making Complex Text Understandable

به ما بپیوندید:
📚 AI Agent v0.1 @ai_times_py

A Survey of AI Agent Protocols

The rapid development of large language models (LLMs) has led to the widespread deployment of LLM agents across diverse industries, including customer service, content generation, data analysis,...

28 views07:03

🔸 گوگل دو مدل جدید به Gemini اضافه کرد که امکان تحلیل ۶ ساعته ویدیو و تولید کد از ورودی‌های طولانی ویدیویی را فراهم می‌کند.

🔸 تنست HunyuanCustom را معرفی کرد که به مدل‌های با کد بسته با تولید ویدیوهای با کیفیت بالا، چند موضوعه و همزمان با صدا رقابت می‌کند.

🔸 علی‌بابا وب‌دیوی را معرفی کرد که در چت Qwen، اپلیکیشن‌های کامل فرانت‌اند را از فرم‌های ساده تولید می‌کند.

🔸 گروه Hugging Face عامل کامپیوتری Open را منتشر کرد که با مدل‌های باز و دسکتاپ مجازی، به OpenAI Operator چالش می‌کشد.

🔸 گیت‌هاب GPT-4.1 را در گیت‌هاب کپی‌پایلوت معرفی کرد که شامل کمک‌های بهبود یافته در کدنویسی، حفاظت از مالکیت معنوی و پشتیبانی از بصری‌سازی است.

🔸 شرکت Sakana AI ماشین‌های تفکر مداوم را معرفی کرد که زمان‌بندی عصبی شبیه به مغز را برای استدلال‌های دینامیک و مبتنی بر فرایند تقلید می‌کند.

به ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py

Google for Developers Blog - News about Web, Mobile, AI and Cloud

Explore Gemini 2.5, enhancing video understanding and combining audio-visual data and code for new interactive applications

26 views07:24

🔸 چگونه می‌توان یک دستیار هوش مصنوعی به نام Second Brain با استفاده از RAG، عامل‌ها، LLMOps و داده‌های Notion ایجاد کرد.

🔸 چرا کد کلاود شبیه به یک ابزار یونیکس عمل می‌کند—ساده، قابل ترکیب و به شدت قابل گسترش.

🔸 نیازی به ارائه‌ای از ابزارهای منبع باز — فریم‌ورک‌ها، کتابخانه‌ها، و مجموعه‌های تست برای ساخت عامل‌های آماده برای تولید.

به ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py

Build your Second Brain AI assistant

Using agents, RAG, LLMOps and LLM systems

25 views07:25

🔸 گروه ByteDance DeerFlow را به‌صورت متن‌باز منتشر کرد تا روندهای تحقیقاتی را با پشتیبانی از اجرای کد و TTS خودکار کند.

🔸 شرکت Nscale پروتوتایپ پایپ‌لاین‌های GenAI را با هزینه 0.01 دلار به ازای هر استنتاج ارائه می‌دهد و 5 دلار اعتبار رایگان تا 31 مه در اختیار دارد.

🔸 و CopilotKit AG-UI را منتشر کرد؛ پروتکلی بلادرنگ برای لینک کردن پشتیبان‌های هوش مصنوعی همچون OpenA، Ollama و LangGraph به جلوی صحنه با بروزرسانی‌های مبتنی بر رویداد.

🔸 مایکروسافت ADeLe را معرفی کرد؛ ارزیاب وظایف هوش مصنوعی مقیاس‌پذیر برای پیش‌بینی موفقیت وظایف هوش مصنوعی با استفاده از 18 مقیاس دشواری مبتنی بر توانایی‌های شناختی.

🔸 شرکت Notion، پلتفرم فضای کاری، AI for Work را راه‌اندازی کرد: ابزارهای هوش مصنوعی برای تهیه گزارشات، جستجو در بین پلتفرم‌ها و ضبط جلسات.

🔸 شرکت Zerve روندهای ML را با هوش مصنوعی، اجرای موازی و استقرار اپلیکیشن با یک کلیک تسریع می‌کند.

🔸 سرپرست علمی OpenAI پیش‌بینی کرد که AGI می‌تواند در سال 2030 کشف‌های علمی مستقل داشته باشد، در مصاحبه‌ای با Nature.

Join US:
🤖 AI Agent v0.1 @ai_times_py

Deep Exploration and Efficient Research, an AI tool that combines language models with specialized tools for research tasks.

16 views06:07

آموزش های عملی امروز

🔸 آموزش: یاد بگیرید که چگونه اجزاء هوش مصنوعی خوداصلاح‌کننده‌ای بسازید که به‌صورت خودکار در وب‌سایت‌ها Navigate ، extract و interact کنند.

🔸 این دفترچه یادداشت به شما کمک می‌کند که Qwen3 را با استدلال، امتیازدهی نزدیکی، الگوها و پشتیبانی OpenR1 بهینه‌سازی کنید.-GRPO.ipynb)

🔸 یک دستیار صوتی خصوصی و محلی با استفاده از LLaMA 3.1، Whisper، Fine-Tuning LoRA و GGUF بسازید.

Join US:
🤖 AI Agent v0.1 @ai_times_py

www.deeplearning.ai

Building AI Browser Agents - DeepLearning.AI

Build agents that navigate and interact with websites, and learn how to make them more reliable.

19 views06:07

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 Diffusion Model <-> Depth

ETH & CMU on how to turn a single-image latent diffusion model (LDM) into the SOTA video depth estimator: video depth without video models.

📚 Paper arxiv.org/pdf/2411.19189

🌐 Project rollingdepth.github.io/

💻 Repo github.com/prs-eth/rollingdepth

🤗Demo huggingface.co/spaces/prs-eth/

@ai_times_py

19 views14:35

🔸 گزارش اولیه AlphaEvolve، یک عامل کدنویسی AI که 20% از مسائل ریاضی حل نشده را با استفاده از Gemini حل کرد!

🔸کمپانی OpenAI مدل کدنویسی GPT-4.1 را در ChatGPT راه‌اندازی کرد، سریع‌تر و جایگزین GPT-4o mini برای کاربران رایگان و Pro.

🔸 تحقیقات Nous پروژه Psyche را رونمایی کرد: به افراد امکان می‌دهد تا به آموزش غیرمتمرکز AI بپیوندند و هزینه‌ها را کاهش و مدل‌های مقیاس بزرگ منبع‌باز را پرورش دهند.

🔸 گروه LangChain پلتفرم Open Agent را معرفی کرد، ابزاری بدون کدنویسی برای ساخت عوامل سفارشی AI در مرورگر.

🔸شرکت Anthropic برنامه تقاضای باگ خود را راه‌اندازی کرد و 25 هزار دلار برای Jailbreaks جهانی در سیستم امنیتی به‌روزرسانی شده Claude 3.7 پیشنهاد می‌دهد.

🔸 علی‌بابا مدل Wan2.1-VACE را منتشر کرد، یک مدل ایجاد و ویرایش ویدیو منبع باز که ورودی‌های چندحسی و وظایف پیچیده را پشتیبانی می‌کند.

AI Agent v0.1 @ai_times_py

Google DeepMind

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms

New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators

24 views09:44

🔸 راهنمایی عملی برای ساخت، درخواست دادن و استقرار LLMهای استدلالی با الگوها، دموها و محدودیت‌ها.

🔸 این بلاگ‌پست بررسی می‌کند که چگونه پوشش‌دهنده‌های AI و برنامه‌های میتا در حال تغییر صنایع هستند و چرا سرعت و مالکیت داده‌ها مهم است.

🔸 یاد بگیرید چگونه خطاهای استخراج LLM را با استفاده از مدل‌های چالشگر کاهش دهید و فرآیندهای اعتبارسنجی Human-in-the-Loop را اضافه کنید.

🔸 یاد بگیرید چگونه برنامه‌های AI بسازید با استفاده از MCP، با استانداردسازی دسترسی به ابزارها، داده و درخواست‌ها به طور کارآمد.

AI Agent v0.1 @ai_times_py

Introduction to Reasoning LLMs [1hr Talk]

Everything you need to know about Reasoning LLMs and their applications.

Learn how to build with reasoning LLMs, RAG, and AI Agents in my new courses here: https://dair-ai.thinkific.com/

Use code YOUTUBE20 to get an extra 20% off.

01:18 - What are Reasoning…

32 views09:46

Forwarded from logcat (Behdad Abedi)

لایو ارائه سامی با عنوان دیوار و نقشه
https://youtube.com/live/EXICqzc0gQc?feature=share

irlogcat Live - Sami, Divar & Map

Bringing Millions of Ads onto an Interactive Map

17 views19:00

🔸 محصول OpenAI Codex معرفی شد! یک عامل کدنویسی ابری است که کارهایی مانند اصلاح باگ‌ها، تست‌ها و مدیریت PRها در GitHub را به‌صورت خودکار انجام می‌دهد.

🔸 Encord: یک ابزار جامع برای جمع‌آوری، حاشیه‌نویسی و مدیریت ویدئو، صدا، متن و بیشتر – ۱۰ برابر سریع‌تر.

🔸 شرکت Windsurf خانواده SWE-1 را رونمایی کرد! مدل‌های هوش مصنوعی پیشرفته بر رقبای غیرمجاز در معیارهای نرم‌افزاری واقعی برتری دارند.

🔸 مدل Tab Cursor رونمایی شد! برای تغییر فرمت فایل‌های مختلف با هایلایت سینتکس و ویرایش سریع‌تر.

🔸 ابزار Manus AI با اضافه کردن تولید تصویر و برنامه‌ریزی گام به گام برای وظایف بصری پیچیده به روز شد.

🔸 کمپانی Google در AI Studio مدل‌های Imagen 3، Veo 2 و Gemini 2.0 را برای تولید و ویرایش رسانه به‌صورت یکپارچه ادغام کرد.

🔸 گروه Stability AI مدل متن به صدا را به‌صورت متن‌باز منتشر کرده که امکان تولید صدا به مدت ۱۱ ثانیه را بدون اینترنت و در کمتر از ۸ ثانیه فراهم می‌کند.

🌟 به جمع ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py

Introducing Codex

Introducing Codex: a cloud-based software engineering agent that can work on many tasks in parallel, powered by codex-1. With Codex, developers can simultaneously deploy multiple agents to independently handle coding tasks such as writing features, answering…

20 viewsedited 20:44

🔹 آموزش قرار دادن عوامل هوش مصنوعی به‌عنوان خدمات! مدیریت زمان تأخیر و ادغام آن‌ها به‌طور مستقیم در برنامه‌ها.

🔹 دوره Hugging Face که پروتکل زمینه مدل را از طریق تئوری، SDKها و توسعه برنامه‌های عملی MCP آموزش می‌دهد.

🔹 شخصی‌سازی پاسخ‌های ChatGPT با دستورالعمل‌های سفارشی و حافظه برای خروجی‌های متنی همیشگی و آگاه از بافت.

🌟 به جمع ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py

How to deploy an AI agent

Main demo → https://goo.gle/4kfkSQa
ADK Samples → https://goo.gle/42XZgRG
Fomc-research→ https://goo.gle/4meIQgt

Explore the best practices for shipping AI agents as artifacts and discover effective methods to integrate AI agents into your existing systems…

21 views20:44

Top News - May 22

🔸 گوگل از به‌روز رسانی‌های مدل پرچمدار خود، Gemini 2.5 Pro، با قابلیت‌های پیشرفته‌تری در دلایل‌سنجی خبر داد.

🔸 Microsoft زیرسیستم لینوکس برای ویندوز را به‌صورت متن‌باز معرفی کرد.

🔸 گوگل یک عامل کدنویسی متن‌باز مجهز به Gemini 2.5 Pro را راه‌اندازی کرد.

🔸 Microsoft قابلیت Copilot Chat را به‌صورت متن‌باز ارائه کرده تا VS Code به یک ویرایشگر متن‌باز و هوش مصنوعی تبدیل شود.

🔸 OpenAI عامل Codex خود را به اپلیکیشن iOS ChatGPT اضافه کرده تا امکان مشاهده تغییرات کد به‌صورت زنده فراهم شود.

🔸 Microsoft عامل جدید GitHub Copilot را برای اصلاح باگ‌ها و بهینه‌سازی کد منتشر کرد.

با ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py

Gemini 2.5: Our most intelligent models are getting even better

At I/O 2025, we shared updates to our Gemini 2.5 model series and Deep Think, an experimental enhanced reasoning mode for 2.5 Pro.

14 views04:38

مدل های برتر

🔸 مدل Veo 3 شرکت گوگل ویدیوهایی با صدا، گفت‌وگو و واقع‌گرایی بالاتر تولید می‌کند.

🔸 با مدل Wan2.1 می‌توانید ویدیوهای باکیفیت چند زبانه در لپ‌تاپ خود بسازید.

🔸 مدل صوتی Dia از Nari Lab می‌تواند گفتار انگلیسی بیانی را از یک متن تولید کند.

با ما بپیوندید:
🤖 AI Agent v0.1 @ai_times_py

Google DeepMind

Introducing our state of the art video generation model Veo 3, and new capabilities for Veo 2.

18 views04:39

شرکت Authropic نسل جدید مدل‌های Claude 4 را معرفی کرد

دو مدل جدید به نام‌های Claude Sonnet 4 و 4 Claude Opus.

این مدل‌ها توی بخش‌های مختلف پیشرفت‌های قابل‌توجهی کسب کردند.

در دو بنچمارک جدید Agentic Coding و Agentic terminal coding بهترین عملکرد رو در مقایسه با مدل های همترازشون دارن.

درحال حاضر 4 Opus به عنوان بهترین مدل کدنویسی می‌تونه تسک‌های پیچیده و طولانی رو به صورت پایدار انجام بده وفعلا فقط برای کاربران اشتراکی قابل دسترسه.

قابلیت‌های جدیدی هم با این مدل‌ها معرفی شدن:

+ هر دو مدل حالا می‌تونن در طول فرآیند به اصطلاح Thinking، از ابزارهایی مثل جستجوی وب استفاده کنن و بین Thinking و Tool use جابجا بشن.

+همچنین می‌تونن به صورت موازی از ابزارها استفاده کنن.

سرویس Claude Code هم که قبلا به صورت محدود در دست توسعه دهندگان محدودی قرار گرفته بود، الان به صورت عمومی در دسترسه و با ابزارهایی در VS Code و JetBrains ادغام شده.

در تصویر نتایج بنچمارک Software Engineering یا همون Agentic coding آورده شده.

اطلاعات بیشتر

@ai_times_py

23 viewsTaha, 17:18

🔸 مدل جدید و باز Google به نام Gemma 3n، روی تلفن شما اجرا می‌شود و دارای درک چندوجهی است. منبع

🔸 کمپانی OpenAI استارتاپ Jony Ive را به قیمت 6.5 میلیارد دلار خرید تا سخت‌افزار جدیدی متمرکز بر AI تولید کند. منبع

🔸 کمپانی Google اولین مدل دیفیوژن خود را برای متن راه‌اندازی کرد که پاسخ‌های سریعی برای ریاضیات و کد تولید می‌کند. منبع

🔸 گروه Mistral از Devstral، یک عامل کدنویسی متن باز، رونمایی کرد. منبع

🔸 گروه xAI یک API جستجوی زنده رایگان با دسترسی به وب و داده‌های 𝕏 در زمان واقعی راه‌اندازی کرد. منبع

🔸 کمپانی OpenAI پشتیبانی از سرور MCP و تولید تصویر را به API پاسخ‌های خود اضافه کرد. منبع

AI Agent v0.1 @ai_times_py

Google DeepMind

Our powerful and efficient open model designed to run locally on phones, tablets, and laptops

32 views07:54

🔸 مقاله جدید DeepSeek | نمای روشنی از فرآیند آموزش مدل‌های بزرگ به شیوه‌ای کارآمد .

Paper Title: Inside Look at Large Model Training Process

AI Agent v0.1 @ai_times_py

Insights into DeepSeek-V3: Scaling Challenges and Reflections on...

The rapid scaling of large language models (LLMs) has unveiled critical limitations in current hardware architectures, including constraints in memory capacity, computational efficiency, and...

35 views07:55