AI Pulse
3.74K subscribers
397 photos
137 videos
5 files
138 links
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
Download Telegram
گوگل در تازه‌ترین به‌روزرسانی اپلیکیشن Gemini، قابلیت جدیدی به نام Deep Think رو برای کاربران پلن «Google AI Ultra» فعال کرده؛ مدلی پیشرفته که توانایی حل مسائل پیچیده علمی و ریاضی رو داره.

این نسخه از مدل Gemini 2.5، با استفاده از روش «تفکر موازی» می‌تونه هم‌زمان چند ایده مختلف رو بررسی و اصلاح کنه و در نهایت به راه‌حل بهینه برسه. جالبه بدونید نسخه کامل این مدل در رقابت‌های المپیاد جهانی ریاضی (IMO) موفق به کسب مدال طلا شده و حالا نسخه سریع‌تر و کاربردی‌ترش در اختیار عموم کاربران حرفه‌ای قرار گرفته.

بر اساس ارزیابی‌های داخلی گوگل، Deep Think توی حل مسائل کدنویسی پیچیده، کشف فرضیات ریاضی، و توسعه مرحله‌ای طراحی و محصول عملکرد چشم‌گیری داشته و در بنچ‌مارک‌هایی مثل LiveCodeBench V6 و Humanity’s Last Exam نتایج خوبی کسب کرده.

این قابلیت فعلاً با محدودیت تعداد درخواست روزانه در دسترس کاربران Ultra هست و به‌زودی از طریق API برای توسعه‌دهنده‌ها هم ارائه می‌شه. گوگل می‌گه این تنها شروع مسیریه که قراره مرزهای تفکر مصنوعی رو جابه‌جا کنه.

@aipulse24
🔥255❤‍🔥3👍1🥴1
شرکت OpenAI امروز دو مدل جدید با وزن‌های باز و قابلیت استدلال پیشرفته معرفی کرده که از نظر عملکرد نزدیک به مدل‌های سری o این شرکت هستن. این مدل‌ها با نام‌های gpt-oss-120b و gpt-oss-20b عرضه شدن و مدل کوچک‌تر این مجموعه برای اجرا روی یک GPU انویدیا یا حتی لپ‌تاپ‌های معمولی با ۱۶ گیگابایت رم بهینه شدن. هر دو مدل به‌صورت رایگان از طریق پلتفرم Hugging Face قابل دانلود هستن و این اولین‌بار از زمان انتشار GPT-2 در سال ۲۰۱۹ هست که OpenAI یک مدل زبانی باز منتشر می‌کنه.

‏OpenAI گفته این مدل‌ها می‌تونن وقتی توان انجام یک وظیفه خاص رو ندارن، درخواست رو به مدل‌های قدرتمندتر و غیر باز خودش در فضای ابری بفرستن. این تصمیم در حالی گرفته شده که این شرکت طی سال‌های اخیر بیشتر به سمت مدل‌های بسته حرکت کرده بود. فشار روزافزون از طرف آزمایشگاه‌های هوش مصنوعی چین مثل DeepSeek، Qwen و Moonshot AI، و همچنین درخواست اخیر دولت آمریکا برای متن‌باز کردن بخشی از فناوری‌ها، از دلایل مهم این تغییر مسیر عنوان شده.

در آزمون Codeforces، مدل gpt-oss-120b امتیاز ۲۶۲۲ و مدل gpt-oss-20b امتیاز ۲۵۱۶ رو کسب کرده که بهتر از DeepSeek R1 اما ضعیف‌تر از مدل‌های o3 و o4-mini بوده. توی آزمون Humanity’s Last Exam هم این دو مدل به‌ترتیب ۱۹٪ و ۱۷.۳٪ امتیاز گرفتن. با این حال، نرخ خطا یا «هذیان‌گویی» این مدل‌ها بالاست و در سنجش PersonQA به ۴۹٪ و ۵۳٪ رسیده که بیش از سه برابر مدل o1 هست.

‏OpenAI گفته فرآیند آموزش این مدل‌ها شبیه مدل‌های اختصاصی خودش بوده و از معماری mixture-of-experts و یادگیری تقویتی با محاسبات سنگین استفاده کرده. این مدل‌ها قابلیت فراخوانی ابزارهایی مثل جستجوی وب یا اجرای کد پایتون رو دارن، ولی صرفاً متنی هستن و نمی‌تونن تصویر یا صوت رو پردازش کنن. انتشارشون تحت مجوز آزاد Apache 2.0 انجام شده که به شرکت‌ها اجازه می‌ده بدون هزینه برای مقاصد تجاری ازشون استفاده کنن، ولی داده‌های آموزشی اون‌ها منتشر نمی‌شه.

‏OpenAI عرضه این مدل‌ها رو چندین بار به دلیل بررسی‌های ایمنی عقب انداخته بود. آزمایش‌ها نشون داده هرچند gpt-oss کمی توانایی در حوزه‌های زیستی پیدا می‌کنه، اما به آستانه خطر بالا در این زمینه‌ها نمی‌رسه. با این حال، بازار مدل‌های باز به‌زودی با عرضه DeepSeek R2 و مدل تازه Meta رقابتی‌تر می‌شه.

اگر حوصله اجرای لوکال این مدل‌هارو ندارید از طریق وبسایت gpt-oss.com میتونید این مدل هارو امتحان کنید.

@aipulse24
👍19🔥4❤‍🔥2🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل دیپ‌مایند نسخه جدید مدل هوش مصنوعی «جهان‌ساز» خودش با نام Genie 3 رو معرفی کرده؛ مدلی که می‌تونه محیط‌های سه‌بعدی رو به‌صورت زنده و در لحظه تولید کنه و کاربرها یا عامل‌های هوش مصنوعی بتونن باهاش تعامل داشته باشن. دیپ‌مایند میگه این نسخه نسبت به قبل مدت زمان بیشتری امکان گشت‌وگذار در محیط‌ها رو فراهم می‌کنه و حتی مکان اشیا رو در حافظه نگه می‌داره تا وقتی کاربر دوباره به اون نقطه برگرده، جزئیات تغییری نکرده باشن.

مدل‌های «جهان‌ساز» (World Models) نوعی سیستم هوش مصنوعی هستن که می‌تونن برای اهدافی مثل آموزش، سرگرمی یا حتی آموزش ربات‌ها، محیط‌های مجازی بسازن. کاربر با دادن یک پرامپت می‌تونه محیطی شبیه یک بازی ویدئویی ایجاد کنه، با این تفاوت که این دنیا به‌جای طراحی دستی با ابزارهای سه‌بعدی، به‌طور کامل با هوش مصنوعی ساخته میشه. گوگل در ماه دسامبر نسخه قبلی یعنی Genie 2 رو معرفی کرده بود که می‌تونست از روی یک تصویر، دنیایی تعاملی بسازه و حالا تیم ویژه «مدل‌سازی جهان» رو زیر نظر یکی از مدیران سابق پروژه Sora اوپن‌ای‌آی توسعه میده.

با این حال، نسخه‌های قبلی محدودیت‌های زیادی داشتن؛ مثلا محیط‌های Genie 2 فقط تا حدود یک دقیقه قابل بازی بودن و در بسیاری مواقع جزئیات محیط به‌طور غیرمنتظره تغییر می‌کردن. اما Genie 3 این محدودیت رو بهبود داده و حالا میشه با یک پرامپت، دنیایی ساخت که چند دقیقه تعامل مداوم رو پشتیبانی کنه. همچنین این مدل می‌تونه برای حدود یک دقیقه، جزئیات محیط رو در حافظه نگه داره؛ یعنی اگر از یک دیوار با نوشته خاص دور بشید و دوباره برگردید، نوشته همون‌طور باقی می‌مونه. کیفیت محیط‌ها هم ۷۲۰p و نرخ فریم ۲۴fps خواهد بود.

یکی از قابلیت‌های جدید Genie 3، امکان ایجاد رویدادهای جهان‌محور با پرامپت هست. مثلا کاربر می‌تونه تنها با نوشتن یک دستور، شرایط آب‌وهوایی رو تغییر بده یا شخصیت‌های جدید به محیط اضافه کنه. این ویژگی می‌تونه تجربه تعامل رو برای آموزش یا سرگرمی بسیار متنوع‌تر کنه.

با این وجود، گوگل فعلا این مدل رو به‌صورت پیش‌نمایش تحقیقاتی محدود ارائه می‌کنه و فقط گروه کوچکی از پژوهشگرها و خالقان محتوا بهش دسترسی خواهند داشت تا ریسک‌ها و راهکارهای ایمن‌سازی بهتر بررسی بشه. محدودیت‌هایی مثل نوع تعامل کاربر با محیط‌ها و دشواری تولید متن خوانا در داخل دنیاهای ساخته‌شده همچنان وجود داره. گوگل گفته در آینده احتمالا این مدل رو برای آزمایش‌کننده‌های بیشتری در دسترس قرار خواهد داد.

@aipulse24
👏18👍6❤‍🔥4🤯2😍2
از امروز می‌تونید با اپ جمنای، کتاب‌های داستانی تصویری و شخصی‌سازی‌شده بسازید؛ با روایت صوتی و تصویرسازی اختصاصی. فقط کافیه داستانی که توی ذهنتونه رو توصیف کنید تا جمنای یه کتاب ده‌صفحه‌ای با تصویر و صدای منحصر‌به‌فرد بسازه. حتی می‌تونید از عکس‌ها و فایل‌های شخصیتون هم استفاده کنید تا داستان‌ها حال‌وهوای واقعی‌تری بگیرن.

سبک تصویرسازی هم کاملاً به انتخاب شماست، از پیکسل‌آرت و کمیک گرفته تا استاپ‌موشن، عروسکی، یا حتی کتاب رنگ‌آمیزی، و همه اینا در بیش از ۴۵ زبان مختلف در دسترسه. می‌تونید برای بچه‌تون یه داستان آموزنده بسازید، با شخصیت اصلی‌ای که بچه‌تون دوستش داره. یا مثلاً یه داستان درباره منظومه شمسی که برای یه کودک ۵ ساله قابل فهم باشه. حتی نقاشی بچه‌تون رو آپلود کنید تا جمنای براش یه داستان تخیلی بسازه.

@aipulse24
21🤯3👏2👍1😍1
شرکت OpenAI نسل جدید مدل هوش مصنوعی خودش با نام GPT-5 رو معرفی کرده؛ مدلی که قراره قلب تپنده نسخه‌های آینده ChatGPT باشه. این مدل تازه، نه فقط یک ارتقاء فنی، بلکه یک حرکت مهم در مسیر ساخت هوش مصنوعی‌های عامل‌محور محسوب میشه؛ یعنی هوش‌هایی که مثل یک دستیار واقعی می‌تونن کارهای پیچیده انجام بدن، نه فقط چت کنن.

‏GPT-5 اولین مدلیه که OpenAI اون رو «یکپارچه» می‌دونه؛ چون ترکیبیه از توان استدلالی سری o و سرعت پاسخگویی سری GPT. به‌کمک این مدل، حالا ChatGPT می‌تونه وظایفی مثل ساخت اپلیکیشن، بررسی تقویم، یا تولید گزارش‌های پژوهشی رو هم برعهده بگیره. از طرفی، کار کردن باهاش ساده‌تر شده چون GPT-5 خودش تصمیم می‌گیره چقدر فکر کنه و چطور بهترین پاسخ رو بده.

سم آلتمن، مدیرعامل OpenAI، در جلسه خبری گفته GPT-5 «بهترین مدل دنیاست» و اضافه کرده که این مدل، گام بزرگی به‌سوی رسیدن به هوش عمومی مصنوعی (AGI) محسوب میشه؛ یعنی مدلی که بتونه از انسان در بیشتر کارها پیشی بگیره. از امروز همه کاربران رایگان ChatGPT می‌تونن به GPT-5 دسترسی داشته باشن. این تصمیم، بخشی از هدف OpenAI برای توزیع برابرتر هوش مصنوعیه.

طبق آمار رسمی، ChatGPT حالا بیش از ۷۰۰ میلیون کاربر هفتگی داره و انتظار می‌ره GPT-5 با توانایی‌هاش، نه فقط برای کاربران عادی، بلکه برای شرکت‌های فناوری، بازارهای مالی و سیاست‌گذاران هم اهمیت پیدا کنه. چون هم به‌عنوان نشانه‌ای از پیشرفت AI شناخته می‌شه و هم می‌تونه استانداردهای جدیدی برای رقبا تعیین کنه.

از نظر فنی، GPT-5 تونسته عملکرد خیلی خوبی در حوزه کدنویسی داشته باشه. توی آزمون SWE-bench Verified، که مجموعه‌ای از تسک‌های واقعی برنامه‌نویسیه، این مدل با امتیاز ۷۴.۹٪ بالاتر از Claude Opus 4.1 (با ۷۴.۵٪) و Gemini 2.5 Pro (با ۵۹.۶٪) قرار گرفته. توی حوزه علوم هم عملکرد خوبی داشته؛ مثلاً در آزمون GPQA Diamond مربوط به سوالات سطح دکتری، امتیاز ۸۹.۴٪ کسب کرده.

از نظر ایمنی و دقت هم GPT-5 پیشرفت قابل توجهی داشته. نرخ "هذیان‌گویی" مدل، یعنی زمانی که اطلاعات نادرست ارائه می‌ده، به ۴.۸٪ رسیده؛ عددی که در مدل‌های قبلی مثل GPT-4o حدود ۲۰٪ بود. این مدل همچنین در تشخیص درخواست‌های خطرناک نسبت به درخواست‌های عادی عملکرد بهتری داره و کمتر دچار قضاوت اشتباه می‌شه.

برای کاربران ChatGPT هم قابلیت‌های جدیدی درنظر گرفته شده. حالا می‌تونید از بین چهار شخصیت جدید (مثل ربات، شنونده، یا شخصیت بدبین و Nerd) یکی رو انتخاب کنید تا مدل متناسب با اون شخصیت باهاتون حرف بزنه. همچنین نسخه Pro با پرداخت ۲۰۰ دلار در ماه امکانات بیشتری مثل دسترسی به GPT-5 Pro رو فراهم می‌کنه.

در نهایت، GPT-5 با سه نسخه مختلف (Nano، Mini و Base) به API اضافه شده و قیمت پایه اون برای توسعه‌دهنده‌ها ۱.۲۵ دلار به ازای هر میلیون توکن ورودی اعلام شده. با اینکه GPT-5 در برخی حوزه‌ها مثل تعامل با وب‌سایت‌ها هنوز به سطح رقبا نرسیده، اما در مجموع می‌تونه نقطه عطفی در مسیر توسعه هوش مصنوعی باشه. حالا باید دید در دنیای واقعی، عملکردش چقدر با وعده‌ها همخوانی داره.

@aipulse24
1👍2011
AI Pulse
Photo
نمودار به سبک OpenAI!
🤣51💩101👍1
This media is not supported in your browser
VIEW IN TELEGRAM
جمنای قابلیت جدیدی به نام Guided Learning رو معرفی کرده که برای کمک به یادگیری عمیق‌تر طراحی شده و به جای دادن یک جواب کوتاه، مسائل رو مرحله‌به‌مرحله توضیح می‌ده و با پرسش‌های باز، کاربر رو وارد فرایند یادگیری می‌کنه.

‏Guided Learning می‌تونه با استفاده از متن، تصویر، ویدئو، نمودار و کوییز تعاملی، یادگیری رو متنوع‌تر کنه. این قابلیت بر پایه مدل‌های ویژه آموزش گوگل به نام LearnLM ساخته شده که با همکاری معلم‌ها و متخصصان آموزشی توسعه پیدا کرده.

به گفته گوگل، این ابزار می‌تونه برای آمادگی امتحان، نوشتن تحقیق یا حتی یادگیری مهارت‌های شخصی استفاده بشه و معلم‌ها هم می‌تونن لینک مستقیمش رو در کلاس‌های آنلاین به اشتراک بذارن. گوگل گفته هدف اینه که با Guided Learning، مسیر یادگیری برای کاربران در هر سطحی ساده‌تر و مؤثرتر بشه.

@aipulse24
❤‍🔥317👍4🔥2
گوگل اعلام کرد ابزار هوش مصنوعی برنامه‌نویسی «Jules» بعد از دو ماه آزمایش عمومی از حالت بتا خارج شده. این ابزار با مدل Gemini 2.5 Pro کار می‌کنه، با گیت‌هاب یکپارچه می‌شه و می‌تونه روی ماشین مجازی گوگل کد رو اصلاح یا به‌روزرسانی کنه، حتی وقتی کاربر حضور نداره.

با عرضه عمومی، نسخه رایگان روزانه ۱۵ تسک و سه تسک هم‌زمان رو پشتیبانی می‌کنه. پلن‌های پولی Google AI Pro و Ultra به‌ترتیب با قیمت ۱۹.۹۹ و ۱۲۴.۹۹ دلار، سقف استفاده رو پنج و بیست برابر بیشتر می‌کنن. سیاست حریم خصوصی هم شفاف‌تر شده و داده مخزن خصوصی برای آموزش استفاده نمی‌شه.

‏«Jules» به‌صورت Asynchronous کار می‌کنه و این هفته قابلیت باز کردن خودکار Pull Request و ویژگی «Environment Snapshots» رو دریافت کرده. از زمان بتا، بیش از ۲.۲۸ میلیون بازدید داشته که ۴۵ درصدش از موبایل بوده و گوگل قصد داره امکانات بیشتری برای این کاربران توسعه بده.

از طریق این لینک میتونید به این ابزار دسترسی داشته باشید.

@aipulse24
16🔥4
انتروپیک قابلیت جدیدی به نام «بازبینی امنیتی خودکار» رو به ابزار Claude Code اضافه کرده. این ویژگی با استفاده از یک دستور جدید به نام /security-review و همچنین یک اکشن GitHub، به توسعه‌دهنده‌ها کمک می‌کنه تا مشکلات امنیتی کد رو پیدا و رفع کنن. ایده اینه که امنیت کد از همون مراحل اولیه توسعه بررسی بشه تا آسیب‌پذیری‌ها قبل از رسیدن به محیط عملیاتی شناسایی و برطرف بشن.

با دستور /security-review می‌شه از داخل ترمینال، بدون نیاز به کامیت کردن کد، یک بررسی امنیتی انجام داد. این بررسی به دنبال الگوهای رایج آسیب‌پذیری مثل تزریق SQL، XSS، مشکلات احراز هویت و مجوزدهی، مدیریت ناامن داده و باگ‌های Dependency ها می‌گرده. بعد از شناسایی مشکلات، Claude Code می‌تونه خودش پیشنهاد رفع یا حتی اصلاح مستقیم اون‌ها رو ارائه بده.

اکشن جدید GitHub این فرایند رو خودکارتر می‌کنه. به محض باز شدن یک Pull Request، کد تغییر یافته رو بررسی می‌کنه، طبق قوانین قابل تنظیم، موارد مشکوک رو فیلتر یا علامت‌گذاری می‌کنه و نتایج رو به‌صورت کامنت داخل PR می‌ذاره. این باعث می‌شه تیم‌ها یک فرایند امنیتی ثابت و متمرکز داشته باشن و هیچ کدی بدون بررسی امنیتی به مرحله انتشار نرسه.

انتروپیک می‌گه خودش هم از این قابلیت‌ها برای بررسی امنیتی کدهای داخلی، حتی Claude Code، استفاده می‌کنه. به گفته اون‌ها، همین ابزار تونسته آسیب‌پذیری‌هایی مثل امکان اجرای کد از راه دور از طریق DNS rebinding و همچنین ضعف در برابر حملات SSRF رو قبل از انتشار پیدا و رفع کنه.

هر دو قابلیت الان برای همه کاربران Claude Code فعال هستن. برای استفاده از دستور /security-review کافیه آخرین نسخه رو نصب و دستور رو در پوشه پروژه اجرا کنید. برای اکشن GitHub هم راهنمای نصب و پیکربندی در مخزن رسمی انتروپیک موجوده.

@aipulse24
22😍5🏆3
شرکت انتروپیک قابلیت «حافظه» رو به چت‌بات خودش، Claude، اضافه کرده تا کاربران بتونن راحت‌تر مکالمات و پروژه‌هاشون رو از جایی که قبلاً رها کرده بودن ادامه بدن. این قابلیت باعث میشه Claude بتونه به چت‌های قبلی کاربر (وقتی که ازش خواسته میشه) رجوع کنه، بنابراین دیگه لازم نیست کاربر دوباره همه چیز رو توضیح بده.

در ویدئوی دموی منتشرشده توسط انتروپیک، کاربری از Claude پرسید قبل از تعطیلات روی چه کاری مشغول بوده و Claude با جستجو در مکالمات قدیمی، فهرست موضوعات، خلاصه کارها و پیشنهاد ادامه پروژه رو ارائه داد. این قابلیت فعلاً برای مشترکان نسخه‌های Max، Team و Enterprise روی وب، دسکتاپ و موبایل فعال میشه و امکان جدا نگه‌داشتن پروژه‌ها و فضاهای کاری مختلف رو هم داره.

انتروپیک اعلام کرده که با این ویژگی «دیگه هیچ‌وقت روند کارتون رو گم نمی‌کنید» و می‌تونید بدون شروع از صفر، پروژه‌ها رو ادامه بدید یا به بحث‌های قبلی رجوع کنید. برای فعال‌کردنش باید به بخش Settings، قسمت Profile برید و گزینه جستجو و ارجاع به چت‌ها رو روشن کنید.

البته انتروپیک تأکید کرده که این قابلیت با شبیه به چیزی که در حافظه ChatGPT میبینیم فرق داره و Claude به‌طور خودکار همه گفته‌ها رو ذخیره یا پروفایل شخصی کاربر رو ایجاد نمی‌کنه؛ بلکه فقط وقتی کاربر بخواد، به مکالمات قبلی مراجعه می‌کنه.

@aipulse24
15🔥2🍓2
گوگل هم با انتشار یک به‌روزرسانی جدید برای جمنای، قابلیت حافظه خودکار رو فعال کرده که می‌تونه جزئیات و ترجیحات کاربر رو به‌طور خودکار و بر اساس چت های قبلی به خاطر بسپره و برای شخصی‌سازی پاسخ‌ها استفاده کنه، بدون این‌که کاربر نیازی به یادآوری اون‌ها داشته باشه.

این ویژگی که نسخه پیشرفته‌تر قابلیت سال گذشته‌ست، به جمنای اجازه میده اطلاعات مربوط به پروژه‌ها و علایق قبلی رو در پاسخ‌ها لحاظ کنه. برای مثال، اگر قبلاً از جمنای برای ایده‌سازی یک کانال یوتیوب با محوریت فرهنگ ژاپن استفاده کرده باشید، ممکنه در آینده پیشنهاد تولید محتوای مرتبط با غذاهای ژاپنی رو بده.

این قابلیت به‌طور پیش‌فرض فعاله، اما کاربر می‌تونه از طریق تنظیمات اپلیکیشن و بخش Personal Context گزینه Your past chats with Gemini رو خاموش کنه.

این قابلیت ابتدا برای مدل Gemini 2.5 Pro در بعضی کشورها فعال میشه و بعد به مرور برای مدل 2.5 Flash و مناطق دیگه هم ارائه میشه.

علاوه بر این، گوگل قابلیت جدید «چت موقت» رو معرفی کرده که باعث میشه مکالمه‌ها در لیست چت‌های اخیر یا Keep Activity ذخیره نشن و برای شخصی‌سازی مکالمات آینده یا آموزش مدل‌های هوش مصنوعی گوگل استفاده نشن. این مکالمه‌ها فقط ۷۲ ساعت نگهداری میشن و بعد حذف میشن. به گفته گوگل، این ویژگی برای پرسیدن سؤالات خصوصی یا جلوگیری از ارجاع جزئیات یک مکالمه در گفت‌وگوهای بعدی بسیار کاربردیه.

@aipulse24
👍143