شرکت انتروپیک اعلام کرده که بعضی از کاربران Claude Code بهطور ۲۴ ساعته از این ابزار استفاده میکنن و حجم بالایی از منابع سرور رو مصرف میکنن. مثلاً یه کاربر با پلن ۲۰۰ دلاری، دهها هزار دلار مصرف داشته. انتروپیک گفته این استفادهها هرچند جالبه، اما هزینهی سنگینی داره و نمیتونن برای همه ادامهاش بدن.
از اون طرف، یه عدهی دیگه قوانین رو زیر پا گذاشتن و دارن حسابها رو به اشتراک میذارن یا میفروشن. این کار باعث شده کیفیت خدمات برای بقیهی کاربرا بیاد پایین و انتروپیک داره جلوی این موارد رو میگیره.
بنابراین از تاریخ ۲۸ اوت، محدودیتهای هفتگی جدیدی اعمال میشن تا از این سوءاستفادهها جلوگیری شه و در عین حال، کمترین تأثیر ممکن رو روی بقیهی کاربرا داشته باشه. کاربرای پلن Max هم اگه بخوان، میتونن مصرف اضافه رو با نرخ API بخرن.
@aipulse24
از اون طرف، یه عدهی دیگه قوانین رو زیر پا گذاشتن و دارن حسابها رو به اشتراک میذارن یا میفروشن. این کار باعث شده کیفیت خدمات برای بقیهی کاربرا بیاد پایین و انتروپیک داره جلوی این موارد رو میگیره.
بنابراین از تاریخ ۲۸ اوت، محدودیتهای هفتگی جدیدی اعمال میشن تا از این سوءاستفادهها جلوگیری شه و در عین حال، کمترین تأثیر ممکن رو روی بقیهی کاربرا داشته باشه. کاربرای پلن Max هم اگه بخوان، میتونن مصرف اضافه رو با نرخ API بخرن.
@aipulse24
👎19👍16🤔2🥰1🖕1🗿1
سم آلتمن، مدیرعامل OpenAI، اخیراً در گفتوگویی با تئو وان، کمدین و مجری پادکست This Past Weekend، به نگرانی مهمی درباره حریم خصوصی کاربران چتباتهای هوش مصنوعی اشاره کرده. او گفته که هنوز صنعت هوش مصنوعی نتونسته چارچوب مشخصی برای محافظت از حریم خصوصی گفتگوهای حساس کاربران با ابزارهایی مثل ChatGPT ایجاد کنه، بهویژه وقتی پای مسائل عاطفی، روانی یا شخصی وسطه. بهگفتهی آلتمن، چون در حال حاضر برای این نوع گفتگوها هیچ مفهومی مثل «محرمانگی دکتر و بیمار» تعریف نشده، کاربران نباید تصور کنن که صحبتهاشون با یک مدل هوش مصنوعی واقعاً امن و شخصیه.
آلتمن توضیح داده که بسیاری از کاربران، بهخصوص جوانترها، از ChatGPT بهعنوان مشاور، رواندرمانگر یا همراه احساسی استفاده میکنن و دربارهی خصوصیترین جنبههای زندگیشون باهاش حرف میزنن، اما برخلاف گفتگو با پزشک، روانشناس یا وکیل، فعلاً هیچ چارچوب قانونی مشخصی برای محافظت از این حرفها وجود نداره. این موضوع میتونه در صورت پیگرد قانونی، به ضرر کاربران تموم بشه، چون OpenAI ممکنه مجبور بشه این گفتگوها رو تحویل مراجع قضایی بده که به گفتهی آلتمن، این وضعیت میتونه جلوی پذیرش گستردهتر ابزارهای هوش مصنوعی رو بگیره.
او در ادامه گفته که باید سطح حفاظت از گفتگوهای کاربران با AI بهاندازهی گفتوگو با یک درمانگر بالا بره و تأکید کرده که چنین دغدغهای تا همین یک سال پیش اصلاً مطرح نبود.
در این مصاحبه، وقتی آلتمن از تئو وان پرسید چرا زیاد از ChatGPT استفاده نمیکنه، وان گفت که به خاطر نگرانی از حریم خصوصی فعلاً علاقهای نداره. آلتمن هم با این دیدگاه موافقت کرد و گفت منطقیه که قبل از استفادهی جدی، آدم منتظر شفافسازی قانونی بمونه.
@aipulse24
آلتمن توضیح داده که بسیاری از کاربران، بهخصوص جوانترها، از ChatGPT بهعنوان مشاور، رواندرمانگر یا همراه احساسی استفاده میکنن و دربارهی خصوصیترین جنبههای زندگیشون باهاش حرف میزنن، اما برخلاف گفتگو با پزشک، روانشناس یا وکیل، فعلاً هیچ چارچوب قانونی مشخصی برای محافظت از این حرفها وجود نداره. این موضوع میتونه در صورت پیگرد قانونی، به ضرر کاربران تموم بشه، چون OpenAI ممکنه مجبور بشه این گفتگوها رو تحویل مراجع قضایی بده که به گفتهی آلتمن، این وضعیت میتونه جلوی پذیرش گستردهتر ابزارهای هوش مصنوعی رو بگیره.
او در ادامه گفته که باید سطح حفاظت از گفتگوهای کاربران با AI بهاندازهی گفتوگو با یک درمانگر بالا بره و تأکید کرده که چنین دغدغهای تا همین یک سال پیش اصلاً مطرح نبود.
در این مصاحبه، وقتی آلتمن از تئو وان پرسید چرا زیاد از ChatGPT استفاده نمیکنه، وان گفت که به خاطر نگرانی از حریم خصوصی فعلاً علاقهای نداره. آلتمن هم با این دیدگاه موافقت کرد و گفت منطقیه که قبل از استفادهی جدی، آدم منتظر شفافسازی قانونی بمونه.
@aipulse24
👍21❤6👎3👏2
گوگل در تازهترین بهروزرسانی اپلیکیشن Gemini، قابلیت جدیدی به نام Deep Think رو برای کاربران پلن «Google AI Ultra» فعال کرده؛ مدلی پیشرفته که توانایی حل مسائل پیچیده علمی و ریاضی رو داره.
این نسخه از مدل Gemini 2.5، با استفاده از روش «تفکر موازی» میتونه همزمان چند ایده مختلف رو بررسی و اصلاح کنه و در نهایت به راهحل بهینه برسه. جالبه بدونید نسخه کامل این مدل در رقابتهای المپیاد جهانی ریاضی (IMO) موفق به کسب مدال طلا شده و حالا نسخه سریعتر و کاربردیترش در اختیار عموم کاربران حرفهای قرار گرفته.
بر اساس ارزیابیهای داخلی گوگل، Deep Think توی حل مسائل کدنویسی پیچیده، کشف فرضیات ریاضی، و توسعه مرحلهای طراحی و محصول عملکرد چشمگیری داشته و در بنچمارکهایی مثل LiveCodeBench V6 و Humanity’s Last Exam نتایج خوبی کسب کرده.
این قابلیت فعلاً با محدودیت تعداد درخواست روزانه در دسترس کاربران Ultra هست و بهزودی از طریق API برای توسعهدهندهها هم ارائه میشه. گوگل میگه این تنها شروع مسیریه که قراره مرزهای تفکر مصنوعی رو جابهجا کنه.
@aipulse24
این نسخه از مدل Gemini 2.5، با استفاده از روش «تفکر موازی» میتونه همزمان چند ایده مختلف رو بررسی و اصلاح کنه و در نهایت به راهحل بهینه برسه. جالبه بدونید نسخه کامل این مدل در رقابتهای المپیاد جهانی ریاضی (IMO) موفق به کسب مدال طلا شده و حالا نسخه سریعتر و کاربردیترش در اختیار عموم کاربران حرفهای قرار گرفته.
بر اساس ارزیابیهای داخلی گوگل، Deep Think توی حل مسائل کدنویسی پیچیده، کشف فرضیات ریاضی، و توسعه مرحلهای طراحی و محصول عملکرد چشمگیری داشته و در بنچمارکهایی مثل LiveCodeBench V6 و Humanity’s Last Exam نتایج خوبی کسب کرده.
این قابلیت فعلاً با محدودیت تعداد درخواست روزانه در دسترس کاربران Ultra هست و بهزودی از طریق API برای توسعهدهندهها هم ارائه میشه. گوگل میگه این تنها شروع مسیریه که قراره مرزهای تفکر مصنوعی رو جابهجا کنه.
@aipulse24
🔥25❤5❤🔥3👍1🥴1
شرکت OpenAI امروز دو مدل جدید با وزنهای باز و قابلیت استدلال پیشرفته معرفی کرده که از نظر عملکرد نزدیک به مدلهای سری o این شرکت هستن. این مدلها با نامهای gpt-oss-120b و gpt-oss-20b عرضه شدن و مدل کوچکتر این مجموعه برای اجرا روی یک GPU انویدیا یا حتی لپتاپهای معمولی با ۱۶ گیگابایت رم بهینه شدن. هر دو مدل بهصورت رایگان از طریق پلتفرم Hugging Face قابل دانلود هستن و این اولینبار از زمان انتشار GPT-2 در سال ۲۰۱۹ هست که OpenAI یک مدل زبانی باز منتشر میکنه.
OpenAI گفته این مدلها میتونن وقتی توان انجام یک وظیفه خاص رو ندارن، درخواست رو به مدلهای قدرتمندتر و غیر باز خودش در فضای ابری بفرستن. این تصمیم در حالی گرفته شده که این شرکت طی سالهای اخیر بیشتر به سمت مدلهای بسته حرکت کرده بود. فشار روزافزون از طرف آزمایشگاههای هوش مصنوعی چین مثل DeepSeek، Qwen و Moonshot AI، و همچنین درخواست اخیر دولت آمریکا برای متنباز کردن بخشی از فناوریها، از دلایل مهم این تغییر مسیر عنوان شده.
در آزمون Codeforces، مدل gpt-oss-120b امتیاز ۲۶۲۲ و مدل gpt-oss-20b امتیاز ۲۵۱۶ رو کسب کرده که بهتر از DeepSeek R1 اما ضعیفتر از مدلهای o3 و o4-mini بوده. توی آزمون Humanity’s Last Exam هم این دو مدل بهترتیب ۱۹٪ و ۱۷.۳٪ امتیاز گرفتن. با این حال، نرخ خطا یا «هذیانگویی» این مدلها بالاست و در سنجش PersonQA به ۴۹٪ و ۵۳٪ رسیده که بیش از سه برابر مدل o1 هست.
OpenAI گفته فرآیند آموزش این مدلها شبیه مدلهای اختصاصی خودش بوده و از معماری mixture-of-experts و یادگیری تقویتی با محاسبات سنگین استفاده کرده. این مدلها قابلیت فراخوانی ابزارهایی مثل جستجوی وب یا اجرای کد پایتون رو دارن، ولی صرفاً متنی هستن و نمیتونن تصویر یا صوت رو پردازش کنن. انتشارشون تحت مجوز آزاد Apache 2.0 انجام شده که به شرکتها اجازه میده بدون هزینه برای مقاصد تجاری ازشون استفاده کنن، ولی دادههای آموزشی اونها منتشر نمیشه.
OpenAI عرضه این مدلها رو چندین بار به دلیل بررسیهای ایمنی عقب انداخته بود. آزمایشها نشون داده هرچند gpt-oss کمی توانایی در حوزههای زیستی پیدا میکنه، اما به آستانه خطر بالا در این زمینهها نمیرسه. با این حال، بازار مدلهای باز بهزودی با عرضه DeepSeek R2 و مدل تازه Meta رقابتیتر میشه.
اگر حوصله اجرای لوکال این مدلهارو ندارید از طریق وبسایت gpt-oss.com میتونید این مدل هارو امتحان کنید.
@aipulse24
OpenAI گفته این مدلها میتونن وقتی توان انجام یک وظیفه خاص رو ندارن، درخواست رو به مدلهای قدرتمندتر و غیر باز خودش در فضای ابری بفرستن. این تصمیم در حالی گرفته شده که این شرکت طی سالهای اخیر بیشتر به سمت مدلهای بسته حرکت کرده بود. فشار روزافزون از طرف آزمایشگاههای هوش مصنوعی چین مثل DeepSeek، Qwen و Moonshot AI، و همچنین درخواست اخیر دولت آمریکا برای متنباز کردن بخشی از فناوریها، از دلایل مهم این تغییر مسیر عنوان شده.
در آزمون Codeforces، مدل gpt-oss-120b امتیاز ۲۶۲۲ و مدل gpt-oss-20b امتیاز ۲۵۱۶ رو کسب کرده که بهتر از DeepSeek R1 اما ضعیفتر از مدلهای o3 و o4-mini بوده. توی آزمون Humanity’s Last Exam هم این دو مدل بهترتیب ۱۹٪ و ۱۷.۳٪ امتیاز گرفتن. با این حال، نرخ خطا یا «هذیانگویی» این مدلها بالاست و در سنجش PersonQA به ۴۹٪ و ۵۳٪ رسیده که بیش از سه برابر مدل o1 هست.
OpenAI گفته فرآیند آموزش این مدلها شبیه مدلهای اختصاصی خودش بوده و از معماری mixture-of-experts و یادگیری تقویتی با محاسبات سنگین استفاده کرده. این مدلها قابلیت فراخوانی ابزارهایی مثل جستجوی وب یا اجرای کد پایتون رو دارن، ولی صرفاً متنی هستن و نمیتونن تصویر یا صوت رو پردازش کنن. انتشارشون تحت مجوز آزاد Apache 2.0 انجام شده که به شرکتها اجازه میده بدون هزینه برای مقاصد تجاری ازشون استفاده کنن، ولی دادههای آموزشی اونها منتشر نمیشه.
OpenAI عرضه این مدلها رو چندین بار به دلیل بررسیهای ایمنی عقب انداخته بود. آزمایشها نشون داده هرچند gpt-oss کمی توانایی در حوزههای زیستی پیدا میکنه، اما به آستانه خطر بالا در این زمینهها نمیرسه. با این حال، بازار مدلهای باز بهزودی با عرضه DeepSeek R2 و مدل تازه Meta رقابتیتر میشه.
اگر حوصله اجرای لوکال این مدلهارو ندارید از طریق وبسایت gpt-oss.com میتونید این مدل هارو امتحان کنید.
@aipulse24
👍19🔥4❤🔥2🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل دیپمایند نسخه جدید مدل هوش مصنوعی «جهانساز» خودش با نام Genie 3 رو معرفی کرده؛ مدلی که میتونه محیطهای سهبعدی رو بهصورت زنده و در لحظه تولید کنه و کاربرها یا عاملهای هوش مصنوعی بتونن باهاش تعامل داشته باشن. دیپمایند میگه این نسخه نسبت به قبل مدت زمان بیشتری امکان گشتوگذار در محیطها رو فراهم میکنه و حتی مکان اشیا رو در حافظه نگه میداره تا وقتی کاربر دوباره به اون نقطه برگرده، جزئیات تغییری نکرده باشن.
مدلهای «جهانساز» (World Models) نوعی سیستم هوش مصنوعی هستن که میتونن برای اهدافی مثل آموزش، سرگرمی یا حتی آموزش رباتها، محیطهای مجازی بسازن. کاربر با دادن یک پرامپت میتونه محیطی شبیه یک بازی ویدئویی ایجاد کنه، با این تفاوت که این دنیا بهجای طراحی دستی با ابزارهای سهبعدی، بهطور کامل با هوش مصنوعی ساخته میشه. گوگل در ماه دسامبر نسخه قبلی یعنی Genie 2 رو معرفی کرده بود که میتونست از روی یک تصویر، دنیایی تعاملی بسازه و حالا تیم ویژه «مدلسازی جهان» رو زیر نظر یکی از مدیران سابق پروژه Sora اوپنایآی توسعه میده.
با این حال، نسخههای قبلی محدودیتهای زیادی داشتن؛ مثلا محیطهای Genie 2 فقط تا حدود یک دقیقه قابل بازی بودن و در بسیاری مواقع جزئیات محیط بهطور غیرمنتظره تغییر میکردن. اما Genie 3 این محدودیت رو بهبود داده و حالا میشه با یک پرامپت، دنیایی ساخت که چند دقیقه تعامل مداوم رو پشتیبانی کنه. همچنین این مدل میتونه برای حدود یک دقیقه، جزئیات محیط رو در حافظه نگه داره؛ یعنی اگر از یک دیوار با نوشته خاص دور بشید و دوباره برگردید، نوشته همونطور باقی میمونه. کیفیت محیطها هم ۷۲۰p و نرخ فریم ۲۴fps خواهد بود.
یکی از قابلیتهای جدید Genie 3، امکان ایجاد رویدادهای جهانمحور با پرامپت هست. مثلا کاربر میتونه تنها با نوشتن یک دستور، شرایط آبوهوایی رو تغییر بده یا شخصیتهای جدید به محیط اضافه کنه. این ویژگی میتونه تجربه تعامل رو برای آموزش یا سرگرمی بسیار متنوعتر کنه.
با این وجود، گوگل فعلا این مدل رو بهصورت پیشنمایش تحقیقاتی محدود ارائه میکنه و فقط گروه کوچکی از پژوهشگرها و خالقان محتوا بهش دسترسی خواهند داشت تا ریسکها و راهکارهای ایمنسازی بهتر بررسی بشه. محدودیتهایی مثل نوع تعامل کاربر با محیطها و دشواری تولید متن خوانا در داخل دنیاهای ساختهشده همچنان وجود داره. گوگل گفته در آینده احتمالا این مدل رو برای آزمایشکنندههای بیشتری در دسترس قرار خواهد داد.
@aipulse24
مدلهای «جهانساز» (World Models) نوعی سیستم هوش مصنوعی هستن که میتونن برای اهدافی مثل آموزش، سرگرمی یا حتی آموزش رباتها، محیطهای مجازی بسازن. کاربر با دادن یک پرامپت میتونه محیطی شبیه یک بازی ویدئویی ایجاد کنه، با این تفاوت که این دنیا بهجای طراحی دستی با ابزارهای سهبعدی، بهطور کامل با هوش مصنوعی ساخته میشه. گوگل در ماه دسامبر نسخه قبلی یعنی Genie 2 رو معرفی کرده بود که میتونست از روی یک تصویر، دنیایی تعاملی بسازه و حالا تیم ویژه «مدلسازی جهان» رو زیر نظر یکی از مدیران سابق پروژه Sora اوپنایآی توسعه میده.
با این حال، نسخههای قبلی محدودیتهای زیادی داشتن؛ مثلا محیطهای Genie 2 فقط تا حدود یک دقیقه قابل بازی بودن و در بسیاری مواقع جزئیات محیط بهطور غیرمنتظره تغییر میکردن. اما Genie 3 این محدودیت رو بهبود داده و حالا میشه با یک پرامپت، دنیایی ساخت که چند دقیقه تعامل مداوم رو پشتیبانی کنه. همچنین این مدل میتونه برای حدود یک دقیقه، جزئیات محیط رو در حافظه نگه داره؛ یعنی اگر از یک دیوار با نوشته خاص دور بشید و دوباره برگردید، نوشته همونطور باقی میمونه. کیفیت محیطها هم ۷۲۰p و نرخ فریم ۲۴fps خواهد بود.
یکی از قابلیتهای جدید Genie 3، امکان ایجاد رویدادهای جهانمحور با پرامپت هست. مثلا کاربر میتونه تنها با نوشتن یک دستور، شرایط آبوهوایی رو تغییر بده یا شخصیتهای جدید به محیط اضافه کنه. این ویژگی میتونه تجربه تعامل رو برای آموزش یا سرگرمی بسیار متنوعتر کنه.
با این وجود، گوگل فعلا این مدل رو بهصورت پیشنمایش تحقیقاتی محدود ارائه میکنه و فقط گروه کوچکی از پژوهشگرها و خالقان محتوا بهش دسترسی خواهند داشت تا ریسکها و راهکارهای ایمنسازی بهتر بررسی بشه. محدودیتهایی مثل نوع تعامل کاربر با محیطها و دشواری تولید متن خوانا در داخل دنیاهای ساختهشده همچنان وجود داره. گوگل گفته در آینده احتمالا این مدل رو برای آزمایشکنندههای بیشتری در دسترس قرار خواهد داد.
@aipulse24
👏18👍6❤🔥4🤯2😍2
از امروز میتونید با اپ جمنای، کتابهای داستانی تصویری و شخصیسازیشده بسازید؛ با روایت صوتی و تصویرسازی اختصاصی. فقط کافیه داستانی که توی ذهنتونه رو توصیف کنید تا جمنای یه کتاب دهصفحهای با تصویر و صدای منحصربهفرد بسازه. حتی میتونید از عکسها و فایلهای شخصیتون هم استفاده کنید تا داستانها حالوهوای واقعیتری بگیرن.
سبک تصویرسازی هم کاملاً به انتخاب شماست، از پیکسلآرت و کمیک گرفته تا استاپموشن، عروسکی، یا حتی کتاب رنگآمیزی، و همه اینا در بیش از ۴۵ زبان مختلف در دسترسه. میتونید برای بچهتون یه داستان آموزنده بسازید، با شخصیت اصلیای که بچهتون دوستش داره. یا مثلاً یه داستان درباره منظومه شمسی که برای یه کودک ۵ ساله قابل فهم باشه. حتی نقاشی بچهتون رو آپلود کنید تا جمنای براش یه داستان تخیلی بسازه.
@aipulse24
سبک تصویرسازی هم کاملاً به انتخاب شماست، از پیکسلآرت و کمیک گرفته تا استاپموشن، عروسکی، یا حتی کتاب رنگآمیزی، و همه اینا در بیش از ۴۵ زبان مختلف در دسترسه. میتونید برای بچهتون یه داستان آموزنده بسازید، با شخصیت اصلیای که بچهتون دوستش داره. یا مثلاً یه داستان درباره منظومه شمسی که برای یه کودک ۵ ساله قابل فهم باشه. حتی نقاشی بچهتون رو آپلود کنید تا جمنای براش یه داستان تخیلی بسازه.
@aipulse24
❤21🤯3👏2👍1😍1
شرکت OpenAI نسل جدید مدل هوش مصنوعی خودش با نام GPT-5 رو معرفی کرده؛ مدلی که قراره قلب تپنده نسخههای آینده ChatGPT باشه. این مدل تازه، نه فقط یک ارتقاء فنی، بلکه یک حرکت مهم در مسیر ساخت هوش مصنوعیهای عاملمحور محسوب میشه؛ یعنی هوشهایی که مثل یک دستیار واقعی میتونن کارهای پیچیده انجام بدن، نه فقط چت کنن.
GPT-5 اولین مدلیه که OpenAI اون رو «یکپارچه» میدونه؛ چون ترکیبیه از توان استدلالی سری o و سرعت پاسخگویی سری GPT. بهکمک این مدل، حالا ChatGPT میتونه وظایفی مثل ساخت اپلیکیشن، بررسی تقویم، یا تولید گزارشهای پژوهشی رو هم برعهده بگیره. از طرفی، کار کردن باهاش سادهتر شده چون GPT-5 خودش تصمیم میگیره چقدر فکر کنه و چطور بهترین پاسخ رو بده.
سم آلتمن، مدیرعامل OpenAI، در جلسه خبری گفته GPT-5 «بهترین مدل دنیاست» و اضافه کرده که این مدل، گام بزرگی بهسوی رسیدن به هوش عمومی مصنوعی (AGI) محسوب میشه؛ یعنی مدلی که بتونه از انسان در بیشتر کارها پیشی بگیره. از امروز همه کاربران رایگان ChatGPT میتونن به GPT-5 دسترسی داشته باشن. این تصمیم، بخشی از هدف OpenAI برای توزیع برابرتر هوش مصنوعیه.
طبق آمار رسمی، ChatGPT حالا بیش از ۷۰۰ میلیون کاربر هفتگی داره و انتظار میره GPT-5 با تواناییهاش، نه فقط برای کاربران عادی، بلکه برای شرکتهای فناوری، بازارهای مالی و سیاستگذاران هم اهمیت پیدا کنه. چون هم بهعنوان نشانهای از پیشرفت AI شناخته میشه و هم میتونه استانداردهای جدیدی برای رقبا تعیین کنه.
از نظر فنی، GPT-5 تونسته عملکرد خیلی خوبی در حوزه کدنویسی داشته باشه. توی آزمون SWE-bench Verified، که مجموعهای از تسکهای واقعی برنامهنویسیه، این مدل با امتیاز ۷۴.۹٪ بالاتر از Claude Opus 4.1 (با ۷۴.۵٪) و Gemini 2.5 Pro (با ۵۹.۶٪) قرار گرفته. توی حوزه علوم هم عملکرد خوبی داشته؛ مثلاً در آزمون GPQA Diamond مربوط به سوالات سطح دکتری، امتیاز ۸۹.۴٪ کسب کرده.
از نظر ایمنی و دقت هم GPT-5 پیشرفت قابل توجهی داشته. نرخ "هذیانگویی" مدل، یعنی زمانی که اطلاعات نادرست ارائه میده، به ۴.۸٪ رسیده؛ عددی که در مدلهای قبلی مثل GPT-4o حدود ۲۰٪ بود. این مدل همچنین در تشخیص درخواستهای خطرناک نسبت به درخواستهای عادی عملکرد بهتری داره و کمتر دچار قضاوت اشتباه میشه.
برای کاربران ChatGPT هم قابلیتهای جدیدی درنظر گرفته شده. حالا میتونید از بین چهار شخصیت جدید (مثل ربات، شنونده، یا شخصیت بدبین و Nerd) یکی رو انتخاب کنید تا مدل متناسب با اون شخصیت باهاتون حرف بزنه. همچنین نسخه Pro با پرداخت ۲۰۰ دلار در ماه امکانات بیشتری مثل دسترسی به GPT-5 Pro رو فراهم میکنه.
در نهایت، GPT-5 با سه نسخه مختلف (Nano، Mini و Base) به API اضافه شده و قیمت پایه اون برای توسعهدهندهها ۱.۲۵ دلار به ازای هر میلیون توکن ورودی اعلام شده. با اینکه GPT-5 در برخی حوزهها مثل تعامل با وبسایتها هنوز به سطح رقبا نرسیده، اما در مجموع میتونه نقطه عطفی در مسیر توسعه هوش مصنوعی باشه. حالا باید دید در دنیای واقعی، عملکردش چقدر با وعدهها همخوانی داره.
@aipulse24
GPT-5 اولین مدلیه که OpenAI اون رو «یکپارچه» میدونه؛ چون ترکیبیه از توان استدلالی سری o و سرعت پاسخگویی سری GPT. بهکمک این مدل، حالا ChatGPT میتونه وظایفی مثل ساخت اپلیکیشن، بررسی تقویم، یا تولید گزارشهای پژوهشی رو هم برعهده بگیره. از طرفی، کار کردن باهاش سادهتر شده چون GPT-5 خودش تصمیم میگیره چقدر فکر کنه و چطور بهترین پاسخ رو بده.
سم آلتمن، مدیرعامل OpenAI، در جلسه خبری گفته GPT-5 «بهترین مدل دنیاست» و اضافه کرده که این مدل، گام بزرگی بهسوی رسیدن به هوش عمومی مصنوعی (AGI) محسوب میشه؛ یعنی مدلی که بتونه از انسان در بیشتر کارها پیشی بگیره. از امروز همه کاربران رایگان ChatGPT میتونن به GPT-5 دسترسی داشته باشن. این تصمیم، بخشی از هدف OpenAI برای توزیع برابرتر هوش مصنوعیه.
طبق آمار رسمی، ChatGPT حالا بیش از ۷۰۰ میلیون کاربر هفتگی داره و انتظار میره GPT-5 با تواناییهاش، نه فقط برای کاربران عادی، بلکه برای شرکتهای فناوری، بازارهای مالی و سیاستگذاران هم اهمیت پیدا کنه. چون هم بهعنوان نشانهای از پیشرفت AI شناخته میشه و هم میتونه استانداردهای جدیدی برای رقبا تعیین کنه.
از نظر فنی، GPT-5 تونسته عملکرد خیلی خوبی در حوزه کدنویسی داشته باشه. توی آزمون SWE-bench Verified، که مجموعهای از تسکهای واقعی برنامهنویسیه، این مدل با امتیاز ۷۴.۹٪ بالاتر از Claude Opus 4.1 (با ۷۴.۵٪) و Gemini 2.5 Pro (با ۵۹.۶٪) قرار گرفته. توی حوزه علوم هم عملکرد خوبی داشته؛ مثلاً در آزمون GPQA Diamond مربوط به سوالات سطح دکتری، امتیاز ۸۹.۴٪ کسب کرده.
از نظر ایمنی و دقت هم GPT-5 پیشرفت قابل توجهی داشته. نرخ "هذیانگویی" مدل، یعنی زمانی که اطلاعات نادرست ارائه میده، به ۴.۸٪ رسیده؛ عددی که در مدلهای قبلی مثل GPT-4o حدود ۲۰٪ بود. این مدل همچنین در تشخیص درخواستهای خطرناک نسبت به درخواستهای عادی عملکرد بهتری داره و کمتر دچار قضاوت اشتباه میشه.
برای کاربران ChatGPT هم قابلیتهای جدیدی درنظر گرفته شده. حالا میتونید از بین چهار شخصیت جدید (مثل ربات، شنونده، یا شخصیت بدبین و Nerd) یکی رو انتخاب کنید تا مدل متناسب با اون شخصیت باهاتون حرف بزنه. همچنین نسخه Pro با پرداخت ۲۰۰ دلار در ماه امکانات بیشتری مثل دسترسی به GPT-5 Pro رو فراهم میکنه.
در نهایت، GPT-5 با سه نسخه مختلف (Nano، Mini و Base) به API اضافه شده و قیمت پایه اون برای توسعهدهندهها ۱.۲۵ دلار به ازای هر میلیون توکن ورودی اعلام شده. با اینکه GPT-5 در برخی حوزهها مثل تعامل با وبسایتها هنوز به سطح رقبا نرسیده، اما در مجموع میتونه نقطه عطفی در مسیر توسعه هوش مصنوعی باشه. حالا باید دید در دنیای واقعی، عملکردش چقدر با وعدهها همخوانی داره.
@aipulse24
1👍20❤11
This media is not supported in your browser
VIEW IN TELEGRAM
جمنای قابلیت جدیدی به نام Guided Learning رو معرفی کرده که برای کمک به یادگیری عمیقتر طراحی شده و به جای دادن یک جواب کوتاه، مسائل رو مرحلهبهمرحله توضیح میده و با پرسشهای باز، کاربر رو وارد فرایند یادگیری میکنه.
Guided Learning میتونه با استفاده از متن، تصویر، ویدئو، نمودار و کوییز تعاملی، یادگیری رو متنوعتر کنه. این قابلیت بر پایه مدلهای ویژه آموزش گوگل به نام LearnLM ساخته شده که با همکاری معلمها و متخصصان آموزشی توسعه پیدا کرده.
به گفته گوگل، این ابزار میتونه برای آمادگی امتحان، نوشتن تحقیق یا حتی یادگیری مهارتهای شخصی استفاده بشه و معلمها هم میتونن لینک مستقیمش رو در کلاسهای آنلاین به اشتراک بذارن. گوگل گفته هدف اینه که با Guided Learning، مسیر یادگیری برای کاربران در هر سطحی سادهتر و مؤثرتر بشه.
@aipulse24
Guided Learning میتونه با استفاده از متن، تصویر، ویدئو، نمودار و کوییز تعاملی، یادگیری رو متنوعتر کنه. این قابلیت بر پایه مدلهای ویژه آموزش گوگل به نام LearnLM ساخته شده که با همکاری معلمها و متخصصان آموزشی توسعه پیدا کرده.
به گفته گوگل، این ابزار میتونه برای آمادگی امتحان، نوشتن تحقیق یا حتی یادگیری مهارتهای شخصی استفاده بشه و معلمها هم میتونن لینک مستقیمش رو در کلاسهای آنلاین به اشتراک بذارن. گوگل گفته هدف اینه که با Guided Learning، مسیر یادگیری برای کاربران در هر سطحی سادهتر و مؤثرتر بشه.
@aipulse24
❤🔥31❤7👍4🔥2
گوگل اعلام کرد ابزار هوش مصنوعی برنامهنویسی «Jules» بعد از دو ماه آزمایش عمومی از حالت بتا خارج شده. این ابزار با مدل Gemini 2.5 Pro کار میکنه، با گیتهاب یکپارچه میشه و میتونه روی ماشین مجازی گوگل کد رو اصلاح یا بهروزرسانی کنه، حتی وقتی کاربر حضور نداره.
با عرضه عمومی، نسخه رایگان روزانه ۱۵ تسک و سه تسک همزمان رو پشتیبانی میکنه. پلنهای پولی Google AI Pro و Ultra بهترتیب با قیمت ۱۹.۹۹ و ۱۲۴.۹۹ دلار، سقف استفاده رو پنج و بیست برابر بیشتر میکنن. سیاست حریم خصوصی هم شفافتر شده و داده مخزن خصوصی برای آموزش استفاده نمیشه.
«Jules» بهصورت Asynchronous کار میکنه و این هفته قابلیت باز کردن خودکار Pull Request و ویژگی «Environment Snapshots» رو دریافت کرده. از زمان بتا، بیش از ۲.۲۸ میلیون بازدید داشته که ۴۵ درصدش از موبایل بوده و گوگل قصد داره امکانات بیشتری برای این کاربران توسعه بده.
از طریق این لینک میتونید به این ابزار دسترسی داشته باشید.
@aipulse24
با عرضه عمومی، نسخه رایگان روزانه ۱۵ تسک و سه تسک همزمان رو پشتیبانی میکنه. پلنهای پولی Google AI Pro و Ultra بهترتیب با قیمت ۱۹.۹۹ و ۱۲۴.۹۹ دلار، سقف استفاده رو پنج و بیست برابر بیشتر میکنن. سیاست حریم خصوصی هم شفافتر شده و داده مخزن خصوصی برای آموزش استفاده نمیشه.
«Jules» بهصورت Asynchronous کار میکنه و این هفته قابلیت باز کردن خودکار Pull Request و ویژگی «Environment Snapshots» رو دریافت کرده. از زمان بتا، بیش از ۲.۲۸ میلیون بازدید داشته که ۴۵ درصدش از موبایل بوده و گوگل قصد داره امکانات بیشتری برای این کاربران توسعه بده.
از طریق این لینک میتونید به این ابزار دسترسی داشته باشید.
@aipulse24
❤16🔥4
انتروپیک قابلیت جدیدی به نام «بازبینی امنیتی خودکار» رو به ابزار Claude Code اضافه کرده. این ویژگی با استفاده از یک دستور جدید به نام /security-review و همچنین یک اکشن GitHub، به توسعهدهندهها کمک میکنه تا مشکلات امنیتی کد رو پیدا و رفع کنن. ایده اینه که امنیت کد از همون مراحل اولیه توسعه بررسی بشه تا آسیبپذیریها قبل از رسیدن به محیط عملیاتی شناسایی و برطرف بشن.
با دستور /security-review میشه از داخل ترمینال، بدون نیاز به کامیت کردن کد، یک بررسی امنیتی انجام داد. این بررسی به دنبال الگوهای رایج آسیبپذیری مثل تزریق SQL، XSS، مشکلات احراز هویت و مجوزدهی، مدیریت ناامن داده و باگهای Dependency ها میگرده. بعد از شناسایی مشکلات، Claude Code میتونه خودش پیشنهاد رفع یا حتی اصلاح مستقیم اونها رو ارائه بده.
اکشن جدید GitHub این فرایند رو خودکارتر میکنه. به محض باز شدن یک Pull Request، کد تغییر یافته رو بررسی میکنه، طبق قوانین قابل تنظیم، موارد مشکوک رو فیلتر یا علامتگذاری میکنه و نتایج رو بهصورت کامنت داخل PR میذاره. این باعث میشه تیمها یک فرایند امنیتی ثابت و متمرکز داشته باشن و هیچ کدی بدون بررسی امنیتی به مرحله انتشار نرسه.
انتروپیک میگه خودش هم از این قابلیتها برای بررسی امنیتی کدهای داخلی، حتی Claude Code، استفاده میکنه. به گفته اونها، همین ابزار تونسته آسیبپذیریهایی مثل امکان اجرای کد از راه دور از طریق DNS rebinding و همچنین ضعف در برابر حملات SSRF رو قبل از انتشار پیدا و رفع کنه.
هر دو قابلیت الان برای همه کاربران Claude Code فعال هستن. برای استفاده از دستور /security-review کافیه آخرین نسخه رو نصب و دستور رو در پوشه پروژه اجرا کنید. برای اکشن GitHub هم راهنمای نصب و پیکربندی در مخزن رسمی انتروپیک موجوده.
@aipulse24
با دستور /security-review میشه از داخل ترمینال، بدون نیاز به کامیت کردن کد، یک بررسی امنیتی انجام داد. این بررسی به دنبال الگوهای رایج آسیبپذیری مثل تزریق SQL، XSS، مشکلات احراز هویت و مجوزدهی، مدیریت ناامن داده و باگهای Dependency ها میگرده. بعد از شناسایی مشکلات، Claude Code میتونه خودش پیشنهاد رفع یا حتی اصلاح مستقیم اونها رو ارائه بده.
اکشن جدید GitHub این فرایند رو خودکارتر میکنه. به محض باز شدن یک Pull Request، کد تغییر یافته رو بررسی میکنه، طبق قوانین قابل تنظیم، موارد مشکوک رو فیلتر یا علامتگذاری میکنه و نتایج رو بهصورت کامنت داخل PR میذاره. این باعث میشه تیمها یک فرایند امنیتی ثابت و متمرکز داشته باشن و هیچ کدی بدون بررسی امنیتی به مرحله انتشار نرسه.
انتروپیک میگه خودش هم از این قابلیتها برای بررسی امنیتی کدهای داخلی، حتی Claude Code، استفاده میکنه. به گفته اونها، همین ابزار تونسته آسیبپذیریهایی مثل امکان اجرای کد از راه دور از طریق DNS rebinding و همچنین ضعف در برابر حملات SSRF رو قبل از انتشار پیدا و رفع کنه.
هر دو قابلیت الان برای همه کاربران Claude Code فعال هستن. برای استفاده از دستور /security-review کافیه آخرین نسخه رو نصب و دستور رو در پوشه پروژه اجرا کنید. برای اکشن GitHub هم راهنمای نصب و پیکربندی در مخزن رسمی انتروپیک موجوده.
@aipulse24
❤22😍5🏆3
شرکت انتروپیک قابلیت «حافظه» رو به چتبات خودش، Claude، اضافه کرده تا کاربران بتونن راحتتر مکالمات و پروژههاشون رو از جایی که قبلاً رها کرده بودن ادامه بدن. این قابلیت باعث میشه Claude بتونه به چتهای قبلی کاربر (وقتی که ازش خواسته میشه) رجوع کنه، بنابراین دیگه لازم نیست کاربر دوباره همه چیز رو توضیح بده.
در ویدئوی دموی منتشرشده توسط انتروپیک، کاربری از Claude پرسید قبل از تعطیلات روی چه کاری مشغول بوده و Claude با جستجو در مکالمات قدیمی، فهرست موضوعات، خلاصه کارها و پیشنهاد ادامه پروژه رو ارائه داد. این قابلیت فعلاً برای مشترکان نسخههای Max، Team و Enterprise روی وب، دسکتاپ و موبایل فعال میشه و امکان جدا نگهداشتن پروژهها و فضاهای کاری مختلف رو هم داره.
انتروپیک اعلام کرده که با این ویژگی «دیگه هیچوقت روند کارتون رو گم نمیکنید» و میتونید بدون شروع از صفر، پروژهها رو ادامه بدید یا به بحثهای قبلی رجوع کنید. برای فعالکردنش باید به بخش Settings، قسمت Profile برید و گزینه جستجو و ارجاع به چتها رو روشن کنید.
البته انتروپیک تأکید کرده که این قابلیت با شبیه به چیزی که در حافظه ChatGPT میبینیم فرق داره و Claude بهطور خودکار همه گفتهها رو ذخیره یا پروفایل شخصی کاربر رو ایجاد نمیکنه؛ بلکه فقط وقتی کاربر بخواد، به مکالمات قبلی مراجعه میکنه.
@aipulse24
در ویدئوی دموی منتشرشده توسط انتروپیک، کاربری از Claude پرسید قبل از تعطیلات روی چه کاری مشغول بوده و Claude با جستجو در مکالمات قدیمی، فهرست موضوعات، خلاصه کارها و پیشنهاد ادامه پروژه رو ارائه داد. این قابلیت فعلاً برای مشترکان نسخههای Max، Team و Enterprise روی وب، دسکتاپ و موبایل فعال میشه و امکان جدا نگهداشتن پروژهها و فضاهای کاری مختلف رو هم داره.
انتروپیک اعلام کرده که با این ویژگی «دیگه هیچوقت روند کارتون رو گم نمیکنید» و میتونید بدون شروع از صفر، پروژهها رو ادامه بدید یا به بحثهای قبلی رجوع کنید. برای فعالکردنش باید به بخش Settings، قسمت Profile برید و گزینه جستجو و ارجاع به چتها رو روشن کنید.
البته انتروپیک تأکید کرده که این قابلیت با شبیه به چیزی که در حافظه ChatGPT میبینیم فرق داره و Claude بهطور خودکار همه گفتهها رو ذخیره یا پروفایل شخصی کاربر رو ایجاد نمیکنه؛ بلکه فقط وقتی کاربر بخواد، به مکالمات قبلی مراجعه میکنه.
@aipulse24
❤15🔥2🍓2