اخبار هوش مصنوعی
2.83K subscribers
672 photos
354 videos
1.01K files
1.36K links
Download Telegram
Forwarded from AI Pulse (Mohammad)
روز سه‌شنبه، OpenAI ابزارهای جدیدی رو معرفی کرد که به توسعه‌دهندگان و شرکت‌ها کمک می‌کنه تا ایجنت‌های هوش مصنوعی - سیستم‌های خودکاری که می‌تونن مستقلاً وظایف رو انجام بدن - با استفاده از مدل‌ها و چارچوب‌های خود این شرکت بسازن. این ابزارها بخشی از Responses API جدید OpenAI هستن که به کسب‌وکارها اجازه می‌ده ایجنت‌های هوش مصنوعی سفارشی رو توسعه بدن که می‌تونن جستجوی وب انجام بدن، فایل‌های شرکت رو اسکن کنن و در وب‌سایت‌ها گشت‌وگذار کنن، درست مثل محصول Operator این شرکت. Responses API عملاً جایگزین Assistants API میشه که قراره در نیمه اول سال ۲۰۲۶ کنار گذاشته بشه.

محبوبیت ایجنت‌های هوش مصنوعی در سال‌های اخیر به‌طور چشمگیری افزایش پیدا کرده، علی‌رغم اینکه شرکت‌های هوش مصنوعی در نشون دادن یا حتی تعریف کردن اینکه "ایجنت‌های هوش مصنوعی" واقعاً چی هستن، با مشکل مواجه شدن. در جدیدترین نمونه از پیشی گرفتن تبلیغات از کاربرد واقعی، استارتاپ چینی Butterfly Effect اوایل این هفته با پلتفرم ایجنت هوش مصنوعی جدیدی به نام Manus در فضای مجازی محبوب شد که کاربران سریعاً کشف کردن این پلتفرم بسیاری از وعده‌های شرکت رو محقق نمی‌کنه.

اولیویه گودمان، مدیر محصول API در OpenAI، در مصاحبه‌ای به TechCrunch گفته: "نمایش دادن ایجنت هوش مصنوعی خیلی آسونه. اما مقیاس‌پذیر کردن یک ایجنت خیلی سخته، و اینکه مردم رو ترغیب کنی اغلب از اون استفاده کنن هم خیلی دشواره." اوایل امسال، OpenAI دو ایجنت هوش مصنوعی رو در ChatGPT معرفی کرد: Operator که از طرف شما در وب‌سایت‌ها گردش می‌کنه و Deep Research که گزارش‌های تحقیقاتی رو برای شما تهیه می‌کنه. هر دو ابزار نگاهی کلی به چیزی که ایجنت ها قادر به انجامش هستن ارائه دادن، اما در بخش "خودمختاری" چیزهای زیادی برای بهبود وجود داره.

حالا با Responses API، شرکت OpenAI می‌خواد دسترسی به ابزارهای سازنده ایجنت‌های هوش مصنوعی رو فراهم کنه و به توسعه‌دهندگان اجازه بده ایجنت‌هایی مشابه Operator و Deep Research رو بسازن. OpenAI امیدواره که توسعه‌دهندگان بتونن با استفاده از فناوری ایجنت‌های این شرکت، برنامه‌هایی بسازن که نسبت به آنچه امروز در دسترسه، خودمختارتر به نظر برسن. با استفاده از Responses API، توسعه‌دهندگان می‌تونن به همون مدل‌های هوش مصنوعی که در پشت صحنه ابزار جستجوی وب ChatGPT Search استفاده میشه، دسترسی پیدا کنن یعنی GPT-4o search و GPT-4o mini search. این مدل‌ها می‌تونن برای یافتن پاسخ سؤالات در وب جستجو کنن و هنگام تولید پاسخ‌ها به منابع استناد کنن.

این شرکت ادعا میکنه قابلیت سرچ مدل‌های GPT-4o و GPT-4o mini بسیار دقیق و قابل اتکا هستن. در بنچمارک SimpleQA که توانایی مدل‌ها برای پاسخ به سوالات کوتاه اما چالش برانگیز و متکی به واقعیت رو میسنجه، مدل GPT-4o و GPT-4o mini تونستن به ترتیب ۹۰٪ و ۸۸٪ امتیاز رو کسب کنن درحالی که مدل GPT-4.5 نتونسته بیشتر از ۶۳٪ امتیاز بگیره.

شرکت OpenAI همچنین یک جعبه ابزار اوپن سورس به نام Agents SDK رو منتشر می‌کنه که به توسعه‌دهندگان ابزارهای رایگانی ارائه می‌ده تا مدل‌ها رو با سیستم‌های داخلیشون ادغام کنن، تمهیدات ایمنی رو به کار بگیرن و فعالیت‌های ایجنت هوش مصنوعی رو برای اشکال‌زدایی و بهینه‌سازی نظارت کنن. گودمان گفته امیدواره OpenAI بتونه امسال شکاف بین ایجنت‌های نمایشی هوش مصنوعی و محصولات واقعی رو پر کنه و به نظر اون، "ایجنت‌ها تأثیرگذارترین کاربرد هوش مصنوعی خواهند بود که اتفاق خواهد افتاد." این حرف بازتاب اعلامیه سم آلتمن، مدیرعامل OpenAI، در ژانویه است که ۲۰۲۵ سالیه که از ایجنت‌های هوش مصنوعی به عنوان نیروی کار استفاده میشه.

@aipulse24
This media is not supported in your browser
VIEW IN TELEGRAM
Video-to-audio
یک ویژگی جدید برای تبدیل ویدیو به صدا معرفی شده است! این ابزار هوش مصنوعی می‌تواند ویدیوهای شما را به‌طور خودکار صداگذاری کند. فقط کافی است دکمه Audio را در این سرویس فشار دهید تا هوش مصنوعی، صدای مناسب را برای ویدیوی شما انتخاب کند.

اگر بخواهید کنترل بیشتری داشته باشید، می‌توانید یک توضیح متنی اضافه کنید تا هوش مصنوعی صدا و حس و حال دلخواه شما را ایجاد کند.

این قابلیت در مرحله آزمایشی (بتا) قرار دارد و برای همه رایگان است.

https://lumalabs.ai/dream-machine

#هوش_مصنوعی
NINJACHAT.AI – برنامه دانشجویی
APP.HEYGEN.COM – ترجمه ویدیوها
QUIVER – تولید مقاله
SLIDESGPT.COM – ارائه‌ساز
QWEN – جایگزین چت جی پی تی
CHATPDF – خلاصه کردن پی‌دی‌اف‌ها
LETSENHANCE.IO – افزایش کیفیت عکس
SUNO.COM – ساخت موزیک
PROMPTIFY.AI – ساخت پرامپت
MATHGPTPRO.COM – حل مسائل ریاضی
APP.CHATHUB.GG – موتور جستجوی چت‌بات‌ها
AILOGOMAKER.IO – طراحی لوگو با هوش مصنوعی
PI.AI – یادگیری انگلیسی
PODCAST.ADOBE – افزایش کیفیت صدا
MAGICERASER – حذف اشیا از عکس
AIHOMEDESIGN – دکوراسیون داخلی
IMAGECOLORIZER – بازسازی عکس قدیمی
DONOTPLAY – وکیل هوش مصنوعی


معرفی 18 ابزار #هوش_مصنوعی
Virtual House Flip
(بازسازی مجازی خانه) با استفاده از #هوش_مصنوعی ، فقط با یک عکس، آگهی فروش ملک شما را متحول می‌کند. این ابزار هم برای طراحی داخلی و هم نمای خارجی ساختمان قابل استفاده است و به شما امکان می‌دهد فضاهای مختلف را با نتایج چشمگیر و الهام‌گرفته از معماران و طراحان داخلی برجسته دنیا، بازسازی کنید.

https://www.virtualhouseflip.com/
This media is not supported in your browser
VIEW IN TELEGRAM
Mojo AI
#هوش_مصنوعی برای متحرک‌سازی لوگوها

بدون نیاز به ثبت‌نام و کاملاً رایگان، می‌توانید از این سرویس استفاده کنید. در عرض چند دقیقه، چندین گزینه مختلف برای انیمیشن لوگوی خود دریافت خواهید کرد. کافی است وارد سایت شوید، یک نمونه (رفرنس) ارائه دهید، یکی از چهار قالب موجود را انتخاب کنید و منتظر بمانید. این ابزار با تصاویر چهره انسان و حیوانات نیز بدون مشکل کار می‌کند.

https://mojo-app.com/ai
This media is not supported in your browser
VIEW IN TELEGRAM
Same dev

"با این سرویس، کپی کردن وب‌سایت‌ها مثل آب خوردن است! فقط کافیه لینک وب‌سایت مورد نظرتون رو وارد کنید و کمی صبر کنید. ربات ما کل کد اون سایت رو زیر و رو می‌کنه و یک کپی تقریباً مو به مو بهتون تحویل می‌ده، طوری که کسی نمی‌تونه ایرادی ازش بگیره."

https://same.dev/chat
This media is not supported in your browser
VIEW IN TELEGRAM
alphaXiv

آلفاایکس‌آی‌وی (alphaXiv): آرشیوی از مقالات علمی با کمک #هوش_مصنوعی .
این (آلفاایکس‌آی‌وی) کمک می‌کنه حتی پیچیده‌ترین مقالات رو هم بفهمید، انگار که برای یک بچه پنج ساله نوشته شده باشند.

https://www.alphaxiv.org/explore
Currents AI

کارنتس ای‌آی (Currents AI): موتور جستجوی ترندها
یه هوش مصنوعی رو تصور کنید که شبانه‌روز و به صورت لحظه‌ای شبکه‌های اجتماعی رو بررسی می‌کنه و گزارش‌های تصویری و واضحی از ترندهای روز رو همون لحظه به شما نشون می‌ده. این دقیقاً همون کاریه که این ابزار انجام می‌ده! این سرویس تحقیقات عمیق انجام می‌ده، بحث‌ها و نظرات رو در پلتفرم‌های مختلف تحلیل می‌کنه. برای کسب‌وکارها خیلی مفیده: می‌تونید رقبای خودتون، مشکلات و نقاط ضعفشون رو به شکل مؤثری ارزیابی کنید.
یه پلن رایگان هم داره! توی این پلن، دسترسی دارید به:
* تحقیقات عمیق بین پلتفرمی بدون محدودیت زمانی
* جستجوهای رایگان و نامحدود برای تحقیقات بازاریابی
* مانیتورینگ 24 ساعته و لحظه‌ای بازار
* خلاصه‌های دقیق مبتنی بر هوش مصنوعی با تحلیل اولیه نظرات
امکانات پیشرفته‌تر هم با پرداخت هزینه اشتراک در دسترس هستند.
#هوش_مصنوعی

https://www.currents.one/en
تو قسمت نتیجه‌گیری مقاله ماشین لرنینگ نوشتن ما هیچ توضیحی برای اینکه چرا این مدلها خوب کار میکنن نداریم جز لطف الهی😂😂😂
#طنز
Forwarded from DLeX: AI Python (NaviD DariYa)
@ai_python

دیگه مستقیم خود دیتا رو 2 دستی تقدیم چت جی پی تی کنیم که Regression هم برامون انجام بده. 🔍
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Geek Alerts
ویژگی Gems در جمنای رایگان شد

این ویژگی Gems اجازه میده یه نسخه شخصی‌سازی شده از جمنای بسازی، یه جورایی چت‌بات اختصاصی خودت رو داشته باشی، مثلا باهاش جمنای رو تبدیل کنی به یه مترجم که بدونه هر بار وقتی بهش پیام میدی باید پیام‌هاتو ترجمه کنه.

🔗 gemini.google.com
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Geek Alerts
ویژگی Deep Research جمنای گوگل رایگان شد

این ویژگی که قبلا فقط کاربرهای اشتراک پولی بهش دسترسی داشتن کارش اینه که توی اینترنت میگرده، براتون تحقیق میکنه و نتیجه‌رو توی یه گزارش بهتون اعلام میکنه، برای وقت‌هایی که میتونید برای گرفتن جواب کمی صبر کنید ولی یه جواب طولانی و کامل میخواید بهترین گزینه هست.

🔗 gemini.google.com
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Deep Learning for Vídeo Understanding.pdf
17.1 MB
Deep Learning for Vídeo Understanding ( Zuxuan Wu & Yu-Gang Jiang ). Springer 2024
گوگل همچنین بالاخره قابلیت ساخت عکس با هوش مصنوعی Gemini 2.0 Flash رو هم فعال کرده که قابلیتهای متمایزی نسبت به دیگر مدلهای ساخت عکس داره.

برخلاف دیگر هوش مصنوعیها از جمله میدجرنی و فلاکس که مدل diffusion هست، گوگل یکی از اولین شرکتهایی که مدل ساخت عکس رو برای یک مدل زبانی بزرگ (LLM) فعال کرده به طوری که وقتی ازش خواسته بشه که عکس بسازه، این هوش مصنوعی به مدل دیگه ای که برای ساخت عکس طراحی شده، وصل نمیشه بلکه خودش ذاتا امکان تولید عکس رو داره.

چنین قابلیتی به این مدل امکانات متمایزی میده که از جمله اونها این هست چون یک مدل LLM هست، اطلاعاتی زیادی در مورد جهان داره و دستورات متنی کاربر رو خیلی بهتر از دیگر مدلها میتونه متوجه بشه و دقت بالایی در ساخت عکسها براساس پرامپت کاربر داره.

علاوه بر این در ایجاد تغییرات روی یک عکس ورودی هم بهتر از بقیه عمل میکنه به طوری که وقتی ازش خواسته میشه یک دستور پخت غذا رو بنویسه، این مدل میتونه برای هر مرحله اون عکس قبلی رو تغییر بده و فقط موادی که به اون غذا در هر مرحله اضافه میشه رو به عکس اضافه کنه.

همچنین در ساخت تصاویر با نوشته های طولانی هم خوب عمل میکنه و این نوشته ها عمدتا غلطهای املایی کمتری نسبت به بقیه مدلها دارن.

این هوش مصنوعی از حالا به صورت رایگان از طریق پلتفرم Google AI Studio با انتخاب مدل Gemini 2.0 Flash Experimental و قرار دادن output format روی images and text قابل استفاده هست.

🔎 venturebeat

📍 @TechTube
بروزرسانی جمنای

دسترسی رایگان به ویژگی Deep Research در جمنای

ویژگی Deep Research که قبلاً فقط برای کاربران اشتراک پولی در دسترس بود، حالا برای همه رایگان شده. این قابلیت به شما کمک می‌کند تا جستجوی عمیقی در اینترنت انجام دهید، اطلاعات را پردازش کنید و گزارشی جامع دریافت کنید. اگر برای دریافت پاسخی دقیق و کامل کمی زمان دارید، این ابزار گزینه‌ای عالی است.

مدل Flash Thinking 2.0 رایگان شد

نسخه جدید این مدل با قابلیت‌های بهبودیافته منتشر شده. حالا امکان آپلود فایل‌ها را دارید، سرعت پردازش افزایش پیدا کرده و استدلال بهتری ارائه می‌دهد. این نسخه ارتقایافته را می‌توانید به رایگان در جمنای امتحان کنید.

ویژگی Gems به شما اجازه می‌دهد که یک نسخه شخصی‌سازی‌شده از جمنای بسازید. این یعنی می‌توانید جمنای را به یک چت‌بات اختصاصی تبدیل کنید که وظایف خاصی را مطابق نیاز شما انجام دهد، مثلاً مترجمی که همیشه پیام‌های شما را ترجمه کند.

https://gemini.google.com/app