اخبار هوش مصنوعی
2.78K subscribers
688 photos
378 videos
1.01K files
1.39K links
Download Telegram
Runway Aleph


فتوشاپ #هوش_مصنوعی برای ویدیو!

فقط کافیه ویدیوتو آپلود کنی و بنویسی چی می‌خوای عوض شه. همین! خروجی میشه یه ویدیوی با کیفیت عجیب غریب با افکت‌هایی در حد فیلم‌های هالیوودی.
چه بخوای یه شیء خاصو تغییر بدی، چه پس‌زمینه، نور یا حتی آب‌وهوا، همش رو خفن و دقیق انجام میده.

یه نمونه جالبش: یه صحنه از فیلم «ماتریکس» رو گذاشتن وسط استخر، و از یه دختر فقط چشمش مونده بعد از ادیت!

https://runwayml.com/research/introducing-runway-aleph
1
This media is not supported in your browser
VIEW IN TELEGRAM
ایدئوگرام یه قابلیت جدید داده بیرون به اسم Character.
می‌تونی باهاش عکسای خفن با صورت خودت بسازی.

– کیفیت چهره واقعاً بالاست،
– رایگانه: روزی ۱۰ تا تصویر می‌تونی بسازی.
– عالیه واسه پوسترای شبکه‌های اجتماعی یا تبلیغات.

http://ideogram.ai/character

#هوش_مصنوعی
🚀 جینی ۳ – نسل جدید مدل‌های دنیاساز گوگل

🎮 مدل‌های دنیاساز (World Model) در واقع نوعی موتور بازی عصبی هستند که به هوش مصنوعی اجازه می‌دهند در یک دنیای شبیه‌سازی‌شده و خیالی حرکت کرده و با آن تعامل داشته باشند.

🆚 تفاوت با نسل قبل (جینی ۲):

⏱️ نسخه قبلی فقط ۱۰ تا ۲۰ ثانیه شبیه‌سازی داشت

📺 وضوح تصویر ۳۶۰p بود

🎮 تعامل با محیط بسیار محدود بود


جینی ۳ چه تغییراتی دارد؟

⏱️ امکان تعامل برای چند دقیقه

📺 وضوح تصویر ۷۲۰p

🧠 حافظه قوی‌تر برای یادآوری اتفاقات و تعاملات کاربر


📌 در یکی از دموها، کاربر دیوار اتاق را رنگ می‌کند، کمی در اتاق حرکت می‌کند و رنگ همچنان روی دیوار باقی می‌ماند!
در حالی که کمتر از یک سال پیش، مدل‌های مشابه مثل «ماینکرفت عصبی» فقط کافی بود لحظه‌ای رویشان برنگردید تا کل محیط را فراموش کنند!

🔥 حالا این مدل‌ها قادرند نه‌تنها محیط، بلکه رویدادها و اتفاقات داخل آن محیط را هم شبیه‌سازی کنند.
این یعنی می‌توان از آن‌ها برای آموزش هوش مصنوعی‌های پیشرفته جهت انجام کارهای واقعی استفاده کرد.

🎮 صنعت بازی نخستین بهره‌بردار این فناوری است.
🔥1
🚀 نسخه جدید Claude Opus 4.1 منتشر شد!

📈 یک جهش کوچک اما چشمگیر در تمامی تست‌ها، و همه اینها با همان قیمت قبلی!
👨‍💻 تست‌کننده‌ها می‌گویند که نسخه به‌روزرسانی شده Opus بهتر روی کدبیس‌های بزرگ و بازسازی‌های پیچیده عمل می‌کند.

😂 نکته جالب: یکی از شرکت‌هایی که دسترسی زودهنگام به این نسخه را دارد، Windsurf است؛ شرکتی که فقط چند ماه پیش Anthropic دسترسی آن‌ها به API رسمی را قطع کرده بود!

این مدل اکنون در اشتراک‌ها، API و Claude Code در دسترس است.
من شخصاً خیلی از Anthropic خوشم می‌آید چون دسترسی به مدل‌هایشان را همیشه سریع و بدون انتظارهای طولانی باز می‌کنند، بر خلاف OpenAI که معمولاً هفته‌ها زمان برای انتشار می‌گذارد.
🚀 مدل‌های متن‌باز جدید OpenAI منتشر شد: GPT OSS!
بعد از مدت‌ها انتظار، OpenAI اولین مدل‌های بزرگ زبان (LLM) متن‌باز خود را با نام GPT OSS معرفی کرد.
این مدل‌ها مبتنی بر معماری MoE هستند و در دو اندازه عرضه شده‌اند:
۲۰ میلیارد پارامتر (با ۳.۶ میلیارد پارامتر فعال)
۱۲۰ میلیارد پارامتر (با ۵.۱ میلیارد پارامتر فعال)
مدل بزرگ عملکرد بهتری نسبت به مدل (o4-mini) دارد و مدل کوچک در حد و اندازه مدل (o3-mini) است.
نسخه‌های بومی (fp4) برای این مدل‌ها وجود دارد که اجرای مدل ۲۰ میلیارد پارامتر تنها به ۱۶ گیگابایت حافظه ویدئویی نیاز دارد.
مجوز استفاده این مدل‌ها (Apache 2.0) است.
نکته منفی: پشتیبانی نکردن از چندرسانه‌ای بودن (مولتی‌مدالیته) در این نسخه‌ها است.
🔥 این اولین مدل بزرگ زبان متن‌باز از OpenAI پس از ۶ سال، یعنی از زمان (GPT-2) به این طرف است!
🔗 وزن مدل ۱۲۰ میلیارد پارامتر
🔗 وزن مدل ۲۰ میلیارد پارامتر
🔗 دموی مدل
🚀 مدل‌های متن‌باز جدید OpenAI منتشر شد: GPT OSS!
بعد از مدت‌ها انتظار، OpenAI اولین مدل‌های بزرگ زبان (LLM) متن‌باز خود را با نام GPT OSS معرفی کرد.
این مدل‌ها مبتنی بر معماری MoE هستند و در دو اندازه عرضه شده‌اند:
۲۰ میلیارد پارامتر (با ۳.۶ میلیارد پارامتر فعال)
۱۲۰ میلیارد پارامتر (با ۵.۱ میلیارد پارامتر فعال)
مدل بزرگ عملکرد بهتری نسبت به مدل (o4-mini) دارد و مدل کوچک در حد و اندازه مدل (o3-mini) است.
نسخه‌های بومی (fp4) برای این مدل‌ها وجود دارد که اجرای مدل ۲۰ میلیارد پارامتر تنها به ۱۶ گیگابایت حافظه ویدئویی نیاز دارد.
مجوز استفاده این مدل‌ها (Apache 2.0) است.
نکته منفی: پشتیبانی نکردن از چندرسانه‌ای بودن (مولتی‌مدالیته) در این نسخه‌ها است.
🔥 این اولین مدل بزرگ زبان متن‌باز از OpenAI پس از ۶ سال، یعنی از زمان (GPT-2) به این طرف است!
🔗 وزن مدل ۱۲۰ میلیارد پارامتر
🔗 وزن مدل ۲۰ میلیارد پارامتر
🔗 دموی مدل
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ عملکرد GPT-OSS 120B روی Cerebras

مدل GPT-OSS 120B توانایی تولید ۳۰۰۰ توکن در ثانیه روی سخت‌افزار Cerebras را دارد.

💰 قیمت‌ها منطقی و مناسب هستند:

حدود ۰.۲۵ تا ۰.۶۹ دلار برای هر میلیون توکن
این قیمت نسبت به ارائه‌دهندگان GPU کمی بالاتر است، اما سرعت اجرا ده‌ها برابر بیشتر است.


شرکت Groq نیز این مدل را اجرا کرده، اما نتایج به این اندازه چشمگیر نیست:

برای مدل 120B، حدود ۵۰۰ توکن در ثانیه (قیمت: ۰.۱۵ تا ۰.۷۵ دلار برای هر میلیون توکن)

برای مدل 20B، حدود ۱۰۰۰ توکن در ثانیه (قیمت: ۰.۱ تا ۰.۵ دلار برای هر میلیون توکن)


برای اطلاعات بیشتر:
🌐 inference.cerebras.ai