💡 پژوهشگران ByteDance و استنفورد روشی تازه برای ساخت ویدیوهای طولانی معرفی کردهاند: Mixture of Contexts.
🔑 مشکل اصلی:
وقتی ویدیو طولانی میشود، توجه مدل بیش از حد گسترده میشود:
هزینهی محاسبات بالا میرود
جزئیات از دست میرود
شخصیتها فراموش میشوند و ویدیو دچار «انحراف» میگردد
⚡ نوآوری Mixture of Contexts:
ویدیو به بخشهایی (فریمها، شاتها، کپشنها) تقسیم میشود
هر بار فقط بخشهای مرتبط انتخاب میشوند، نه کل تاریخچه
انتخاب بخشها با مقایسهی ویژگیها و ارزیابی میزان ارتباط انجام میشود
دو «لنگر» همیشه حفظ میشوند: پرامپت کامل متنی و شات محلی برای جزئیات
Causal Mask دسترسی به فریمهای آینده را میبندد تا حلقهی تکراری ایجاد نشود
سپس Flash Attention فقط روی همین بخشهای منتخب اعمال میشود → محاسبات وابسته به کل طول ویدیو نیست، بلکه فقط به محتوای مفید
📊 نتایج:
۷ برابر کاهش FLOPs
۲.۲ برابر سرعت بیشتر
در صحنههای طولانی (۱۸۰هزار توکن) تا ۸۵٪ توجه بیهوده حذف میشود
🎥 دستاورد:
کیفیت کلیپهای کوتاه حفظ میشود
صحنههای بلند روانتر و شخصیتها پایدارتر هستند
🔑 مشکل اصلی:
وقتی ویدیو طولانی میشود، توجه مدل بیش از حد گسترده میشود:
هزینهی محاسبات بالا میرود
جزئیات از دست میرود
شخصیتها فراموش میشوند و ویدیو دچار «انحراف» میگردد
⚡ نوآوری Mixture of Contexts:
ویدیو به بخشهایی (فریمها، شاتها، کپشنها) تقسیم میشود
هر بار فقط بخشهای مرتبط انتخاب میشوند، نه کل تاریخچه
انتخاب بخشها با مقایسهی ویژگیها و ارزیابی میزان ارتباط انجام میشود
دو «لنگر» همیشه حفظ میشوند: پرامپت کامل متنی و شات محلی برای جزئیات
Causal Mask دسترسی به فریمهای آینده را میبندد تا حلقهی تکراری ایجاد نشود
سپس Flash Attention فقط روی همین بخشهای منتخب اعمال میشود → محاسبات وابسته به کل طول ویدیو نیست، بلکه فقط به محتوای مفید
📊 نتایج:
۷ برابر کاهش FLOPs
۲.۲ برابر سرعت بیشتر
در صحنههای طولانی (۱۸۰هزار توکن) تا ۸۵٪ توجه بیهوده حذف میشود
🎥 دستاورد:
کیفیت کلیپهای کوتاه حفظ میشود
صحنههای بلند روانتر و شخصیتها پایدارتر هستند
آموزش ساخت اکشن فیگور واقعگرایان
به جمنای یا گوگل استودیو برید به قسمت image یا nano banan برید عکس رو آپلود کنید و این پرامپت رو وارد کنید
تمام
به جمنای یا گوگل استودیو برید به قسمت image یا nano banan برید عکس رو آپلود کنید و این پرامپت رو وارد کنید
Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is a 3D modeling process of this figurine. Next to the computer screen is a toy packaging box, designed in a style reminiscent of high-quality collectible figures, printed with original artwork. The packaging features two-dimensional flat illustrations
.
تمام
اکانت رسمی Nano Banana گوگل توی ایکس فعال شده. هر وقت منشنش کنی و یه پرامپت براش بنویسی، همونجا برات تصویر میسازه.
https://x.com/NanoBanana
#هوش_مصنوعی
https://x.com/NanoBanana
#هوش_مصنوعی
👍2
شرکت Decart از Oasis 2.0 رونمایی کرد — یک مدل هوش مصنوعی که امکان تغییر دنیای بازی و سبکها را بهصورت زنده و در لحظه فراهم میکند: کیفیت 1080p، سرعت 30fps.
✨ نمونهها فوقالعادهاند:
🎮 ماینکرفت در کوههای آلپ سوئیس
🔥 یا در جشنواره Burning Man
🧩 یا با کاراکترهای کاملاً متفاوت
دنیای بازی میتواند بدون نیاز به بارگذاری مجدد، در لحظه تغییر کند.
🟢 میتوانید دمو را در وب امتحان کنید یا آن را بهعنوان یک ماد برای ماینکرفت نصب کنید:
👉 http://oasis2.decart.ai/demo
✨ نمونهها فوقالعادهاند:
🎮 ماینکرفت در کوههای آلپ سوئیس
🔥 یا در جشنواره Burning Man
🧩 یا با کاراکترهای کاملاً متفاوت
دنیای بازی میتواند بدون نیاز به بارگذاری مجدد، در لحظه تغییر کند.
🟢 میتوانید دمو را در وب امتحان کنید یا آن را بهعنوان یک ماد برای ماینکرفت نصب کنید:
👉 http://oasis2.decart.ai/demo
❤1
گوگل از EmbeddingGemma رونمایی کرد: یک مدل اوپنسورس و سبک برای تولید امبدینگهای متنی.
🔒 این مدل میتواند روی گوشی یا لپتاپ و حتی بدون اینترنت اجرا شود — با حفظ کامل حریم خصوصی.
✨ چرا مهمه؟
رهبر جدید بین مدلهای متنباز چندزبانه زیر 500M روی بنچمارک MTEB
فقط 308M پارامتر اما کیفیت بالاتر از همهی مدلهای زیر 500M
سرعت فوقالعاده: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
پشتیبانی از بیش از 100 زبان
امکان کاهش اندازهی امبدینگ (از 768 → 128) بدون افت کیفیت
پشتیبانی از متن تا 2000 توکن
همین حالا در ابزارهایی مثل Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate در دسترسه
🟠 بلاگ رسمی: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
🔒 این مدل میتواند روی گوشی یا لپتاپ و حتی بدون اینترنت اجرا شود — با حفظ کامل حریم خصوصی.
✨ چرا مهمه؟
رهبر جدید بین مدلهای متنباز چندزبانه زیر 500M روی بنچمارک MTEB
فقط 308M پارامتر اما کیفیت بالاتر از همهی مدلهای زیر 500M
سرعت فوقالعاده: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
پشتیبانی از بیش از 100 زبان
امکان کاهش اندازهی امبدینگ (از 768 → 128) بدون افت کیفیت
پشتیبانی از متن تا 2000 توکن
همین حالا در ابزارهایی مثل Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate در دسترسه
🟠 بلاگ رسمی: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
This media is not supported in your browser
VIEW IN TELEGRAM
فقط یه سؤال: اگه همچین رباتی رو توی خیابون ببینی، چیکار میکنی؟
😁1🤣1
🚀 تیم Qwen از بزرگترین مدل خودش رونمایی کرد: Qwen3-Max-Preview (Instruct) با بیش از ۱ تریلیون پارامتر.
📊 طبق بنچمارکها، این مدل از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 قویتره.
🗣️ تستهای داخلی و اولین بازخوردها نشون میده که مدل توی دیالوگ، اجرای وظایف عاملمحور، پیروی از دستورها و گسترهی دانش پیشرفت چشمگیری داشته.
🔮 تیم Qwen قول داده بهزودی خبرهای جذابتری منتشر کنه.
🟢 Qwen Chat: https://chat.qwen.ai
🟢 Alibaba Cloud API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview
#هوش_مصنوعی #Qwen3 #LLM #AlibabaCloud #QwenChat
📊 طبق بنچمارکها، این مدل از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 قویتره.
🗣️ تستهای داخلی و اولین بازخوردها نشون میده که مدل توی دیالوگ، اجرای وظایف عاملمحور، پیروی از دستورها و گسترهی دانش پیشرفت چشمگیری داشته.
🔮 تیم Qwen قول داده بهزودی خبرهای جذابتری منتشر کنه.
🟢 Qwen Chat: https://chat.qwen.ai
🟢 Alibaba Cloud API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview
#هوش_مصنوعی #Qwen3 #LLM #AlibabaCloud #QwenChat
❤1
حل مسائل ریاضی فقط با چند کلیک
Mathos یه ابزار ساده برای دانشجوهاست که مسائل سخت ریاضی رو به توضیحات روشن و تصویری تبدیل میکنه.
🔸 پوشش کامل: جبر، هندسه، مثلثات، جبر خطی، حساب دیفرانسیل و انتگرال، احتمال و آمار
🔸 ورودیها: متن، عکس، PDF یا حتی صدا
🔸 نمایش راهحل مرحله به مرحله + رسم نمودار برای شفافیت بیشتر
🔸 کاملاً رایگان
📚 اگر زیر حجم تمرینها دفن شدی، Mathos میتونه ساعتها وقت برات ذخیره کنه.
Mathos یه ابزار ساده برای دانشجوهاست که مسائل سخت ریاضی رو به توضیحات روشن و تصویری تبدیل میکنه.
🔸 پوشش کامل: جبر، هندسه، مثلثات، جبر خطی، حساب دیفرانسیل و انتگرال، احتمال و آمار
🔸 ورودیها: متن، عکس، PDF یا حتی صدا
🔸 نمایش راهحل مرحله به مرحله + رسم نمودار برای شفافیت بیشتر
🔸 کاملاً رایگان
📚 اگر زیر حجم تمرینها دفن شدی، Mathos میتونه ساعتها وقت برات ذخیره کنه.
میخواد آیفونت رو به جای تو اداره کنه
استارتاپ Dafdef از سانفرانسیسکو که به خاطر مرورگرهای هوشمندش شناخته میشه، گجت جدیدی معرفی کرده: AI Key — یک دانگل USB-C که به آیفون وصل میشه و نقش یه عامل هوش مصنوعی قابلحمل رو داره.
🔸 مثل «موس با چشم» عمل میکنه: روی اپها ضربه میزنه، سوایپ میکنه و متن تایپ میکنه
🔸 کارها رو از رزرو هتل تا سفارش غذا انجام میده — مرحله به مرحله با تأیید شما
🔸 میتونی برنامهها رو وسط کار تغییر بدی — همیشه کنترل دست خودته
🔸 به حافظه گوشی یا دادههای پرداخت دسترسی نداره → ریسک امنیتی کمتر
🔸 همین حالا توسط فاوندرها، خالقان محتوا و پژوهشگران برای حذف کارهای تکراری استفاده میشه
🤔 یک قدم عجیب برای دادن کنترل مستقیم گوشی به هوش مصنوعی. اما سوال اصلی اینه: کاربرها به همچین عاملی اعتماد میکنن؟
استارتاپ Dafdef از سانفرانسیسکو که به خاطر مرورگرهای هوشمندش شناخته میشه، گجت جدیدی معرفی کرده: AI Key — یک دانگل USB-C که به آیفون وصل میشه و نقش یه عامل هوش مصنوعی قابلحمل رو داره.
🔸 مثل «موس با چشم» عمل میکنه: روی اپها ضربه میزنه، سوایپ میکنه و متن تایپ میکنه
🔸 کارها رو از رزرو هتل تا سفارش غذا انجام میده — مرحله به مرحله با تأیید شما
🔸 میتونی برنامهها رو وسط کار تغییر بدی — همیشه کنترل دست خودته
🔸 به حافظه گوشی یا دادههای پرداخت دسترسی نداره → ریسک امنیتی کمتر
🔸 همین حالا توسط فاوندرها، خالقان محتوا و پژوهشگران برای حذف کارهای تکراری استفاده میشه
🤔 یک قدم عجیب برای دادن کنترل مستقیم گوشی به هوش مصنوعی. اما سوال اصلی اینه: کاربرها به همچین عاملی اعتماد میکنن؟
Media is too big
VIEW IN TELEGRAM
مدل انساننمای Helix از شرکت Figure نشون میده رباتهای چندمنظوره تا کجا میتونن پیش برن. همون سیستمی که قبلاً حولهها رو تا میکرد و بستهها رو مرتب میکرد، حالا ظرفها رو هم داخل ماشین ظرفشویی میذاره — بدون الگوریتم جدید، فقط با دادههای تازه.
🔸 مدیریت بشقابهای روی هم، لیوانها و حالتهای بههمریخته
🔸 استفاده همزمان از دو دست برای جابهجایی ایمن اجسام شکننده
🔸 ادامهی کار حتی بعد از لیز خوردن یا برخورد، بدون توقف
🔸 یادگیری مهارتهای تازه بهصورت تدریجی در حوزههای مختلف
شاید بارگذاری ماشین ظرفشویی ساده به نظر برسه، اما برای رباتیک یعنی ترکیب بینایی، دقت و تطبیقپذیری. پیشرفت Helix یک گام دیگه به سمت رباتهای انساننمای کاربردی در دنیای واقعی فراتر از دموهاست.
🔸 مدیریت بشقابهای روی هم، لیوانها و حالتهای بههمریخته
🔸 استفاده همزمان از دو دست برای جابهجایی ایمن اجسام شکننده
🔸 ادامهی کار حتی بعد از لیز خوردن یا برخورد، بدون توقف
🔸 یادگیری مهارتهای تازه بهصورت تدریجی در حوزههای مختلف
شاید بارگذاری ماشین ظرفشویی ساده به نظر برسه، اما برای رباتیک یعنی ترکیب بینایی، دقت و تطبیقپذیری. پیشرفت Helix یک گام دیگه به سمت رباتهای انساننمای کاربردی در دنیای واقعی فراتر از دموهاست.
🎬 Mootion —
پلتفرم #هوش_مصنوعی برای ساخت ویدیوهای جذاب!
با Mootion میتونی با وارد کردن یک متن یا ایده، ویدیو بسازی، صداگذاری کنی و حتی از آواتارهای AI استفاده کنی. عالی برای تولید محتوا، تبلیغات و داستانسرایی!
🔗 mootion.com
پلتفرم #هوش_مصنوعی برای ساخت ویدیوهای جذاب!
با Mootion میتونی با وارد کردن یک متن یا ایده، ویدیو بسازی، صداگذاری کنی و حتی از آواتارهای AI استفاده کنی. عالی برای تولید محتوا، تبلیغات و داستانسرایی!
🔗 mootion.com
This media is not supported in your browser
VIEW IN TELEGRAM
بالاخره Higgsfield مشکل تبلیغات و پرزنت محصولو جمع کرد 😎
📢 معرفی: Higgsfield Ads 2.0
دیگه لازم نیست کلی تیم بگیری، همهچی (تولید، مارکتینگ، خلاقیت) توی یه مینیاپ تو Higgsfield جمع شده!
با داشتن Unlimited Kling و Unlimited Nano Banana واسه یه سال کامل، میتونی تنهایی مثل یه تیم حرفهای کار کنی، بسازی، تبلیغ کنی و بترکونی 🚀
خودت رییس خودتی، بقیهشو بسپر به Higgsfield.
https://higgsfield.ai/
#هوش_مصنوعی
📢 معرفی: Higgsfield Ads 2.0
دیگه لازم نیست کلی تیم بگیری، همهچی (تولید، مارکتینگ، خلاقیت) توی یه مینیاپ تو Higgsfield جمع شده!
با داشتن Unlimited Kling و Unlimited Nano Banana واسه یه سال کامل، میتونی تنهایی مثل یه تیم حرفهای کار کنی، بسازی، تبلیغ کنی و بترکونی 🚀
خودت رییس خودتی، بقیهشو بسپر به Higgsfield.
https://higgsfield.ai/
#هوش_مصنوعی