🎬 Veo 3 Ultimate — آپدیت بزرگ از گوگل
گوگل همزمان با معرفی Nano Banana، بهصورت بیسروصدا آپدیت مهمی منتشر کرد:
🔹 حالا با اشتراک Ultra میتوان بینهایت ویدیو روی نسخه سبکتر Veo 3 Fast تولید کرد.
💵 قبلاً هر ثانیه تولید ویدیو حدود ۰.۴ دلار هزینه داشت (یعنی یک ویدیو کوتاه تا ۳.۲ دلار). حالا همهچیز فقط با ۲۵۰ دلار در ماه نامحدود است.
👨💻 این خبر میتواند فریلنسـرها و استودیوهای تبلیغاتی را به سمت گوگل بکشاند.
⚠️ اما هنوز دو محدودیت باقی است:
— نبود پشتیبانی از ویدیوی عمودی 📱
— رزولوشن فقط ۷۲۰p (در حالی که Kling مدتهاست روی ۱۰۸۰p کار میکند).
گوگل همزمان با معرفی Nano Banana، بهصورت بیسروصدا آپدیت مهمی منتشر کرد:
🔹 حالا با اشتراک Ultra میتوان بینهایت ویدیو روی نسخه سبکتر Veo 3 Fast تولید کرد.
💵 قبلاً هر ثانیه تولید ویدیو حدود ۰.۴ دلار هزینه داشت (یعنی یک ویدیو کوتاه تا ۳.۲ دلار). حالا همهچیز فقط با ۲۵۰ دلار در ماه نامحدود است.
👨💻 این خبر میتواند فریلنسـرها و استودیوهای تبلیغاتی را به سمت گوگل بکشاند.
⚠️ اما هنوز دو محدودیت باقی است:
— نبود پشتیبانی از ویدیوی عمودی 📱
— رزولوشن فقط ۷۲۰p (در حالی که Kling مدتهاست روی ۱۰۸۰p کار میکند).
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Krea Real-Time Video — آیندهی Img2Video؟
🔹 Img2video یا Video2video؟
Krea بهتازگی ژنراتور ویدیو در لحظه (real-time) معرفی کرده که با کشیدن شکلهای سادهی هندسی میتوان آن را کنترل کرد.
👀 نتیجه چیزی شبیه real-time img2img است، با این تفاوت که:
— انسجام زمانی (temporal consistency) رعایت میشود.
— تولیدها به نسلهای قبلی توجه دارند تا تصویر پایدارتر باشد.
⚡️ سرعت رندر هم جالب است: ۱۲ فریم بر ثانیه در لحظه.
🎶 شاید برای پروژههای مفهومی یا موزیکویدیوها خیلی جذاب باشد. در عمل چقدر کاربردی است؟ باید صبر کنیم و دید.
🔹 Img2video یا Video2video؟
Krea بهتازگی ژنراتور ویدیو در لحظه (real-time) معرفی کرده که با کشیدن شکلهای سادهی هندسی میتوان آن را کنترل کرد.
👀 نتیجه چیزی شبیه real-time img2img است، با این تفاوت که:
— انسجام زمانی (temporal consistency) رعایت میشود.
— تولیدها به نسلهای قبلی توجه دارند تا تصویر پایدارتر باشد.
⚡️ سرعت رندر هم جالب است: ۱۲ فریم بر ثانیه در لحظه.
🎶 شاید برای پروژههای مفهومی یا موزیکویدیوها خیلی جذاب باشد. در عمل چقدر کاربردی است؟ باید صبر کنیم و دید.
ارتقای جدی OpenAI Codex
🔧 مهمترین تغییر — بازطراحی کامل CLI با کلی قابلیت جدید:
— صف پیامها
— جستجو در اینترنت
— لیستهای TODO
— پشتیبانی از ورودی تصویری
— و کلی بهبود جزئی دیگه
⚡️ همچنین افزونهای برای VSCode عرضه شده (سازگار با Cursor، Windsurf و سایر فورکها):
— امکان اجرای تسکها هم روی سیستم محلی و هم روی فضای ابری
— اتصال به GitHub حالا میتونه بهصورت خودکار Pull Requestها رو بررسی کنه
📈 Codex که در ابتدا شروع موفقی نداشت، توی یک ماه اخیر به رقیب جدی Claude Code تبدیل شده.
و جایی که رقابت باشه، کیفیت محصولات هم بالاتر میره.
🧩 #هوش_مصنوعی #OpenAI #Codex #کدنویسی
🔧 مهمترین تغییر — بازطراحی کامل CLI با کلی قابلیت جدید:
— صف پیامها
— جستجو در اینترنت
— لیستهای TODO
— پشتیبانی از ورودی تصویری
— و کلی بهبود جزئی دیگه
⚡️ همچنین افزونهای برای VSCode عرضه شده (سازگار با Cursor، Windsurf و سایر فورکها):
— امکان اجرای تسکها هم روی سیستم محلی و هم روی فضای ابری
— اتصال به GitHub حالا میتونه بهصورت خودکار Pull Requestها رو بررسی کنه
📈 Codex که در ابتدا شروع موفقی نداشت، توی یک ماه اخیر به رقیب جدی Claude Code تبدیل شده.
و جایی که رقابت باشه، کیفیت محصولات هم بالاتر میره.
🧩 #هوش_مصنوعی #OpenAI #Codex #کدنویسی
چطور ChatGPT رو در چند ثانیه طبیعیتر کنیم
هیچ ابزار خارجی لازم نیست — تنظیماتش داخل خود ChatGPT هست.
🔸 ChatGPT رو باز کن
🔸 روی عکس پروفایلت بزن → Customize ChatGPT
🔸 داخل بخش Traits این متن رو بذار:
✍️
«به انگلیسی طبیعی و انسانی بنویس. لحن رباتی و خیلی رسمی نداشته باش.
از جملات خشک، نقلقول زیاد، اصطلاحات شرکتی و اداری دوری کن.
ساده و روشن بنویس. اگر مکالمهای باشه و مفهوم رو بهتر برسونه، اشکالی نداره.
جملات تکراری و طولانی الکی نساز.
ریتم جملهها رو تغییر بده تا متن زندهتر بهنظر برسه.
اولویت با وضوح، سبک شخصی و ارزش عملی در هر خطه.
هر جمله باید هدفمند باشه، نه مکانیکی.»
📌 وقتی ذخیره بشه، خروجی ChatGPT دیگه خشک و رسمی نیست و متنها خیلی شفافتر، روانتر و طبیعیتر میشن.
هیچ ابزار خارجی لازم نیست — تنظیماتش داخل خود ChatGPT هست.
🔸 ChatGPT رو باز کن
🔸 روی عکس پروفایلت بزن → Customize ChatGPT
🔸 داخل بخش Traits این متن رو بذار:
✍️
«به انگلیسی طبیعی و انسانی بنویس. لحن رباتی و خیلی رسمی نداشته باش.
از جملات خشک، نقلقول زیاد، اصطلاحات شرکتی و اداری دوری کن.
ساده و روشن بنویس. اگر مکالمهای باشه و مفهوم رو بهتر برسونه، اشکالی نداره.
جملات تکراری و طولانی الکی نساز.
ریتم جملهها رو تغییر بده تا متن زندهتر بهنظر برسه.
اولویت با وضوح، سبک شخصی و ارزش عملی در هر خطه.
هر جمله باید هدفمند باشه، نه مکانیکی.»
📌 وقتی ذخیره بشه، خروجی ChatGPT دیگه خشک و رسمی نیست و متنها خیلی شفافتر، روانتر و طبیعیتر میشن.
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 ساخت کتاب صوتی از هر متن یا کتاب فقط در چند ثانیه با هوش مصنوعی
ویژگیهای این ابزار جدید:
— پشتیبانی از چندین زبان؛
— استفاده از یکی از بهترین مدلهای تبدیل متن به گفتار: KokoroTTS؛
— امکان ساخت صدای اختصاصی در صورت عدم رضایت از لیست آماده؛
— نصب و راهاندازی ساده؛
— کاملاً اوپنسورس و رایگان برای همه.
ویژگیهای این ابزار جدید:
— پشتیبانی از چندین زبان؛
— استفاده از یکی از بهترین مدلهای تبدیل متن به گفتار: KokoroTTS؛
— امکان ساخت صدای اختصاصی در صورت عدم رضایت از لیست آماده؛
— نصب و راهاندازی ساده؛
— کاملاً اوپنسورس و رایگان برای همه.
😍2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖✨ سیستم Blackdot — ربات جدید برای تاتو با هوش مصنوعی و بینایی کامپیوتری
این ربات توسط یک استارتاپ آمریکایی ساخته شده و میتواند تاتوهای سیاهوسفید را روی قسمتهای صاف پوست مثل دست و پا اجرا کند. در آینده هم قابلیت کار روی بخشهایی مثل سینه و شانه اضافه خواهد شد.
🎨 طراحی تاتوها توسط هنرمندان حرفهای انجام میشود. سپس طرح انتخابی با سایز دلخواه به ربات داده میشود.
🖤 ربات جوهر را به شکل نقاطی میگذارد که حتی از ضخامت یک تار مو هم باریکترند.
📷 یک دوربین داخلی و لیزر به صورت لحظهای کیفیت را کنترل کرده و تنظیمات را تغییر میدهند.
✅ نتیجه: سرعت بیشتر، دقت بالاتر و درد کمتر نسبت به روش سنتی، چون سوراخکاریها سطحیتر هستند.
این ربات توسط یک استارتاپ آمریکایی ساخته شده و میتواند تاتوهای سیاهوسفید را روی قسمتهای صاف پوست مثل دست و پا اجرا کند. در آینده هم قابلیت کار روی بخشهایی مثل سینه و شانه اضافه خواهد شد.
🎨 طراحی تاتوها توسط هنرمندان حرفهای انجام میشود. سپس طرح انتخابی با سایز دلخواه به ربات داده میشود.
🖤 ربات جوهر را به شکل نقاطی میگذارد که حتی از ضخامت یک تار مو هم باریکترند.
📷 یک دوربین داخلی و لیزر به صورت لحظهای کیفیت را کنترل کرده و تنظیمات را تغییر میدهند.
✅ نتیجه: سرعت بیشتر، دقت بالاتر و درد کمتر نسبت به روش سنتی، چون سوراخکاریها سطحیتر هستند.
👏1
Media is too big
VIEW IN TELEGRAM
🚀 HunyuanWorld-Voyager — هوش مصنوعی برای ساخت دنیاهای سهبعدی
Tencent اولین مدل اپنسورس دنیا رو معرفی کرده که همزمان ویدیو رو به صحنهی سهبعدی واقعی تبدیل میکنه و بازسازی سهبعدی رو به صورت بومی انجام میده.
✨ یعنی چی؟
✅ تبدیل مستقیم ویدیو به دنیای سهبعدی، بدون نیاز به ابزار اضافه
✅ مدل «حافظهی فضایی» داره و هندسهی درست رو از هر زاویهای نگه میداره
✅ رتبهی شماره ۱ در Stanford WorldScore برای ویدیو و بازسازی سهبعدی
🎮 کاربردها: واقعیت مجازی (VR)، بازیها، شبیهسازی و پروژههای سهبعدی — با کنترل از طریق کیبورد یا جویاستیک.
🌐 Project Page: https://3d-models.hunyuan.tencent.com/world/
💻 GitHub: https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
🤗 HuggingFace: https://huggingface.co/tencent/HunyuanWorld-Voyager
📄 PDF: https://3d-models.hunyuan.tencent.com/voyager/voyager_en/assets/HYWorld_Voyager.pdf
🏆 Leaderboard: https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard
@ai_machinelearning_big_data
#هوش_مصنوعی #سهبعدی #VR #بازی #اپن_سورس
Tencent اولین مدل اپنسورس دنیا رو معرفی کرده که همزمان ویدیو رو به صحنهی سهبعدی واقعی تبدیل میکنه و بازسازی سهبعدی رو به صورت بومی انجام میده.
✨ یعنی چی؟
✅ تبدیل مستقیم ویدیو به دنیای سهبعدی، بدون نیاز به ابزار اضافه
✅ مدل «حافظهی فضایی» داره و هندسهی درست رو از هر زاویهای نگه میداره
✅ رتبهی شماره ۱ در Stanford WorldScore برای ویدیو و بازسازی سهبعدی
🎮 کاربردها: واقعیت مجازی (VR)، بازیها، شبیهسازی و پروژههای سهبعدی — با کنترل از طریق کیبورد یا جویاستیک.
🌐 Project Page: https://3d-models.hunyuan.tencent.com/world/
💻 GitHub: https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
🤗 HuggingFace: https://huggingface.co/tencent/HunyuanWorld-Voyager
📄 PDF: https://3d-models.hunyuan.tencent.com/voyager/voyager_en/assets/HYWorld_Voyager.pdf
🏆 Leaderboard: https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard
@ai_machinelearning_big_data
#هوش_مصنوعی #سهبعدی #VR #بازی #اپن_سورس
❤3
💡 پژوهشگران ByteDance و استنفورد روشی تازه برای ساخت ویدیوهای طولانی معرفی کردهاند: Mixture of Contexts.
🔑 مشکل اصلی:
وقتی ویدیو طولانی میشود، توجه مدل بیش از حد گسترده میشود:
هزینهی محاسبات بالا میرود
جزئیات از دست میرود
شخصیتها فراموش میشوند و ویدیو دچار «انحراف» میگردد
⚡ نوآوری Mixture of Contexts:
ویدیو به بخشهایی (فریمها، شاتها، کپشنها) تقسیم میشود
هر بار فقط بخشهای مرتبط انتخاب میشوند، نه کل تاریخچه
انتخاب بخشها با مقایسهی ویژگیها و ارزیابی میزان ارتباط انجام میشود
دو «لنگر» همیشه حفظ میشوند: پرامپت کامل متنی و شات محلی برای جزئیات
Causal Mask دسترسی به فریمهای آینده را میبندد تا حلقهی تکراری ایجاد نشود
سپس Flash Attention فقط روی همین بخشهای منتخب اعمال میشود → محاسبات وابسته به کل طول ویدیو نیست، بلکه فقط به محتوای مفید
📊 نتایج:
۷ برابر کاهش FLOPs
۲.۲ برابر سرعت بیشتر
در صحنههای طولانی (۱۸۰هزار توکن) تا ۸۵٪ توجه بیهوده حذف میشود
🎥 دستاورد:
کیفیت کلیپهای کوتاه حفظ میشود
صحنههای بلند روانتر و شخصیتها پایدارتر هستند
🔑 مشکل اصلی:
وقتی ویدیو طولانی میشود، توجه مدل بیش از حد گسترده میشود:
هزینهی محاسبات بالا میرود
جزئیات از دست میرود
شخصیتها فراموش میشوند و ویدیو دچار «انحراف» میگردد
⚡ نوآوری Mixture of Contexts:
ویدیو به بخشهایی (فریمها، شاتها، کپشنها) تقسیم میشود
هر بار فقط بخشهای مرتبط انتخاب میشوند، نه کل تاریخچه
انتخاب بخشها با مقایسهی ویژگیها و ارزیابی میزان ارتباط انجام میشود
دو «لنگر» همیشه حفظ میشوند: پرامپت کامل متنی و شات محلی برای جزئیات
Causal Mask دسترسی به فریمهای آینده را میبندد تا حلقهی تکراری ایجاد نشود
سپس Flash Attention فقط روی همین بخشهای منتخب اعمال میشود → محاسبات وابسته به کل طول ویدیو نیست، بلکه فقط به محتوای مفید
📊 نتایج:
۷ برابر کاهش FLOPs
۲.۲ برابر سرعت بیشتر
در صحنههای طولانی (۱۸۰هزار توکن) تا ۸۵٪ توجه بیهوده حذف میشود
🎥 دستاورد:
کیفیت کلیپهای کوتاه حفظ میشود
صحنههای بلند روانتر و شخصیتها پایدارتر هستند
آموزش ساخت اکشن فیگور واقعگرایان
به جمنای یا گوگل استودیو برید به قسمت image یا nano banan برید عکس رو آپلود کنید و این پرامپت رو وارد کنید
تمام
به جمنای یا گوگل استودیو برید به قسمت image یا nano banan برید عکس رو آپلود کنید و این پرامپت رو وارد کنید
Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is a 3D modeling process of this figurine. Next to the computer screen is a toy packaging box, designed in a style reminiscent of high-quality collectible figures, printed with original artwork. The packaging features two-dimensional flat illustrations
.
تمام
اکانت رسمی Nano Banana گوگل توی ایکس فعال شده. هر وقت منشنش کنی و یه پرامپت براش بنویسی، همونجا برات تصویر میسازه.
https://x.com/NanoBanana
#هوش_مصنوعی
https://x.com/NanoBanana
#هوش_مصنوعی
👍2
شرکت Decart از Oasis 2.0 رونمایی کرد — یک مدل هوش مصنوعی که امکان تغییر دنیای بازی و سبکها را بهصورت زنده و در لحظه فراهم میکند: کیفیت 1080p، سرعت 30fps.
✨ نمونهها فوقالعادهاند:
🎮 ماینکرفت در کوههای آلپ سوئیس
🔥 یا در جشنواره Burning Man
🧩 یا با کاراکترهای کاملاً متفاوت
دنیای بازی میتواند بدون نیاز به بارگذاری مجدد، در لحظه تغییر کند.
🟢 میتوانید دمو را در وب امتحان کنید یا آن را بهعنوان یک ماد برای ماینکرفت نصب کنید:
👉 http://oasis2.decart.ai/demo
✨ نمونهها فوقالعادهاند:
🎮 ماینکرفت در کوههای آلپ سوئیس
🔥 یا در جشنواره Burning Man
🧩 یا با کاراکترهای کاملاً متفاوت
دنیای بازی میتواند بدون نیاز به بارگذاری مجدد، در لحظه تغییر کند.
🟢 میتوانید دمو را در وب امتحان کنید یا آن را بهعنوان یک ماد برای ماینکرفت نصب کنید:
👉 http://oasis2.decart.ai/demo
❤1
گوگل از EmbeddingGemma رونمایی کرد: یک مدل اوپنسورس و سبک برای تولید امبدینگهای متنی.
🔒 این مدل میتواند روی گوشی یا لپتاپ و حتی بدون اینترنت اجرا شود — با حفظ کامل حریم خصوصی.
✨ چرا مهمه؟
رهبر جدید بین مدلهای متنباز چندزبانه زیر 500M روی بنچمارک MTEB
فقط 308M پارامتر اما کیفیت بالاتر از همهی مدلهای زیر 500M
سرعت فوقالعاده: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
پشتیبانی از بیش از 100 زبان
امکان کاهش اندازهی امبدینگ (از 768 → 128) بدون افت کیفیت
پشتیبانی از متن تا 2000 توکن
همین حالا در ابزارهایی مثل Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate در دسترسه
🟠 بلاگ رسمی: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
🔒 این مدل میتواند روی گوشی یا لپتاپ و حتی بدون اینترنت اجرا شود — با حفظ کامل حریم خصوصی.
✨ چرا مهمه؟
رهبر جدید بین مدلهای متنباز چندزبانه زیر 500M روی بنچمارک MTEB
فقط 308M پارامتر اما کیفیت بالاتر از همهی مدلهای زیر 500M
سرعت فوقالعاده: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
پشتیبانی از بیش از 100 زبان
امکان کاهش اندازهی امبدینگ (از 768 → 128) بدون افت کیفیت
پشتیبانی از متن تا 2000 توکن
همین حالا در ابزارهایی مثل Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate در دسترسه
🟠 بلاگ رسمی: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4