اخبار هوش مصنوعی
2.85K subscribers
802 photos
502 videos
1.01K files
1.46K links
آخرین اخبار و منابع فناوری ؛ هوش مصنوعی و یادگیری ماشین

@GPT360
Download Telegram
🎬 Veo 3 Ultimate — آپدیت بزرگ از گوگل

گوگل همزمان با معرفی Nano Banana، به‌صورت بی‌سروصدا آپدیت مهمی منتشر کرد:
🔹 حالا با اشتراک Ultra می‌توان بی‌نهایت ویدیو روی نسخه سبک‌تر Veo 3 Fast تولید کرد.

💵 قبلاً هر ثانیه تولید ویدیو حدود ۰.۴ دلار هزینه داشت (یعنی یک ویدیو کوتاه تا ۳.۲ دلار). حالا همه‌چیز فقط با ۲۵۰ دلار در ماه نامحدود است.

👨‍💻 این خبر می‌تواند فریلنسـرها و استودیوهای تبلیغاتی را به سمت گوگل بکشاند.
⚠️ اما هنوز دو محدودیت باقی است:
— نبود پشتیبانی از ویدیوی عمودی 📱
— رزولوشن فقط ۷۲۰p (در حالی که Kling مدت‌هاست روی ۱۰۸۰p کار می‌کند).
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Krea Real-Time Video — آینده‌ی Img2Video؟

🔹 Img2video یا Video2video؟
Krea به‌تازگی ژنراتور ویدیو در لحظه (real-time) معرفی کرده که با کشیدن شکل‌های ساده‌ی هندسی می‌توان آن را کنترل کرد.

👀 نتیجه چیزی شبیه real-time img2img است، با این تفاوت که:
— انسجام زمانی (temporal consistency) رعایت می‌شود.
— تولیدها به نسل‌های قبلی توجه دارند تا تصویر پایدارتر باشد.

⚡️ سرعت رندر هم جالب است: ۱۲ فریم بر ثانیه در لحظه.

🎶 شاید برای پروژه‌های مفهومی یا موزیک‌ویدیوها خیلی جذاب باشد. در عمل چقدر کاربردی است؟ باید صبر کنیم و دید.
ارتقای جدی OpenAI Codex

🔧 مهم‌ترین تغییر — بازطراحی کامل CLI با کلی قابلیت جدید:
— صف پیام‌ها
— جستجو در اینترنت
— لیست‌های TODO
— پشتیبانی از ورودی تصویری
— و کلی بهبود جزئی دیگه

⚡️ همچنین افزونه‌ای برای VSCode عرضه شده (سازگار با Cursor، Windsurf و سایر فورک‌ها):
— امکان اجرای تسک‌ها هم روی سیستم محلی و هم روی فضای ابری
— اتصال به GitHub حالا می‌تونه به‌صورت خودکار Pull Requestها رو بررسی کنه

📈 Codex که در ابتدا شروع موفقی نداشت، توی یک ماه اخیر به رقیب جدی Claude Code تبدیل شده.
و جایی که رقابت باشه، کیفیت محصولات هم بالاتر میره.

🧩 #هوش_مصنوعی #OpenAI #Codex #کدنویسی
چطور ChatGPT رو در چند ثانیه طبیعی‌تر کنیم

هیچ ابزار خارجی لازم نیست — تنظیماتش داخل خود ChatGPT هست.

🔸 ChatGPT رو باز کن
🔸 روی عکس پروفایلت بزن → Customize ChatGPT
🔸 داخل بخش Traits این متن رو بذار:

✍️
«به انگلیسی طبیعی و انسانی بنویس. لحن رباتی و خیلی رسمی نداشته باش.
از جملات خشک، نقل‌قول زیاد، اصطلاحات شرکتی و اداری دوری کن.
ساده و روشن بنویس. اگر مکالمه‌ای باشه و مفهوم رو بهتر برسونه، اشکالی نداره.
جملات تکراری و طولانی الکی نساز.
ریتم جمله‌ها رو تغییر بده تا متن زنده‌تر به‌نظر برسه.
اولویت با وضوح، سبک شخصی و ارزش عملی در هر خطه.
هر جمله باید هدفمند باشه، نه مکانیکی.»

📌 وقتی ذخیره بشه، خروجی ChatGPT دیگه خشک و رسمی نیست و متن‌ها خیلی شفاف‌تر، روان‌تر و طبیعی‌تر می‌شن.
1
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 ساخت کتاب صوتی از هر متن یا کتاب فقط در چند ثانیه با هوش مصنوعی

ویژگی‌های این ابزار جدید:
— پشتیبانی از چندین زبان؛
— استفاده از یکی از بهترین مدل‌های تبدیل متن به گفتار: KokoroTTS؛
— امکان ساخت صدای اختصاصی در صورت عدم رضایت از لیست آماده؛
— نصب و راه‌اندازی ساده؛
— کاملاً اوپن‌سورس و رایگان برای همه.
😍2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سیستم Blackdot — ربات جدید برای تاتو با هوش مصنوعی و بینایی کامپیوتری

این ربات توسط یک استارتاپ آمریکایی ساخته شده و می‌تواند تاتوهای سیاه‌وسفید را روی قسمت‌های صاف پوست مثل دست و پا اجرا کند. در آینده هم قابلیت کار روی بخش‌هایی مثل سینه و شانه اضافه خواهد شد.

🎨 طراحی تاتوها توسط هنرمندان حرفه‌ای انجام می‌شود. سپس طرح انتخابی با سایز دلخواه به ربات داده می‌شود.
🖤 ربات جوهر را به شکل نقاطی می‌گذارد که حتی از ضخامت یک تار مو هم باریک‌ترند.
📷 یک دوربین داخلی و لیزر به صورت لحظه‌ای کیفیت را کنترل کرده و تنظیمات را تغییر می‌دهند.

نتیجه: سرعت بیشتر، دقت بالاتر و درد کمتر نسبت به روش سنتی، چون سوراخ‌کاری‌ها سطحی‌تر هستند.
👏1
Media is too big
VIEW IN TELEGRAM
🚀 HunyuanWorld-Voyager — هوش مصنوعی برای ساخت دنیاهای سه‌بعدی

Tencent اولین مدل اپن‌سورس دنیا رو معرفی کرده که همزمان ویدیو رو به صحنه‌ی سه‌بعدی واقعی تبدیل می‌کنه و بازسازی سه‌بعدی رو به صورت بومی انجام میده.

یعنی چی؟
تبدیل مستقیم ویدیو به دنیای سه‌بعدی، بدون نیاز به ابزار اضافه
مدل «حافظه‌ی فضایی» داره و هندسه‌ی درست رو از هر زاویه‌ای نگه میداره
رتبه‌ی شماره ۱ در Stanford WorldScore برای ویدیو و بازسازی سه‌بعدی

🎮 کاربردها: واقعیت مجازی (VR)، بازی‌ها، شبیه‌سازی و پروژه‌های سه‌بعدی — با کنترل از طریق کیبورد یا جوی‌استیک.

🌐 Project Page: https://3d-models.hunyuan.tencent.com/world/
💻 GitHub: https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
🤗 HuggingFace: https://huggingface.co/tencent/HunyuanWorld-Voyager
📄 PDF: https://3d-models.hunyuan.tencent.com/voyager/voyager_en/assets/HYWorld_Voyager.pdf
🏆 Leaderboard: https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard

@ai_machinelearning_big_data

#هوش_مصنوعی #سه‌بعدی #VR #بازی #اپن_سورس
3
💡 پژوهشگران ByteDance و استنفورد روشی تازه برای ساخت ویدیوهای طولانی معرفی کرده‌اند: Mixture of Contexts.

🔑 مشکل اصلی:
وقتی ویدیو طولانی می‌شود، توجه مدل بیش از حد گسترده می‌شود:

هزینه‌ی محاسبات بالا می‌رود

جزئیات از دست می‌رود

شخصیت‌ها فراموش می‌شوند و ویدیو دچار «انحراف» می‌گردد


نوآوری Mixture of Contexts:

ویدیو به بخش‌هایی (فریم‌ها، شات‌ها، کپشن‌ها) تقسیم می‌شود

هر بار فقط بخش‌های مرتبط انتخاب می‌شوند، نه کل تاریخچه

انتخاب بخش‌ها با مقایسه‌ی ویژگی‌ها و ارزیابی میزان ارتباط انجام می‌شود

دو «لنگر» همیشه حفظ می‌شوند: پرامپت کامل متنی و شات محلی برای جزئیات

Causal Mask دسترسی به فریم‌های آینده را می‌بندد تا حلقه‌ی تکراری ایجاد نشود

سپس Flash Attention فقط روی همین بخش‌های منتخب اعمال می‌شود → محاسبات وابسته به کل طول ویدیو نیست، بلکه فقط به محتوای مفید


📊 نتایج:

۷ برابر کاهش FLOPs

۲.۲ برابر سرعت بیشتر

در صحنه‌های طولانی (۱۸۰هزار توکن) تا ۸۵٪ توجه بیهوده حذف می‌شود


🎥 دستاورد:

کیفیت کلیپ‌های کوتاه حفظ می‌شود

صحنه‌های بلند روان‌تر و شخصیت‌ها پایدارتر هستند
آموزش ساخت اکشن فیگور واقع‌گرایان


به جمنای یا گوگل استودیو برید  به قسمت image یا nano banan برید  عکس رو آپلود کنید و این پرامپت رو وارد کنید

Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is a 3D modeling process of this figurine. Next to the computer screen is a toy packaging box, designed in a style reminiscent of high-quality collectible figures, printed with original artwork. The packaging features two-dimensional flat illustrations.


تمام
اکانت رسمی Nano Banana گوگل توی ایکس فعال شده. هر وقت منشنش کنی و یه پرامپت براش بنویسی، همون‌جا برات تصویر می‌سازه.

https://x.com/NanoBanana

#هوش_مصنوعی
👍2
شرکت Decart از Oasis 2.0 رونمایی کرد — یک مدل هوش مصنوعی که امکان تغییر دنیای بازی و سبک‌ها را به‌صورت زنده و در لحظه فراهم می‌کند: کیفیت 1080p، سرعت 30fps.

نمونه‌ها فوق‌العاده‌اند:
🎮 ماینکرفت در کوه‌های آلپ سوئیس
🔥 یا در جشنواره Burning Man
🧩 یا با کاراکترهای کاملاً متفاوت

دنیای بازی می‌تواند بدون نیاز به بارگذاری مجدد، در لحظه تغییر کند.

🟢 می‌توانید دمو را در وب امتحان کنید یا آن را به‌عنوان یک ماد برای ماینکرفت نصب کنید:
👉 http://oasis2.decart.ai/demo
1
گوگل از EmbeddingGemma رونمایی کرد: یک مدل اوپن‌سورس و سبک برای تولید امبدینگ‌های متنی.

🔒 این مدل می‌تواند روی گوشی یا لپ‌تاپ و حتی بدون اینترنت اجرا شود — با حفظ کامل حریم خصوصی.

چرا مهمه؟

رهبر جدید بین مدل‌های متن‌باز چندزبانه زیر 500M روی بنچمارک MTEB

فقط 308M پارامتر اما کیفیت بالاتر از همه‌ی مدل‌های زیر 500M

سرعت فوق‌العاده: کمتر از 15 میلی‌ثانیه روی EdgeTPU (برای 256 توکن)

پشتیبانی از بیش از 100 زبان

امکان کاهش اندازه‌ی امبدینگ (از 768 → 128) بدون افت کیفیت

پشتیبانی از متن تا 2000 توکن

همین حالا در ابزارهایی مثل Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate در دسترسه


🟠 بلاگ رسمی: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدل‌ها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4