اخبار هوش مصنوعی

Forwarded from Silicon Brain | جامعه هوش مصنوعی

کامبک گوگل به دنیای LLM

گوگل دیپ‌مایند (#deep_m8nd) مدل Gemma-2 با دو بیلیون پارامتر رو عرضه کرده. یکی از بزرگترین دستاوردهای این کار، عملکرد بهتر مدل در پلتفرم ارزیابی Chatbot Arena نسبت به مدل GPT-3.5 هست!

مدل GPT-3.5 بیش از 175 بیلیون پارامتر و Gemma-2 تنها با دو بیلیون پارامتر داره! تصویر هم مربوط به LMSYS Chatbot Arena هست که عملکرد مدل Gemma-2 رو نسبت به سایر مدل‌ها نشون میده.

علاوه بر Gemma-2 2B دو نسخه دیگه بنام GemmaShield و GemmaScope هم عرضه شده که اینها هم کاربردهای بسیار جالبی دارن.

شاید ندونید LMSYS Chatbot Arena چی هست؟
یک پلتفرم آنلاین و آزاد هست برای ارزیابی #LLM ها و VLM-هاست. ارزیابی‌های جالبی هم داره؛ مثلا، یک حالت Battle داره. شما یک سوال میپرسید و دو مدل A و B نامشخص بهش جواب میدن. شما جواب‌ها رو میخونید و بعد می‌تونید انتخاب کنید که کدوم جواب بهتر هست. بعد از اینکه جواب دادید، بهتون میگه این دو مدل که بهت جواب دادن اسمشون چی بوده.

وبلاگ Gemma-2

#gemma #lmsys #chatbot_arena
@silicon_brain | از هوش مصنوعی عقب نمانید

❤1

363 views05:49

اخبار هوش مصنوعی

Forwarded from Silicon Brain | جامعه هوش مصنوعی

پیشرفت در زمینه بهینه ساز ها توسط متا

متا بهینه‌سازی بنام Schedule-free Optimizer معرفی کرده که مورد توجه قرار گرفته. خیلی‌ها درحال ارزیابیش هستن و فیدبک مثبت دادن. چه ویژگی مثبتی داره که ترند شده؟

عملکرد بهتری نسبت به بهینه‌سازهای رایج مثل #SGD و #Adam داره. شکل بالا رو ببینید. این بهینه‌ساز نسبت به بهینه‌ساز AdamW با تابع پله‌ای یا کسینوسی همگرایی سریع‌تری داره.

نیازی به تنظیم لرنینگ ریت (LR Scheduler) نداره. یعنی، دیگه نیازی نیست که #learning_rate رو حین آموزش تغییر بدید.

چطوری ازش استفاده کنیم؟ اول که نصب:

pip install schedulefree

بعدش هم می‌تونید از بهینه‌ساز مبتنی بر SGD یا AdamW استفاده کنید:

optimizer = schedulefree.AdamWScheduleFree(model.parameters(), lr=args.lr)

تو لینک زیر، اومدن یک شبکه CNN رو روی دیتاست MNIST با این بهینه‌ساز آموزش دادن که برای شروع کار باهاش و ارزیابی عملکردش میتونین استفاده کنین:
لینک کد | گیتهاب
#ScheduleFree
@silicon_brain | از هوش مصنوعی عقب نمانید

450 views05:49

اخبار هوش مصنوعی

🤖 Voiser
سرویس متن به گفتار مبتنی بر #هوش_مصنوعی پیشرفته

💬 Voiser
یک سرویس خلاقانه مبتنی بر هوش مصنوعی ارائه می دهد که متن را به گفتار انسان مانند در بیش از 70 زبان تبدیل می کند. همچنین یک سرویس گفتار به متن قدرتمند ارائه می دهد که به کاربران امکان می دهد فایل های صوتی خود را به سرعت رونویسی کنند.‌‌
پشتیبانی از زبان فارسی

https://voiser.net/en

492 views16:08

اخبار هوش مصنوعی

تمام شبکه های عصبی متنی در یک مکان

ChatHub
یک سرویس گیرنده چت بات است که چت بات های مختلفی مانند ChatGPT، Bing، Claude، Bard و دیگران را در یک پلتفرم ادغام می کند و به شما امکان می دهد همزمان به چند ربات چت دسترسی داشته باشید.

https://app.chathub.gg/

#هوش_مصنوعی

695 views16:09

اخبار هوش مصنوعی

Forwarded from DeepMind AI Expert (Farzad)

اگه کلی فایل pdf دارین و هنوز نخوندین این سایت بهتون کمک میکنه که اونها رو خلاصه کنید

pdfsummarizer.org

#هوش_مصنوعی

🔸 مطالب بیشتر 👇👇

✅ @AI_DeepMind
🔸 @AI_Person

319 views18:20

اخبار هوش مصنوعی

Forwarded from DeepMind AI Expert (Farzad)

1:27

This media is not supported in your browser

VIEW IN TELEGRAM

یکی از بهترین روشهای یادگیری مدلهای transformers اینه که تصویری ببینیم چطورکارمیکنن بخصوص قسمت attention.یک نفر یک اپ درست کرده که عالی نشون میده مدلهای GPT چطور کارمیکنن. جالب اینکه مدل GPT-2 را درbrowser اجرا میکنه که میتونید با تکست خودتون امتحان کنید.
◾️ Transformer Explainer: Interactive Learning of Text-Generative Models

https://poloclub.github.io/transformer-explainer/

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

✅ @AI_DeepMind
🔸 @AI_Person

285 views18:22

اخبار هوش مصنوعی

Forwarded from DeepMind AI Expert (Farzad)

دوستان فعال در حوزه استارت آپ های #لباس میتونین با این مدل CatVTON در ایران پیشرفتهای قابل توجهی رو برای این حوزه رقم بزنین بودجه زیادی رو در این حیطه حیف و میل کنین 😂🚶‍♂️🚶‍♂️

◾️ 🐈 CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models

🔸 مطالب بیشتر 👇👇

✅ @AI_DeepMind
🔸 @AI_Person

273 views18:22

اخبار هوش مصنوعی

Forwarded from Geek Alerts

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

کاربرهای پلن رایگان ChatGPT میتونن از الان روزانه ۲ تصویر رایگان باهاش بسازن.
نکته مثبت اینه که میتونید پرامپت خودتون رو به هر زبانی حتی «فارسی» بنویسید.
توی پرامپت نویسی برای تولید عکس هرچقدر بیشتر توضیح بدید مثل سبک و مدل عکس چطور باشه، رنگ‌بندیش چی باشه و هرچیزی که به ذهنتون میرسه باعث میشه خروجی خیلی بهتر بشه.
عکسی که بهتون میده با خروجی ۱۰۲۴ پیکسل هست که کیفیت خوبی برای استفاده داره.
https://chatgpt.com/
@geekalerts

256 views18:22

اخبار هوش مصنوعی

Forwarded from Geek Alerts

گوگل بالاخره Imagen 3 رو در دسترس عموم قرار داد. این مدل سازنده تصویر که شبیه midjourney هست حدود ۳ ماه پیش در دسترس کاربران محدودی قرار گرفت و همین امروز به طور عمومی عرضه شد. عملکرد بسیار خوبی داره و درحد و اندازه همین midjourney می‌تونه تصاویر بسیار زیبایی رو تولید کنه. این ابزار تحت عنوان ImageFX در آدرس زیر در دسترسه.

https://aitestkitchen.withgoogle.com/tools/image-fx
hadi @geekalerts

272 views18:23

اخبار هوش مصنوعی

Forwarded from TechTube 𝕏 تک توب

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

دختری که در واقعیت وجود نداره!

عکس این دختر توسط هوش مصنوعی قدرتمند Flux ساخته شده و بعد از اون با استفاده از مدل تولید ویدیوی Gen-3 Alpha متحرک و به ویدیو تبدیل شده.

🔎 iamneubert

📍 @TechTube

302 views18:24

اخبار هوش مصنوعی

Forwarded from TechTube 𝕏 تک توب

شرکت Black Forest Labs هوش مصنوعی تولید عکس جدیدی به نام Flux رو عرضه کرده که رقیب متن بازی برای میدجرنی هست!

این شرکت توسط مهندسان سابق Stability AI تاسیس شده که ساخت و توسعه مدلهای محبوب Stable Diffusion و قبل از اون Latent Diffusion رو در کارنامه اشون دارن و نتیجه اولین کارشون مدل قدرتمند Flux هست که عکسهای با کیفیت بالا و واقع گرایانه میتونه بسازه و از ورودی کاربر به شکل دقیقی میتونه تبعیت کنه که برای ورودی های پیچیده کاربردی هست. علاوه بر این قدرت بالایی هم در ساخت عکسهایی همراه با متن داره.

این مدل در سه نسخه عرضه میشه که قویترین اونها Flux Pro هست که متن باز نیست و فقط از طریق API این شرکت و دیگر سایتها در دسترسه. مدل بعدی Flux Dev هست که متن بازه و میشه روی کامپیوتری با کارت گرافیک قوی اون رو به صورت افلاین اجرا کرد و مدل اخر Flux Schnell که هست نسخه سبکتری از Devعه و امکان ساخت عکسها با سرعت بالاتری رو فراهم میکنه. این مدل هم متن باز شده.

این مدل اما مدل سنگینی هست و به کارت گرافیکی با VRAM بالا نیاز داره. اما به لطف کاربران مختلف، نسخه بهینه تری از اون عرضه که میشه اون رو با 12 گیگ VRAM و حتی کمتر (اما به قیمت زمان ساخت عکس طولانی تر) اجرا کرد و از اون به صورت افلاین بهره برد. با این نسخه و کارت گرافیک 3090 برای ساخت هر عکس با مدل Dev حدود 40 ثانیه و مدل Schnell حدود 15 ثانیه زمان نیازه. شخصا دقت بالای مدل Dev رو به سرعت بالاتر مدل Schnell ترجیح میدم.

برای استفاده از این مدل به صورت افلاین و بهینه لازم هست چیزی حدود 22 گیگ فایل دانلود کنید که اموزش استفاده از اون به صورت مرحله به مرحله در این ویدیو قابل مشاهده هست.

این مدل رو به صورت انلاین و رایگان میتونین از سایتهای زیر ازمایش کنید:

🔗

Flux Pro

🔗

Flux Dev

🔗

Flux Schnell

این شرکت گفته که مدل بعدی اون مدل ساخت ویدیو هست که رقیبی برای Sora خواهد بود.

🔎 tomsguide

📍 @TechTube

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

369 views18:24