Forwarded from Silicon Brain | جامعه هوش مصنوعی
پیشرفت در زمینه بهینه ساز ها توسط متا
متا بهینهسازی بنام Schedule-free Optimizer معرفی کرده که مورد توجه قرار گرفته. خیلیها درحال ارزیابیش هستن و فیدبک مثبت دادن. چه ویژگی مثبتی داره که ترند شده؟
عملکرد بهتری نسبت به بهینهسازهای رایج مثل #SGD و #Adam داره. شکل بالا رو ببینید. این بهینهساز نسبت به بهینهساز AdamW با تابع پلهای یا کسینوسی همگرایی سریعتری داره.
نیازی به تنظیم لرنینگ ریت (LR Scheduler) نداره. یعنی، دیگه نیازی نیست که #learning_rate رو حین آموزش تغییر بدید.
چطوری ازش استفاده کنیم؟ اول که نصب:
بعدش هم میتونید از بهینهساز مبتنی بر SGD یا AdamW استفاده کنید:
تو لینک زیر، اومدن یک شبکه CNN رو روی دیتاست MNIST با این بهینهساز آموزش دادن که برای شروع کار باهاش و ارزیابی عملکردش میتونین استفاده کنین:
لینک کد | گیتهاب
#ScheduleFree
@silicon_brain | از هوش مصنوعی عقب نمانید
متا بهینهسازی بنام Schedule-free Optimizer معرفی کرده که مورد توجه قرار گرفته. خیلیها درحال ارزیابیش هستن و فیدبک مثبت دادن. چه ویژگی مثبتی داره که ترند شده؟
عملکرد بهتری نسبت به بهینهسازهای رایج مثل #SGD و #Adam داره. شکل بالا رو ببینید. این بهینهساز نسبت به بهینهساز AdamW با تابع پلهای یا کسینوسی همگرایی سریعتری داره.
نیازی به تنظیم لرنینگ ریت (LR Scheduler) نداره. یعنی، دیگه نیازی نیست که #learning_rate رو حین آموزش تغییر بدید.
چطوری ازش استفاده کنیم؟ اول که نصب:
pip install schedulefree
بعدش هم میتونید از بهینهساز مبتنی بر SGD یا AdamW استفاده کنید:
optimizer = schedulefree.AdamWScheduleFree(model.parameters(), lr=args.lr)
تو لینک زیر، اومدن یک شبکه CNN رو روی دیتاست MNIST با این بهینهساز آموزش دادن که برای شروع کار باهاش و ارزیابی عملکردش میتونین استفاده کنین:
لینک کد | گیتهاب
#ScheduleFree
@silicon_brain | از هوش مصنوعی عقب نمانید
🤖 Voiser
سرویس متن به گفتار مبتنی بر #هوش_مصنوعی پیشرفته
💬 Voiser
یک سرویس خلاقانه مبتنی بر هوش مصنوعی ارائه می دهد که متن را به گفتار انسان مانند در بیش از 70 زبان تبدیل می کند. همچنین یک سرویس گفتار به متن قدرتمند ارائه می دهد که به کاربران امکان می دهد فایل های صوتی خود را به سرعت رونویسی کنند.
پشتیبانی از زبان فارسی
https://voiser.net/en
سرویس متن به گفتار مبتنی بر #هوش_مصنوعی پیشرفته
💬 Voiser
یک سرویس خلاقانه مبتنی بر هوش مصنوعی ارائه می دهد که متن را به گفتار انسان مانند در بیش از 70 زبان تبدیل می کند. همچنین یک سرویس گفتار به متن قدرتمند ارائه می دهد که به کاربران امکان می دهد فایل های صوتی خود را به سرعت رونویسی کنند.
پشتیبانی از زبان فارسی
https://voiser.net/en
تمام شبکه های عصبی متنی در یک مکان
ChatHub
یک سرویس گیرنده چت بات است که چت بات های مختلفی مانند ChatGPT، Bing، Claude، Bard و دیگران را در یک پلتفرم ادغام می کند و به شما امکان می دهد همزمان به چند ربات چت دسترسی داشته باشید.
https://app.chathub.gg/
#هوش_مصنوعی
ChatHub
یک سرویس گیرنده چت بات است که چت بات های مختلفی مانند ChatGPT، Bing، Claude، Bard و دیگران را در یک پلتفرم ادغام می کند و به شما امکان می دهد همزمان به چند ربات چت دسترسی داشته باشید.
https://app.chathub.gg/
#هوش_مصنوعی
Forwarded from DeepMind AI Expert (Farzad)
اگه کلی فایل pdf دارین و هنوز نخوندین این سایت بهتون کمک میکنه که اونها رو خلاصه کنید
pdfsummarizer.org
#هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
pdfsummarizer.org
#هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Forwarded from DeepMind AI Expert (Farzad)
This media is not supported in your browser
VIEW IN TELEGRAM
یکی از بهترین روشهای یادگیری مدلهای transformers اینه که تصویری ببینیم چطورکارمیکنن بخصوص قسمت attention.یک نفر یک اپ درست کرده که عالی نشون میده مدلهای GPT چطور کارمیکنن. جالب اینکه مدل GPT-2 را درbrowser اجرا میکنه که میتونید با تکست خودتون امتحان کنید.
◾️ Transformer Explainer: Interactive Learning of Text-Generative Models
https://poloclub.github.io/transformer-explainer/
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Transformer Explainer: Interactive Learning of Text-Generative Models
https://poloclub.github.io/transformer-explainer/
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Forwarded from DeepMind AI Expert (Farzad)
دوستان فعال در حوزه استارت آپ های #لباس میتونین با این مدل CatVTON در ایران پیشرفتهای قابل توجهی رو برای این حوزه رقم بزنین بودجه زیادی رو در این حیطه حیف و میل کنین 😂🚶♂️🚶♂️
◾️ 🐈 CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ 🐈 CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Forwarded from Geek Alerts
کاربرهای پلن رایگان ChatGPT میتونن از الان روزانه ۲ تصویر رایگان باهاش بسازن.
نکته مثبت اینه که میتونید پرامپت خودتون رو به هر زبانی حتی «فارسی» بنویسید.
توی پرامپت نویسی برای تولید عکس هرچقدر بیشتر توضیح بدید مثل سبک و مدل عکس چطور باشه، رنگبندیش چی باشه و هرچیزی که به ذهنتون میرسه باعث میشه خروجی خیلی بهتر بشه.
عکسی که بهتون میده با خروجی ۱۰۲۴ پیکسل هست که کیفیت خوبی برای استفاده داره.
https://chatgpt.com/
@geekalerts
نکته مثبت اینه که میتونید پرامپت خودتون رو به هر زبانی حتی «فارسی» بنویسید.
توی پرامپت نویسی برای تولید عکس هرچقدر بیشتر توضیح بدید مثل سبک و مدل عکس چطور باشه، رنگبندیش چی باشه و هرچیزی که به ذهنتون میرسه باعث میشه خروجی خیلی بهتر بشه.
عکسی که بهتون میده با خروجی ۱۰۲۴ پیکسل هست که کیفیت خوبی برای استفاده داره.
https://chatgpt.com/
@geekalerts
Forwarded from Geek Alerts
گوگل بالاخره Imagen 3 رو در دسترس عموم قرار داد. این مدل سازنده تصویر که شبیه midjourney هست حدود ۳ ماه پیش در دسترس کاربران محدودی قرار گرفت و همین امروز به طور عمومی عرضه شد. عملکرد بسیار خوبی داره و درحد و اندازه همین midjourney میتونه تصاویر بسیار زیبایی رو تولید کنه. این ابزار تحت عنوان ImageFX در آدرس زیر در دسترسه.
https://aitestkitchen.withgoogle.com/tools/image-fx
hadi @geekalerts
https://aitestkitchen.withgoogle.com/tools/image-fx
hadi @geekalerts
Forwarded from TechTube 𝕏 تک توب
This media is not supported in your browser
VIEW IN TELEGRAM
دختری که در واقعیت وجود نداره!
عکس این دختر توسط هوش مصنوعی قدرتمند Flux ساخته شده و بعد از اون با استفاده از مدل تولید ویدیوی Gen-3 Alpha متحرک و به ویدیو تبدیل شده.
🔎 iamneubert
📍 @TechTube
عکس این دختر توسط هوش مصنوعی قدرتمند Flux ساخته شده و بعد از اون با استفاده از مدل تولید ویدیوی Gen-3 Alpha متحرک و به ویدیو تبدیل شده.
🔎 iamneubert
📍 @TechTube
Forwarded from TechTube 𝕏 تک توب
شرکت Black Forest Labs هوش مصنوعی تولید عکس جدیدی به نام Flux رو عرضه کرده که رقیب متن بازی برای میدجرنی هست!
این شرکت توسط مهندسان سابق Stability AI تاسیس شده که ساخت و توسعه مدلهای محبوب Stable Diffusion و قبل از اون Latent Diffusion رو در کارنامه اشون دارن و نتیجه اولین کارشون مدل قدرتمند Flux هست که عکسهای با کیفیت بالا و واقع گرایانه میتونه بسازه و از ورودی کاربر به شکل دقیقی میتونه تبعیت کنه که برای ورودی های پیچیده کاربردی هست. علاوه بر این قدرت بالایی هم در ساخت عکسهایی همراه با متن داره.
این مدل در سه نسخه عرضه میشه که قویترین اونها Flux Pro هست که متن باز نیست و فقط از طریق API این شرکت و دیگر سایتها در دسترسه. مدل بعدی Flux Dev هست که متن بازه و میشه روی کامپیوتری با کارت گرافیک قوی اون رو به صورت افلاین اجرا کرد و مدل اخر Flux Schnell که هست نسخه سبکتری از Devعه و امکان ساخت عکسها با سرعت بالاتری رو فراهم میکنه. این مدل هم متن باز شده.
این مدل اما مدل سنگینی هست و به کارت گرافیکی با VRAM بالا نیاز داره. اما به لطف کاربران مختلف، نسخه بهینه تری از اون عرضه که میشه اون رو با 12 گیگ VRAM و حتی کمتر (اما به قیمت زمان ساخت عکس طولانی تر) اجرا کرد و از اون به صورت افلاین بهره برد. با این نسخه و کارت گرافیک 3090 برای ساخت هر عکس با مدل Dev حدود 40 ثانیه و مدل Schnell حدود 15 ثانیه زمان نیازه. شخصا دقت بالای مدل Dev رو به سرعت بالاتر مدل Schnell ترجیح میدم.
برای استفاده از این مدل به صورت افلاین و بهینه لازم هست چیزی حدود 22 گیگ فایل دانلود کنید که اموزش استفاده از اون به صورت مرحله به مرحله در این ویدیو قابل مشاهده هست.
این مدل رو به صورت انلاین و رایگان میتونین از سایتهای زیر ازمایش کنید:
🔗 Flux Pro
🔗 Flux Dev
🔗 Flux Schnell
این شرکت گفته که مدل بعدی اون مدل ساخت ویدیو هست که رقیبی برای Sora خواهد بود.
🔎 tomsguide
📍 @TechTube
این شرکت توسط مهندسان سابق Stability AI تاسیس شده که ساخت و توسعه مدلهای محبوب Stable Diffusion و قبل از اون Latent Diffusion رو در کارنامه اشون دارن و نتیجه اولین کارشون مدل قدرتمند Flux هست که عکسهای با کیفیت بالا و واقع گرایانه میتونه بسازه و از ورودی کاربر به شکل دقیقی میتونه تبعیت کنه که برای ورودی های پیچیده کاربردی هست. علاوه بر این قدرت بالایی هم در ساخت عکسهایی همراه با متن داره.
این مدل در سه نسخه عرضه میشه که قویترین اونها Flux Pro هست که متن باز نیست و فقط از طریق API این شرکت و دیگر سایتها در دسترسه. مدل بعدی Flux Dev هست که متن بازه و میشه روی کامپیوتری با کارت گرافیک قوی اون رو به صورت افلاین اجرا کرد و مدل اخر Flux Schnell که هست نسخه سبکتری از Devعه و امکان ساخت عکسها با سرعت بالاتری رو فراهم میکنه. این مدل هم متن باز شده.
این مدل اما مدل سنگینی هست و به کارت گرافیکی با VRAM بالا نیاز داره. اما به لطف کاربران مختلف، نسخه بهینه تری از اون عرضه که میشه اون رو با 12 گیگ VRAM و حتی کمتر (اما به قیمت زمان ساخت عکس طولانی تر) اجرا کرد و از اون به صورت افلاین بهره برد. با این نسخه و کارت گرافیک 3090 برای ساخت هر عکس با مدل Dev حدود 40 ثانیه و مدل Schnell حدود 15 ثانیه زمان نیازه. شخصا دقت بالای مدل Dev رو به سرعت بالاتر مدل Schnell ترجیح میدم.
برای استفاده از این مدل به صورت افلاین و بهینه لازم هست چیزی حدود 22 گیگ فایل دانلود کنید که اموزش استفاده از اون به صورت مرحله به مرحله در این ویدیو قابل مشاهده هست.
این مدل رو به صورت انلاین و رایگان میتونین از سایتهای زیر ازمایش کنید:
این شرکت گفته که مدل بعدی اون مدل ساخت ویدیو هست که رقیبی برای Sora خواهد بود.
🔎 tomsguide
📍 @TechTube
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM