اخبار هوش مصنوعی
2.83K subscribers
672 photos
354 videos
1.01K files
1.36K links
Download Telegram
کامبک گوگل به دنیای LLM

گوگل دیپ‌مایند (#deep_m8nd) مدل Gemma-2 با دو بیلیون پارامتر رو عرضه کرده. یکی از بزرگترین دستاوردهای این کار، عملکرد بهتر مدل در پلتفرم ارزیابی Chatbot Arena نسبت به مدل GPT-3.5 هست!

مدل GPT-3.5 بیش از 175 بیلیون پارامتر و Gemma-2 تنها با دو بیلیون پارامتر داره! تصویر هم مربوط به LMSYS Chatbot Arena هست که عملکرد مدل Gemma-2 رو نسبت به سایر مدل‌ها نشون میده.

علاوه بر Gemma-2 2B دو نسخه دیگه بنام GemmaShield و GemmaScope هم عرضه شده که اینها هم کاربردهای بسیار جالبی دارن.

شاید ندونید LMSYS Chatbot Arena چی هست؟
یک پلتفرم آنلاین و آزاد هست برای ارزیابی #LLM ها و VLM-هاست. ارزیابی‌های جالبی هم داره؛ مثلا، یک حالت Battle داره. شما یک سوال میپرسید و دو مدل A و B نامشخص بهش جواب میدن. شما جواب‌ها رو میخونید و بعد می‌تونید انتخاب کنید که کدوم جواب بهتر هست. بعد از اینکه جواب دادید، بهتون میگه این دو مدل که بهت جواب دادن اسمشون چی بوده.

وبلاگ Gemma-2

#gemma #lmsys #chatbot_arena
@silicon_brain | از هوش مصنوعی عقب نمانید
پیشرفت در زمینه بهینه ساز ها توسط متا

متا بهینه‌سازی بنام Schedule-free Optimizer معرفی کرده که مورد توجه قرار گرفته. خیلی‌ها درحال ارزیابیش هستن و فیدبک مثبت دادن. چه ویژگی مثبتی داره که ترند شده؟

عملکرد بهتری نسبت به بهینه‌سازهای رایج مثل #SGD و #Adam داره. شکل بالا رو ببینید. این بهینه‌ساز نسبت به بهینه‌ساز AdamW با تابع پله‌ای یا کسینوسی همگرایی سریع‌تری داره.

نیازی به تنظیم لرنینگ ریت (LR Scheduler) نداره. یعنی، دیگه نیازی نیست که #learning_rate رو حین آموزش تغییر بدید.

چطوری ازش استفاده کنیم؟ اول که نصب:
pip install schedulefree

بعدش هم می‌تونید از بهینه‌ساز مبتنی بر SGD یا AdamW استفاده کنید:
optimizer = schedulefree.AdamWScheduleFree(model.parameters(), lr=args.lr)

تو لینک زیر، اومدن یک شبکه CNN رو روی دیتاست MNIST با این بهینه‌ساز آموزش دادن که برای شروع کار باهاش و ارزیابی عملکردش میتونین استفاده کنین:
لینک کد | گیتهاب
#ScheduleFree
@silicon_brain | از هوش مصنوعی عقب نمانید
🤖 Voiser
سرویس متن به گفتار مبتنی بر #هوش_مصنوعی پیشرفته



💬 Voiser
یک سرویس خلاقانه مبتنی بر هوش مصنوعی ارائه می دهد که متن را به گفتار انسان مانند در بیش از 70 زبان تبدیل می کند. همچنین یک سرویس گفتار به متن قدرتمند ارائه می دهد که به کاربران امکان می دهد فایل های صوتی خود را به سرعت رونویسی کنند.‌‌
پشتیبانی از زبان فارسی

https://voiser.net/en
تمام شبکه های عصبی متنی در یک مکان

ChatHub
یک سرویس گیرنده چت بات است که چت بات های مختلفی مانند ChatGPT، Bing، Claude، Bard و دیگران را در یک پلتفرم ادغام می کند و به شما امکان می دهد همزمان به چند ربات چت دسترسی داشته باشید.

https://app.chathub.gg/

#هوش_مصنوعی
Forwarded from DeepMind AI Expert (Farzad)
اگه کلی فایل pdf دارین و هنوز نخوندین این سایت بهتون کمک میکنه که اونها رو خلاصه کنید

pdfsummarizer.org

#هوش_مصنوعی


🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from DeepMind AI Expert (Farzad)
This media is not supported in your browser
VIEW IN TELEGRAM
یکی از بهترین روشهای یادگیری مدلهای transformers اینه که تصویری ببینیم چطورکارمیکنن بخصوص قسمت attention.یک نفر یک اپ درست کرده که عالی نشون میده مدلهای GPT چطور کارمیکنن. جالب اینکه مدل GPT-2 را درbrowser اجرا میکنه که میتونید با تکست خودتون امتحان کنید.
◾️ Transformer Explainer: Interactive Learning of Text-Generative Models

https://poloclub.github.io/transformer-explainer/

#مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from DeepMind AI Expert (Farzad)
دوستان فعال در حوزه استارت آپ های #لباس میتونین با این مدل CatVTON در ایران پیشرفتهای قابل توجهی رو برای این حوزه رقم بزنین بودجه زیادی رو در این حیطه حیف و میل کنین 😂🚶‍♂️🚶‍♂️

◾️ 🐈 CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
Forwarded from Geek Alerts
کاربرهای پلن رایگان ChatGPT میتونن از الان روزانه ۲ تصویر رایگان باهاش بسازن.
نکته مثبت اینه که میتونید پرامپت خودتون رو به هر زبانی حتی «فارسی» بنویسید.
توی پرامپت نویسی برای تولید عکس هرچقدر بیشتر توضیح بدید مثل سبک و مدل عکس چطور باشه، رنگ‌بندیش چی باشه و هرچیزی که به ذهنتون میرسه باعث میشه خروجی خیلی بهتر بشه.
عکسی که بهتون میده با خروجی ۱۰۲۴ پیکسل هست که کیفیت خوبی برای استفاده داره.
https://chatgpt.com/
@geekalerts
Forwarded from Geek Alerts
گوگل بالاخره Imagen 3 رو در دسترس عموم قرار داد. این مدل سازنده تصویر که شبیه midjourney هست حدود ۳ ماه پیش در دسترس کاربران محدودی قرار گرفت و همین امروز به طور عمومی عرضه شد. عملکرد بسیار خوبی داره و درحد و اندازه همین midjourney می‌تونه تصاویر بسیار زیبایی رو تولید کنه. این ابزار تحت عنوان ImageFX در آدرس زیر در دسترسه.

https://aitestkitchen.withgoogle.com/tools/image-fx
hadi @geekalerts
This media is not supported in your browser
VIEW IN TELEGRAM
دختری که در واقعیت وجود نداره!

عکس این دختر توسط هوش مصنوعی قدرتمند Flux ساخته شده و بعد از اون با استفاده از مدل تولید ویدیوی Gen-3 Alpha متحرک و به ویدیو تبدیل شده.

🔎 iamneubert

📍 @TechTube
شرکت Black Forest Labs هوش مصنوعی تولید عکس جدیدی به نام Flux رو عرضه کرده که رقیب متن بازی برای میدجرنی هست!

این شرکت توسط مهندسان سابق Stability AI تاسیس شده که ساخت و توسعه مدلهای محبوب Stable Diffusion و قبل از اون Latent Diffusion رو در کارنامه اشون دارن و نتیجه اولین کارشون مدل قدرتمند Flux هست که عکسهای با کیفیت بالا و واقع گرایانه میتونه بسازه و از ورودی کاربر به شکل دقیقی میتونه تبعیت کنه که برای ورودی های پیچیده کاربردی هست. علاوه بر این قدرت بالایی هم در ساخت عکسهایی همراه با متن داره.

این مدل در سه نسخه عرضه میشه که قویترین اونها Flux Pro هست که متن باز نیست و فقط از طریق API این شرکت و دیگر سایتها در دسترسه. مدل بعدی Flux Dev هست که متن بازه و میشه روی کامپیوتری با کارت گرافیک قوی اون رو به صورت افلاین اجرا کرد و مدل اخر Flux Schnell که هست نسخه سبکتری از Devعه و امکان ساخت عکسها با سرعت بالاتری رو فراهم میکنه. این مدل هم متن باز شده.

این مدل اما مدل سنگینی هست و به کارت گرافیکی با VRAM بالا نیاز داره. اما به لطف کاربران مختلف، نسخه بهینه تری از اون عرضه که میشه اون رو با 12 گیگ VRAM و حتی کمتر (اما به قیمت زمان ساخت عکس طولانی تر) اجرا کرد و از اون به صورت افلاین بهره برد. با این نسخه و کارت گرافیک 3090 برای ساخت هر عکس با مدل Dev حدود 40 ثانیه و مدل Schnell حدود 15 ثانیه زمان نیازه. شخصا دقت بالای مدل Dev رو به سرعت بالاتر مدل Schnell ترجیح میدم.

برای استفاده از این مدل به صورت افلاین و بهینه لازم هست چیزی حدود 22 گیگ فایل دانلود کنید که اموزش استفاده از اون به صورت مرحله به مرحله در این ویدیو قابل مشاهده هست.

این مدل رو به صورت انلاین و رایگان میتونین از سایتهای زیر ازمایش کنید:

🔗 Flux Pro

🔗 Flux Dev

🔗 Flux Schnell

این شرکت گفته که مدل بعدی اون مدل ساخت ویدیو هست که رقیبی برای Sora خواهد بود.

🔎 tomsguide

📍 @TechTube
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM