⚡️ Ling-flash-2.0 در دسترس عموم قرار گرفت! ⚡️
🔹 مدل با ۱۰۰ میلیارد پارامتر، اما تنها ≈۶.۱B فعال — فوقالعاده بهینه در مصرف منابع
🔹 آموزشدیده با بیش از ۲۰ تریلیون توکن + مراحل RL و فاینتیونینگ
🔹 بهترین عملکرد در بین مدلهای تا ۴۰B، بهخصوص در استدلال پیچیده، تولید کد و تسکهای فرانتاند
🔹 معماری MoE با فعالسازی 1/32 پارامترها، به همراه تکنیکهای پیشرفته مسیریابی و تعادل توجه
🔹 سرعت: تولید ۲۰۰+ توکن در ثانیه روی H20 (۳ برابر سریعتر از مدلهای متراکم 36B)
🔹 پشتیبانی از کانتکست تا ۱۲۸K توکن (با YaRN)
#moe #llm #ml #ai #opensource
🔹 مدل با ۱۰۰ میلیارد پارامتر، اما تنها ≈۶.۱B فعال — فوقالعاده بهینه در مصرف منابع
🔹 آموزشدیده با بیش از ۲۰ تریلیون توکن + مراحل RL و فاینتیونینگ
🔹 بهترین عملکرد در بین مدلهای تا ۴۰B، بهخصوص در استدلال پیچیده، تولید کد و تسکهای فرانتاند
🔹 معماری MoE با فعالسازی 1/32 پارامترها، به همراه تکنیکهای پیشرفته مسیریابی و تعادل توجه
🔹 سرعت: تولید ۲۰۰+ توکن در ثانیه روی H20 (۳ برابر سریعتر از مدلهای متراکم 36B)
🔹 پشتیبانی از کانتکست تا ۱۲۸K توکن (با YaRN)
#moe #llm #ml #ai #opensource