Forwarded from Silicon Brain | جامعه هوش مصنوعی
مدل زبانی بزرگ فاین تیوین شده برای زبان فارسی
این مقاله در مورد #LLM فارسی به نام #PersianLLaMA هستش. این مدل روی مجموعه ای از متنها و دیتاستهای فارسی آموزش داده شده و با دو نسخه با 7 و 13 میلیارد پارامتر ارائه شده است که بر روی متون رسمی و محاوره ای فارسی با دو رویکرد متفاوت آموزش داده شده.
PersianLLaMA: Towards Building First Persian Large Language Model
لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
این مقاله در مورد #LLM فارسی به نام #PersianLLaMA هستش. این مدل روی مجموعه ای از متنها و دیتاستهای فارسی آموزش داده شده و با دو نسخه با 7 و 13 میلیارد پارامتر ارائه شده است که بر روی متون رسمی و محاوره ای فارسی با دو رویکرد متفاوت آموزش داده شده.
PersianLLaMA: Towards Building First Persian Large Language Model
لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید
arXiv.org
PersianLLaMA: Towards Building First Persian Large Language Model
Despite the widespread use of the Persian language by millions globally, limited efforts have been made in natural language processing for this language. The use of large language models as...
Forwarded from Silicon Brain | جامعه هوش مصنوعی
کامبک گوگل به دنیای LLM
گوگل دیپمایند (#deep_m8nd) مدل Gemma-2 با دو بیلیون پارامتر رو عرضه کرده. یکی از بزرگترین دستاوردهای این کار، عملکرد بهتر مدل در پلتفرم ارزیابی Chatbot Arena نسبت به مدل GPT-3.5 هست!
مدل GPT-3.5 بیش از 175 بیلیون پارامتر و Gemma-2 تنها با دو بیلیون پارامتر داره! تصویر هم مربوط به LMSYS Chatbot Arena هست که عملکرد مدل Gemma-2 رو نسبت به سایر مدلها نشون میده.
علاوه بر Gemma-2 2B دو نسخه دیگه بنام GemmaShield و GemmaScope هم عرضه شده که اینها هم کاربردهای بسیار جالبی دارن.
شاید ندونید LMSYS Chatbot Arena چی هست؟
یک پلتفرم آنلاین و آزاد هست برای ارزیابی #LLM ها و VLM-هاست. ارزیابیهای جالبی هم داره؛ مثلا، یک حالت Battle داره. شما یک سوال میپرسید و دو مدل A و B نامشخص بهش جواب میدن. شما جوابها رو میخونید و بعد میتونید انتخاب کنید که کدوم جواب بهتر هست. بعد از اینکه جواب دادید، بهتون میگه این دو مدل که بهت جواب دادن اسمشون چی بوده.
وبلاگ Gemma-2
#gemma #lmsys #chatbot_arena
@silicon_brain | از هوش مصنوعی عقب نمانید
گوگل دیپمایند (#deep_m8nd) مدل Gemma-2 با دو بیلیون پارامتر رو عرضه کرده. یکی از بزرگترین دستاوردهای این کار، عملکرد بهتر مدل در پلتفرم ارزیابی Chatbot Arena نسبت به مدل GPT-3.5 هست!
مدل GPT-3.5 بیش از 175 بیلیون پارامتر و Gemma-2 تنها با دو بیلیون پارامتر داره! تصویر هم مربوط به LMSYS Chatbot Arena هست که عملکرد مدل Gemma-2 رو نسبت به سایر مدلها نشون میده.
علاوه بر Gemma-2 2B دو نسخه دیگه بنام GemmaShield و GemmaScope هم عرضه شده که اینها هم کاربردهای بسیار جالبی دارن.
شاید ندونید LMSYS Chatbot Arena چی هست؟
یک پلتفرم آنلاین و آزاد هست برای ارزیابی #LLM ها و VLM-هاست. ارزیابیهای جالبی هم داره؛ مثلا، یک حالت Battle داره. شما یک سوال میپرسید و دو مدل A و B نامشخص بهش جواب میدن. شما جوابها رو میخونید و بعد میتونید انتخاب کنید که کدوم جواب بهتر هست. بعد از اینکه جواب دادید، بهتون میگه این دو مدل که بهت جواب دادن اسمشون چی بوده.
وبلاگ Gemma-2
#gemma #lmsys #chatbot_arena
@silicon_brain | از هوش مصنوعی عقب نمانید
Forwarded from هوش مصنوعی |یادگیری ماشین| علم داده
وقتی ChatGPT o1 با ۶ پرامپت در 1 ساعت چیزی که حدود یک سال طول کشید تا دکترای خود را بگذرانید انجام می دهد :
https://youtu.be/M9YOO7N5jF8?feature=shared
لینک مقاله پژوهشی: https://iopscience.iop.org/article/10.3847/1538-4357/ac7a38/meta
#هوش_مصنوعی #یادگیری_ماشین
#AI #LLM #ML
🆔 @Ai_Tv
https://youtu.be/M9YOO7N5jF8?feature=shared
لینک مقاله پژوهشی: https://iopscience.iop.org/article/10.3847/1538-4357/ac7a38/meta
#هوش_مصنوعی #یادگیری_ماشین
#AI #LLM #ML
🆔 @Ai_Tv
YouTube
ChatGPT o1 preview + mini Wrote My PhD Code in 1 Hour*—What Took Me ~1 Year
After about 6 prompts, ChatGPT o1’s preview and mini create a running version of the code described from the methods section of my research paper. I do want to emphasize that while the skeletal code does emulate what my code does, it did use its own synthetic…
Forwarded from codepedia (M admin)
این مخزن GitHub مجموعه ی بی نظیری از دیتاست پرامپت های LLM است
https://github.com/verazuo/jailbreak_llms
#AI #LLM #ML
🆔 @code_pedia
https://github.com/verazuo/jailbreak_llms
#AI #LLM #ML
🆔 @code_pedia
GitHub
GitHub - verazuo/jailbreak_llms: [CCS'24] A dataset consists of 15,140 ChatGPT prompts from Reddit, Discord, websites, and open…
[CCS'24] A dataset consists of 15,140 ChatGPT prompts from Reddit, Discord, websites, and open-source datasets (including 1,405 jailbreak prompts). - verazuo/jailbreak_llms
Forwarded from زندگی به عنوان سرویس
این مقاله الف تا یای مدلهای زبانی رو توی خودش جا داده. از جمع آوری و آمادهسازی داده گرفته تا آموزش مدل و فاینتیون کردن و دیپلوی کردن روی پروداکشن و بهبود پرفورمنس. پیشنهاد میکنم یه نگاه چشمی هم شده بهش بندازید.
🖇 لینک مقاله
#LLM
#Generative_AI
#paper
🆔 @lifeAsAService
🖇 لینک مقاله
#LLM
#Generative_AI
#paper
🆔 @lifeAsAService