ایشون عمر خطاب هستن
فردی که داره استاد دانشگاه MIT میشه و میزان contribution هاش واقعا قابل تحسینه و اینکه ایشون تو پروژه dspy داره هم زمان با اینکه کد میزنه، پروژه رو مدیریت می کنه و به issue ها جواب میده
برخلاف اساتیدی که ما تو ایران داریم که از دانشجو بیگاری میکشن و سواد فنی چندانی ندارن
البته اساتیدی هستن که به دانشجو اهمیت میدن و خودشون رو از لحاظ فنی بروز نگه میدارن
فردی که داره استاد دانشگاه MIT میشه و میزان contribution هاش واقعا قابل تحسینه و اینکه ایشون تو پروژه dspy داره هم زمان با اینکه کد میزنه، پروژه رو مدیریت می کنه و به issue ها جواب میده
برخلاف اساتیدی که ما تو ایران داریم که از دانشجو بیگاری میکشن و سواد فنی چندانی ندارن
البته اساتیدی هستن که به دانشجو اهمیت میدن و خودشون رو از لحاظ فنی بروز نگه میدارن
👍10😁1
Msnp's binary thoughts
Photo
طرف نویسنده اول ColBERT عه
تورو خدا ببین اوضاع چیه
حالا استاد ما میاد سین میزنه جواب نمیده میگه به دلایلی که خودتون میدونید 🤡
تورو خدا ببین اوضاع چیه
حالا استاد ما میاد سین میزنه جواب نمیده میگه به دلایلی که خودتون میدونید 🤡
👍1😁1
اون روز داشتن درمورد قضاوت و استفاده و fine tune کردن llm ها تو چیزایی مثل کاربرد قضایی حساس صحبت میشد به نظرم دیدن این ویدیو خالی از لطف نیست
https://youtu.be/WwbukAcMM4k?si=khVQjH3z5b0F_MHA
در ضمن yannic رو هم subscribe کنید خیلی مطالب بدرد بخوری میذاره
https://youtu.be/WwbukAcMM4k?si=khVQjH3z5b0F_MHA
در ضمن yannic رو هم subscribe کنید خیلی مطالب بدرد بخوری میذاره
YouTube
Privacy Backdoors: Stealing Data with Corrupted Pretrained Models (Paper Explained)
#llm #privacy #finetuning
Can you tamper with a base model in such a way that it will exactly remember its fine-tuning data? This paper presents a method of doing exactly that, and implements it in modern transformers.
OUTLINE:
0:00 - Intro & Overview…
Can you tamper with a base model in such a way that it will exactly remember its fine-tuning data? This paper presents a method of doing exactly that, and implements it in modern transformers.
OUTLINE:
0:00 - Intro & Overview…
🤔1
Forwarded from دستاوردهای یادگیری عمیق(InTec)
YouTube
Deep Dive into LLMs like ChatGPT
This is a general audience deep dive into the Large Language Model (LLM) AI technology that powers ChatGPT and related products. It is covers the full training stack of how the models are developed, along with mental models of how to think about their "psychology"…
❤1
Msnp's binary thoughts
در حال پخت و پز Agent
از دیروز تا الان 0.57$ خرج توکن کردم فقط برای دوتا مسئله کگل
فکر نکنم بتونم با این وضعیت دووم بیارم 🥲
فکر نکنم بتونم با این وضعیت دووم بیارم 🥲
یه لحظه تو ذهنم گفتم که معدل 3 ترم اخیرم نرماله و اکثر نمراتم حول و حوش معدل هستن و دیدم بله
عجیبه ها
سه تا نمودار گذاشتم سه نفر لفت دادن
اینکه یه فرضیه ای تو ذهنت باشه بری داده ها رو scrape کنی بعد تمیزشون کنی و مصور کنی تا ببینی فرضت درسته لفت دادن داره؟ 🤦♂
سه تا نمودار گذاشتم سه نفر لفت دادن
اینکه یه فرضیه ای تو ذهنت باشه بری داده ها رو scrape کنی بعد تمیزشون کنی و مصور کنی تا ببینی فرضت درسته لفت دادن داره؟ 🤦♂
🤣5👍1
Forwarded from LLM Club
🔔 اعلام برنامه جلسهی چهاردهم ژورنالکلاب مدلهای زبانی بزرگ
📚 موضوع: نحوهی ساخت و آموزش مدلهای زبانی چندزبانه و به طور خاص مدل Aya-expanse
👤 سخنران مهمان: دکتر مرضیه فدایی، پژوهشگر ارشد هوش مصنوعی در شرکت Cohere
🗓 زمان: یکشنبه ۱۴۰۳/۱۱/۲۸، ساعت ۱۹:۳۰ تا ۲۱:٠٠
مکان برگزاری: vc.sharif.edu/ch/mjafari
🔍 مدل زبانی آیا-اکسپنس یک مدل چندزبانه بزرگ است که توسط تیم Cohere For AI توسعه یافته و از ۲۳ زبان مختلف از جمله فارسی پشتیبانی میکند. این مدل با استفاده از تکنیکهای پیشرفتهای مانند داوری داده، آموزش با ترجیح چندزبانه، تنظیمات ایمنی و ترکیب مدلها، عملکرد بالایی را در پردازش زبانهای مختلف ارائه میدهد. هدف از توسعه ایا-اکسپنس، ارائه یک مدل چندزبانه با کیفیت بالا برای استفاده پژوهشگران در سراسر جهان است. طبق معیارها و سنجههای مختلف (از جمله این سنجه) مدل آیا-اکسپنس کیفیت خوبی بر روی زبان فارسی نیز دارد.
لینک یوتیوب ژورنالکلاب (ویدئو و اسلاید جلسهها)
افزودن رویداد به تقویم گوگل
از همهی شما دعوت میکنیم که در این جلسه شرکت کنید.
#LLM #LLM_JC #LLM_Club #INL_Lab #Aya_Expanse
@LLM_JC
📚 موضوع: نحوهی ساخت و آموزش مدلهای زبانی چندزبانه و به طور خاص مدل Aya-expanse
👤 سخنران مهمان: دکتر مرضیه فدایی، پژوهشگر ارشد هوش مصنوعی در شرکت Cohere
🗓 زمان: یکشنبه ۱۴۰۳/۱۱/۲۸، ساعت ۱۹:۳۰ تا ۲۱:٠٠
مکان برگزاری: vc.sharif.edu/ch/mjafari
🔍 مدل زبانی آیا-اکسپنس یک مدل چندزبانه بزرگ است که توسط تیم Cohere For AI توسعه یافته و از ۲۳ زبان مختلف از جمله فارسی پشتیبانی میکند. این مدل با استفاده از تکنیکهای پیشرفتهای مانند داوری داده، آموزش با ترجیح چندزبانه، تنظیمات ایمنی و ترکیب مدلها، عملکرد بالایی را در پردازش زبانهای مختلف ارائه میدهد. هدف از توسعه ایا-اکسپنس، ارائه یک مدل چندزبانه با کیفیت بالا برای استفاده پژوهشگران در سراسر جهان است. طبق معیارها و سنجههای مختلف (از جمله این سنجه) مدل آیا-اکسپنس کیفیت خوبی بر روی زبان فارسی نیز دارد.
لینک یوتیوب ژورنالکلاب (ویدئو و اسلاید جلسهها)
افزودن رویداد به تقویم گوگل
از همهی شما دعوت میکنیم که در این جلسه شرکت کنید.
#LLM #LLM_JC #LLM_Club #INL_Lab #Aya_Expanse
@LLM_JC
🔥1
Msnp's binary thoughts
در حال پخت و پز Agent
خیلی وقت بود که اینو ندیده بودم که پروسه با موفقیت تموم بشه همش با کمک claude sonnet بجای gpt-4o که خیلی کمک کننده بودش
این کورس خیلی خوبی برای درک نحوه کار LLM هاست
https://www.deeplearning.ai/short-courses/how-transformer-llms-work
در کل به هیچ وجه short course های deeplearning.ai رو از دست ندید
https://www.deeplearning.ai/short-courses/how-transformer-llms-work
در کل به هیچ وجه short course های deeplearning.ai رو از دست ندید
DeepLearning.AI - Learning Platform
How Transformer LLMs Work
Understand the transformer architecture that powers LLMs to use them more effectively.
👍1🙏1