برای فاین تون کردن مدل اصلی خام هم روی دیتای 23 هزار سمپلی
به صورت CLM با Accelerate که DDP زده بودم
تقریبا 50 ساعت برای 20 ایپوک زمان برد!
@css_nlp
به صورت CLM با Accelerate که DDP زده بودم
تقریبا 50 ساعت برای 20 ایپوک زمان برد!
@css_nlp
Research is something different from Engineering!
این متن رو اینجا مینویسم بعدا توضیح میدم و به نظرم مبحث مهمی هستش که طی دو سال اخیر تجربش کردم!
@css_nlp
این متن رو اینجا مینویسم بعدا توضیح میدم و به نظرم مبحث مهمی هستش که طی دو سال اخیر تجربش کردم!
@css_nlp
Ali's Notes
Research is something different from Engineering! این متن رو اینجا مینویسم بعدا توضیح میدم و به نظرم مبحث مهمی هستش که طی دو سال اخیر تجربش کردم! @css_nlp
خب سلامی دوباره!
Engineer
یا همون مهندس خودمون، یک شخص practitioner هستش
یعنی اینکه ایده رو به عمل میرسونه!
مثلا ساخت و تولید یک چیزی!
حالا شاید شما بپرسید که خب طرف نمیشینه این رو فکر کنه که چطوری بسازه و فلان؟!
جواب اینکه فکر میکنه که چطوری بسازه و به عمل برسونه اما! سوال نمیپرسه!!!!!!!!!!!!!
سوال پرسیدن سخته!
قاضی بودن سخته!
بزارید با یه مثالی این قضیه رو براتون بشکنم.
مثالم میشه همین ChatGPT که یهو ترکید و همه ازش حرف زدن.
تکنولوژی و علم ساخت ChatGPT از سال 2015 بوده، اما ما ChatGPT رو اون موقع ندیدیم
Engineer
های محترم اومدن و با داشتن ایده و علم که بوده( نه شاید متمرکز) با گرفتن Consulting از researcher های محترم
تونستن تحت عنوان شرکت OpenAI این محصول(ChatGPT) رو بسازن و ما شاهد این زیبایی باشیم.
ریسرچر فقط به رسیدن جواب بسنده نمیکنه!
میشینه فکر میکنه که چرا این جواب ها بیرون اومدن
یا اصلا چرا جواب درست شد
سوال میپرسه و از سوال پرسیدن دست نمیکشه و اینطوری هستش که دنیای علم بزرگ و بزرگ تر میشه
یه مثال دیگه میشه هم این باشه که یه دولوپر وبسایت میاد میسازه یه محصولی رو بلی روی ساختش فکر میکنه
اما تکنولوژی ساخت وبسایت رو ایشون پیدا نکرده. بلکه توسط اشخاصی(ریسرچر های حوزه وب) بالا اومده و این دولوپر از نتیجه کار اون ها استفاده میکنه
و یک وبسایت رو ایجاد میکنه.
من فارسیم زیاد خوب نیست اگر غلط املایی بوده باشه از قبل عذرخواهی میکنم.
@css_nlp
Engineer
یا همون مهندس خودمون، یک شخص practitioner هستش
یعنی اینکه ایده رو به عمل میرسونه!
مثلا ساخت و تولید یک چیزی!
حالا شاید شما بپرسید که خب طرف نمیشینه این رو فکر کنه که چطوری بسازه و فلان؟!
جواب اینکه فکر میکنه که چطوری بسازه و به عمل برسونه اما! سوال نمیپرسه!!!!!!!!!!!!!
سوال پرسیدن سخته!
قاضی بودن سخته!
بزارید با یه مثالی این قضیه رو براتون بشکنم.
مثالم میشه همین ChatGPT که یهو ترکید و همه ازش حرف زدن.
تکنولوژی و علم ساخت ChatGPT از سال 2015 بوده، اما ما ChatGPT رو اون موقع ندیدیم
Engineer
های محترم اومدن و با داشتن ایده و علم که بوده( نه شاید متمرکز) با گرفتن Consulting از researcher های محترم
تونستن تحت عنوان شرکت OpenAI این محصول(ChatGPT) رو بسازن و ما شاهد این زیبایی باشیم.
ریسرچر فقط به رسیدن جواب بسنده نمیکنه!
میشینه فکر میکنه که چرا این جواب ها بیرون اومدن
یا اصلا چرا جواب درست شد
سوال میپرسه و از سوال پرسیدن دست نمیکشه و اینطوری هستش که دنیای علم بزرگ و بزرگ تر میشه
یه مثال دیگه میشه هم این باشه که یه دولوپر وبسایت میاد میسازه یه محصولی رو بلی روی ساختش فکر میکنه
اما تکنولوژی ساخت وبسایت رو ایشون پیدا نکرده. بلکه توسط اشخاصی(ریسرچر های حوزه وب) بالا اومده و این دولوپر از نتیجه کار اون ها استفاده میکنه
و یک وبسایت رو ایجاد میکنه.
من فارسیم زیاد خوب نیست اگر غلط املایی بوده باشه از قبل عذرخواهی میکنم.
@css_nlp
سلام
این اکستنشن رو خیلی دوست داشتم برای همین خواستم با شما هم به اشتراک بزارم.
توسط خود گوگل اسکولار ساخته شده و میشه حین خوندن مقاله تم بک گراند رو به سیاه مثلا تغییر داد، روی سایتیشن که کلیک میکنی مقاله رو بالا میاره.
و چندین کاربرد دیگه.
این اکستنشن رو من روی کروم نصب کردم، احتمال زیاد برای براوزر های دیگه هم موجود باشه.
🔗 Link
@css_nlp
این اکستنشن رو خیلی دوست داشتم برای همین خواستم با شما هم به اشتراک بزارم.
توسط خود گوگل اسکولار ساخته شده و میشه حین خوندن مقاله تم بک گراند رو به سیاه مثلا تغییر داد، روی سایتیشن که کلیک میکنی مقاله رو بالا میاره.
و چندین کاربرد دیگه.
این اکستنشن رو من روی کروم نصب کردم، احتمال زیاد برای براوزر های دیگه هم موجود باشه.
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
این یک وبسایت عالی برای دیدن کارهای مهم که هر هفته انجام میشه هستش
که توسط Sebastian Raschka مدیریت میشه.
همونجوری که میدونین هر روز یه عالمه مقاله در مورد LLM ها میاد بیرون و نمیشه این ها رو دنبال کرد به راحتی.
برای همین میتونید از این وبسایت استفاده کنید تا نالج خودتون رو آپدیت نگه دارید.
🔗 Link
@css_nlp
که توسط Sebastian Raschka مدیریت میشه.
همونجوری که میدونین هر روز یه عالمه مقاله در مورد LLM ها میاد بیرون و نمیشه این ها رو دنبال کرد به راحتی.
برای همین میتونید از این وبسایت استفاده کنید تا نالج خودتون رو آپدیت نگه دارید.
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
Sebastianraschka
Ahead of AI | Sebastian Raschka, PhD | Substack
Ahead of AI specializes in Machine Learning & AI research and is read by tens of thousands of researchers and practitioners who want to stay ahead in the ever-evolving field. Click to read Ahead of AI, by Sebastian Raschka, PhD, a Substack publication with…
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Why Wikipedia Works; and Social Media Not So Much - Taha Yasseri
The paradox of openness on the modern Web. The open Web was supposed to be inherently amazing and a force that would improve all of humanity. However, has technology actually made us dumber and led us to devalue the truth? What can we learn from the relative…
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - NirmalSilwal/system-design-resources: Contains system design materials to prepare for system design interviews 🚩👨💻👨💻👨💻
Contains system design materials to prepare for system design interviews 🚩👨💻👨💻👨💻 - GitHub - NirmalSilwal/system-design-resources: Contains system design materials to prepare for system design i...
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - valeman/Awesome_Math_Books
Contribute to valeman/Awesome_Math_Books development by creating an account on GitHub.
TGI Multi-LoRA: Deploy Once, Serve 30 models
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
TGI Multi-LoRA: Deploy Once, Serve 30 Models
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Statistics for Applications
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
MIT 18.650 Statistics for Applications, Fall 2016
MIT 18.650 Statistics for Applications, Fall 2016 View the complete course: http://ocw.mit.edu/18-650F16 Instructor: Philippe Rigollet This course offers an ...
Popular sources of data
US government http://www.data.gov/
https://www.ipums.org/
https://international.ipums.org/international/
A data repository with many data sets on lots of subjects
https://dataverse.harvard.edu/ where many researchers
archive their data
http://aws.amazon.com/public-data-sets/
http://www.dhsprogram.com/
http://www.rand.org/labor/data.html
directly available to people
on the news feeds of several Yahoo properties”.
http://webscope.sandbox.yahoo.com/catalog.php?datatype=r&did=75
https://movement.uber.com/cities
http://nbasavant.com/
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
EVERY PROGRAMMER SHOULD KNOW
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - mtdvio/every-programmer-should-know: A collection of (mostly) technical things every software developer should know about
A collection of (mostly) technical things every software developer should know about - mtdvio/every-programmer-should-know
Please open Telegram to view this post
VIEW IN TELEGRAM
How To Read A Paper Quickly & Effectively | Easy Research Reading Technique
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
How To Read A Paper Quickly & Effectively | Easy Research Reading Technique
📚 For academic support, proofreading and mentorship https://www.thepagedoctor.com
🧠 Pick my brain, book a 1-1 academic consultation with me https://resources.thepagedoctor.com/l/draminayonisconsultation
🚀 Download my expert-designed academic writing templates…
🧠 Pick my brain, book a 1-1 academic consultation with me https://resources.thepagedoctor.com/l/draminayonisconsultation
🚀 Download my expert-designed academic writing templates…