Ali's Notes
998 subscribers
8 photos
2 videos
58 links
من علی نجفی ام.
اینجا برای خودم نوت برداری میکنم
شاید به درد شما هم بخوره :‌)


Website: www.najafi-ali.com
BlueSky: https://bsky.app/profile/najafialiai.bsky.social
Linkedin: www.linkedin.com/in/najafi-ali1998
Download Telegram
به نظرم فیچر نایسی هستش!
@css_nlp
meta-llama/Meta-Llama-3-8B-Instruct

خیلی راضی کننده اس این مدلشون
راحت میتونید رو تسک فارسی هم فاین تون کنید و ازش لذت ببرید : )


من روی یدونه 4090 بالا آوردم!


@css_nlp
برای فاین تون کردن مدل اصلی خام هم روی دیتای 23 هزار سمپلی
به صورت CLM با Accelerate که DDP زده بودم
تقریبا 50 ساعت برای 20 ایپوک زمان برد!

@css_nlp
Research is something different from Engineering!

این متن رو اینجا مینویسم بعدا توضیح میدم و به نظرم مبحث مهمی هستش که طی دو سال اخیر تجربش کردم!

@css_nlp
Ali's Notes
Research is something different from Engineering! این متن رو اینجا مینویسم بعدا توضیح میدم و به نظرم مبحث مهمی هستش که طی دو سال اخیر تجربش کردم! @css_nlp
خب سلامی دوباره!

Engineer
یا همون مهندس خودمون، یک شخص practitioner هستش
یعنی اینکه ایده رو به عمل میرسونه!
مثلا ساخت و تولید یک چیزی!
حالا شاید شما بپرسید که خب طرف نمیشینه این رو فکر کنه که چطوری بسازه و فلان؟!
جواب اینکه فکر میکنه که چطوری بسازه و به عمل برسونه اما! سوال نمیپرسه!!!!!!!!!!!!!
سوال پرسیدن سخته!
قاضی بودن سخته!


بزارید با یه مثالی این قضیه رو براتون بشکنم.
مثالم میشه همین ChatGPT که یهو ترکید و همه ازش حرف زدن.
تکنولوژی و علم ساخت ChatGPT از سال 2015 بوده، اما ما ChatGPT رو اون موقع ندیدیم
Engineer
های محترم اومدن و با داشتن ایده و علم که بوده( نه شاید متمرکز) با گرفتن Consulting از researcher های محترم
تونستن تحت عنوان شرکت OpenAI این محصول(ChatGPT) رو بسازن و ما شاهد این زیبایی باشیم.

ریسرچر فقط به رسیدن جواب بسنده نمیکنه!
میشینه فکر میکنه که چرا این جواب ها بیرون اومدن
یا اصلا چرا جواب درست شد
سوال میپرسه و از سوال پرسیدن دست نمیکشه و اینطوری هستش که دنیای علم بزرگ و بزرگ تر میشه


یه مثال دیگه میشه هم این باشه که یه دولوپر وبسایت میاد میسازه یه محصولی رو بلی روی ساختش فکر میکنه
اما تکنولوژی ساخت وبسایت رو ایشون پیدا نکرده. بلکه توسط اشخاصی(ریسرچر های حوزه وب) بالا اومده و این دولوپر از نتیجه کار اون ها استفاده میکنه
و یک وبسایت رو ایجاد میکنه.

من فارسیم زیاد خوب نیست اگر غلط املایی بوده باشه از قبل عذرخواهی میکنم.

@css_nlp
سلام
این اکستنشن رو خیلی دوست داشتم برای همین خواستم با شما هم به اشتراک بزارم.

توسط خود گوگل اسکولار ساخته شده و میشه حین خوندن مقاله تم بک گراند رو به سیاه مثلا تغییر داد، روی سایتیشن که کلیک میکنی مقاله رو بالا میاره.
و چندین کاربرد دیگه.
این اکستنشن رو من روی کروم نصب کردم، احتمال زیاد برای براوزر های دیگه هم موجود باشه.

🔗Link

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
🔹
LLMs Simulation
🔹
سلام.
این کتابخونه رو برای شبیه سازی محیط اینترکتیو LLM ها ساختن.
چیز تمیزی هستش.

🔗Link

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
استک اورفلو هم این بین عقب نمونده : )
حتی اکستنشن vscode هم براش زدن


🔗Overflow AI

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
این یک وبسایت عالی برای دیدن کارهای مهم که هر هفته انجام میشه هستش
که توسط Sebastian Raschka مدیریت میشه.
همونجوری که میدونین هر روز یه عالمه مقاله در مورد LLM ها میاد بیرون و نمیشه این ها رو دنبال کرد به راحتی.
برای همین میتونید از این وبسایت استفاده کنید تا نالج خودتون رو آپدیت نگه دارید.

🔗 Link


@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
یک survey عالی برای کسانی که به Coordinated Online Behaviour علاقه دارند.

🔗Link

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
🔹
Popular sources of data
🔹

✔️ Data.gov: Datasets generated by the executive branch of the
US government http://www.data.gov/
✔️ IPUMS : censuses from the US and many more!
https://www.ipums.org/
✔️ International IPUMS
https://international.ipums.org/international/
✔️ ICPSR http://www.icpsr.umich.edu/icpsrweb/ICPSR/:
A data repository with many data sets on lots of subjects
✔️ Harvard-MIT Data center and Harvard Data verse
https://dataverse.harvard.edu/ where many researchers
archive their data
✔️ Amazon dataverse
http://aws.amazon.com/public-data-sets/
✔️ Demographic and Health surveys
http://www.dhsprogram.com/
✔️ World bank http://data.worldbank.org/
✔️ LSMS (search for LSMS on the world bank data page)
✔️ Rand public-use databases
http://www.rand.org/labor/data.html
✔️ Randomized control trials
✔️ https://dataverse.harvard.edu/dataverse/jpal
✔️ https://dataverse.harvard.edu/dataverse/socialsciencercts
✔️ Many websites that are data intensive are making that data
directly available to people
✔️ 538
✔️ Yahoo data dump : “a sample of anonymized user interactions
on the news feeds of several Yahoo properties”.
http://webscope.sandbox.yahoo.com/catalog.php?datatype=r&did=75
✔️ Uber movement (to come)
https://movement.uber.com/cities
✔️ Some sites are specializing in aggregating data
✔️ Sports data sets http://www.opensourcesports.com/,
http://nbasavant.com/
✔️ Web pages: Way back machine https://archive.org/web/



@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM