Ali's Notes
993 subscribers
8 photos
2 videos
58 links
من علی نجفی ام.
اینجا برای خودم نوت برداری میکنم
شاید به درد شما هم بخوره :‌)


Website: www.najafi-ali.com
BlueSky: https://bsky.app/profile/najafialiai.bsky.social
Linkedin: www.linkedin.com/in/najafi-ali1998
Download Telegram
مقاله خوبی هستش
Instruction Tuning
رو یه جا جمع کرده و دیتاست هایی که استفاده شده و همچنین بنچ مارک هایی که وجود داره!

https://arxiv.org/pdf/2308.10792

@css_nlp
یه آپدیتی از ترنزیشنی که گفته بودم بهتون بدم!

من برای فال امسال اپلای کرده بودم برای مقطع دکتری تو امریکا.
و من اینجا (سابانجی) همچنان داشتم دکترام رو ادامه میدادم‌ و ریسرچم رو

اتفاقی که افتاد این بود که ترامپ اومد و زحمت هام برای اپلای به باد رفت.
برای دانشگاه های
Michigan Ann Arbor
USC
Indiana Bloomington
و چند تا دانشگاه دیگه اینترویو شدم و همه فیدبک ها عالی بود
و اینم بگم که درنهایت اتفاقی که رخ داد به خاطر funding cuts ها پوزیشنی که بهم داده بودن رو ابطال کردن
اگر خبر ندارید میتونید یه سرچی کنید که چه بلایی به فاند های NIH, NSF
اومد


در نهایت تصمیم بر این شد که همینجا در سابانجی دکترام رو ادامه بدم.
این تصمیم سخت بود و شاید بپرسین که چرا اروپا نرفتی و فلان
و حقیقتش اینکه من اینجا بیشتر راضیم و بیشتر میتونم کارهای خوبی انجام بدم.

امیدوارم که بتونم کارهای بزرگی انجام بدم تو حوزه آکادمی و ریسرچ
و سعی میکنم که بیشتر فعال باشم تو کانال :‌)
@css_nlp
🔹🔹🔹
Moral Machine
🔹🔹🔹

وبسایتی هستش که بهتون یه سری سناریو هایی میدن که شما رو تو دوراهی های اخلاقی قرار میدن تا بتونن کانپست اخلاق رو درک کنن.
این چنین دیتاست های برای align کردن AI ایجنت ها به درد میخوره.
که در اصل میره سمت حوزه Human Alignment

🔗 https://www.moralmachine.net/



@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
🔗 https://suno.com/song/ed9536e3-d286-4821-b907-f1564887c029

آهنگی که با AI جنریت شده.
انصافا لذت بردم

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
یکی از بحث هایی که بعد از اینکه Elon Musk تویتر رو خریداری کرد
قضیه API تویتر بود که ایشون دسترسی این پلتفرم رو به طور کلی بستن و دیگه
ریسرچر ها نتونستن به دیتای این پلتفورم دیگه دسترسی پیدا کنن.

این اتفاق باعث شد که خیلی از ریسرچ ها به مشکل بخورن و بعضی ها رو آوردن به scrape کردن و دامپ کردن تو گیت هاب و همچین جاهایی.

الان چیزی که برای ریسرچر ها درسترس هستش روی آوردن به پلتفورم های دیگه اس.

یکی از این پلتفورم ها BlueSky هستش که حتی دسترسی به API Firehose دارید و میتونید به صورت استریم و لایو دیتا جمع کنید.
و همچنین backfilling انجام بدید
که این پلتفورم رو روی پروتکل atproto بالا آوردن.

پلفورم دیگه TikTok هستش که خب یه نوع پلتفورم متفاوت شبیه اینستاگرام هستش که دسترسی به API رو میده.


AT Protocol Explained:

🔗 https://www.youtube.com/watch?v=ac2gFrATm7U


@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 VRL Lab Graduate Open House – You're Invited! 🎓
Are you considering graduate studies and interested in the intersection of AI, network science, and social sciences at Sabanci University? Join us for the VRL Lab Graduate Open House to learn more about our research, meet current lab members, and explore opportunities for joining our team!
🗓️ Date: May 23rd, Friday
🕒 Time: 6PM (GMT+3)
📍 Location: Online via Zoom
🔗 Zoom Link: https://lnkd.in/dfe2Bshk
👩‍🔬 At Viral Research Lab (VRL), we work hard, dream big, and enjoy life while developing techniques to analyze online behaviors to improve individual well-being and address societal problems. We leverage online and offline data to gain insight into human behaviors and analyze technological systems to mitigate threats against online conversations by developing techniques in machine learning, network science, and computational social sciences.

If you’re excited by interdisciplinary research and want to be part of a collaborative, innovative lab—this is your chance to connect!
🌐 Learn more about our work: https://varollab.com/
📥 Apply to join us: https://lnkd.in/dbtYzkzY
We welcome prospective PhD and Master's applicants from diverse backgrounds.
Feel free to share this with anyone who might be interested. See you there!


@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
🚨 Paper Alert

🔹🔹🔹
LLM Social Simulations Are a Promising Research Method
🔹🔹🔹

🔗 https://arxiv.org/pdf/2504.02234

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
🚨 Paper Alert

🔹🔹🔹
From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning
🔹🔹🔹


این یکی از باحال ترین مقاله هایی هستش که ژورافسکی و یان لکون که نام های آشنایی هستن بیرون دادن.
تو این مقاله سعی کردن تفاوت بین LLM ها و سیستم زبانی انسان ها رو مشخص کنن.
و نتیجه های باحالی به دست اوردن.

مدل های زبانی به صورت اگرسیو طور کامپرس میکنن مفاهیم رو و اونقدر که دیگه با مفاهیم ما انسان ها تفاوت ایجاد میشه.

قضیه اینکه این مدل ها در اصل یه عالمه دیتا رو که بخوردشون میدیم کامپرس میکنن اطلاعات رو و بعد چون کامپرس شدن (فضای کمتری میگیرن تو فضا) و بعد زمان تولید یا جنریشن این اطلاعات کامپرس شده دیکود میشن.

مغز ماهم همینطور هستش و مثلا شما ممکنه یه کتاب ۱۰۰۰ صفحه ای رو بخونید و بعدش تو ذهن شما یه سامری یا خلاصه ای تو ذهن شما میمونه و شما بعد ها زمانی که بازگو میکنید میتونید اون خلوص داستان رو با طبع ایجاد variation بازگو کنید.



As the mental scaffolding of human cognition, concepts enable efficient interpretation, generalization
from sparse data, and rich communication. For LLMs to transcend surface-level mimicry and achieve
more human-like understanding, it is critical to investigate how their internal representations navigate
the crucial trade-off between information compression and the preservation of semantic meaning. Do
LLMs develop conceptual structures mirroring the efficiency and richness of human thought, or do
they employ fundamentally different representational strategies?



حتما این مقاله رو بخونید ‌:)



🔗 https://arxiv.org/pdf/2505.17117v2

@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
تویت جالب اندرو کارپاسی درمورد

LLMs and code generation


https://x.com/karpathy/status/1930305209747812559




You could see it as there being two modes in creation. Borrowing GAN terminology:
1) generation and
2) discrimination.
e.g. painting - you make a brush stroke (1) and then you look for a while to see if you improved the painting (2). these two stages are interspersed in pretty much all creative work.

Second point. Discrimination can be computationally very hard.
- images are by far the easiest. e.g. image generator teams can create giant grids of results to decide if one image is better than the other. thank you to the giant GPU in your brain built for processing images very fast.
- text is much harder. it is skimmable, but you have to read, it is semantic, discrete and precise so you also have to reason (esp in e.g. code).
- audio is maybe even harder still imo, because it force a time axis so it's not even skimmable. you're forced to spend serial compute and can't parallelize it at all.

You could say that in coding LLMs have collapsed (1) to ~instant, but have done very little to address (2). A person still has to stare at the results and discriminate if they are good. This is my major criticism of LLM coding in that they casually spit out *way* too much code per query at arbitrary complexity, pretending there is no stage 2. Getting that much code is bad and scary. Instead, the LLM has to actively work with you to break down problems into little incremental steps, each more easily verifiable. It has to anticipate the computational work of (2) and reduce it as much as possible. It has to really care.

This leads me to probably the biggest misunderstanding non-coders have about coding. They think that coding is about writing the code (1). It's not. It's about staring at the code (2). Loading it all into your working memory. Pacing back and forth. Thinking through all the edge cases. If you catch me at a random point while I'm "programming", I'm probably just staring at the screen and, if interrupted, really mad because it is so computationally strenuous. If we only get much faster 1, but we don't also reduce 2 (which is most of the time!), then clearly the overall speed of coding won't improve (see Amdahl's law).

@css_nlp
Please RT to reach those concerned and impacted.

To my dear Iranian International Students:

The crisis unfolding in Iran right now is heartbreaking. Many of you are watching from afar worried for your families, overwhelmed by the news, trying to focus on your studies while carrying a weight that’s hard to put into words.

If you’re feeling anxious, distracted, helpless, or just not yourself, please know that these are real, human responses to an unbearable situation. You are not alone. You are not invisible. And there are people here who see you, who care about you, and who want to walk alongside you through this.

My top priority, and I am sure many other Iranian Faculty members, right now is to do what can be done to support you. Please don’t hesitate to reach out. Whether you just need to talk, need help navigating something, or simply want someone to listen. You are always welcome to contact me: ebrahim.bagheri@utoronto.ca

If you'd like to help support the community, please sign up here and we'll see how we can support each other: https://lnkd.in/gb8yZBX8

Even in the darkest of times, our strength lies in one another. Let’s hold on to that strength, keep each other close, and move forward together and with hope.

Human beings are members of one another,
In creation they are of one essence.
When one member is afflicted with pain,
The other members cannot remain at peace.

دانشجویان ایرانی عزیز خارج از میهن
،
دل همه‌ٔ ما پیش شماست. این روزها بحران در ایران قلب همه‌ٔ ما را فشرده. بسیاری از شما از راه دور، با دل‌نگرانی برای خانواده‌ها، زیر فشار اخبار تلخ و سنگین، و در حالی‌که تلاش می‌کنید تمرکز خود را در دانشگاه حفظ کنید، بار سنگینی را به دوش می‌کشید
.
اگر این روزها دل‌نگران، آشفته یا بی‌تاب هستید، بدانید این احساس‌ها کاملاً طبیعی‌اند. شما تنها نیستید. ما شما را می‌بینیم، رنجتان را درک می‌کنیم، و کسانی هستند که دل‌شان با شماست و در کنار شما ایستاده‌اند.

در این روزها، برای من و بسیاری از اعضای هیئت علمی ایرانی در دانشگاه‌های خارج از کشور، هیچ دغدغه‌ای مهم‌تر از این نیست که ببینیم چگونه می‌توانیم در کنار شما باشیم و به شما کمک کنیم. اگر نیازی داشتید، در هر زمانی و بدون هیچ تردیدی با من تماس بگیرید؛ چه برای گفتگو، هم‌فکری، یا حتی فقط شنیده شدن.

ایمیل من اینجاست: ebrahim.bagheri@utoronto.ca

اگر تمایل دارید با دیگران در ارتباط باشید و فضای کوچکی از حمایت و هم‌دلی بسازیم، لطفاً در این فرم کوتاه ثبت‌نام کنید:
https://lnkd.in/gb8yZBX8

حتی در تاریک‌ترین لحظات، امید و تاب‌آوری ما از کنار هم بودن معنا می‌گیرد. بیایید این همدلی را زنده نگه داریم، پشتیبان یکدیگر باشیم و با امید، راه را ادامه دهیم.

بنی‌آدم اعضای یک پیکرند
که در آفرینش ز یک گوهرند
چو عضوی به درد آورد روزگار
دگر عضوها را نماند قرار

با مهر و همراهی،
ابراهیم باقری


@css_nlp