فرانسوا شله و AGI
فرانسوا شله، محقق هوش مصنوعی و خالق فریمورک کراس است. اسم او با بنچمارک ابداعی او به نام Abstraction and Reasoning Corpus یا ARC عجین شده است. شله با ارائه این بنچمارک درصدد بوده تا میزان هوش یک عامل را مستقل از تجربه و اینداکتیوبایاسهای تزریقی آن اندازهگیری کند و معتقد بوده که حل این بنچمارک سهل ممتنع، نیازمند استفاده از سوگیریهای القایی سیستم۲ است. در این جلسه، آرش ماری اوریاد، به ارائه در مورد صحبتهای شله در کنفرانس AGI2024 پرداخته است. همچنین در مورد دیتاست ARC و دیدگاهها شله در مورد سیستم۲ نیز مباحثه صورت میگیرد.
لینک یوتیوب:
https://www.youtube.com/watch?v=nOVAGHQgtVM
لینک آپارات:
https://www.aparat.com/v/omq8zuo
فرانسوا شله، محقق هوش مصنوعی و خالق فریمورک کراس است. اسم او با بنچمارک ابداعی او به نام Abstraction and Reasoning Corpus یا ARC عجین شده است. شله با ارائه این بنچمارک درصدد بوده تا میزان هوش یک عامل را مستقل از تجربه و اینداکتیوبایاسهای تزریقی آن اندازهگیری کند و معتقد بوده که حل این بنچمارک سهل ممتنع، نیازمند استفاده از سوگیریهای القایی سیستم۲ است. در این جلسه، آرش ماری اوریاد، به ارائه در مورد صحبتهای شله در کنفرانس AGI2024 پرداخته است. همچنین در مورد دیتاست ARC و دیدگاهها شله در مورد سیستم۲ نیز مباحثه صورت میگیرد.
لینک یوتیوب:
https://www.youtube.com/watch?v=nOVAGHQgtVM
لینک آپارات:
https://www.aparat.com/v/omq8zuo
YouTube
system2 journal club session3
مقاله Lets Verify Step by Step
یکی از ویژگیهای مسائل reasoning این است که برای حل آنها نیازمند چیدن گامهای میانی هستیم. برای مثال برای حل یک مساله ریاضی، گاه باید قدم به قدم متغیرهای میانی را محاسبه کنیم و نهایتا به جواب نهایی برسیم. در سالهای اخیر با پیشرفت LLMها، سعی شده تا از آنها برای حل این دسته مسائل نیز استفاده شوند. LLMها به خاطر توانایی تولید گامهای میانی به صورت متن، قدرت قابل توجهی در حل این مسائل دارند. با این وجود امکان اشتباه و hallucination در یک گام، ممکن است باعث شود تا کل سولوشن تولیدشده توسط LLM نادرست شود. یکی از پارادایم مطرحشده برای مقابله با این مشکل، استفاده از reward model برای گامهای میانی است. به این صورت که از LLM خواسته میشود تا چندین سری گام میانی را تولید کرده و سپس از ریوارد مدل (یا به اصطلاح verifier) خواسته میشود تا بهترین دنباله راه حل را انتخاب کند. در جلسه چهارم از ژورنال کلاب سیستم۲، مهدی سمیعی، دانشجوی دکتری آزمایشگاه یادگیری ماشین، به ارائه پیپر Lets Verift Step by Step که با این موضوع در ارتباط است میپردازد. این پیپر در سال ۲۰۲۳ توسط OpenAI ارائه شده و در آن به بررسی نقش انواع سوپرویژن برای آموزش verifier پرداخته شده است. آشنایی با این مقاله، میتواند در فهم نحوه عملکرد مدل O1 موثر باشد.
لینک یوتیوب:
https://www.youtube.com/watch?v=vXjxJDTCT_o
لینک آپارات:
https://www.aparat.com/v/kpl89v4
یکی از ویژگیهای مسائل reasoning این است که برای حل آنها نیازمند چیدن گامهای میانی هستیم. برای مثال برای حل یک مساله ریاضی، گاه باید قدم به قدم متغیرهای میانی را محاسبه کنیم و نهایتا به جواب نهایی برسیم. در سالهای اخیر با پیشرفت LLMها، سعی شده تا از آنها برای حل این دسته مسائل نیز استفاده شوند. LLMها به خاطر توانایی تولید گامهای میانی به صورت متن، قدرت قابل توجهی در حل این مسائل دارند. با این وجود امکان اشتباه و hallucination در یک گام، ممکن است باعث شود تا کل سولوشن تولیدشده توسط LLM نادرست شود. یکی از پارادایم مطرحشده برای مقابله با این مشکل، استفاده از reward model برای گامهای میانی است. به این صورت که از LLM خواسته میشود تا چندین سری گام میانی را تولید کرده و سپس از ریوارد مدل (یا به اصطلاح verifier) خواسته میشود تا بهترین دنباله راه حل را انتخاب کند. در جلسه چهارم از ژورنال کلاب سیستم۲، مهدی سمیعی، دانشجوی دکتری آزمایشگاه یادگیری ماشین، به ارائه پیپر Lets Verift Step by Step که با این موضوع در ارتباط است میپردازد. این پیپر در سال ۲۰۲۳ توسط OpenAI ارائه شده و در آن به بررسی نقش انواع سوپرویژن برای آموزش verifier پرداخته شده است. آشنایی با این مقاله، میتواند در فهم نحوه عملکرد مدل O1 موثر باشد.
لینک یوتیوب:
https://www.youtube.com/watch?v=vXjxJDTCT_o
لینک آپارات:
https://www.aparat.com/v/kpl89v4
YouTube
system2 journal club session4
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
We are looking for an intern to work on an idea for emergent language. The work consists of a study on emergent language, which is a field that has significant implications for understanding communication protocols among artificial agents. In addition, we aim to apply a new idea to develop communication strategies that are more "efficient and robust," enabling improved coordination and task-solving capabilities in multi-agent environments.
## Requirements
- Sufficiency in deep learning teqniques and their implementation
- Having high skills in reading and presenting papers
## Preferred Qualifications
- Familiarity with reinforcement learning
To apply, please complete this form:
Application Form
#research_application
## Requirements
- Sufficiency in deep learning teqniques and their implementation
- Having high skills in reading and presenting papers
## Preferred Qualifications
- Familiarity with reinforcement learning
To apply, please complete this form:
Application Form
#research_application
اسلایدها و فیلمهای درس یادگیری عمیق، ترم بهار ۱۴۰۳
اسلایدها و فیلم جلسات درس یادگیری عمیق، ارائه شده توسط دکتر سلیمانی، در ترم بهار ۱۴۰۳ دانشکده مهندسی کامپیوتر دانشگاه شریف را میتوانید از لینکهای زیر دریافت کنید.
لینک فیلم جلسات:
https://ocw.sharif.ir/course/id/532
لینک اسلایدها:
https://drive.google.com/drive/folders/18woCenH5RIkk78aeAyidY4xQ7AX3aQ6J?usp=sharing
اسلایدها و فیلم جلسات درس یادگیری عمیق، ارائه شده توسط دکتر سلیمانی، در ترم بهار ۱۴۰۳ دانشکده مهندسی کامپیوتر دانشگاه شریف را میتوانید از لینکهای زیر دریافت کنید.
لینک فیلم جلسات:
https://ocw.sharif.ir/course/id/532
لینک اسلایدها:
https://drive.google.com/drive/folders/18woCenH5RIkk78aeAyidY4xQ7AX3aQ6J?usp=sharing
استدلال چندگامه در نظر Noah Goodman
در جلسه پنجم از ژورنال کلاب سیستم ۲، یوسف جواهریان، دانشجوی ارشد آزمایشگاه یادگیری ماشین، به بررسی مقاله why think step by step توسط گروه اقای noah goodman می پردازد. به طور خلاصه این مقاله با رویکردی scientific به بررسی شرایطی می پردازد که در آن استدلال های چند گامه می توانند تاثیر چشمگیری در بهبود عملکرد استدلال در مدل شوند.
لینک آپارات:
https://www.aparat.com/v/akul5pg
لینک یوتیوب:
https://www.youtube.com/watch?v=NxXlkcTPI0A
در جلسه پنجم از ژورنال کلاب سیستم ۲، یوسف جواهریان، دانشجوی ارشد آزمایشگاه یادگیری ماشین، به بررسی مقاله why think step by step توسط گروه اقای noah goodman می پردازد. به طور خلاصه این مقاله با رویکردی scientific به بررسی شرایطی می پردازد که در آن استدلال های چند گامه می توانند تاثیر چشمگیری در بهبود عملکرد استدلال در مدل شوند.
لینک آپارات:
https://www.aparat.com/v/akul5pg
لینک یوتیوب:
https://www.youtube.com/watch?v=NxXlkcTPI0A
آپارات - سرویس اشتراک ویدیو
ژورنال کلاب سیستم-۲، جلسه پنجم
🚨 Open Research Position: Symbolic Representation Learning.
We announce that there is an open research position in the ML lab at Sharif University of Technology, supervised by Dr. Soleymani.
🔍 Project Description:
We are pleased to announce an open call for applicants to join a cutting-edge research project on Symbolic Representation Learning. If you are passionate about artificial intelligence, machine learning, cognitive science, or the intersection of representation and language, this is your opportunity to contribute to groundbreaking work at the forefront of these fields.
Our project is dedicated to advancing symbolic representation learning, an area of research focused on enabling machines to represent and reason with structured language including symbols. This research aims to bridge the gap between neural networks' statistical learning and the symbolic, structured knowledge representations that are central to human cognition. We will explore new techniques for creating and reasoning with symbolic representations in AI systems.
Requirements:
- Good understanding of deep learning concepts
- Fluency in Python, PyTorch
- Willingness to dedicate significant time
Submit your application here:
Application Form
Application Deadline:
2024/12/02 (23:59 UTC+3:30)
If you have any questions, contact:
@mmsamiei
We announce that there is an open research position in the ML lab at Sharif University of Technology, supervised by Dr. Soleymani.
🔍 Project Description:
We are pleased to announce an open call for applicants to join a cutting-edge research project on Symbolic Representation Learning. If you are passionate about artificial intelligence, machine learning, cognitive science, or the intersection of representation and language, this is your opportunity to contribute to groundbreaking work at the forefront of these fields.
Our project is dedicated to advancing symbolic representation learning, an area of research focused on enabling machines to represent and reason with structured language including symbols. This research aims to bridge the gap between neural networks' statistical learning and the symbolic, structured knowledge representations that are central to human cognition. We will explore new techniques for creating and reasoning with symbolic representations in AI systems.
Requirements:
- Good understanding of deep learning concepts
- Fluency in Python, PyTorch
- Willingness to dedicate significant time
Submit your application here:
Application Form
Application Deadline:
2024/12/02 (23:59 UTC+3:30)
If you have any questions, contact:
@mmsamiei
جستجوی در فضای نهان برنامهها برای حل ARC
در جلسه هفتم از ژورنال کلاب سیستم۲، آرش ماریاوریاد، به ارائه در مورد مقاله Searching Latent Program Spaces میپردازد. در این مقاله راهحلی برای مساله ARC مطرح شده، بدین صورت که در این راه حل در test-time مدل اقدام به بهینهسازی فضای latent برای پیداکردن بهترین program متناظر با مساله داده شده میپردازد.
لینک یوتیوب:
https://www.youtube.com/watch?v=-htUQ4lZJvQ
لینک آپارات:
https://www.aparat.com/v/iobx769
لینک مقاله:
https://arxiv.org/abs/2411.08706
در جلسه هفتم از ژورنال کلاب سیستم۲، آرش ماریاوریاد، به ارائه در مورد مقاله Searching Latent Program Spaces میپردازد. در این مقاله راهحلی برای مساله ARC مطرح شده، بدین صورت که در این راه حل در test-time مدل اقدام به بهینهسازی فضای latent برای پیداکردن بهترین program متناظر با مساله داده شده میپردازد.
لینک یوتیوب:
https://www.youtube.com/watch?v=-htUQ4lZJvQ
لینک آپارات:
https://www.aparat.com/v/iobx769
لینک مقاله:
https://arxiv.org/abs/2411.08706
YouTube
system2 journal club session7
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
مقاله RL-GPT
در جلسه هشتم ژورنال کلاب سیستم۲، امیرمحمد ایزدی به بررسی و ارائه مقالهای با عنوان RL-GPT پرداخت.
لینک یوتیوب:
https://www.youtube.com/watch?v=ZWqHJHiO5CI
لینک آپارات:
https://www.aparat.com/v/pct4qsk
لینک مقاله:
https://arxiv.org/abs/2402.19299
در جلسه هشتم ژورنال کلاب سیستم۲، امیرمحمد ایزدی به بررسی و ارائه مقالهای با عنوان RL-GPT پرداخت.
لینک یوتیوب:
https://www.youtube.com/watch?v=ZWqHJHiO5CI
لینک آپارات:
https://www.aparat.com/v/pct4qsk
لینک مقاله:
https://arxiv.org/abs/2402.19299
YouTube
system2 journal club session8
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
آیا فضای زبان طبیعی مناسبترین ابزار برای انجام استدلالهای پیچیده در مدلهای زبانی بزرگ است؟
این مقاله نشان میدهد که به جای تکیه بر زبان طبیعی (مانند زنجیره تفکر یا CoT)، میتوان از فضای نهفته پیوسته (Continuous Latent Space) برای استدلال استفاده کرد. در این روش، مدل مستقیماً حالت نهفته خود را بهعنوان ورودی برای گامهای بعدی استدلال بازخورد میدهد. این رویکرد به مدل اجازه میدهد بهجای محدود شدن به یک مسیر ثابت و خطی مانند CoT، مسیرهای مختلف استدلال را بهطور همزمان بررسی کرده و گزینههای بهینه را شناسایی کند. روش حاضر در مقایسه با CoT، در وظایف منطقی پیچیده که نیاز به بازنگری و برنامهریزی دارند، عملکرد بهتری دارد و استدلال را با تعداد توکنهای کمتری انجام میدهد.
امروز ساعت ۱۷، هادی حسینی، دانشجوی ارشد آزمایشگاه یادگیری ماشین، در نهمین جلسه ژورنال کلاب سیستم ۲، این مقاله را ارائه خواهد داد. میتوانید از طریق این لینک در جلسه شرکت کنید.
این مقاله نشان میدهد که به جای تکیه بر زبان طبیعی (مانند زنجیره تفکر یا CoT)، میتوان از فضای نهفته پیوسته (Continuous Latent Space) برای استدلال استفاده کرد. در این روش، مدل مستقیماً حالت نهفته خود را بهعنوان ورودی برای گامهای بعدی استدلال بازخورد میدهد. این رویکرد به مدل اجازه میدهد بهجای محدود شدن به یک مسیر ثابت و خطی مانند CoT، مسیرهای مختلف استدلال را بهطور همزمان بررسی کرده و گزینههای بهینه را شناسایی کند. روش حاضر در مقایسه با CoT، در وظایف منطقی پیچیده که نیاز به بازنگری و برنامهریزی دارند، عملکرد بهتری دارد و استدلال را با تعداد توکنهای کمتری انجام میدهد.
امروز ساعت ۱۷، هادی حسینی، دانشجوی ارشد آزمایشگاه یادگیری ماشین، در نهمین جلسه ژورنال کلاب سیستم ۲، این مقاله را ارائه خواهد داد. میتوانید از طریق این لینک در جلسه شرکت کنید.
«دستیاری درس یادگیری عمیق دکتر سلیمانی»
🔹 Deep Learning TA Application Form
🔸 Dr. Mahdieh Soleymani Baghshah
⭕️ دانشجویانی که تمایل دارند در نیمسال آینده (نیمسال بهار ۱۴۰۳-۰۴) دستیار آموزشی درس یادگیری عمیق دکتر سلیمانی باشند، میتوانند درخواست خود را از طریق فرم زیر ثبت نمایند.
⏰ Deadline: January 10th
https://docs.google.com/forms/d/e/1FAIpQLScpwH9YLLK7I54TXX_5BARmm47x-qbxa8TAROh35d1KM_MgWA/viewform?usp=dialog
🔹 Deep Learning TA Application Form
🔸 Dr. Mahdieh Soleymani Baghshah
⭕️ دانشجویانی که تمایل دارند در نیمسال آینده (نیمسال بهار ۱۴۰۳-۰۴) دستیار آموزشی درس یادگیری عمیق دکتر سلیمانی باشند، میتوانند درخواست خود را از طریق فرم زیر ثبت نمایند.
⏰ Deadline: January 10th
https://docs.google.com/forms/d/e/1FAIpQLScpwH9YLLK7I54TXX_5BARmm47x-qbxa8TAROh35d1KM_MgWA/viewform?usp=dialog
📣 TA Application Form
🤖 Course: System-2 AI
🧑🏻🏫 Instructors: Dr. Rohban, Dr. Soleymani, Mr. Samiei
⏰ Deadline: January 23rd
https://docs.google.com/forms/d/e/1FAIpQLSewqI25q5c3DcsdcCzhCVg42motC2S-bg_xuuPWZ0wA60rYHQ/viewform?usp=dialog
🤖 Course: System-2 AI
🧑🏻🏫 Instructors: Dr. Rohban, Dr. Soleymani, Mr. Samiei
⏰ Deadline: January 23rd
https://docs.google.com/forms/d/e/1FAIpQLSewqI25q5c3DcsdcCzhCVg42motC2S-bg_xuuPWZ0wA60rYHQ/viewform?usp=dialog
درباره DeepSeek R1
در جلسه دهم از ژورنال کلاب سیستم۲، دکتر مهدیه سلیمانی به ارائه در مورد مقاله DeepSeek R1 و تفاوت رویکرد آن در استفاده از RL برای جستجو، پرداخت.
لینک یوتیوب:
https://www.youtube.com/watch?v=x3GaRLwO8fA
لینک آپارات:
https://www.aparat.com/v/jmeyz2p
در جلسه دهم از ژورنال کلاب سیستم۲، دکتر مهدیه سلیمانی به ارائه در مورد مقاله DeepSeek R1 و تفاوت رویکرد آن در استفاده از RL برای جستجو، پرداخت.
لینک یوتیوب:
https://www.youtube.com/watch?v=x3GaRLwO8fA
لینک آپارات:
https://www.aparat.com/v/jmeyz2p
YouTube
system2 journal club session10
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
سلام
یک فرصت همکاری با کمیتهی المپیاد دانشآموزی هوش مصنوعی برای دوستانی که علاقهمند به تدریس یا تولید محتوا در شاخههای یادگیری ماشین و یادگیری ژرف هستند و سابقه فعالیت در این زمینه را دارند فراهم است. در صورتی که متمایل به همکاری هستید این فرم را پر کنید.
یک فرصت همکاری با کمیتهی المپیاد دانشآموزی هوش مصنوعی برای دوستانی که علاقهمند به تدریس یا تولید محتوا در شاخههای یادگیری ماشین و یادگیری ژرف هستند و سابقه فعالیت در این زمینه را دارند فراهم است. در صورتی که متمایل به همکاری هستید این فرم را پر کنید.
Forwarded from بر لبهی سکوی(؟) بلند
🔔 «بر لبه سکوی(؟) بلند»
📝 نگاهی واقعنگرانه به وضعیت امروز حوزهی هوش مصنوعی، تحولات پیشروی آن، و تبعات اقتصادی - سیاسی تحولات مذکور؛ با هدف بررسی ابعاد و زوایای پدیده دگرگونی حاصل از هوش مصنوعی (AI Transformation) با حضور اساتید و کارشناسان حوزههای مختلف
🔸 نشست نخست: «در آستانه عاملهای خودمختار»
🗣 دکتر مهدیه سلیمانی، استاد مهندسی کامپیوتر دانشگاه صنعتی شریف | دکتر محمد حسین رهبان، استاد مهندسی کامپیوتر دانشگاه صنعتی شریف.
⏰ چهارشنبه، ۸ اسفند - ساعت ۱۷:۰۰
🏛 دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف، سالن خوارزمی.
——————————————
🆔 @HP_Edge | @AI_Sharif
📝 نگاهی واقعنگرانه به وضعیت امروز حوزهی هوش مصنوعی، تحولات پیشروی آن، و تبعات اقتصادی - سیاسی تحولات مذکور؛ با هدف بررسی ابعاد و زوایای پدیده دگرگونی حاصل از هوش مصنوعی (AI Transformation) با حضور اساتید و کارشناسان حوزههای مختلف
🔸 نشست نخست: «در آستانه عاملهای خودمختار»
🗣 دکتر مهدیه سلیمانی، استاد مهندسی کامپیوتر دانشگاه صنعتی شریف | دکتر محمد حسین رهبان، استاد مهندسی کامپیوتر دانشگاه صنعتی شریف.
⏰ چهارشنبه، ۸ اسفند - ساعت ۱۷:۰۰
🏛 دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف، سالن خوارزمی.
——————————————
🆔 @HP_Edge | @AI_Sharif
Open Position: Research Intern/Collaborator – 3D Image Analysis
We are seeking motivated interns and collaborators to join an innovative joint project with Tehran University of Medical Sciences, focused on the prediction of knee diseases using knee MRI images. This research aims to leverage deep learning techniques to analyze 3D medical images, and the dataset, collected at Imam Khomeini Hospital, will eventually be made publicly available to the scientific community.
🔹 Requirements
▪️ Strong proficiency in Deep Learning
▪️ Hands-on experience with PyTorch
🔹 Preferred Qualifications
▪️ Background in medical image analysis, particularly with 3D imaging techniques
✉️ How to Apply
To apply for the position, please send your CV and transcript, as well as a research statement, describing how you fulfill the position's requirements to soleymani@sharif.edu
🕔 Application Deadline
Send your application by Wednesday, 1403/12/15
This is an opportunity to contribute to a research with significant implications for medical diagnostics. If you are passionate about advancing the field of medical AI and have the required expertise, we would love to hear from you.
We are seeking motivated interns and collaborators to join an innovative joint project with Tehran University of Medical Sciences, focused on the prediction of knee diseases using knee MRI images. This research aims to leverage deep learning techniques to analyze 3D medical images, and the dataset, collected at Imam Khomeini Hospital, will eventually be made publicly available to the scientific community.
🔹 Requirements
▪️ Strong proficiency in Deep Learning
▪️ Hands-on experience with PyTorch
🔹 Preferred Qualifications
▪️ Background in medical image analysis, particularly with 3D imaging techniques
✉️ How to Apply
To apply for the position, please send your CV and transcript, as well as a research statement, describing how you fulfill the position's requirements to soleymani@sharif.edu
🕔 Application Deadline
Send your application by Wednesday, 1403/12/15
This is an opportunity to contribute to a research with significant implications for medical diagnostics. If you are passionate about advancing the field of medical AI and have the required expertise, we would love to hear from you.
فرصت همکاری پژوهشی: Emergent Language و Compositionality
برای کسب اطلاعات بیشتر سند زیر را مطالعه بفرمایید:
https://docs.google.com/document/d/1Q0xPXse3C7TITzKe0hkoQqtR_41Ca1ij-M7mkSPgPJ8/edit?usp=sharing
برای کسب اطلاعات بیشتر سند زیر را مطالعه بفرمایید:
https://docs.google.com/document/d/1Q0xPXse3C7TITzKe0hkoQqtR_41Ca1ij-M7mkSPgPJ8/edit?usp=sharing
Google Docs
فرصت همکاری در زمینه Emergent Language و Compositionality
فرصت همکاری در زمینه Emergent Language و Compositionality درباره پروژه این پروژه تحقیقاتی به مطالعه و تحلیل پدیده ظهور زبان میان عاملهای هوشمند (Emergent Language) میپردازد، با تمرکز ویژه بر ویژگیهای ترکیبپذیری (Compositionality) در این سیستمهای زبانی…
دانشجویانی که علاقمند به عضویت در تیم تدریس درس هوش مصنوعی در نیمسال اول تحصیلی ۱۴۰۵-۱۴۰۴ (پاییز) با تدریس دکتر سلیمانی هستند، لطفا این فرم را تکمیل فرمایند:
https://docs.google.com/forms/d/e/1FAIpQLSepRyHB4QoAl8ulIwdSBDi-aulXnvJjhWhB-KFcfFSFe1aBGw/viewform?usp=header
https://docs.google.com/forms/d/e/1FAIpQLSepRyHB4QoAl8ulIwdSBDi-aulXnvJjhWhB-KFcfFSFe1aBGw/viewform?usp=header
Forwarded from آموزش دانشکده کامپیوتر
در صورتی که تمایل به همکاری به عنوان دستیار آموزشی در درس یادگیری ژرف (نیمسال دوم ۱۴۰۴-۱۴۰۵) دارید، لطفا فرم زیر را حداکثر تا تاریخ ۱۷ بهمن ماه پر نمایند:
https://forms.gle/4ZVFPYY92no32PLm7
https://forms.gle/4ZVFPYY92no32PLm7
با سلام؛
اگر علاقهمند به همکاری بهعنوان دستیار آموزشی در درس بازیابی پیشرفته اطلاعات (نیمسال دوم ۱۴۰۴-۱۴۰۵) خانم دکتر سلیمانی هستید، لطفا درخواست خود را تا تاریخ ۳۰ بهمن از طریق این فرم ثبت کنید.
اگر علاقهمند به همکاری بهعنوان دستیار آموزشی در درس بازیابی پیشرفته اطلاعات (نیمسال دوم ۱۴۰۴-۱۴۰۵) خانم دکتر سلیمانی هستید، لطفا درخواست خود را تا تاریخ ۳۰ بهمن از طریق این فرم ثبت کنید.
🔘 Open Research Positions: Shortcut Learning and Spurious Correlation
We are looking for motivated students to join our research projects.
🔍 Project Description
Shortcut learning occurs when models rely on spurious or overly simple patterns instead of learning the intended underlying task. Our research aims to understand why and how shortcuts emerge, and how they can be identified, analyzed, and mitigated.
We offer three research assistant positions aligned with the following directions, co-advised by Dr. Rohban and Dr. Soleymani:
🔹 1. Understanding the Implicit Effects of Inductive Biases on Shortcut Learning
This project investigates how training-related inductive biases, such as batch size, learning rate, and loss function, influence the emergence of shortcut learning and group robustness.
[1] The Silent Helper: How Implicit Regularization Enhances Group Robustness (HiLD Workshop ICLR 2025)
[2] On the Role of Implicit Regularization of Stochastic Gradient Descent in Group Robustness (ICLR 2026)
🔗 Apply here: Google Form
🔹 2. Understanding Shortcut Learning Through the Lens of Task Arithmetic
It has been observed that shortcut features are often learned early during training. By analyzing the trajectory of weight evolution, we aim to identify shortcut task directions in parameter space and leverage this understanding to mitigate shortcut reliance.
[3] Editing Models with Task Arithmetic (ICLR 2023)
🔗 Apply here: Google Form
🔹 3. Investigating Shortcut Learning in Large-Scale Models
Shortcut-based generalization failures were first studied in linear models and simple settings. In this project, we aim to understand how these biases propagate to large-scale models, including language models, and explore strategies to mitigate them.
[4] Do LLMs Overcome Shortcut Learning? An Evaluation of Shortcut Challenges in Large Language Models (EMNLP 2024)
[5] Small Batch Size Training for Language Models: When Vanilla SGD Works, and Why Gradient Accumulation Is Wasteful (NeurIPS 2025)
🔗 Apply here: Google Form
📌 Important Notes:
Please carefully read the Internship Ethics and Guidelines before submitting your application.
Submitting the application form does not guarantee acceptance.
Only shortlisted candidates will be contacted via email by March 15.
We are looking for motivated students to join our research projects.
🔍 Project Description
Shortcut learning occurs when models rely on spurious or overly simple patterns instead of learning the intended underlying task. Our research aims to understand why and how shortcuts emerge, and how they can be identified, analyzed, and mitigated.
We offer three research assistant positions aligned with the following directions, co-advised by Dr. Rohban and Dr. Soleymani:
🔹 1. Understanding the Implicit Effects of Inductive Biases on Shortcut Learning
This project investigates how training-related inductive biases, such as batch size, learning rate, and loss function, influence the emergence of shortcut learning and group robustness.
[1] The Silent Helper: How Implicit Regularization Enhances Group Robustness (HiLD Workshop ICLR 2025)
[2] On the Role of Implicit Regularization of Stochastic Gradient Descent in Group Robustness (ICLR 2026)
🔗 Apply here: Google Form
🔹 2. Understanding Shortcut Learning Through the Lens of Task Arithmetic
It has been observed that shortcut features are often learned early during training. By analyzing the trajectory of weight evolution, we aim to identify shortcut task directions in parameter space and leverage this understanding to mitigate shortcut reliance.
[3] Editing Models with Task Arithmetic (ICLR 2023)
🔗 Apply here: Google Form
🔹 3. Investigating Shortcut Learning in Large-Scale Models
Shortcut-based generalization failures were first studied in linear models and simple settings. In this project, we aim to understand how these biases propagate to large-scale models, including language models, and explore strategies to mitigate them.
[4] Do LLMs Overcome Shortcut Learning? An Evaluation of Shortcut Challenges in Large Language Models (EMNLP 2024)
[5] Small Batch Size Training for Language Models: When Vanilla SGD Works, and Why Gradient Accumulation Is Wasteful (NeurIPS 2025)
🔗 Apply here: Google Form
📌 Important Notes:
Please carefully read the Internship Ethics and Guidelines before submitting your application.
Submitting the application form does not guarantee acceptance.
Only shortlisted candidates will be contacted via email by March 15.
Google Docs
آییننامهی برنامهی کارآموزی
پروژهی همبستگی جعلی منتور: نهال میرزایی اساتید: آقای دکتر رهبان و خانم دکتر سلیمانی آییننامه برنامهی کارآموزی پژوهشی شرایط، انتظارات و سیاستهای همکاری این برنامه با هدف ایجاد یک تجربه پژوهشی ساختارمند، حرفهای و اخلاقمحور برای دانشجویان علاقهمند…