📊 گزارش وضعیت هوش مصنوعی در چین - سهماهه دوم ۲۰۲۵
منتشر شده توسط: Artificial Analysis 🇨🇳
چین همچنان با سرعت بالا در حال پیشروی در رقابت جهانی هوش مصنوعیست و دستکم ۱۰ لابراتوار فعال در این حوزه داره که همگی مدلهایی با امتیاز هوشی بالا تولید میکنن! 🚀
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
منتشر شده توسط: Artificial Analysis 🇨🇳
چین همچنان با سرعت بالا در حال پیشروی در رقابت جهانی هوش مصنوعیست و دستکم ۱۰ لابراتوار فعال در این حوزه داره که همگی مدلهایی با امتیاز هوشی بالا تولید میکنن! 🚀
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🎓 یه دوره رایگان و خیلی خوب از دانشگاه واترلو برای کسایی که میخوان مدلهای زبانی (LLM) رو از پایه یاد بگیرن!
از مفاهیم اولیه مثل RNN و NLP تا ساخت ترنسفورمر و آموزش مدل 🚀
اگه به یادگیری عمیق و هوش مصنوعی علاقه داری، این دوره یه شروع فوقالعادهست!
https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_
schedule : https://stanford-cs336.github.io/spring202
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
از مفاهیم اولیه مثل RNN و NLP تا ساخت ترنسفورمر و آموزش مدل 🚀
اگه به یادگیری عمیق و هوش مصنوعی علاقه داری، این دوره یه شروع فوقالعادهست!
https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_
schedule : https://stanford-cs336.github.io/spring202
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔗 اتصال هر LLM به هر سرور MCP!
🛠 در واقع MCP-Use یک ابزار متنباز و قدرتمنده که به شما این امکان رو میده تا هر مدل زبانی (LLM) رو به هر سرور MCP متصل کنید و ایجنتهای سفارشی با دسترسی به ابزار بسازید — بدون نیاز به کلاینتهای بسته یا اپلیکیشنهای اختصاصی! 😎
✅ ساخت کلاینتهای کاملاً لوکال
✅ بدون وابستگی به کدهای بسته
✅ مناسب برای توسعهدهندههایی که به کنترل کامل روی زیرساخت اهمیت میدن
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🛠 در واقع MCP-Use یک ابزار متنباز و قدرتمنده که به شما این امکان رو میده تا هر مدل زبانی (LLM) رو به هر سرور MCP متصل کنید و ایجنتهای سفارشی با دسترسی به ابزار بسازید — بدون نیاز به کلاینتهای بسته یا اپلیکیشنهای اختصاصی! 😎
✅ ساخت کلاینتهای کاملاً لوکال
✅ بدون وابستگی به کدهای بسته
✅ مناسب برای توسعهدهندههایی که به کنترل کامل روی زیرساخت اهمیت میدن
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
"THINK-ON-GRAPH: Deep and Responsible Reasoning of Large Language Models on Knowledge Graphs"
این مقاله روش خفنی به نام گرافهای دانش (Knowledge Graph)معرفی میکند:
🔍 مثال قشنگی هم زده:
سؤال اینه که «حزب اکثریت در کشوری که شهر Canberra توشه چیه؟»
سه روش مختلف برای جواب دادن بررسی شدن:
1️⃣ مدل تنها (LLM-only):
فقط از اطلاعات خود مدل استفاده میکنه. مثلاً میگه تا ۲۰۲۱ نخستوزیر استرالیا فلانی بوده، پس حزبش فلان بوده.
✅ مشکل؟ اطلاعاتش قدیمیه یا ناقصه، جواب اشتباه میده!
2️⃣ مدل + گراف دانش (LLM + KG):
مدل سعی میکنه با زبان SPARQL از گراف سوال بپرسه. اما گراف اطلاعات لازم رو نداره یا مدل بلد نیست خوب بپرسه.
⛔️ نتیجه؟ باز هم نمیتونه جواب بده!
3️⃣ ✅ Think-on-Graph (LLM ⊗ KG):
مدل مرحله به مرحله «فکر میکنه» روی گراف!
مثلاً اول بررسی میکنه Canberra پایتخت چیه، بعد میره ببینه نخستوزیر استرالیا کیه، بعد از اطلاعات خودش (یا گراف) درمیاره که اون عضو حزب Labor هست.
نتیجه؟ جواب درسته و منطقیه! 🎯
https://arxiv.org/abs/2307.07697
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این مقاله روش خفنی به نام گرافهای دانش (Knowledge Graph)معرفی میکند:
🔍 مثال قشنگی هم زده:
سؤال اینه که «حزب اکثریت در کشوری که شهر Canberra توشه چیه؟»
سه روش مختلف برای جواب دادن بررسی شدن:
1️⃣ مدل تنها (LLM-only):
فقط از اطلاعات خود مدل استفاده میکنه. مثلاً میگه تا ۲۰۲۱ نخستوزیر استرالیا فلانی بوده، پس حزبش فلان بوده.
✅ مشکل؟ اطلاعاتش قدیمیه یا ناقصه، جواب اشتباه میده!
2️⃣ مدل + گراف دانش (LLM + KG):
مدل سعی میکنه با زبان SPARQL از گراف سوال بپرسه. اما گراف اطلاعات لازم رو نداره یا مدل بلد نیست خوب بپرسه.
⛔️ نتیجه؟ باز هم نمیتونه جواب بده!
3️⃣ ✅ Think-on-Graph (LLM ⊗ KG):
مدل مرحله به مرحله «فکر میکنه» روی گراف!
مثلاً اول بررسی میکنه Canberra پایتخت چیه، بعد میره ببینه نخستوزیر استرالیا کیه، بعد از اطلاعات خودش (یا گراف) درمیاره که اون عضو حزب Labor هست.
نتیجه؟ جواب درسته و منطقیه! 🎯
https://arxiv.org/abs/2307.07697
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگر به یادگیری ماشین علاقهمند هستید، پروژهی «100 روز کدنویسی یادگیری ماشین» از Avik Jain یک مسیر منظم و عملی برای تسلط بر مفاهیم آن ارائه میدهد. این پروژه شامل آموزشهای روزانه با کدهای پایتون و توضیحات مفهومی است.
https://github.com/Avik-Jain/100-Days-Of-ML-Code
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/Avik-Jain/100-Days-Of-ML-Code
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🎓 دنبال یه منبع قوی و رایگان برای شروع یادگیری مدلهای بنیادین LLM هستی؟
این دوره رایگان از دانشگاه واترلو دقیقاً همونه که لازم داری!
هم مفاهیم پایه رو پوشش میده، هم به موضوعات پیشرفته وارد میشه. 👇
📚 توی این دوره یاد میگیری:
🔹 مفاهیم پایهای RNN، CNN، NLP و بینایی کامپیوتری (CV)
🔹 مکانیزم attention و ساختار Transformer
🔹 آموزش اولیه مدلها (Pretraining) و روشهای تنظیم پارامترها (PEFT)
🔹 و کلی مطالب پیشرفته دیگه برای فهم بهتر LLMها!
https://cs.uwaterloo.ca/~wenhuche/teaching/cs886/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره رایگان از دانشگاه واترلو دقیقاً همونه که لازم داری!
هم مفاهیم پایه رو پوشش میده، هم به موضوعات پیشرفته وارد میشه. 👇
📚 توی این دوره یاد میگیری:
🔹 مفاهیم پایهای RNN، CNN، NLP و بینایی کامپیوتری (CV)
🔹 مکانیزم attention و ساختار Transformer
🔹 آموزش اولیه مدلها (Pretraining) و روشهای تنظیم پارامترها (PEFT)
🔹 و کلی مطالب پیشرفته دیگه برای فهم بهتر LLMها!
https://cs.uwaterloo.ca/~wenhuche/teaching/cs886/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔹 آیا میتونید فرق انسان و هوش مصنوعی رو تشخیص بدید؟
در سهماهه اول ۲۰۲۵، توی آزمایشهای شبیه تورینگ، افراد در ۷۳٪ مواقع پاسخ چتباتهای هوش مصنوعی رو با انسان اشتباه گرفتن!
تنها ۶ ماه پیش این عدد حدود ۵۰٪ بود!
🔍 پیشرفت هوش مصنوعی در تقلید گفتوگوی انسانی با سرعت خیرهکنندهای داره جلو میره...
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
در سهماهه اول ۲۰۲۵، توی آزمایشهای شبیه تورینگ، افراد در ۷۳٪ مواقع پاسخ چتباتهای هوش مصنوعی رو با انسان اشتباه گرفتن!
تنها ۶ ماه پیش این عدد حدود ۵۰٪ بود!
🔍 پیشرفت هوش مصنوعی در تقلید گفتوگوی انسانی با سرعت خیرهکنندهای داره جلو میره...
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Media is too big
VIEW IN TELEGRAM
🎯 AgenticSeek: دستیار هوش مصنوعی ۱۰۰٪ لوکال و خصوصی
🧠 مرور وب، کدنویسی، برنامهریزی و اجرای کارها بهصورت کاملاً خودکار — بدون وابستگی به فضای ابری
🔒 همه دادهها فقط روی دستگاه شما
🎙 پشتیبانی از فرمان صوتی، مثل یک AI آیندهنگر در فیلمها
👨💻 انتخاب هوشمند عامل مناسب برای هر کار
🌐 مناسب برای مدلهای reasoning محلی و بدون نیاز به API
https://github.com/Fosowl/agenticSeek
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🧠 مرور وب، کدنویسی، برنامهریزی و اجرای کارها بهصورت کاملاً خودکار — بدون وابستگی به فضای ابری
🔒 همه دادهها فقط روی دستگاه شما
🎙 پشتیبانی از فرمان صوتی، مثل یک AI آیندهنگر در فیلمها
👨💻 انتخاب هوشمند عامل مناسب برای هر کار
🌐 مناسب برای مدلهای reasoning محلی و بدون نیاز به API
https://github.com/Fosowl/agenticSeek
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📌 Vector Similarity Search
در مدلهای هوش مصنوعی، هر داده (مثل یک جمله، تصویر یا کلمه) به یک بردار عددی در فضای چندبعدی تبدیل میشه. این بردارها داخل دیتابیسهای مخصوصی مثل Vector Database ذخیره میشن.
وقتی کاربر سوالی میپرسه، مدل بهجای جستجو در متن، به دنبال بردارهایی میگرده که از نظر فاصله (شباهت عددی) به سوال نزدیکترن. این فرآیند با روشهایی مثل:
🔹 فاصله اقلیدسی (فاصله مستقیم بین دو نقطه)
🔹 فاصله منهتن (جمع قدرمطلق تفاوتها)
🔹 فاصله کسینوسی (زاویه بین بردارها)
🔹 ضرب داخلی (میزان همراستایی)
انجام میشه تا نزدیکترین جواب ممکن پیدا شه.
📊 این روش توی جستجو، پیشنهاد محتوا، چتباتها و حتی سیستمهای تشخیص تصویر استفاده میشه و باعث میشه مدلها "بفهمن" که چه چیزهایی به هم شبیهان.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
در مدلهای هوش مصنوعی، هر داده (مثل یک جمله، تصویر یا کلمه) به یک بردار عددی در فضای چندبعدی تبدیل میشه. این بردارها داخل دیتابیسهای مخصوصی مثل Vector Database ذخیره میشن.
وقتی کاربر سوالی میپرسه، مدل بهجای جستجو در متن، به دنبال بردارهایی میگرده که از نظر فاصله (شباهت عددی) به سوال نزدیکترن. این فرآیند با روشهایی مثل:
🔹 فاصله اقلیدسی (فاصله مستقیم بین دو نقطه)
🔹 فاصله منهتن (جمع قدرمطلق تفاوتها)
🔹 فاصله کسینوسی (زاویه بین بردارها)
🔹 ضرب داخلی (میزان همراستایی)
انجام میشه تا نزدیکترین جواب ممکن پیدا شه.
📊 این روش توی جستجو، پیشنهاد محتوا، چتباتها و حتی سیستمهای تشخیص تصویر استفاده میشه و باعث میشه مدلها "بفهمن" که چه چیزهایی به هم شبیهان.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
دورهی خوبی دربارهی Agentic AI و چارچوبهای مختلف برای پیادهسازی آن
https://www.youtube.com/playlist?list=PLv8Cp2NvcY8DeLpPBREcC9aU8ESfYeSeX
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://www.youtube.com/playlist?list=PLv8Cp2NvcY8DeLpPBREcC9aU8ESfYeSeX
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🎉 یه کشف مهم تو دنیای هوش مصنوعی!
تحقیقات جدید تو مقالهای به اسم «Harnessing the Universal Geometry of Embeddings» نشون میده که مدلهای مختلف هوش مصنوعی، یه زبان جهانی مشترک دارن!
با روش جدیدی به نام vec2vec میشه کدهای متنی (embedding) تولید شده توسط هر مدل رو، حتی بدون داشتن دادههای آماده، به کدهای مدل دیگه ترجمه کرد!
یعنی میتونیم بفهمیم اون مدل چی گفته، حتی اگه مدل رو نشناسیم!
این یعنی یه دنیای جدید از ارتباط بین مدلها باز شده، اما در کنارش هشدار امنیتی هم هست؛ چون ممکنه کسی با این روش به اطلاعات محرمانه دسترسی پیدا کنه!
https://arxiv.org/abs/2505.12540
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
تحقیقات جدید تو مقالهای به اسم «Harnessing the Universal Geometry of Embeddings» نشون میده که مدلهای مختلف هوش مصنوعی، یه زبان جهانی مشترک دارن!
با روش جدیدی به نام vec2vec میشه کدهای متنی (embedding) تولید شده توسط هر مدل رو، حتی بدون داشتن دادههای آماده، به کدهای مدل دیگه ترجمه کرد!
یعنی میتونیم بفهمیم اون مدل چی گفته، حتی اگه مدل رو نشناسیم!
این یعنی یه دنیای جدید از ارتباط بین مدلها باز شده، اما در کنارش هشدار امنیتی هم هست؛ چون ممکنه کسی با این روش به اطلاعات محرمانه دسترسی پیدا کنه!
https://arxiv.org/abs/2505.12540
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🎓 ۷ پلیلیست طلایی برای یادگیری عمیقترین مفاهیم هوش مصنوعی
اگه دنبال منابعی هستی که واقعاً ارزش وقت گذاشتن دارن، این مجموعه دقیقاً همون چیزیه که لازم داری.
از ساخت GPT با چند خط کد تا درک عمیق مدلهای زبانی بزرگ مثل ChatGPT — همه اینجا جمع شدن! 👇
🔹 ۱. Neural Networks: Zero to Hero – با Karpathy
از مفاهیم پایه تا nanoGPT، همهچی با کدنویسی شهودی. https://www.youtube.com/playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ
🔹 ۲. CS336 استنفورد (۲۰۲۵) – مدلسازی زبان از صفر
یک دورهی کامل از داده تا آموزش، استقرار و ارزیابی LLMها.
https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_
🔹 ۳. MIT 6.S191 – مقدمهای بر یادگیری عمیق (۲۰۲۵)
مروری سریع و حرفهای بر دیپلرنینگ، ترنسفورمرها و مدلهای دیفیوژن در کمتر از ۲ ساعت.
https://www.youtube.com/watch?v=alfdI7S6wCY
🔹 ۴. CS25 – آشنایی با ترنسفورمرها با Karpathy
درک عملی مقالهی معروف "Attention is All You Need" به زبان کد.
https://www.youtube.com/watch?v=XfpMkf4rD6E&t=126s
🔹 ۵. سخنرانی مهمان در CS229 استنفورد – ساخت LLM
نگاهی به نحوهی طراحی، مقیاسگذاری، و بهینهسازی مدلهای زبانی بزرگ.
https://www.youtube.com/watch?v=9vM4p9NN0Ts&t=4505s
🔹 ۶. Deep Dive into LLMs like ChatGPT
۳.۵ ساعت محتوای ناب دربارهی نحوهی شکلگیری GPTها.
https://www.youtube.com/watch?v=7xTGNNLPyMI&t=11224s
🔹 ۷. Let's Build GPT from Scratch
۲۰۰ خط کد پایتون = ساخت یک GPT واقعی. مناسب برای درک عمیق ساختار داخلی.
https://www.youtube.com/watch?v=kCc8FmEb1nY&t=1859s
📌 این لیست رو ذخیره کن. یادگیری واقعی از همینجا شروع میشه!
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگه دنبال منابعی هستی که واقعاً ارزش وقت گذاشتن دارن، این مجموعه دقیقاً همون چیزیه که لازم داری.
از ساخت GPT با چند خط کد تا درک عمیق مدلهای زبانی بزرگ مثل ChatGPT — همه اینجا جمع شدن! 👇
🔹 ۱. Neural Networks: Zero to Hero – با Karpathy
از مفاهیم پایه تا nanoGPT، همهچی با کدنویسی شهودی. https://www.youtube.com/playlist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ
🔹 ۲. CS336 استنفورد (۲۰۲۵) – مدلسازی زبان از صفر
یک دورهی کامل از داده تا آموزش، استقرار و ارزیابی LLMها.
https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_
🔹 ۳. MIT 6.S191 – مقدمهای بر یادگیری عمیق (۲۰۲۵)
مروری سریع و حرفهای بر دیپلرنینگ، ترنسفورمرها و مدلهای دیفیوژن در کمتر از ۲ ساعت.
https://www.youtube.com/watch?v=alfdI7S6wCY
🔹 ۴. CS25 – آشنایی با ترنسفورمرها با Karpathy
درک عملی مقالهی معروف "Attention is All You Need" به زبان کد.
https://www.youtube.com/watch?v=XfpMkf4rD6E&t=126s
🔹 ۵. سخنرانی مهمان در CS229 استنفورد – ساخت LLM
نگاهی به نحوهی طراحی، مقیاسگذاری، و بهینهسازی مدلهای زبانی بزرگ.
https://www.youtube.com/watch?v=9vM4p9NN0Ts&t=4505s
🔹 ۶. Deep Dive into LLMs like ChatGPT
۳.۵ ساعت محتوای ناب دربارهی نحوهی شکلگیری GPTها.
https://www.youtube.com/watch?v=7xTGNNLPyMI&t=11224s
🔹 ۷. Let's Build GPT from Scratch
۲۰۰ خط کد پایتون = ساخت یک GPT واقعی. مناسب برای درک عمیق ساختار داخلی.
https://www.youtube.com/watch?v=kCc8FmEb1nY&t=1859s
📌 این لیست رو ذخیره کن. یادگیری واقعی از همینجا شروع میشه!
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
YouTube
Neural Networks: Zero to Hero
Share your videos with friends, family, and the world
🔥 مدلسازی یادگیری ماشین فقط با زبان طبیعی؟ بله واقعاً!
با Plexe AI فقط کافیه توضیح بدی دنبال چه مدلی هستی — بقیهی کار رو یه تیم عامل هوشمند خودکار انجام میده!
📌 این یعنی چی؟ یعنی بدون نیاز به نوشتن حتی یک خط کد، میتونی یه مدل کامل ML بسازی.
🚀 چرا Plexe AI یه تغییر بازیه؟
✅ تعریف مدلها فقط با زبان ساده انگلیسی
✅ تیم عامل هوشمند برای: برنامهریزی، کدنویسی، تست و بستهبندی
✅ ساخت مدل تنها با یک فراخوانی
✅ پشتیبانی از Ray برای آموزش سریع و توزیعشده
✅ مدیریت هوشمند دادهها (تشخیص خودکار ساختار + تولید داده)
https://github.com/plexe-ai/plexe
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
با Plexe AI فقط کافیه توضیح بدی دنبال چه مدلی هستی — بقیهی کار رو یه تیم عامل هوشمند خودکار انجام میده!
📌 این یعنی چی؟ یعنی بدون نیاز به نوشتن حتی یک خط کد، میتونی یه مدل کامل ML بسازی.
🚀 چرا Plexe AI یه تغییر بازیه؟
✅ تعریف مدلها فقط با زبان ساده انگلیسی
✅ تیم عامل هوشمند برای: برنامهریزی، کدنویسی، تست و بستهبندی
✅ ساخت مدل تنها با یک فراخوانی
✅ پشتیبانی از Ray برای آموزش سریع و توزیعشده
✅ مدیریت هوشمند دادهها (تشخیص خودکار ساختار + تولید داده)
https://github.com/plexe-ai/plexe
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگر به یادگیری درباره «ماشینهای تفکر پیوسته» (Continuous Thought Machines) علاقهمند هستید، آموزشهایی بهصورت نوتبوکهای تعاملی تهیه شده تا بتوانید بهراحتی با CTMها کار کرده و آنها را شخصاً امتحان کنید.
https://sakana.ai/ctm/
http://github.com/SakanaAI/continuous-thought-machines/blob/main/examples/01_mnist.ipynb
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://sakana.ai/ctm/
http://github.com/SakanaAI/continuous-thought-machines/blob/main/examples/01_mnist.ipynb
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🚀 تابع SoftPick: جایگزینی هوشمند برای Softmax در ترنسفورمرها
🔸تابع SoftPick یک تابع جدید برای مکانیزم توجه در ترنسفورمرهاست که برخلاف softmax، خروجیاش الزامی برای جمع برابر با ۱ ندارد.
🔸 این روش بهطور کامل مشکل attention sink را حذف کرده و نقشههای توجهی پراکندهتر (sparse) ایجاد میکند.
🔸 مدلهایی که از SoftPick استفاده میکنند، با وجود پارامترهای بالا (تا 1.8B)، فعالسازیهای متعادلتر و بردارهای پنهان با کشیدگی کمتر تولید میکنند.
🔸 در مدلهای کوانتیزهشده (Quantized)، SoftPick حتی در دقتهای پایینتر عملکرد بهتری نسبت به softmax نشان داده است.
🎯 مناسب برای: آموزش با دقت پایین، کوانتیزاسیون، بهینهسازی پراکندگی، هرس و تفسیرپذیری بهتر مدلها.
https://arxiv.org/abs/2504.20966
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔸تابع SoftPick یک تابع جدید برای مکانیزم توجه در ترنسفورمرهاست که برخلاف softmax، خروجیاش الزامی برای جمع برابر با ۱ ندارد.
🔸 این روش بهطور کامل مشکل attention sink را حذف کرده و نقشههای توجهی پراکندهتر (sparse) ایجاد میکند.
🔸 مدلهایی که از SoftPick استفاده میکنند، با وجود پارامترهای بالا (تا 1.8B)، فعالسازیهای متعادلتر و بردارهای پنهان با کشیدگی کمتر تولید میکنند.
🔸 در مدلهای کوانتیزهشده (Quantized)، SoftPick حتی در دقتهای پایینتر عملکرد بهتری نسبت به softmax نشان داده است.
🎯 مناسب برای: آموزش با دقت پایین، کوانتیزاسیون، بهینهسازی پراکندگی، هرس و تفسیرپذیری بهتر مدلها.
https://arxiv.org/abs/2504.20966
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔬 معماری BioReason: مدلی برای استدلال ژنتیکی با هوش مصنوعی
مدل BioReason ترکیبی پیشرفته از مدلهای زبانی و زیستی است که برای تحلیل دقیق اطلاعات DNA در کنار متنهای علمی طراحی شده است. هدف اصلی این معماری، استدلال و پاسخگویی هوشمند درباره سؤالات بیولوژیکی دقیق، همانند یک متخصص زیستشناسی است.
اطلاعات بیشتر در مورد معماری 👇
https://bowang-lab.github.io/BioReason/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مدل BioReason ترکیبی پیشرفته از مدلهای زبانی و زیستی است که برای تحلیل دقیق اطلاعات DNA در کنار متنهای علمی طراحی شده است. هدف اصلی این معماری، استدلال و پاسخگویی هوشمند درباره سؤالات بیولوژیکی دقیق، همانند یک متخصص زیستشناسی است.
اطلاعات بیشتر در مورد معماری 👇
https://bowang-lab.github.io/BioReason/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
💡 بیش از ۱۰۰ نوتبوک فاینتیونینگ با Unsloth
این مخزن شامل نوتبوکهای فاینتیونینگ برای موارد زیر است:
موارد کاربردی: فراخوانی ابزار (Tool-calling)، طبقهبندی، دادههای مصنوعی و موارد دیگر
جریان کاری کامل: آمادهسازی داده، آموزش، اجرا و ذخیره مدلها
مدلها: BERT، مدلهای تبدیل متن به گفتار (TTS)، مدلهای بینایی و سایر مدلها
روشهای آموزش: GRPO، DPO، پیشآموزش ادامهدار، آموزش با نظارت (SFT)، تکمیل متن و بیشتر!
مدلهای پشتیبانیشده: Llama، Qwen، DeepSeek، Gemma، Phi و سایر مدلها
https://github.com/unslothai/notebooks/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این مخزن شامل نوتبوکهای فاینتیونینگ برای موارد زیر است:
موارد کاربردی: فراخوانی ابزار (Tool-calling)، طبقهبندی، دادههای مصنوعی و موارد دیگر
جریان کاری کامل: آمادهسازی داده، آموزش، اجرا و ذخیره مدلها
مدلها: BERT، مدلهای تبدیل متن به گفتار (TTS)، مدلهای بینایی و سایر مدلها
روشهای آموزش: GRPO، DPO، پیشآموزش ادامهدار، آموزش با نظارت (SFT)، تکمیل متن و بیشتر!
مدلهای پشتیبانیشده: Llama، Qwen، DeepSeek، Gemma، Phi و سایر مدلها
https://github.com/unslothai/notebooks/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
DSML.pdf
20.1 MB
📘 «علم داده و یادگیری ماشین»
این کتاب، ریاضیات مورد نیاز برای علم داده و یادگیری ماشین را آموزش میدهد.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این کتاب، ریاضیات مورد نیاز برای علم داده و یادگیری ماشین را آموزش میدهد.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مدلهای متنباز Qwen-3 برای تولید بردار و بازچینی (Embedding و Reranker)
این مدلها بهطور خاص برای وظایف مرتبط با تولید بردارهای متنی (text embedding)، بازیابی اطلاعات (retrieval)، و بازچینی نتایج (reranking) طراحی شدهاند و بر پایهی مدل پایهی Qwen3 ساخته شدهاند.
مدلهای Qwen3 در وظایف تولید بردار و بازچینی، در چندین معیار استاندارد، عملکردی در سطح پیشرفته و پیشگام (state-of-the-art) ارائه میدهند.
سری مدلهای Qwen3 Embedding در اندازههای متنوعی (از ۰٫۶ میلیارد تا ۸ میلیارد پارامتر) برای هر دو کاربرد embedding و reranking ارائه شدهاند.
https://qwenlm.github.io/blog/qwen3-embedding/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این مدلها بهطور خاص برای وظایف مرتبط با تولید بردارهای متنی (text embedding)، بازیابی اطلاعات (retrieval)، و بازچینی نتایج (reranking) طراحی شدهاند و بر پایهی مدل پایهی Qwen3 ساخته شدهاند.
مدلهای Qwen3 در وظایف تولید بردار و بازچینی، در چندین معیار استاندارد، عملکردی در سطح پیشرفته و پیشگام (state-of-the-art) ارائه میدهند.
سری مدلهای Qwen3 Embedding در اندازههای متنوعی (از ۰٫۶ میلیارد تا ۸ میلیارد پارامتر) برای هر دو کاربرد embedding و reranking ارائه شدهاند.
https://qwenlm.github.io/blog/qwen3-embedding/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🔥 ۵۰۰+ پروژه عاملهای هوش مصنوعی با کد آماده! 🔥🤖
https://github.com/ashishpatel26/500-AI-Agents-Projects
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/ashishpatel26/500-AI-Agents-Projects
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer