Forwarded from مرجع دیتاست فارسی (دیتاهابر)
راهنمای کاربردی و ساده برای ساخت چتبات به زبان فارسی!
این پروژه شامل یک چتبات ساده به زبان فارسی است که با استفاده از الگوریتمهای پردازش زبان طبیعی (NLP) و مدلهای ترکیبی نوشته شده است. هدف این پروژه، فراهم آوردن یک مثال عملی و آموزشی جهت پیادهسازی چتباتهای زبان فارسی میباشد.
این چتبات برای پاسخ به سوالات متداول و ارائه اطلاعات ساده در محیطهای کاربردی مختلف مثل وبسایتها و اپلیکیشنها قابل استفاده است.
با مراجعه به این لینک، میتوانید به کدمنبع و مستندات پروژه دسترسی پیدا کنید و با استفاده از راهنماهای موجود، چتبات خود را بسازید.
📱 GitHub Repo
این پروژه شامل یک چتبات ساده به زبان فارسی است که با استفاده از الگوریتمهای پردازش زبان طبیعی (NLP) و مدلهای ترکیبی نوشته شده است. هدف این پروژه، فراهم آوردن یک مثال عملی و آموزشی جهت پیادهسازی چتباتهای زبان فارسی میباشد.
این چتبات برای پاسخ به سوالات متداول و ارائه اطلاعات ساده در محیطهای کاربردی مختلف مثل وبسایتها و اپلیکیشنها قابل استفاده است.
با مراجعه به این لینک، میتوانید به کدمنبع و مستندات پروژه دسترسی پیدا کنید و با استفاده از راهنماهای موجود، چتبات خود را بسازید.
📱 GitHub Repo
GitHub
GitHub - Ahura-Hadipoor/Simple_Chatbot_in_Persian: Robin is my "final project" as a bachelor of computer engineering. I build this…
Robin is my "final project" as a bachelor of computer engineering. I build this chatbot using Pytorch and custom dataset. - Ahura-Hadipoor/Simple_Chatbot_in_Persian
This media is not supported in your browser
VIEW IN TELEGRAM
✨ هر تصویری رو به یه ویدیوی زنده و واقعی تبدیل کن! 😍
با Kling 1.6، فقط کافیه یه تصویر و یه پرامپت ساده مثل این بنویسی:
*«شخصی به آسمون نگاه میکنه، لبخند میزنه و دستش رو برای گرفتن بارون دراز میکنه.»* 📸➡️🎥
🔥 قابلیت Lip Sync هم داره، پس میتونی صدا و حرکت لب رو کاملاً هماهنگ کنی و ویدیوهای حرفهای بسازی.
🚀 وقتشه محتوای متفاوت و خلاقانه تولید کنی و تعامل بیشتری جذب کنی!
https://www.klingai.com/
🧠🛠 | @IsangAI
با Kling 1.6، فقط کافیه یه تصویر و یه پرامپت ساده مثل این بنویسی:
*«شخصی به آسمون نگاه میکنه، لبخند میزنه و دستش رو برای گرفتن بارون دراز میکنه.»* 📸➡️🎥
🔥 قابلیت Lip Sync هم داره، پس میتونی صدا و حرکت لب رو کاملاً هماهنگ کنی و ویدیوهای حرفهای بسازی.
🚀 وقتشه محتوای متفاوت و خلاقانه تولید کنی و تعامل بیشتری جذب کنی!
https://www.klingai.com/
🧠🛠 | @IsangAI
برای فاینتیون مدلهای دیپسیک نیاز داشتم یه دیتاست با استدلال داشته باشم، ولی دیتای مناسبی پیدا نکردم.
بهخاطر همین تصمیم گرفتم خودم دیتایی که لازم دارم رو بسازم.
به این ترتیب اولین نسخه از این دیتاست به اسم Persian-Alpaca-Reasoning-v1 آماده شده!
📊 دیتاست شامل چیه؟
- بیش از ۲ هزار نمونه از پرسش و پاسخهای فارسی همراه با استدلال
- سه ستون:
- instruction: سؤال یا دستور
- reasoning: توضیح و استدلال کامل
- output: پاسخ نهایی
🔍 این دیتاست به چه درد میخوره؟
- فاینتیون مدلهای زبانی فارسی برای تولید پاسخهای دقیقتر و با استدلال
- ساخت چتباتهای هوشمند فارسی
- بهبود سیستمهای پرسش و پاسخ فارسی
🔧 چطور ساختمش؟
این دیتاست در واقع دیتاست Persian Alpaca هست.
برای هر پرسش و پاسخ، یه استدلال کامل با مدل J1 از jabirproject.org تولید کردم. بعدش دادهها رو بررسی کردم و جوابهای ناقص یا بیربط رو حذف کردم تا فقط استدلالهای درست و باکیفیت باقی بمونه.
این دیتاست هنوز کامل نشده و در نسخههای بعدی قراره مقادیرش بیشتر بشه. فعلاً این نسخه رو منتشر کردم تا فیدبک مورد نیازم رو بگیرم و ببینم چه بهبودهایی میشه داد. خیلی خوشحال میشم نظرتون رو بدونم! 😊
🔗 https://huggingface.co/datasets/hosseinhimself/persian-alpaca-reasoning-v1
🧠🛠 | @IsangAI
بهخاطر همین تصمیم گرفتم خودم دیتایی که لازم دارم رو بسازم.
به این ترتیب اولین نسخه از این دیتاست به اسم Persian-Alpaca-Reasoning-v1 آماده شده!
📊 دیتاست شامل چیه؟
- بیش از ۲ هزار نمونه از پرسش و پاسخهای فارسی همراه با استدلال
- سه ستون:
- instruction: سؤال یا دستور
- reasoning: توضیح و استدلال کامل
- output: پاسخ نهایی
🔍 این دیتاست به چه درد میخوره؟
- فاینتیون مدلهای زبانی فارسی برای تولید پاسخهای دقیقتر و با استدلال
- ساخت چتباتهای هوشمند فارسی
- بهبود سیستمهای پرسش و پاسخ فارسی
🔧 چطور ساختمش؟
این دیتاست در واقع دیتاست Persian Alpaca هست.
برای هر پرسش و پاسخ، یه استدلال کامل با مدل J1 از jabirproject.org تولید کردم. بعدش دادهها رو بررسی کردم و جوابهای ناقص یا بیربط رو حذف کردم تا فقط استدلالهای درست و باکیفیت باقی بمونه.
این دیتاست هنوز کامل نشده و در نسخههای بعدی قراره مقادیرش بیشتر بشه. فعلاً این نسخه رو منتشر کردم تا فیدبک مورد نیازم رو بگیرم و ببینم چه بهبودهایی میشه داد. خیلی خوشحال میشم نظرتون رو بدونم! 😊
🔗 https://huggingface.co/datasets/hosseinhimself/persian-alpaca-reasoning-v1
🧠🛠 | @IsangAI
huggingface.co
hosseinhimself/persian-alpaca-reasoning-v1 · Datasets at Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍4
Forwarded from Geek Alerts
شرکت ByteDance، که میشه همون شرکتی که TikTok رو ساخته، مجموعهای از مدلهای AI به اسم گوکو «Goku» رو معرفی کرده که در واقع مدل متن به ویدیو یا همون ساخت عکس و ویدیو با AI هستن.
نمرات خوبی هم توی بنچمارکها داشته مثلا 0.76 تو GenEval (تولید عکس از متن) و 83.65 تو DPG-Bench (تولید عکس از متن) و 84.85 تو VBench (تولید ویدیو از متن).
از اونجای که گوکو یه مدل اوپنسورس هست میشه با بقیه مدلهای اوپنسورس (مثل CogVideoX و Open-Sora-Plan) و پریمیومها (از جمله DreamMachine، Pika، Vidu و Kling) مقایسه کرد که نتیجه نقطه قوت گوکو رو توی خروجیهایی با عناصر هماهنگ نشون میده، در اصل به جزئیاتی متنی که بهش داده میشه دقت بالایی داره.
huggingface
sangjinn
@geekalerts
نمرات خوبی هم توی بنچمارکها داشته مثلا 0.76 تو GenEval (تولید عکس از متن) و 83.65 تو DPG-Bench (تولید عکس از متن) و 84.85 تو VBench (تولید ویدیو از متن).
از اونجای که گوکو یه مدل اوپنسورس هست میشه با بقیه مدلهای اوپنسورس (مثل CogVideoX و Open-Sora-Plan) و پریمیومها (از جمله DreamMachine، Pika، Vidu و Kling) مقایسه کرد که نتیجه نقطه قوت گوکو رو توی خروجیهایی با عناصر هماهنگ نشون میده، در اصل به جزئیاتی متنی که بهش داده میشه دقت بالایی داره.
huggingface
sangjinn
@geekalerts
👍2
❇️ فاین تیون (Fine-Tune) کردن یعنی چی؟ 🤔
فاینتیون کردن (Fine-tuning) یعنی آموزش دوباره یک مدل هوش مصنوعی که از قبل آموزش دیده، برای یک وظیفه خاص.
به جای اینکه مدل رو از صفر آموزش بدیم، از دانش قبلی مدل استفاده میکنیم و اونو برای نیاز خودمون بهینهتر میکنیم.
مثلاً یه مدل زبانی داریم که انگلیسی بلده، حالا میخواهیم فارسی هم یاد بگیره یا به سؤالات ریاضی بهتر جواب بده. اینجا فاینتیون کردن کمک میکنه تا با دادههای جدید و کمتر از حالت عادی، مدل رو برای هدف خاصمون آماده کنیم.
✳️ به زبون خیلییییییی ساده:
فاینتیون کردن مثل این میمونه که یه آشپز حرفهای رو که غذاهای مختلف بلده، فقط برای درست کردن یه نوع غذای خاص مثل قرمهسبزی آموزش بدیم! 🍛😋
🧠🛠 | @IsangAI
فاینتیون کردن (Fine-tuning) یعنی آموزش دوباره یک مدل هوش مصنوعی که از قبل آموزش دیده، برای یک وظیفه خاص.
به جای اینکه مدل رو از صفر آموزش بدیم، از دانش قبلی مدل استفاده میکنیم و اونو برای نیاز خودمون بهینهتر میکنیم.
مثلاً یه مدل زبانی داریم که انگلیسی بلده، حالا میخواهیم فارسی هم یاد بگیره یا به سؤالات ریاضی بهتر جواب بده. اینجا فاینتیون کردن کمک میکنه تا با دادههای جدید و کمتر از حالت عادی، مدل رو برای هدف خاصمون آماده کنیم.
✳️ به زبون خیلییییییی ساده:
فاینتیون کردن مثل این میمونه که یه آشپز حرفهای رو که غذاهای مختلف بلده، فقط برای درست کردن یه نوع غذای خاص مثل قرمهسبزی آموزش بدیم! 🍛😋
🧠🛠 | @IsangAI
🔥2👏1🤩1
ISANG AI | از ابزار های هوش مصنوعی تا مباحث فنی pinned «برای فاینتیون مدلهای دیپسیک نیاز داشتم یه دیتاست با استدلال داشته باشم، ولی دیتای مناسبی پیدا نکردم. بهخاطر همین تصمیم گرفتم خودم دیتایی که لازم دارم رو بسازم. به این ترتیب اولین نسخه از این دیتاست به اسم Persian-Alpaca-Reasoning-v1 آماده شده! 📊…»
Forwarded from DeepMind AI Expert (Farzad 🦅)
مدل Mistral-24B-Reasoning به صورت #متن_باز منتشر شد این مدل به رقابت با مدل پرسروصدای دیپ سیک از خو قدرتی چشمگیر رو به نمایش گذاشت.
📊 New SOTA for open R1 reproduction:
✅ MATH 500: 95.0%
✅ AIME 2025: 53.33%
✅ GPQA-D: 62.02%
https://huggingface.co/yentinglin/Mistral-Small-24B-Instruct-2501-reasoning
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
📊 New SOTA for open R1 reproduction:
✅ MATH 500: 95.0%
✅ AIME 2025: 53.33%
✅ GPQA-D: 62.02%
https://huggingface.co/yentinglin/Mistral-Small-24B-Instruct-2501-reasoning
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
نمونه پرامپتهای ChatGPT برای نوشتن یک رزومه بینظیر! 👇
رزومه خود را به ابزاری قدرتمند تبدیل کنید که در میان دیگران متمایز باشد!
---
⭐ شخصیسازی برای شغل مورد نظر:
👉 پرامپت: رزومه من را طوری تنظیم کن که مهارتها و تجربیات من را مطابق با موقعیت شغلی [عنوان شغل موردنظر] برجسته کند. این رزومه من است: [رزومه را وارد کنید]. این هم توضیحات شغل: [توضیحات شغل را وارد کنید].
---
⭐ برجسته کردن تجربه رهبری:
👉 پرامپت: رزومه من را بررسی کن و مهارتهای رهبری من را برای یک موقعیت [عنوان شغل] در [نام شرکت] بهتر نشان بده. این رزومه و توضیحات شغل من است: [رزومه را وارد کنید] [توضیحات شغل را وارد کنید].
---
⭐ بهبود زبان رزومه برای تأثیرگذاری بیشتر:
👉 پرامپت: متن رزومه من را اصلاح کن تا تجربیاتم به شکلی تأثیرگذارتر و با تأکید بر اقدامات و نتایج بیان شود. موقعیت شغلی: [عنوان شغل]. این رزومه من است: [رزومه را وارد کنید]. این هم توضیحات شغل: [توضیحات شغل را وارد کنید].
---
⭐ تأکید بر مهارتهای همکاری تیمی:
👉 پرامپت: میخواهم مهارتهای همکاری و کار تیمیام را برای یک موقعیت [عنوان شغل] برجسته کنم. چطور میتوانم آنها را بهطور مؤثر در رزومه نشان دهم؟ این رزومه من است: [رزومه را وارد کنید]. این هم توضیحات شغل: [توضیحات شغل را وارد کنید].
---
⭐ ایجاد یک بیانیه هدف قانعکننده:
👉 پرامپت: با توجه به رزومه و توضیحات شغلی من، یک بیانیه هدف (Objective Statement) بنویس که اهداف من را بهطور واضح بیان کرده و ارتباطم را با موقعیت [عنوان شغل] در [نام شرکت] نشان دهد. [رزومه را وارد کنید] [توضیحات شغل را وارد کنید].
---
⭐ برجسته کردن مهارتهای حل مسئله:
👉 پرامپت: رزومه من را بررسی کن و راههایی پیشنهاد بده که بتوانم مهارتهای حل مسئله خود را در آن بهتر نشان دهم. [رزومه را وارد کنید].
---
⭐ تطبیق رزومه برای فرصتهای بینالمللی:
👉 پرامپت: برای یک موقعیت بینالمللی به عنوان [عنوان شغل] درخواست میدهم. چطور میتوانم رزومهام را تنظیم کنم تا مهارتهای فرهنگی و تجربیات بینالمللیام را برجسته کنم؟ [رزومه و توضیحات شغل را وارد کنید].
---
⭐ بهینهسازی برای تغییر صنعت کاری:
👉 پرامپت: من در حال تغییر صنعت کاری خود هستم و برای یک موقعیت [عنوان شغل] درخواست میدهم. چطور میتوانم مهارتهای انتقالپذیر خود را در رزومه بهگونهای برجسته کنم که برای این نقش مناسب به نظر بیاید؟ [رزومه را وارد کنید] [توضیحات شغل را وارد کنید].
---
⭐ نمایش خلاقیت و نوآوری:
👉 پرامپت: رزومه من را بررسی کن و راههایی پیشنهاد بده تا خلاقیت و نوآوریهایم را، بهویژه برای موقعیت [عنوان شغل] در [نام شرکت] بهتر نمایش دهم. [رزومه و توضیحات شغل را وارد کنید].
---
⭐ بهبود نمایش بصری رزومه:
👉 پرامپت: پیشنهاداتی برای بهبود چیدمان و قالببندی رزومه من ارائه بده تا خواناتر و جذابتر شود. [رزومه را وارد کنید].
---
از این پرامپتها برای تقویت رزومه خود استفاده کنید 👍🔥
🧠🛠 | @IsangAI
رزومه خود را به ابزاری قدرتمند تبدیل کنید که در میان دیگران متمایز باشد!
---
⭐ شخصیسازی برای شغل مورد نظر:
👉 پرامپت: رزومه من را طوری تنظیم کن که مهارتها و تجربیات من را مطابق با موقعیت شغلی [عنوان شغل موردنظر] برجسته کند. این رزومه من است: [رزومه را وارد کنید]. این هم توضیحات شغل: [توضیحات شغل را وارد کنید].
---
⭐ برجسته کردن تجربه رهبری:
👉 پرامپت: رزومه من را بررسی کن و مهارتهای رهبری من را برای یک موقعیت [عنوان شغل] در [نام شرکت] بهتر نشان بده. این رزومه و توضیحات شغل من است: [رزومه را وارد کنید] [توضیحات شغل را وارد کنید].
---
⭐ بهبود زبان رزومه برای تأثیرگذاری بیشتر:
👉 پرامپت: متن رزومه من را اصلاح کن تا تجربیاتم به شکلی تأثیرگذارتر و با تأکید بر اقدامات و نتایج بیان شود. موقعیت شغلی: [عنوان شغل]. این رزومه من است: [رزومه را وارد کنید]. این هم توضیحات شغل: [توضیحات شغل را وارد کنید].
---
⭐ تأکید بر مهارتهای همکاری تیمی:
👉 پرامپت: میخواهم مهارتهای همکاری و کار تیمیام را برای یک موقعیت [عنوان شغل] برجسته کنم. چطور میتوانم آنها را بهطور مؤثر در رزومه نشان دهم؟ این رزومه من است: [رزومه را وارد کنید]. این هم توضیحات شغل: [توضیحات شغل را وارد کنید].
---
⭐ ایجاد یک بیانیه هدف قانعکننده:
👉 پرامپت: با توجه به رزومه و توضیحات شغلی من، یک بیانیه هدف (Objective Statement) بنویس که اهداف من را بهطور واضح بیان کرده و ارتباطم را با موقعیت [عنوان شغل] در [نام شرکت] نشان دهد. [رزومه را وارد کنید] [توضیحات شغل را وارد کنید].
---
⭐ برجسته کردن مهارتهای حل مسئله:
👉 پرامپت: رزومه من را بررسی کن و راههایی پیشنهاد بده که بتوانم مهارتهای حل مسئله خود را در آن بهتر نشان دهم. [رزومه را وارد کنید].
---
⭐ تطبیق رزومه برای فرصتهای بینالمللی:
👉 پرامپت: برای یک موقعیت بینالمللی به عنوان [عنوان شغل] درخواست میدهم. چطور میتوانم رزومهام را تنظیم کنم تا مهارتهای فرهنگی و تجربیات بینالمللیام را برجسته کنم؟ [رزومه و توضیحات شغل را وارد کنید].
---
⭐ بهینهسازی برای تغییر صنعت کاری:
👉 پرامپت: من در حال تغییر صنعت کاری خود هستم و برای یک موقعیت [عنوان شغل] درخواست میدهم. چطور میتوانم مهارتهای انتقالپذیر خود را در رزومه بهگونهای برجسته کنم که برای این نقش مناسب به نظر بیاید؟ [رزومه را وارد کنید] [توضیحات شغل را وارد کنید].
---
⭐ نمایش خلاقیت و نوآوری:
👉 پرامپت: رزومه من را بررسی کن و راههایی پیشنهاد بده تا خلاقیت و نوآوریهایم را، بهویژه برای موقعیت [عنوان شغل] در [نام شرکت] بهتر نمایش دهم. [رزومه و توضیحات شغل را وارد کنید].
---
⭐ بهبود نمایش بصری رزومه:
👉 پرامپت: پیشنهاداتی برای بهبود چیدمان و قالببندی رزومه من ارائه بده تا خواناتر و جذابتر شود. [رزومه را وارد کنید].
---
از این پرامپتها برای تقویت رزومه خود استفاده کنید 👍🔥
🧠🛠 | @IsangAI
ویژگی Deep Research برای مشترکین پریمیوم ChatGPT فعال شد.
کیفیت پاسخی که ارائه میده واقعا جالبه و کیفیت خوبی داره.
🧠🛠 | @IsangAI
کیفیت پاسخی که ارائه میده واقعا جالبه و کیفیت خوبی داره.
🧠🛠 | @IsangAI
یه ابزار جدید و جالب به اسم ColorMatch از پولار (Polarr) منتشر شده که با کمک هوش مصنوعی رنگهای عکسها رو اصلاح میکنه. این ابزار الان رایگانه و کارش خیلی ساده و کاربردیست.
چطوری کار میکنه؟
شما یه عکس بهش میدید و یه عکس دیگه هم به عنوان مرجع انتخاب میکنید. بعدش هوش مصنوعی رنگبندی عکس اول رو طوری تغییر میده که شبیه رنگبندی عکس دوم بشه. مثلاً اگه از چند تا دوربین مختلف عکس گرفتید و میخواید رنگبندی همهشون مثل هم بشه، یا اگه از رنگهای یه عکس خوشتون اومده و میخواید عکسهای خودتون رو هم بر اساس اون اصلاح کنید، این ابزار خیلی به دردتون میخوره.
میتونید مستقیم برید تو سایت پولار (colormatch.polarr.com) و ازش استفاده کنید. خیلی راحته و نیاز به نصب هیچ برنامهای هم نداره.
🧠🛠 | @IsangAI
چطوری کار میکنه؟
شما یه عکس بهش میدید و یه عکس دیگه هم به عنوان مرجع انتخاب میکنید. بعدش هوش مصنوعی رنگبندی عکس اول رو طوری تغییر میده که شبیه رنگبندی عکس دوم بشه. مثلاً اگه از چند تا دوربین مختلف عکس گرفتید و میخواید رنگبندی همهشون مثل هم بشه، یا اگه از رنگهای یه عکس خوشتون اومده و میخواید عکسهای خودتون رو هم بر اساس اون اصلاح کنید، این ابزار خیلی به دردتون میخوره.
میتونید مستقیم برید تو سایت پولار (colormatch.polarr.com) و ازش استفاده کنید. خیلی راحته و نیاز به نصب هیچ برنامهای هم نداره.
🧠🛠 | @IsangAI
👍3
Forwarded from NLP stuff (Mahdi Samiei)
خلاصهتر فکر کن
از اونجایی که در مسائل استدلالی (reasoning) ، مدل برای رسیدن به جواب نهایی، باید دنباله افکار میانی رو به شکل CoT تولید کنه، یکی از دردهای آزاردهنده اینه که باید گاهی توکنهای زیادی اون وسط تولید بشن و این امر هم هزینه پولی و هم هزینه زمانی زیادی داره. حالا با توجه به این نکته، این که چطور توکنهای کمتری تولید کنیم و در عین حال دقت مطلوبتری رو حفظ کنیم مسالهی پیشروی ماست.
به تازگی کار جالبی اومده با عنوان Chain of Draft یا CoD که همون CoT هست با این تفاوت که در پرامپت از مدل خواسته میشه که هر سگمنت استدلالی (reasoning) که میخواد خروجی بده حداکثر ۵ کلمه طول داشته باشه. نتایجش جالب شده و نشون داده که با میزان توکن و در نتیجه latency خیلی کمتر تونسته دقت قابل رقابت با CoT رو حفظ کنه و حتی بعضی جاها بهتر از اون نتیجه بده. خلاصه که یکی از جهتهای آینده احتمالا اینه که چطور مدلهایی داشته باشیم که کاراتر فکر کنند.
لینک پیپر:
https://arxiv.org/abs/2502.18600
#read
#paper
@nlp_stuff
از اونجایی که در مسائل استدلالی (reasoning) ، مدل برای رسیدن به جواب نهایی، باید دنباله افکار میانی رو به شکل CoT تولید کنه، یکی از دردهای آزاردهنده اینه که باید گاهی توکنهای زیادی اون وسط تولید بشن و این امر هم هزینه پولی و هم هزینه زمانی زیادی داره. حالا با توجه به این نکته، این که چطور توکنهای کمتری تولید کنیم و در عین حال دقت مطلوبتری رو حفظ کنیم مسالهی پیشروی ماست.
به تازگی کار جالبی اومده با عنوان Chain of Draft یا CoD که همون CoT هست با این تفاوت که در پرامپت از مدل خواسته میشه که هر سگمنت استدلالی (reasoning) که میخواد خروجی بده حداکثر ۵ کلمه طول داشته باشه. نتایجش جالب شده و نشون داده که با میزان توکن و در نتیجه latency خیلی کمتر تونسته دقت قابل رقابت با CoT رو حفظ کنه و حتی بعضی جاها بهتر از اون نتیجه بده. خلاصه که یکی از جهتهای آینده احتمالا اینه که چطور مدلهایی داشته باشیم که کاراتر فکر کنند.
لینک پیپر:
https://arxiv.org/abs/2502.18600
#read
#paper
@nlp_stuff
Forwarded from Geek Alerts
میسترال ایآی دو تا مدل OCR معرفی کرده، یعنی میتونن متن رو از تصاویر و اسناد استخراج کنن، این پردازش میتونه از روی تصاویر یا حتی اسنادی مثل PDF باشه.
توانایی پردازش چند زبان دارن، دقت بالایی توی خوندن متنهای دستنویس دارن یا فرمولهای ریاضی و متون عربی رو به همون شکلی که هستن مینویسن و میتونن قاببندی اصلی اسناد رو حفظ کنن. توی جدول مقایسهای که منتشر کردن این مدل یعنی mistral-ocr-2503 دقیقترین مدل موجود معرفی شده.
راستی الان به صورت رایگان داخل le Chat در دسترس هست.
🔗 mistral
🤓 @geekalerts
توانایی پردازش چند زبان دارن، دقت بالایی توی خوندن متنهای دستنویس دارن یا فرمولهای ریاضی و متون عربی رو به همون شکلی که هستن مینویسن و میتونن قاببندی اصلی اسناد رو حفظ کنن. توی جدول مقایسهای که منتشر کردن این مدل یعنی mistral-ocr-2503 دقیقترین مدل موجود معرفی شده.
راستی الان به صورت رایگان داخل le Chat در دسترس هست.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
اگر من کشور بودم، این پرچم من میشد.
از Chatgpt خواستم که اگر کشور بودم، پرچمم رو طراحی بکنه.
این پرامپت رو بهش دادم:
🧠🛠 | @IsangAI
از Chatgpt خواستم که اگر کشور بودم، پرچمم رو طراحی بکنه.
این پرامپت رو بهش دادم:
If I were a country, based on what you know about me, design my flag.
🧠🛠 | @IsangAI
❤2
Forwarded from Geek Alerts
آنتروپیک میخواد یه نسل جدید از مدلهاشو معرفی میکنه که توانایی پیدا کردن اشتباهاتون خودشون و اصلاحش رو دارن، این قابلیت تو برنامهنویسی هم خیلی کاربردیه و کد تولید شده رو خودکار تست و اصلاح میکنه. [L]
آقای جفری هینتون، یکی از پدرخواندههای هوش مصنوعی، که سال ۲۰۱۶ گفته بود AI تا ۵ سال دیگه رادیولوژیستها رو بیکار میکنه، حالا اعتراف کرده که تحلیلش اشتباه بوده. [L]
متا دو مدل برای تحقیقات مولکولی معرفی کرده، OMol۲۵، بزرگترین دیتاست باز شیمی محاسباتی با بیش از ۱۰۰ میلیون محاسبه مولکولی، و UMA، مدلی که خواص شیمیایی مولکولها رو با سرعت بالا پیشبینی میکنه. این ابزارها که رایگان هستن، برای کشف دارو و مواد جدید خیلی کاربرد دارن. [L]
شرکت سایت ساز ویکس از Wixel رونمایی کرد، یه ابزار AI هست که یه نسخه رایگان هم داره برای ویرایش عکس و متن همراه با قالبهای آماده، نمونه فعلیش کانوا هست. [L]
شرکت OpenAI میخواد یه دیتاسنتر ۵ گیگاواتی تو ابوظبی بسازه، مساحتش حدود ۲۶ کیلومتر مربع (بزرگتر از موناکو) و مصرف برقش معادل ۵ راکتور هستهایه، انویدیا هم قراره سختافزارهای پیشرفته مثل Blackwell GB۳۰۰ رو برای این دیتاسنتر تامین کنه. [L]
اپل داره مشکل لهجه انگلیسی مدلهای AI در زبانهای دیگه رو حل میکنه. این مدلها اغلب با محوریت انگلیسی طراحی شدن و وقتی به زبانهای دیگه صحبت میکنن، مثلا وقتی به فارسی حرف میزنن اما لهجه انگلیسی دارن. [L]
شرکت ویندسرف مدل SWE-۱ رو معرفی کرده که برای استفاده مستقیم روی خود گوشی طراحی شده. ساختارش بر پایه ترنسفورمره و میتونه ورودیهای متنی و تصویری رو همزمان پردازش کنه، سرعت پردازشش روی گوشیهای پرچمدار حدود ۲۵ توکن در ثانیه هست. [L]
بهزودی به Grok قابلیتی اضافه میشه که میتونید باهاش نقاشی بکشید یا متنی رو بنویسید و بهش بدید، ویژگی Sketchpad میتونه برای گوشیها و تبلتها که نوشتن و کشیدن راحتتره مفید باشه. [L]
تیم OpenAI داره روی GPT-۵ کار میکنه و هدف اصلیش اینه که ابزارهای مختلفش مثل Codex، Operator و سیستم حافظه رو تو یه محیط واحد بیاره تا کاربرا هی بینشون سوئیچ نکنن. [L]
ساندکلاود بعد از اعتراض کاربرها به خاطر اینکه در قوانینش نوشته بود از دیتاها برای AI استفاده میکنه حالا مجدد قوانینش رو آپدیت کرده و نوشته از دیتاها برای ساخت صدا استفاده نمیکنه و صرفا برای پیشنهاد موسیقی هست. [L]
🤓 @geekalerts
آقای جفری هینتون، یکی از پدرخواندههای هوش مصنوعی، که سال ۲۰۱۶ گفته بود AI تا ۵ سال دیگه رادیولوژیستها رو بیکار میکنه، حالا اعتراف کرده که تحلیلش اشتباه بوده. [L]
متا دو مدل برای تحقیقات مولکولی معرفی کرده، OMol۲۵، بزرگترین دیتاست باز شیمی محاسباتی با بیش از ۱۰۰ میلیون محاسبه مولکولی، و UMA، مدلی که خواص شیمیایی مولکولها رو با سرعت بالا پیشبینی میکنه. این ابزارها که رایگان هستن، برای کشف دارو و مواد جدید خیلی کاربرد دارن. [L]
شرکت سایت ساز ویکس از Wixel رونمایی کرد، یه ابزار AI هست که یه نسخه رایگان هم داره برای ویرایش عکس و متن همراه با قالبهای آماده، نمونه فعلیش کانوا هست. [L]
شرکت OpenAI میخواد یه دیتاسنتر ۵ گیگاواتی تو ابوظبی بسازه، مساحتش حدود ۲۶ کیلومتر مربع (بزرگتر از موناکو) و مصرف برقش معادل ۵ راکتور هستهایه، انویدیا هم قراره سختافزارهای پیشرفته مثل Blackwell GB۳۰۰ رو برای این دیتاسنتر تامین کنه. [L]
اپل داره مشکل لهجه انگلیسی مدلهای AI در زبانهای دیگه رو حل میکنه. این مدلها اغلب با محوریت انگلیسی طراحی شدن و وقتی به زبانهای دیگه صحبت میکنن، مثلا وقتی به فارسی حرف میزنن اما لهجه انگلیسی دارن. [L]
شرکت ویندسرف مدل SWE-۱ رو معرفی کرده که برای استفاده مستقیم روی خود گوشی طراحی شده. ساختارش بر پایه ترنسفورمره و میتونه ورودیهای متنی و تصویری رو همزمان پردازش کنه، سرعت پردازشش روی گوشیهای پرچمدار حدود ۲۵ توکن در ثانیه هست. [L]
بهزودی به Grok قابلیتی اضافه میشه که میتونید باهاش نقاشی بکشید یا متنی رو بنویسید و بهش بدید، ویژگی Sketchpad میتونه برای گوشیها و تبلتها که نوشتن و کشیدن راحتتره مفید باشه. [L]
تیم OpenAI داره روی GPT-۵ کار میکنه و هدف اصلیش اینه که ابزارهای مختلفش مثل Codex، Operator و سیستم حافظه رو تو یه محیط واحد بیاره تا کاربرا هی بینشون سوئیچ نکنن. [L]
ساندکلاود بعد از اعتراض کاربرها به خاطر اینکه در قوانینش نوشته بود از دیتاها برای AI استفاده میکنه حالا مجدد قوانینش رو آپدیت کرده و نوشته از دیتاها برای ساخت صدا استفاده نمیکنه و صرفا برای پیشنهاد موسیقی هست. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM