ISANG AI | از ابزار های هوش مصنوعی تا مباحث فنی
195 subscribers
42 photos
10 videos
1 file
32 links
من حسین محسنی هستم و اینجا توی ISANG AI با هم هوش مصنوعی رو از دو زاویه بررسی می‌کنیم:

🛠 ابزارها و ترفندهای کاربردی: چطور از AI توی کار و زندگی استفاده کنیم؟

🧠 مباحث فنی و علمی: عمیق‌تر بشیم و مدل‌های AI رو بشناسیم!


Me: @mohsenihossein
Download Telegram
ویژگی Deep Research برای مشترکین پریمیوم ChatGPT فعال شد.

کیفیت پاسخی که ارائه میده واقعا جالبه و کیفیت خوبی داره.

🧠🛠 | @IsangAI
یه ابزار جدید و جالب به اسم ColorMatch از پولار (Polarr) منتشر شده که با کمک هوش مصنوعی رنگ‌های عکس‌ها رو اصلاح می‌کنه. این ابزار الان رایگانه و کارش خیلی ساده و کاربردی‌ست.

چطوری کار می‌کنه؟
شما یه عکس بهش می‌دید و یه عکس دیگه هم به عنوان مرجع انتخاب می‌کنید. بعدش هوش مصنوعی رنگ‌بندی عکس اول رو طوری تغییر می‌ده که شبیه رنگ‌بندی عکس دوم بشه. مثلاً اگه از چند تا دوربین مختلف عکس گرفتید و می‌خواید رنگ‌بندی همه‌شون مثل هم بشه، یا اگه از رنگ‌های یه عکس خوشتون اومده و می‌خواید عکس‌های خودتون رو هم بر اساس اون اصلاح کنید، این ابزار خیلی به دردتون می‌خوره.

می‌تونید مستقیم برید تو سایت پولار (colormatch.polarr.com) و ازش استفاده کنید. خیلی راحته و نیاز به نصب هیچ برنامه‌ای هم نداره.

🧠🛠 | @IsangAI
👍3
Forwarded from NLP stuff (Mahdi Samiei)
خلاصه‌تر فکر کن

از اونجایی که در مسائل استدلالی (reasoning) ، مدل برای رسیدن به جواب نهایی، باید دنباله افکار میانی رو به شکل CoT تولید کنه، یکی از دردهای آزاردهنده اینه که باید گاهی توکن‌های زیادی اون وسط تولید بشن و این امر هم هزینه پولی و هم هزینه زمانی زیادی داره. حالا با توجه به این نکته، این که چطور توکن‌های کمتری تولید کنیم و در عین حال دقت مطلوب‌تری رو حفظ کنیم مساله‌ی پیشروی ماست.

به تازگی کار جالبی اومده با عنوان Chain of Draft یا CoD که همون CoT هست با این تفاوت که در پرامپت از مدل خواسته می‌شه که هر سگمنت استدلالی (reasoning) که می‌خواد خروجی بده حداکثر ۵ کلمه طول داشته باشه. نتایجش جالب شده و نشون داده که با میزان توکن و در نتیجه latency خیلی کمتر تونسته دقت قابل رقابت با CoT رو حفظ کنه و حتی بعضی جاها بهتر از اون نتیجه بده. خلاصه که یکی از جهت‌های آینده احتمالا اینه که چطور مدل‌هایی داشته باشیم که کاراتر فکر کنند.

لینک پیپر:
https://arxiv.org/abs/2502.18600

#read
#paper

@nlp_stuff
Forwarded from Geek Alerts
میسترال ای‌آی دو تا مدل OCR معرفی کرده، یعنی میتونن متن رو از تصاویر و اسناد استخراج کنن، این پردازش میتونه از روی تصاویر یا حتی اسنادی مثل PDF باشه.

توانایی پردازش چند زبان دارن، دقت بالایی توی خوندن متن‌های دست‌نویس دارن یا فرمول‌های ریاضی و متون عربی رو به همون شکلی که هستن مینویسن و میتونن قاب‌بندی اصلی اسناد رو حفظ کنن. توی جدول مقایسه‌ای که منتشر کردن این مدل یعنی mistral-ocr-2503 دقیق‌ترین مدل موجود معرفی شده.

راستی الان به صورت رایگان داخل le Chat در دسترس هست.

🔗 mistral
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
برای اجرای LLMهای با تعداد پارامتر های مختلف چه GPU و چه میزان VRam نیاز داریم؟

🧠🛠 | @IsangAI
👍4
اگر من کشور بودم، این پرچم من میشد.

از Chatgpt خواستم که اگر کشور بودم، پرچمم رو طراحی بکنه.

این پرامپت رو بهش دادم:

If I were a country, based on what you know about me, design my flag.


🧠🛠 | @IsangAI
2
Forwarded from Geek Alerts
آنتروپیک میخواد یه نسل جدید از مدل‌هاشو معرفی میکنه که توانایی پیدا کردن اشتباهاتون خودشون و اصلاحش رو دارن، این قابلیت تو برنامه‌نویسی هم خیلی کاربردیه و کد تولید شده رو خودکار تست و اصلاح می‌کنه. [L]

آقای جفری هینتون، یکی از پدرخوانده‌های هوش مصنوعی، که سال ۲۰۱۶ گفته بود AI تا ۵ سال دیگه رادیولوژیست‌ها رو بیکار می‌کنه، حالا اعتراف کرده که تحلیلش اشتباه بوده. [L]

متا دو مدل برای تحقیقات مولکولی معرفی کرده، OMol۲۵، بزرگترین دیتاست باز شیمی محاسباتی با بیش از ۱۰۰ میلیون محاسبه مولکولی، و UMA، مدلی که خواص شیمیایی مولکول‌ها رو با سرعت بالا پیش‌بینی می‌کنه. این ابزارها که رایگان هستن، برای کشف دارو و مواد جدید خیلی کاربرد دارن. [L]

شرکت سایت ساز ویکس از Wixel رونمایی کرد، یه ابزار AI هست که یه نسخه رایگان هم داره برای ویرایش عکس و متن همراه با قالب‌های آماده، نمونه فعلیش کانوا هست. [L]

شرکت OpenAI میخواد یه دیتاسنتر ۵ گیگاواتی تو ابوظبی بسازه، مساحتش حدود ۲۶ کیلومتر مربع (بزرگتر از موناکو) و مصرف برقش معادل ۵ راکتور هسته‌ایه، انویدیا هم قراره سخت‌افزارهای پیشرفته مثل Blackwell GB۳۰۰ رو برای این دیتاسنتر تامین کنه. [L]

اپل داره مشکل لهجه انگلیسی مدل‌های AI در زبان‌های دیگه رو حل میکنه. این مدل‌ها اغلب با محوریت انگلیسی طراحی شدن و وقتی به زبان‌های دیگه صحبت می‌کنن، مثلا وقتی به فارسی حرف میزنن اما لهجه انگلیسی دارن. [L]

شرکت ویندسرف مدل SWE-۱ رو معرفی کرده که برای استفاده مستقیم روی خود گوشی طراحی شده. ساختارش بر پایه ترنسفورمره و می‌تونه ورودی‌های متنی و تصویری رو همزمان پردازش کنه، سرعت پردازشش روی گوشی‌های پرچمدار حدود ۲۵ توکن در ثانیه هست. [L]

به‌زودی به Grok قابلیتی اضافه میشه که میتونید باهاش نقاشی بکشید یا متنی رو بنویسید و بهش بدید، ویژگی Sketchpad میتونه برای گوشی‌ها و تبلت‌ها که نوشتن و کشیدن راحت‌تره مفید باشه. [L]

تیم OpenAI داره روی GPT-۵ کار می‌کنه و هدف اصلیش اینه که ابزارهای مختلفش مثل Codex، Operator و سیستم حافظه رو تو یه محیط واحد بیاره تا کاربرا هی بینشون سوئیچ نکنن. [L]

ساندکلاود بعد از اعتراض کاربرها به خاطر اینکه در قوانینش نوشته بود از دیتاها برای AI استفاده میکنه حالا مجدد قوانینش رو آپدیت کرده و نوشته از دیتاها برای ساخت صدا استفاده نمیکنه و صرفا برای پیشنهاد موسیقی هست. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🎯 از مقاله تا کد: تجربه‌ای با Paper2Code

چند وقت پیش با ابزار Paper2Code کار کردم تا ببینم چطور می‌تونه به تبدیل مقالات علمی به کد اجرایی کمک کنه. تجربه‌ای جالب و مفید بود که توی یک وبینار رایگان تصمیم گرفتم اون رو با شما به اشتراک بذارم.

در این وبینار، قراره با هم:

ابزار Paper2Code رو بشناسیم و نحوه کارکردش رو بررسی کنیم

مراحل تبدیل یک مقاله به کد رو گام‌به‌گام مرور کنیم

با مثال‌های واقعی، خروجی‌های این ابزار رو تحلیل کنیم

اگر شما هم برنامه‌نویس هستید و با مقالات هوش مصنوعی و یادگیری ماشین سروکار دارید، این وبینار می‌تونه براتون مفید باشه.

📅 تاریخ برگزاری: چهارشنبه، ۷ خرداد ۱۴۰۴
🕕 ساعت: ۲۰:۰۰ تا ۲۱:۰۰
🎟 ثبت‌نام رایگان: eseminar.tv/wb159082

🧠🛠 | @IsangAI
Paper2Code_Webinar.zip
1.5 MB
وبینار Paper2Code دیروز به خوبی برگزار شد و من خودم به شخصه تجربه خوبی ازش داشتم.

امیدوارم که برای شرکت کنندگان هم همینطور بوده باشه.

فایل های مرتبط با وبینار خدمت شما.


🧠🛠 | @IsangAI
4
گوگل برای دانشجویان آمریکایی، اشتراک یک‌ساله‌ی Gemini Pro رو رایگان کرده.

ویژگی‌های باحال Gemini Pro:

🎙 مکالمه صوتی زنده با Gemini Live
میتونی باهاش حرف بزنی، وسط حرفش بپری، یا حتی صدای دلخواهت رو انتخاب کنی.

🎬 خلاصه‌سازی ویدیوهای یوتیوب بدون نیاز به تماشا

🖼 تولید و ویرایش تصویر با مدل Imagen 4
از متن، تصویر می‌سازه یا ویرایش می‌کنه.

📧 ادغام با اپلیکیشن‌های گوگل مثل Gmail و Docs
تو نوشتن ایمیل یا متن کمک می‌کنه.


خبر خوب این که میتونیم با آی پی آمریکا، این اشتراک یکساله رو بگیریم.
با آی پی آمریکا وارد لینک زیر بشین و دریافت کنین:

https://one.google.com/join/ai-student

🧠🛠 | @IsangAI
البته که انگار توی تولید عکس درک بهتری داشته

🧠🛠 | @IsangAI
وبینار بعدی ما درباره ONNX خواهد بود.

🧠 یکی از چالش‌های اصلی در صنعت هوش مصنوعی، اجرای مدل‌ها روی پلتفرم‌های مختلفه.
معمولاً مدل‌ها فقط در بسترهایی مثل Python یا فریم‌ورک‌های خاص قابل استفاده هستن، و این باعث میشه توسعه و استقرار اون‌ها در محیط‌های واقعی زمان‌بر، پرهزینه و محدود بشه.

🚀 در این وبینار با ONNX آشنا می‌شیم — یک استاندارد باز و قدرتمند که به ما اجازه می‌ده مدل‌های هوش مصنوعی رو مستقل از زبان برنامه‌نویسی یا زیرساخت، تبدیل و اجرا کنیم؛ چه روی سرور، چه در موبایل یا مرورگر.

🎟 ثبت‌نام توی این وبینار رایگانه، اما ظرفیت محدوده؛
پس از تکمیل ظرفیت، تنها با پرداخت هزینه امکان شرکت توی وبینار وجود داره. فرصت رو از دست ندید.

اگر به‌دنبال ساختن سیستم‌های مقیاس‌پذیر، منعطف و چندسکویی هستید، این جلسه دقیقاً برای شماست.

🗓 زمان برگزاری: چهارشنبه ۴ تیر، ساعت ۲۰:۰۰

🔗 ثبت‌نام در ایسیمینار: https://eseminar.tv/wb159759

🧠🛠 | @IsangAI
👍2🔥1
تلگرام در به‌روزرسانی اخیر خود قابلیت «پیام مستقیم به کانال‌ها» را معرفی کرده است.

از این پس، کاربران می‌توانند با ضربه زدن روی آیکون پیام در پایین صفحه کانال، مستقیماً با مدیران یا سازندگان کانال‌ها ارتباط برقرار کنند.

برای ارسال پیام مستقیم، می‌تونین روی آیکون حباب پیام در پایین کانال ضربه بزنید. 👇

🧠🛠 | @IsangAI
🔥1