ISANG AI | از ابزار های هوش مصنوعی تا مباحث فنی
195 subscribers
42 photos
10 videos
1 file
32 links
من حسین محسنی هستم و اینجا توی ISANG AI با هم هوش مصنوعی رو از دو زاویه بررسی می‌کنیم:

🛠 ابزارها و ترفندهای کاربردی: چطور از AI توی کار و زندگی استفاده کنیم؟

🧠 مباحث فنی و علمی: عمیق‌تر بشیم و مدل‌های AI رو بشناسیم!


Me: @mohsenihossein
Download Telegram
البته این کار فقط محدود به یک حوزه نیست.

تصور کنید که شما در سایر حوزه ها و جنبه های زندگی هم میتونید این کار رو انجام بدید
چیزهایی مثل:

- سواد مالی و اقتصادی
- مهارت های زندگی، ارتباطی، روان‌شناختی و...

هم با این روش قابل سنجشه.

یه جورایی یک آینه شفاف از خودمونه جلوی چشممون.

🧠🛠 | @IsangAI
1
خب دیروز OpenAI از مدل جدید GPT-5 رونمایی کرده؛ مدلی پیشرفته و یکپارچه که ترکیبی از قدرت استدلال سری o و سرعت پاسخ‌دهی سری GPT است. این مدل توانایی انجام وظایف پیچیده مثل ساخت اپلیکیشن، تحلیل تقویم و تولید گزارش را دارد و خودش تشخیص می‌دهد چقدر فکر کند تا بهترین پاسخ را بدهد.

GPT-5 در آزمون‌های فنی مثل SWE-bench و GPQA عملکرد بسیار خوبی داشته و نرخ خطایش به ۴.۸٪ کاهش یافته (در مقایسه با ۲۰٪ در GPT-4o). از امروز، کاربران رایگان ChatGPT هم به آن دسترسی دارند و نسخه Pro با امکانات بیشتر ۲۰۰ دلار در ماه عرضه شده است.

همچنین شخصیت‌های جدیدی به ChatGPT اضافه شده‌اند و نسخه API این مدل در سه سطح Nano، Mini و Base با قیمت پایه ۱.۲۵ دلار به ازای هر میلیون توکن ورودی ارائه می‌شود. به گفته سم آلتمن، GPT-5 گامی بزرگ به‌سوی هوش عمومی مصنوعی (AGI) است.

🧠🛠 | @IsangAI
This media is not supported in your browser
VIEW IN TELEGRAM
در حال کار کردن با veo3 توی Gemini بودم. ایده ای به ذهنم رسید که یکی از نوشته های قدیمی‌م رو باهاش بصورت ویدیو در بیارم.

با کمک خود جمنای تونستم اون نوشته رو بصورت یک پرامپت در بیارم و نهایتا خروجی شد این.

افکت های صوتی برای خود ویدیو هست و موزیک هم خودم گذاشتم روش

کیفیت خروجی Veo3 همیشه شگفت انگیزه!!


🧠🛠 | @IsangAI
ISANG AI | از ابزار های هوش مصنوعی تا مباحث فنی
در حال کار کردن با veo3 توی Gemini بودم. ایده ای به ذهنم رسید که یکی از نوشته های قدیمی‌م رو باهاش بصورت ویدیو در بیارم. با کمک خود جمنای تونستم اون نوشته رو بصورت یک پرامپت در بیارم و نهایتا خروجی شد این. افکت های صوتی برای خود ویدیو هست و موزیک هم خودم…
پرامپت این ویدیو:

A cinematic shot of a Russian aristocratic room in the 1970s, captured from a fixed camera positioned at the lower-left corner of the room, looking diagonally toward the center. The atmosphere is dark and mysterious. In the center, a large king-sized bed with heavy, dark velvet canopies dominates the space. A woman in an academia-style black and white dress lies motionless on the bed. On a side table, a weathered Dostoevsky book is visible. Through the rain-streaked window on the far side, it is a stormy night, with occasional flashes of lightning illuminating the room.

Audio Description: There is no music in the scene. The only sounds are the intense, continuous patter of rain from outside, occasionally broken by the loud, dramatic sound of thunder.



یه تکنیک و پیشنهاد کاربردی:
با توجه به این که توی Gemini Pro بیشتر از روزانه ۳ ویدیو نمیشه ساخت، پیشنهاد میکنم اول پرامپت رو بصورت عکس خروجی بگیرید، جزئیاتی که دوست دارید اضافه بشه اصلاح کنید. در صورتی که تا ۹۰ درصد نزدیک به چیزیه که دنبالش بودید بعد از اون پرامپت ویدیو بگیرید.

🧠🛠 | @IsangAI
👍4
چند روز پیش درباره Huggingface Spaces نوشتم.

امروز داشتم توش میگشتم و این ابزار رو پیدا کردم به اسم Deepsite که طبق پرامپتی که براش
مینویسید براتون Front-end وب سایت رو خیلی دقیق و تمیز طبق خواسته تون با html و css و افزونه tailwindcss طراحی میکنه

به راحتی میتونه جایگزینی برای loveable باشه.


پرامپتی که من توی تصویر بهش دادم این بود:
‌mimic Twitter with all features and details.
و نتیجه رو توی تصویر میبینید!

لینکش:
https://huggingface.co/spaces/enzostvs/deepsite

🧠🛠 | @IsangAI
👍3🤯2
🔰نکته هایی درباره پرامپت نویسی:

یکی از تکنیک‌هایی که توی‌ نوشتن پرامپت ازش استفاده می‌کنیم، طرح کردن زنجیره افکار یا Chain of Thoughts هست.

به طور خلاصه یعنی «ما به مدل اجازه می‌دیم قدم به قدم فکر‌ کنه.»

🤖 چطور استفاده کنیم؟

1. توی پرامپت میگیم: “قدم‌به‌قدم توضیح بده” یا “مسیر فکری‌تو نشون بده”.


2. سوال رو باز میکنیم تا مدل مجبور بشه جزئیات رو تحلیل کنه.


3. آخر پرامپت جمع‌بندی میخواهیم: “حالا نتیجه نهایی رو بگو”.



📌 مثال ساده:
پرامپت معمولی:
«چطور می‌تونم برای پروژه‌م سرمایه جذب کنم؟»

پرامپت با Chain of Thoughts:
«قدم‌به‌قدم توضیح بده: اول روش‌های جذب سرمایه رو لیست کن، بعد مزایا و معایب هر کدوم رو بگو، بعد اولویت‌بندی کن، و در آخر بهترین گزینه برای من رو جمع‌بندی کن.»


#پرامپت_نویسی
🧠🛠 | @IsangAI
👍2👏1
​بایت‌دنس، شرکت مادر تیک‌تاک، با معرفی مدل هوش مصنوعی Waver 1.0، توانایی‌های خود را در زمینه تولید محتوای بصری به نمایش گذاشته است.

این مدل یک ابزار قدرتمند و چندمنظوره است که می‌تواند از متن، تصویر، یا ترکیبی از هر دو، ویدیوها و تصاویر خلاقانه تولید کند.

یکی از نقاط قوت اصلی Waver 1.0، توانایی آن در ساخت ویدیوهای کوتاه ۵ تا ۱۰ ثانیه‌ای با کیفیت 720p است که امکان ارتقاء به 1080p را نیز دارد. برای دستیابی به چنین کیفیتی، بایت‌دنس از یک معماری جدید به نام Hybrid Stream DiT استفاده کرده که باعث می‌شود مدل، هماهنگی بهتری بین المان‌های مختلف محتوا ایجاد کند.

​بایت‌دنس برای طبیعی‌تر شدن خروجی‌ها، سرمایه‌گذاری زیادی روی پاکسازی و دسته‌بندی دقیق داده‌ها کرده و تلاش ویژه‌ای برای بهبود حرکت‌ها در ویدیوها داشته است. این دقت در پردازش داده‌ها، باعث تولید ویدیوهایی می‌شود که به خصوص در صحنه‌های پویا مانند ورزش، بسیار روان و واقعی به نظر می‌رسند.


🧠🛠 | @IsangAI
ISANG AI | از ابزار های هوش مصنوعی تا مباحث فنی
​بایت‌دنس، شرکت مادر تیک‌تاک، با معرفی مدل هوش مصنوعی Waver 1.0، توانایی‌های خود را در زمینه تولید محتوای بصری به نمایش گذاشته است. این مدل یک ابزار قدرتمند و چندمنظوره است که می‌تواند از متن، تصویر، یا ترکیبی از هر دو، ویدیوها و تصاویر خلاقانه تولید کند.…
با وجود تمام این قابلیت‌ها، Waver 1.0 محدودیت‌هایی نیز دارد. این مدل فعلاً فقط قادر به تولید ویدیوهای کوتاه است و برای پروژه‌های بلندتر، به ویرایش‌های پس از تولید نیاز دارد. علاوه بر این، اجرای این مدل نیازمند سخت‌افزار قوی و پیشرفته‌ای است که ممکن است برای همه در دسترس همگان نباشد.

​برای بهره‌مندی کامل از قدرت مدل Waver 1.0، به یک سیستم با مشخصات بالا نیاز دارید.

هرچند بایت‌دنس لیست رسمی منتشر نکرده، اما بر اساس استانداردهای مدل‌های مشابه، نیازمندی‌ها به شرح زیر است:

​کارت گرافیک (GPU): این مهم‌ترین بخش سخت‌افزار است. برای پردازش‌های سنگین و موازی، به یک کارت گرافیک رده بالا از سری NVIDIA GeForce RTX 3000 یا 4000 یا معادل آن از AMD نیاز دارید.
داشتن حداقل ۱۲ گیگابایت حافظه VRAM ضروری است و هرچقدر بیشتر باشد، عملکرد بهتر خواهد بود.

​پردازنده (CPU): یک پردازنده مدرن و چند هسته‌ای مانند Intel Core i7 یا AMD Ryzen 7 یا مدل‌های بالاتر برای مدیریت عملیات‌ها توصیه می‌شود.

​حافظه رم (RAM): حداقل ۱۶ گیگابایت رم برای اجرای مدل لازم است، اما ۳۲ گیگابایت یا بیشتر برای عملکرد بهینه و سریع‌تر، ایده‌آل است.

​فضای ذخیره‌سازی: استفاده از SSD یا NVMe به دلیل سرعت بالای بارگذاری و پردازش داده‌ها به شدت توصیه میشود‌.

🧠🛠 | @IsangAI
Forwarded from Reza Jafari
آیا تا حالا شده پروژه‌های هوش مصنوعی یا رندرینگ شما ساعت‌ها یا حتی روزها طول بکشد؟

مشکل معمولاً GPU نادرست یا استفاده ناکارآمد از آن است! 🚀
در وبینار “انتخاب بهینه GPU برای کسب‌وکارها”، یاد می‌گیرید چطور بیشترین بهره‌وری را از GPU خود ببرید و پروژه‌هایتان را سریع‌تر، هوشمندانه‌تر و کم‌هزینه‌تر اجرا کنید.

📅 دوشنبه ۳۱ شهریور | ساعت ۱۹
💻 آنلاین | رایگان

ثبت‌نام رایگان👇


https://b2n.ir/yj6672
مدل‌های ویدئوی AI WAN: ۲.۱، ۲.۲ و ۲.۵ چه فرقی دارن؟

ببینید، سری WAN تو تولید ویدئو از متن، تصویر و حتی صدا خیلی پیشرفته‌ست و خوبه یه نگاه به تکاملش بندازیم:

WAN 2.1 – شروع کار با T2V
اولین نسخه بیشتر یه آزمایش بود برای تبدیل متن به ویدئو (T2V). فریم‌ها رو تولید می‌کرد ولی حرکت‌ها گاهی خیلی صاف نبود و وضوح هم کم بود. تصویر و صدا رو پشتیبانی نمی‌کرد و بیشتر یه نمونه اولیه تحقیقاتی بود.

WAN 2.2 – بهتر و پایدارتر، با I2V
نسخه ۲.۲ اومد مشکلات نسخه قبل رو رفع کرد. حالا فریم‌ها باکیفیت‌تر شدن، حرکت‌ها نرم‌تر شدن و مهم‌تر از همه، می‌تونی یه تصویر ثابت بدی و با یه پرامپت حرکت بسازی (I2V). یعنی مثلاً یه عکس درخت رو می‌دی و می‌تونه برف روش بیاد! 😎

WAN 2.5 – کیفیت سینمایی و چند وجهی
این نسخه دیگه یه جهش جدیه. T2V و I2V هنوز هستن، ولی حالا کنترل بیشتری روی نور، زاویه دوربین و کیفیت داریم و بعضاً می‌شه صدا رو هم با تصویر هماهنگ کرد (S2V). بعضی قابلیت‌ها هنوز آزمایشی هستن، ولی می‌بینی که داره کم‌کم مرز بین ویدئوی AI و کار واقعی رو محو می‌کنه.

چطور می‌تونی ازش استفاده کنی؟

* روی سیستم شخصی: اگه کارت گرافیک قوی داری، می‌تونی مدل‌ها رو دانلود و اجرا کنی و مستقیم روی سیستم خودت ویدئو بسازی.
* به صورت آنلاین: بعضی سایت‌ها و پلتفرم‌ها WAN یا مدل‌های مشابه رو سرویس می‌کنن، پس می‌تونی بدون نیاز به سخت‌افزار حرفه‌ای ویدئو تولید کنی.
* کاربردها: برای هنرمندان، بازاریاب‌ها، تولید محتوا یا آموزش آنلاین خیلی کاربردیه.

⚠️ نکته: هر نسخه محدودیت‌هایی داره و کیفیت نهایی به سخت‌افزار و نسخه‌ای که استفاده می‌کنی بستگی داره.

💡 خلاصه اینکه WAN نشون داده AI می‌تونه تولید ویدئو رو خیلی راحت‌تر و حرفه‌ای‌تر کنه، ولی هنوز باید محدودیت‌ها رو در نظر گرفت.

🧠🛠 | @IsangAI
👍2🔥1
⚡️ تا حالا شده حس کنی هوش مصنوعی یه خروجی داره ولی چرا اون چیزی که می‌خوای نیست؟
بیشتر وقت‌ها مشکل، نحوه نوشتن پرامپت ماست 😅

💡 تکنیک امروز: شخصیت (Persona) و محدودیت (Constraint) تعیین کن!

این باعث می‌شه هوش مصنوعی دقیق و عمیق فکر کنه و خروجی‌ای بده که واقعی، جذاب و کاربردی باشه، نه یه جواب خنثی و عمومی.

مثال ساده:
- ضعیف: «بنویس چطور ایده‌م رو ثبت کنم.» → جواب معمولی 😐
- قوی: «تو یک وکیل خبره هستی که داری به یک کارآفرین تازه‌کار توضیح میدی چطور ایده‌اش رو ثبت کنه، با مثال‌های ساده و لحن دوستانه.» → جواب تخصصی و جذاب

چرا مهمه؟ چون وقتی شخصیت و محدودیت مشخص باشه:
- هوش مصنوعی دقیق‌تر عمل می‌کنه
- متن به سبک حرفه‌ای و همزمان دوستانه درمیاد
- وقتت حفظ می‌شه و لازم نیست چند بار خروجی رو اصلاح کنی

مثال‌های سریع:
- مدیرعامل: «تو مشاور استراتژیک با ۲۰ سال تجربه هستی، تحلیل ریسک ورود به بازار X در قالب ۴ نکته.»
- برنامه‌نویس: «تو متخصص امنیت سایبری هستی، این تابع رو از نظر آسیب‌پذیری بررسی و گزارش Markdown بده.»

#پرامپت_نویسی

🧠🛠 | @IsangAI
👏2
🔒 یه سوال مهم: چیارو نباید به هوش مصنوعی بگیم؟

خیلیا فکر می‌کنن میشه هر چیزی رو راحت با چت‌بات‌ها یا ابزارهای AI به اشتراک گذاشت، اما واقعیت اینه که بعضی چیزا فوق‌العاده حساسن و نباید گفته بشن.

◀️ اطلاعات بانکی
شماره کارت، شماره حساب و هرچی مربوط به بانک باشه… اگه یه درصد لو بره، می‌تونه حسابی دردسر درست کنه.

◀️ مشکلات شخصی و بحران‌های فکری
موضوعات خیلی خصوصی یا محرمانه زندگیتون رو به AI نسپارید. این داده‌ها ممکنه برای آموزش مدل استفاده بشن و هویتتون رو به خطر بندازن.

◀️ اطلاعات داخلی کسب‌وکار
سورس‌کد، استراتژی‌ها یا هر دیتای محرمانه از بیزینستون، جای گفتنش توی چت‌بات نیست. امنیت کاری همیشه باید اولویت باشه.

◀️ یوزرنیم، پسورد و API Key
این‌ها مثل کلید گاوصندوقن. لو برن، یعنی دسترسی کامل داده‌اید. حتی سابقه لیک شدنشون هم وجود داشته!

◀️ اطلاعات شخصی
مثل آدرس، کد ملی، شماره شناسنامه و... اینا رو نه به AI بگید، نه به کسی که مطمئن نیستید.

خلاصه کلام: با هوش مصنوعی میشه کلی چیز یاد گرفت و کارای خفن کرد، ولی باید بلد باشیم چه چیزایی رو نباید بگیم تا امنیت خودمون و کارمون حفظ بشه.

🧠🛠 | @IsangAI
👍1😱1
📸 این روزا عکسای آتلیه‌ای با حال‌وهوای دارک حسابی ترند شدن!
خبر خوب اینکه لازم نیست بری آتلیه یا کلی هزینه کنی.
با Gemini و Nano Banana میشه خیلی راحت همین استایل‌ها رو تولید کرد.

👀 توی پست بعدی مرحله‌به‌مرحله آموزش میدم چطور بسازید.


🧠🛠 | @IsangAI
توی Gemini روی گزینه 🍌 Create Image بزنید.

چند تصویر از زوایای مختلف چهره خودتون آپلود بکنید و پرامپت زیر رو براش بنویسید و ارسال کنید.

مردانه:
​A black and white studio portrait of a serious-looking man, looking directly at the camera. He has dark hair, a neat mustache, and is wearing a formal outfit: a dark, double-breasted overcoat, a striped vest, a white collared shirt, and a dark tie. The lighting is dramatic, highlighting his face and the textures of his clothing against a plain dark background. The image has a classic, timeless feel, reminiscent of film noir or vintage photography.


زنانه:
​A black and white studio portrait of a serious-looking woman, looking directly at the camera. She has dark hair styled in a classic, sophisticated manner, and is wearing a formal, tailored feminine outfit: a dark, double-breasted overcoat, a striped vest, a white silk collared blouse, and a delicate dark tie. The lighting is dramatic, highlighting her face and the textures of her clothing against a plain dark background. The image has a classic, timeless feel, reminiscent of film noir or vintage photography.


نکته تکمیلی:

در ادامه مثلا میتونین عکس یک لباس خاص رو براش ارسال کنید و بگید که لباس رو براتون جابجا بکنه

🧠🛠 | @IsangAI
2👍2
📣 خبر این که Sora 2 رسماً معرفی شد!

به تازگی OpenAI مدل تولید ویدیوی جدیدی به اسم Sora 2 آورده، که می‌تونه ویدیو + صدا + گفتار + افکت‌ها رو با واقع‌گرایی بیشتر تولید کنه.
هم‌چنین همراه با این معرفی، اپلیکیشن مستقل Sora هم عرضه شده که کارش شبیه TikTok هست ولی ویدیوهاش همگی توسط هوش مصنوعی تولید می‌شن.

امکانات و تغییرات مهم Sora 2

امکان تولید صدا، گفتار و افکت‌های صوتی همراه با تصویر

بهبود در کیفیت واقعی‌تر صحنه‌ها، حرکات و جزئیات فیزیکی

کنترل بیشتر روی صحنه‌ها (کدوم بخش از تصویر بخوای برجسته باشه، چه افکتی اضافه بشه، و غیره)

محدودیت فعلی ویدیوها ۱۰ ثانیه‌ایه اما با امکان به اشتراک‌گذاری و Remix در اپ Sora

رعایت حقوق مولفان: اگر کسی حق کپی‌رایت داشته باشه، باید به OpenAI اطلاع بده تا اثرش توی تولیدات Sora استفاده نشه

چرا Sora 2 اهمیت داره؟

چون حالا می‌تونیم ایده‌ها رو نه فقط با تصویر، بلکه با صدا و حرکت ببینیم. تولید ویدیو کامل با امکانات چندرسانه‌ای می‌تونه مسیر تولید محتوا رو متحول کنه.
همچنین این حرکت باعث رقابت با مدل‌هایی مثل Veo 3 گوگل خواهد شد که قبلاً قابلیت صوت + ویدیو رو ارائه داده‌اند.

پ.ن: کاربران آیفون می‌تونن اپلیکیشن Sora رو امتحان کنن.
این اپ بخش اجتماعی داره که میشه خروجی‌ها رو اونجا به اشتراک گذاشت.

🧠🛠 | @IsangAI
👍6
📸 چرا Nano Banana چهره رو عالی حفظ می‌کنه، اما مدل‌های قبلی خرابش می‌کردن؟

چهره همیشه سخت‌ترین بخش برای هوش مصنوعی‌ها بوده. 👀

🤖 مدل‌های قدیمی معمولاً نویز اضافه می‌کردن و مدل تلاش داشت با دانشی که داره تصویر رو بازسازی کنه که به همین علت جزئیات رو از دست می‌دادن، یا حتی هویت آدم تو تصویر عوض می‌شد.

ولی Nano Banana اومده این مشکل رو تا حد زیادی حل کرده. 🚀

الان Nano Banana چیکار می‌کنه که فرق داره؟

🔹 روی Character Consistency (حفظ کاراکتر) تمرکز کرده، یعنی صورتت تو هر تغییر همون می‌مونه.

🔹 به جای اینکه همه‌چیزو دوباره حدس بزنه، جزئیات صورتو به خاطر میاره و سرجاش نگه می‌داره.

🔹 می‌تونی با دستور ساده متنی بگی: «نور رو عوض کن ولی صورتو دست نزن.» 💡

🔹 از چندتا عکس مرجع می‌تونه استفاده کنه و تغییرات رو مرحله‌به‌مرحله بده بدون اینکه هویت خراب شه.

🔹 بافت طبیعی پوست رو حفظ می‌کنه؛ نه زیادی صاف می‌کنه، نه مصنوعی. 🌿

🔹 موقع تغییر پس‌زمینه یا نور، صورت با محیط هماهنگ می‌مونه. 🌆

به زبون ساده:
مدل‌های قبلی عکس رو خراب میکردن و از نو می‌ساختن و همین باعث تغییر می‌شد.

اما Nano Banana صورت رو «یاد می‌گیره» و ثابت نگه می‌داره. همین باعث میشه تو عکسای جدید هنوز خودت باشی.

🧠🛠 | @IsangAI
👍4
🧩 یه تکنیک خفن پرامپت نویسی که کمتر کسی می‌گه:
به AI اجازه بده خودش ازت سوال بپرسه تا جوابش دقیق و شفاف بشه 🤯
خیلی وقت‌ها ما همه چیز رو یک‌جا می‌دیم و خروجی سطحی می‌شه،
اما وقتی AI می‌تونه سوال کنه، خودش اطلاعات لازم رو جمع می‌کنه و متن نهایی حرفه‌ای و کاربردی می‌شه.

💡 تکنیک امروز: پرامپت تعاملی (Interactive Prompt)
مثال عملی: به جای گفتن:
«یک کپشن بنویس»، مثلا بگو:
«تو یک نویسنده محتوا هستی. قبل از نوشتن، از من سوال کن تا مشخص کنیم سبک، طول متن و زاویه داستان چیست.»
حالا AI خودش ازت می‌پرسه و بعد متن نهایی رو می‌سازه.

چرا مهمه؟
- خروجی دقیق‌تر و شفاف‌تر می‌شه
- متن حرفه‌ای و آماده تولید می‌کنه
- کاربر زمان کمتری برای اصلاح و ویرایش صرف می‌کنه

به نظر شما وقتی AI خودش سوال می‌کنه، حس می‌کنی متن خلاقانه‌تر می‌شه یا دقیق‌تر ؟

#پرامپت_نویسی

🧠🛠 | @IsangAI
🔥1