This media is not supported in your browser
VIEW IN TELEGRAM
#Python

در ویدیوی فوق، بخشی از نحوه ی کار با پکیج Lux نمایش داده شده است (به منظور وضوح بیشتر ویدیو، می‌توانید روی آن کلیک کنید).

این پکیج یک ابزار عالی برای مصورسازی داده و تجزیه و تحلیل اکتشافی با کد پایتون است. تنها کاری که باید انجام دهید، انتخاب نمودار است. پس از انتخاب نمودار، کد مربوط به آن نمودار ایجاد می گردد و در صورت نیاز می توانید آن را ویرایش کنید.

پکیج های Matplotlib یا Seaborn می توانند زمان بر باشند. بنابراین با Lux می توانید بدون کدنویسی، نمودارها را ترسیم کنید.

به منظور مشاهده ی مثال های بیشتر می توانید به لینک زیر مراجعه کنید:
🔗 https://github.com/lux-org/lux

🏫 @DataScience_School
🌐Http://dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#Python

💎یادگیری ماشین در شناسایی تومورهای کبد

▪️به طور خودکار می توانید کبد را از تومورهای کبد، در سی تی اسکن با 3D-UNET، سگمنت نمایید.

▪️کد اجرایی پایتون:
🔗 https://buff.page.link/7AHp

🏫 @DataScience_School
🌐Http://dsstalent.com
#Python_Excel

❇️پایتون در اکسل!

ترکیب بزرگی از قدرت پایتون و انعطاف پذیری اکسل

طبق آپدیت جدید مایکروسافت، کاربران اکسل به راحتی می توانند با اجرای کد پایتون در یکی از سلول های اکسل، به فرآیند مصورسازی، تمیز کردن داده، یادگیری ماشین و غیره در اکسل دسترسی داشته باشند و نتایج را در کاربرگ ها مشاهده کنند.

لینک منبع
🔗https://buff.page.link/wtEs

🏫 @DataScience_School
🌐Http://dsstalent.com
#Python

✳️ زمانی که داده های زیادی دارید، نمودار Scatter Plot ایده آل نیست. شما می توانید به جای آن از Hexbin Plot استفاده کنید.
در نمودار Hexbin، داده ها را دسته بندی و در شش ضلعی قرار می دهد و براساس میزان داده های موجود در آن نقطه، به آن شدت رنگ اختصاص داده می شود.

🏫 @DataScience_School
🌐Http://dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#Python

✳️سریع ترین مسیر برای ایجاد Pivot Table، چارت و گروه بندی داده ها بدون نوشتن کد در پایتون!
▪️PivotTableJS
یک ابزار drag-n-drop برای ایجاد جداول محوری و نمودارهای تعاملی در Jupyter است. علاوه بر این، شما همچنین می توانید جداول محوری را با heatmaps برای تجزیه و تحلیل پیشرفته افزایش دهید.

🏫 @DataScience_School
🌐Http://dsstalent.com
#Python

🚀 70 برابر Pandas سریع تر فقط با تغییر یک خط کد

▪️کار بر روی مجموعه داده های بزرگ در پانداس چالش برانگیز است. برای سرعت بخشیدن به عملکرد آن، Modin را امتحان کنید. این خط کد، بهبود زمان اجرا فوری را بدون هیچ تلاش اضافی ارائه می دهد، Modin را امتحان کنید. با تغییر عبارت import، آماده استفاده از Modin همانند Pandas API هستید.

🏫 @DataScience_School
🌐Http://dsstalent.com
#Python
#visualisation

❇️بزرگنمایی با matplotlib

▪️در مصورسازی بخش های خاصی وجود دارد که اهمیت ویژه ای دارند، اما ممکن است بلافاصله برای مخاطب آشکار نشوند. یکی از راه های عالی این است که روی منطقه مورد نظر بزرگنمایی کنید. بزرگنمایی تضمین می کند که طرح ما با آنچه قصد به تصویر کشیدن آن را داریم ارتباط برقرار می کند.

▪️در matplotlib می توانید از 𝐢𝐧𝐝𝐢𝐜𝐚𝐭𝐞_𝐢𝐧𝐬𝐞𝐭_𝐳𝐨𝐨𝐦 استفاده کنید. همانطور که در تصویر نشان داده شده است، یک جعبه نشانگر اضافه می کند که می تواند روی قسمت های مهم زوم شود.

🏫 @DataScience_School
🌐Http://dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#Python
#Excel

❇️تبدیل فایل اکسل به پایتون

▪️با استفاده از هوش مصنوعی به نام Pyoneer می‌توان فایل اکسل را به پایتون تبدیل کرد و تمام فعالیت هایی که در اکسل به صورت دستی انجام می‌شود، در پایتون با سرعت بیشتری انجام داد.
▪️این هوش مصنوعی از الگوریتم‌های سفارشی و مدل های پیشرفته OpenAI برای ایجاد فایل پایتون استفاده می کند. Pyoneer اسکریپت فایل اکسل را دقیقاً بازتولید می‌کند. شما یک اسکریپت پایتون کاملاً خودکار و آزمایش شده را دانلود می‌کنید.
🔗https://pyoneer.ai/

🏫 @DataScience_School
🌐Http://dsstalent.com
#Python
❇️یک روش جالب برای بهبود نمودارهای حرارتی (heatmap):

▪️در نمودار حرارتی سنتی، مقادیر با یک مقیاس رنگی نمایش داده می‌شوند. اما فهمیدن دقیق اعداد از روی رنگ‌ها همچنان چالش‌برانگیز است.

▪️اضافه کردن یک مؤلفه اندازه می‌تواند در چنین مواردی بسیار مفید باشد. به این معنا که هرچه اندازه بزرگ‌تر باشد، مقدار مطلق نیز بیشتر است.

▪️این روش به ویژه برای تمیزتر کردن نمودارهای حرارتی کاربردی است، چون مقادیری که به صفر نزدیک‌ترند به سرعت کوچک می‌شوند و دیدن آن‌ها آسان‌تر است.

لینک کد:
🔗https://buff.page.link/GpRL

🏫 @DataScience_School
🌐Http://dsstalent.com
#Python
#DataScience

❇️ سرعت بی‌نظیر پردازش با تغییر ساده در Pandas!

▪️اگر در کار با داده‌ها به سرعت بیشتری نیاز دارید، این تغییر کوچک در کدتان می‌تواند Pandas را 20 تا 30 برابر سریع‌تر کند!
کافیست به جای دستور زیر:
↳ import pandas as pd
این دستور را وارد کنید:
↳ import fireducks.pandas as pd

▪️حالا کل کدتان بدون نیاز به هیچ تغییری با سرعتی بی‌نظیر اجرا می‌شود. براساس بنچمارک‌های رسمی، این کتابخانه 20 تا 30 برابر سریع‌تر از Pandas و حدود 2 برابر سریع‌تر از Polars عمل می‌کند.

🏫 @DataScience_School
🌐 Http://dsstalent.com
#Python
#Data_analytics

❇️ نکات طلایی برای کدنویسی پایتون در تحلیل داده‌ها

▪️ یکی از سوالات پرتکرار علاقه‌مندان و متخصصان تحلیل داده این است: چطور بر پایتون مسلط شویم؟
برای پاسخ به این سوال، پنج راهکار کلیدی وجود دارد که می‌تواند مسیر یادگیری شما را هموارتر و کاربردی‌تر کند:

📍 یادگیری کتابخانه‌های اصلی پایتون:
مهم‌ترین کتابخانه‌های پایتون برای تحلیل داده:

▪️Pandas -> برای کار با DataFrame
▪️NumPy -> برای محاسبات عددی
▪️Matplotlib/Seaborn -> برای مصورسازی
▪️Scikit-learn -> برای یادگیری ماشین


📍 درک مفاهیم پایه:
مفاهیم کلیدی مثل List Comprehensions، توابع Lambda، برنامه‌نویسی شیءگرا و مدیریت خطا برای نوشتن کدی کارآمد.

📍 استفاده از روش‌های حل مسئله:
به کارگیری تکنیک‌های پاکسازی داده، حلقه‌های بهینه و عملیات برداری در NumPy و Pandas برای افزایش کارایی.

📍 اجرای پروژه‌های شبیه‌سازی:
کار روی پروژه‌های کامل از بارگذاری داده تا پاکسازی، تحلیل و مصورسازی.

📍 درس گرفتن از پروژه‌های گذشته:
کدهای قبلی خود را مرور کنید و به دنبال راه‌هایی برای بهینه‌تر کردن آن‌ها باشید.

🏫 @DataScience_School
🌐 Http://dsstalent.com
#Python

❇️چرا نمودارهای Box Plot و Histogram می‌توانند گمراه‌کننده باشند؟

▪️دو مجموعه داده‌ی کاملاً متفاوت می‌توانند یک Box Plot یکسان تولید کنند.
▪️تغییر تعداد binها در Histogram شکل نمودار را تغییر می‌دهد.

🔹 برای جلوگیری از نتیجه‌گیری‌های اشتباه، همیشه بهتر است داده‌ها را با دقت بیشتری نمایش دهیم. یکی از روش‌های مفید، استفاده از Raincloud Plot است که سه نوع نمودار را ترکیب می‌کند:

▪️Box Plot برای نمایش آمار داده‌ها
▪️Strip Plot برای نمایش کلی داده‌ها
▪️KDE Plot برای نمایش توزیع احتمالاتی داده‌ها

مزایای Raincloud Plot:
▪️جلوگیری از تفسیر نادرست داده‌ها
▪️کاهش شلوغی بصری و افزایش وضوح
▪️بهبود مقایسه بین گروه‌های مختلف
▪️نمایش جنبه‌های مختلف داده در یک نمودار

🏫 @DataScience_School
🌐 Http://dsstalent.com
#Python
#DataVisualization

❇️چرا استفاده از Bar Chart برای نمایش تغییر جایگاه رقبا در طول زمان مناسب نیست؟

▪️با افزایش تعداد دسته‌ها، Bar Chart به‌سرعت شلوغ و نامفهوم می‌شود.
▪️مقایسه‌ی تغییر رتبه در یک نمودار میله‌ای دشوار است.
🔹 به جای آن، از Bump Chart استفاده کنید. این نمودار مخصوص نمایش تغییر رتبه‌ی آیتم‌های مختلف در طول زمان است و خوانایی بسیار بهتری دارد.

مزایای Bump Chart:
▪️بهبود وضوح مقایسه‌ی تغییر رتبه‌ها
▪️کاهش شلوغی بصری و افزایش خوانایی
▪️مناسب برای نمایش روند رتبه‌بندی در طول زمان
🏫 @DataScience_School
🌐 Http://dsstalent.com