کارگروه علم داده
428 subscribers
458 photos
14 videos
119 files
431 links
ارتباط با ادمین:
@Smn_statistics
Download Telegram
🔵 هفتاد و یک امین و بینار از سلسله وبینارهای انجمن آمار ایران

مدل رگرسیون کاکس بر پایه یادآوریهای ناقص زمان رخدادها کاربردی از زمان شروع بیماری قلبی در بازماندگان سرطان کودکی

دکتر صدیقه میرزایی
استادیار دانشکده آمار زیستی مرکز تحقیقاتی سرطان کودکان سنت جود

چهارشنبه ۱۴۰۲/۱۰/۰۶ ساعت ۱۸ تا ۱۹:۳۰

🌐 لینک برگزاری: ‏http://vroom.ut.ac.ir/irstat

🆔 @TUSSChannel | انجمن علمی آمار دانشگاه تهران
پیش بینی قیمت جهانی طلا
لینک

@dsfum
👍1
Forwarded from Data Analytics
📚 Advanced Analytics with Power BI and Excel (2023)

1⃣ Join Channel Download:
https://t.me/+MhmkscCzIYQ2MmM8

2⃣ Download Book: https://t.me/c/1854405158/769

💬 Tags: #Excel #PowerBI

👉 BEST DATA SCIENCE CHANNELS ON TELEGRAM 👈
👨🏻‍💻 اگه شما هم مثل من به مشکل نامتعادل بودن و نرمال نبودن داده‌هاتون توی پروژه‌های ML برخورد کردین، نوت‌بوک‌های ML for Imbalanced Data رو به هیچ وجه از دست ندین!

☑️ این نوت‌بوک‌ها مثل یه راهنمای جامع و کاربردی عمل می‌کنه و از روش‌های کلاسیک تا تکنیک‌های پیشرفته رو پوشش میده تا بتونین به کمک‌شون عملکرد مدل‌تون رو بهبود ببخشین.

📂 برخی از موضوعات این نوت‌بوک‌ها :

◼️ استفاده موثر از داده‌های نامتعال در مدل‌های ML
◻️ روش‌های نمونه‌برداری متنوع
◼️ روش‌های مبتنی بر داده، الگوریتم و رویکرد ترکیبی

🏷 ML for Imbalanced Data
📃
Notebooks


هم چنین یه دوره ویدیویی یادگیری ماشین برای داده‌های نامتعادل + ریپوی کد‌هاش رو برای یادگیری کامل‌تر مباحث، براتون قرار میدم.👇🏼

🏷 ML for Imbalanced Data Course
🎬
Videos
🗃
Code Repository


#️⃣ #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
📎
@MachineLearning_ir
👍1
پردازش متن فارسی

مدل زبانی parsBERT ، مدلی بر پایه BERT شرکت گوگل که برای پردازش متون فارسی طراحی شده است.


لینک گیت هاب parsBERT:

https://github.com/hooshvare/parsbert

@dsfum
👍1
Forwarded from Novel Optimization |Datascience| MachinLearning | DeepLearning | Python | علم داده | یادگیری ماشین | یادگیری عمیق | پایتون
Please open Telegram to view this post
VIEW IN TELEGRAM
⭕️ 15 تا از رایج‌ترین کاربردهای Pandas, Polars و SQL در یک فریم!

📑 با این راهنما مهارت‌تون رو در هر سه چارچوب افزایش بدین!

👨🏻‍💻 قبلا در این پست در مورد اهمیت استفاده از Polars و جایگزین کردنش به جای Panas گفتم. اما همیشه می‌دونیم که SQL و Pandas چقدر ابزارهای بسیار قدرتمندی برای دیتا آنالیست‌ها و دیتا ساینتیست‌ها هستن و مهارت در هر دوتاشون چقدر ارزشمنده!

اما اخیراً، Polars نیز در میان دیتا ساینتیست‌ها محبوبیت زیادی پیدا کرده. دلیل این محبوبیت هم اینه که Polars بسیاری از محدودیت‌های Pandas رو رفع کرده، از جمله:

☑️ ابزار Pandas همیشه از محاسبات تک‌هسته‌ای استفاده می‌کنه، درحالی که Polars چند‌هسته‌ایه.

☑️ در Pandas امکان lazy execution وجود نداره، اما Polars این قابلیت رو داره.

☑️ مورد بعدی اینکه Pandas دیتافریم‌های حجیم ایجاد می‌کنه، اما دیتافریم‌های Polars سبک و کم حجمه.

☑️ ابزار Pandas روی دیتاست‌های بزرگ کند عمل می‌کنه، درحالی که Polars به طور قابل توجهی کارآمده.

🗂 دانلود نسخه با کیفیت‌تر این راهنما : Link


#️⃣ #علم_داده #DataScience

📊 دانشمند داده شوید :
📎
@DataScience_ir
#امریه
امریه وزارت ارتباطات
@dsfum
👨🏻‍💻 خیلی وقت‌ها پیش اومده که نیاز داشتین برای پروژتون، داده‌های خام رو از یه نمودار یا تصویر، داخل یه سند استخراج کنین. مخصوصا برای کارهای پژوهشی.

🔷 حتی بعضی‌ها رو دیدم که تصویر رو با نمودارش چاپ می‌کنن و مقادیر رو به صورت دستی وارد می‌کنن و اندازه گیری می‌کنن! اما الان میخوام نتیجه چند ساعت جستجوم در وب رو باهاتون به اشتراک بگذارم.

وبسایت WebPlotDigitizer !

📝 این وبسایت کار شما رو راحت می‌کنه و قابلیت این رو داره که داده‌های مدنظر شما رو از هر تصویر یا نموداری استخراج کنه. می تونید از این ابزار برای هر نموداری مثل هیستوگرام، مقیاس لگاریتمی، نمودار قطبی، حذف شبکه و غیره استفاده کنید. 100% عملی!

◼️ تصویرتون رو آپلود کنید.
◻️ مقیاس مدنظرتون رو با توجه به محورها تنظیم کنید.
◼️ تمام نقاط موردنظرتون رو انتخاب کنین.
◻️ انتقال به یک فایل یا کپی در کلیپ بورد.


🏷 Extract raw data
📚 WebPlotDigitizer


#️⃣ #علم_داده #DataScience

📊 دانشمند داده شوید :
📎
@DataScience_ir
#استخدام
یکی از حوزه های کاری که تحلیل داده و گزارشات و آزمون های آماری کاربرد دارد، حوزه مدیریت منابع مشتری یا CRM هست.

البته علاوه بر دانش تحلیل داده، قبل از ورود به این حوزه لازم هست اطلاعات در حوزه کسب و کار و مشتری مداری نیز کسب کنید.

آگهی شغلی برای استخدام مسئول CRM در شرکت نرم افزاری پارت:
لینک

@dsfum
Forwarded from Python for Data Analysts
Data Visualization with Python.pdf
7.7 MB
Data Visualization with Python
Dr. Pooja, 2023
کتاب آشنایی با نظریه گراف
لینک
@dsfum
🚀 پردازش ۱ میلیارد ردیف در ثانیه در Pandas!

👨🏻‍💻 اگه تابحال با دیتاست‌های بزرگ (100+ گیگابایت) کار کرده باشین، احتمالاً با خطای کمبود حافظه مواجه شدین.

☑️ راه حل های زیادی وجود داره. برخی اسپارک رو پیشنهاد می‌کنن که برای داده‌های بزرگ استفاده میشه. اما اگه بخواین تحلیل داده‌هاتون رو در پایتون ادامه بدین باید چیکار کنین؟

🔥 کتابخانه منبع باز Vaex اینجا کاربرد داره!

📊 در تصویر بالا می‌بینین که این کتابخونه چطور می‌تونه یک فایل 100+ گیگابایتی رو در عرض میلی ثانیه بارگذاری کنه!

🔔 اما سه چیز که باید در مورد Vaex بدونین:

1️⃣ استفاده ازش مثل پانداسه، بنابراین کار باهاش به عنوان یه دیتا ساینتیست براتون راحته.

2️⃣ از دیتافریم های خارج از هسته استفاده می‌کنه و هیچ حافظه‌ای رو هدر نمیده!

3️⃣ می تونین دیتاست‌های بزرگی رو بهش وارد کنین، آمار رو باهاش محاسبه کنین، داده ها رو تجسم کنین و حتی باهاش یادگیری ماشین رو انجام بدین!

🏷 Library Vaex
🗃 Vaex GitHub
📑 Vaex article
🎬 Vaex Tutorials

#️⃣ #علم_داده #DataScience

📊 دانشمند داده شوید :
📎
@DataScience_ir
Forwarded from Machine Learning
📚 Machine Learning Applications (2023)

1⃣ Join Channel Download:
https://t.me/+MhmkscCzIYQ2MmM8

2⃣ Download Book: https://t.me/c/1854405158/989

💬 Tags: #ML

👉 BEST DATA SCIENCE CHANNELS ON TELEGRAM 👈
چرا تحلیل اکتشافی مهم است؟

لینک

🆔@dsfum
Forwarded from آموزش هوش تجاری با Tableau (Sara Saberi)
توضیحات کتاب : 📖

یک راهنمای جامع برای استفاده از ابزار Tableau Desktop در ایجاد داشبوردها و تجسم داده‌ها است. این کتاب شامل بیش از 100 دستور العمل عملی برای افزایش مهارت‌ها و درک بهتر از داده‌ها از طریق نمودارها و گزارش‌های تصویری می‌باشد.

کتاب به صورت گام به گام و با توضیحات جزئی نحوه استفاده از ابزار Tableau Desktop را تشریح می‌دهد. از ایجاد نمودارهای ساده گرفته تا استفاده از ویژگی‌ها و تکنیک‌های پیشرفته، خوانندگان به دستورالعمل‌ها و نکات عملی برای بهینه‌سازی استفاده از Tableau Desktop دست پیدا می‌کنند.

همچنین، ارتباط با منابع آنلاین و امکانات جامعه Tableau نیز به خوانندگان ارائه می‌شود تا به صورت فعالانه در جامعه‌ی Tableau شرکت کرده و از منابع آموزشی بهره‌مند شوند.

🔗https://amatek.ir/business-intelligence-library/tableau-desktop-cookbook/
@MachineLearning_ir - Tensorflow 2.0 & Pytorch.pdf
242.9 KB
📗 جزوه‌ جامع دو کتابخانه مهم یادگیری ماشین؛ TensorFlow و PyTorch

👨🏻‍💻 دو کتابخانه بزرگ حوزه یادگیری عمیق، TensorFlow و PyTorch هستن که هر کدوم ویژگی‌ها و مزایای منحصر به فردی که تو این جزوه من به مقایسه‌شون پرداختم.

🔺کتابخانه TensorFlow ؛ با انعطاف‌پذیری و مقیاس‌پذیری بالا، به عنوان یک ابزار قدرتمند برای انجام پروژه‌های گوناگون ML شناخته میشه.

🔻کتابخانه PyTorch ؛ با نمودار‌های محاسباتی پویا، جذابیتش رو به خاطر سهولتش در پیاده‌سازی مدل‌های پیچیده و قابل فهم بودن کد ارائه میده.


#⃣ #یادگیری_ماشین #ML

💡 مهندس ML شوید :
📎
@MachineLearning_ir
تحلیل داده های شرکت adidas

لینک

🆔@dsfum
Forwarded from کانال آقای صنایع (امیررضا تجلی)
Tech 2024 HBR.pdf
6.4 MB
گزارش مجله کسب‌وکار هاروارد

از روندهای فناوری
2024

◀️ دسترسی به تمامی گزارش‌ها

☯️ آقای صنایع - @Mr_IE 🌎