متخصصان علم داده ها data scientists
1.35K subscribers
1.22K photos
206 videos
190 files
419 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
Road accidents .zip
42.6 MB
📦 Datasets name: Road accidents in the Czech Republic


💬 Detailed dataset of road accidents in the Czech Republic (2016-2022) , The police of Czech Republic regularly gathers and releases detailed data on traffic incidents throughout the nation, typically on an monthly basis. This dataset covers various aspects such as geographic locations, weather conditions, vehicle types, casualty counts, and vehicle maneuvers. The wealth of information makes it a compelling and extensive dataset for analysis and research purposes.


⚙️ Format: CSV file

🔒 From: Kaggle

🗄یکی از روش های کار روی داده ها، استفاده از دیتا ست های استاندارد است.
دیتا ست تصادفات جاده ای در جمهوری چک شامل داده های مربوط به سوانح جاده ای طی،سال‌های ۲۰۱۶ تا ۲۰۲۲ است که توسط پلیس جمهوری چک جمع آوری شده است و شامل علل تصادفات، نوع خودروها، انواع مانورهای خودرو ها در جاده ها( لایی کشیدن، سبقت و سرعت غیر مجاز و...) که منجر به تصادفات شده، وضعیت آب و هوا و...در فرمت csv (,.) برگرفته از سایت کَگِل است.
🪩 https://t.me/toobabigdatascience
⬅️ اکثر مشاهیر فناوری در دو دهه‌ی اخیر بارها اعلام کردن که کدنویسی برای همه به‌خصوص کودکان ضروریه و آقای هوانگ، مدیرعامل انویدیا، در اجلاس اخیر دولت‌های جهان که در دبی برگزار شد، اظهاراتی خلاف دیدگاه آنها را مطرح کرد
👨‍🏫 مدیرعامل انویدیا می‌گوید: «وظیفه‌ی ما، ایجاد فناوری‌‌های محاسباتی است که نیاز به یادگیری برنامه‌نویسی را از بین ببرد و زبان کدنویسی باید مشابه زبان گفتار معیار انسان‌ها باشد. اکنون همه در جهان برنامه‌نویس هستند و این معجزه‌ی هوش مصنوعی است.»
👑 این نخستین بار نیست که هوانگ چنین اظهاراتی درمورد هوش مصنوعی و برنامه‌نویسی مطرح می‌کند؛ او یک‌ سال قبل هم در سخنرانی دانشگاه برکلی درمورد اینکه توانایی‌های کدنویسی ChatGPT چگونه می‌توانند چشم‌انداز حوزه‌ی برنامه‌نویسی را تغییر بدهند، صحبت کرد و در سخنرانی خود گفت: «با هوش مصنوعی همه می‌توانند به‌معنای واقعی کلمه برای کامپیوتر برنامه بنویسند.»
👀هوانگ معتقد است : «اینکه همه‌ی مردم را با هوش مصنوعی مولد آشنا کنیم بسیار حیاتی است و من باور دارم فرایند ارتقای مهارت، لذت‌بخش و شگفت‌انگیز خواهد بود.»

#AI
#generativeai

🪩https://t.me/toobabigdatascience
👽کاخ سفید خواستار دست‌کشیدن از زبان‌های آسیب‌پذیر مانند C و C++

اداره ملی رهبری سایبری دفتر کاخ سفید، در یک گزارش منتشر شده گغت:

دولت باید توسعه‌دهندگان را به کاهش خطر حملات سایبری تشویق کند و از زبان‌های برنامه‌نویسی استفاده کند که دارای آسیب‌پذیری‌های امنیتی حافظه نیستند.

🚫این گزارش به توسعه‌دهندگان پیشنهاد می‌دهد که از زبان‌های برنامه‌نویسی با حافظه امن استفاده کنند، مانند Rust که به عنوان یک مثال از زبان‌های امن ذکر شده است.

♨️همچنین، از طرفی اداره امنیت سایبری NSA، زبان‌های C#، Go، Java، Ruby و Swift را به عنوان زبان‌های برنامه‌نویسی امن معرفی کرده است.

🪩https://t.me/toobabigdatascience
🧬 شرکت مایکروسافت یک شبکه‌ی عصبی گرافی به نام ViSNet برای مدل‌سازی و بازنمایی ساختارهای هندسی سه‌بعدی مانند مولکول‌ها ارائه داده‌ست که قادر‌ست ارتباطات پیچیده بین ساختار مولکولی و فعالیت بیولوژیکی (structure-activity relationships) را درک کرده و رفتار و ویژگی‌های مولکول‌‌ها را پیش‌بینی کند.
🔅 کیفیت سنجی مقالات در هنگام جستجو در گوگل اسکالر با این افزونه در مرورگر کروم:
آدرس وبسایت افزونه:
🔗 https://www.excitation.tech/
#افزونه
#Extension #Research #Tools #ResearchTools #Research_Tools #Chrome #Tool #Search #Free #Rankings #Check #Results #Result #Cited #CitedBy #Paper

🪩https://t.me/toobabigdatascience
Pandas Data Cleaning.pdf
14.9 MB
🐼 In this guide you'll unlock :
1. Key data cleaning Techniques
2. Strategies for Correcting Erroneous Data 
3. Tips for adding New columns in Dataframes
4. Effective methods for hiding duplicates

⬅️انچه در این راهنما می خوانید :
۱. تکنیک‌های کلیدی پاک‌سازی داده
۲. استراتژی‌ها برای اصلاح داده‌های اشتباه
۳. نکات برای افزودن ستون‌های جدید در فریم داده‌ها
۴. روش‌های مؤثر برای مخفی کردن تکرارها
#python
#datacleaning
#pandas
🪩https://t.me/toobabigdatascience
👑 ارزشمند ترین برندهای جهان در ۲۰۲۴

در جدیدترین رتبه‌بندی برند فایننس، پانصد برند بزرگ دنیا رتبه‌بندی شده‌اند و اعلام شده که صد برند ارزشمند دنیا روی هم بیش از پنج تریلیون دلار ارزش دارند. در این میان اپل دوباره با اختلاف زیادی باارزش‌ترین برند جهان است

🐲حضور چین بعد از امریکا، در رده بندی دوم برترین برند های جهان، قابل توجه است.
در این میان سامسونگ کره جنوبی ، با کسب رتبه پنجم،بار دیگر ، جای پای خود را در این رده بندی تثبیت کرده است.
#brands
#Samsung
#🍏
🪩https://t.me/toobabigdatascience
چت.جی.پی.تی ۴، چه موجودیت هولناکی ست؟
تخمینی از توانایی های CHATGPT-4 در
Training Size
Compute Size
و....
Model Size
اما در واقعیت این فقط یک تخمین است
اصل ماجرا را در مدلهای آتی این مدل بزرگ زبانی خواهیم دید.
#CHATGPT4
#LLMs
#AI
🪩https://t.me/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
چگونه #NVIDIA, اینتل را مغبون کرد؟
این مصور سازی خلاصه ی مقالات بسیاری در مورد چگونگی تبدیل شرکت آمریکایی NVIDIA به یک یونیکورن بی رقیب در حوزه لرنینگ و هوش مصنوعی ست.
نقاط عطف جالبی در ویدئو وجود دارد که انویدیا، در آن نقاط بسرعت برق و باد، اینتل را پشت سر می گذارد...
ظهور و بروز بیت کوین و کریپتوکارنسی ها
آغاز عصر کرونا و....
در نهایت پیشرفت های عجیب اخیر هوش مصنوعی و ظهور CHATGPT و GENERATIVE AI
و پیش‌بینی های درست انویدیا از آینده بازار سخت افزار و انحصار در تولید GPU.
☢️رمز موقیت انویدیا چه بود؟
در عصر تب طلا در آمریکا، کاشفان معادن طلا به این منابع ثروت هجوم آوردند... ظاهرا یکنفر بجای رقابت با این تشنگان طلا ، به فکر افتاد که بیل و کلنگ!!! تولید کند (یعنی آنچه برای استخراج نیاز بود )و به آنها بفروشد!،
انویدیا، دقیقا همینکار را در بازاری به بزرگی بازار داده ها و کلان داده انجام داد
که امروزه به آن نفت دیجیتال، طلای دیجیتال، و ثروت دیجیتال می گویند
و ابزار استخراج آن، در اختیار و انحصار انویدیا ست!
#NVIDIA
#INTEL
#BIGDATA
#AI
#GPU
#CHATGPT
🌐https://t.me/toobabigdatascience
⬅️آنتراکت :" تابلوی اعلانات دانشگاه ِ آزاد _واحد علوم و تحقیقات...
🪩https://t.me/toobabigdatascience
بعنوان یک دانشمند علوم داده، به چه میزان دانش ریاضیات نیاز دارید؟ آیا به اندازه یک فارغ التحصیل دکتری؟ یا ارشد و یا حتی دانش آموخته دوره لیسانس؟ خیر...برای آنکه در علوم داده موفق باشید کافیست به اندازه ریاضیات ارائه شده در دو ترم نخست دوره کارشناسی رشته های فنّی_ مهندسی، و یا حتی ریاضیات ارائه شده در اواخر دوره دبیرستان رشته ریاضی مسلط باشید...
🪩https://t.me/toobabigdatascience
💸🪓ده میلیون دلار جایزه برای سر ِ یک هکر ایرانی
ظاهرا در عصر حکمرانی فضای سایبر، حکمرانان ایالات متحده، هنوز در عصر فیلم‌های وسترن، کابوی های جایزه بگیر ، اوباش، کلانترهای فاسد ،گاوچران ها و... سیر می کند!
امّا با تکیه بر چه نیرویی؟
آمریکا به چه کسانی امید دارد که در این لاتاری بزرگ شرکت کنند و اطلاعات هموطن شان را به سرویس های جاسوسی خارجی بفروشند ؟ جواب این سوال هر چه هست، یک فاجعه ی اجتماعی و ملّی ست...
🕸 البته عموما پاسخ حمله و نفوذ، باید دفاع و سپس حمله و نفوذ باشد
نه جایزه گذاشتن برای سر ِ یک انسان!


👁‍🗨بالاخص اینکه تمامیت زمین جنگ های سایبری در اختیار امریکاست، حتی ابزاری که دیگران برای حمله از آن به زیر ساخت های خود ِ امریکا سود می جویند( که اخیرا با پیشرفت‌های حیرت انگیزی که در مهندسی معکوس ِ بدافزارها رخ داده است ، ساخت و استفاده از آنها در انحصار هیچ کشوری نیست)...



https://www.dw.com/fa-ir/%D8%AF%D9%87-%D9%85%DB%8C%D9%84%DB%8C%D9%88%D9%86-%D8%AF%D9%84%D8%A7%D8%B1-%D8%AC%D8%A7%DB%8C%D8%B2%D9%87-%D8%A2%D9%85%D8%B1%DB%8C%DA%A9%D8%A7-%D8%A8%D8%B1%D8%A7%DB%8C-%D8%A7%D8%B1%D8%A7%D8%A6%D9%87-%D8%A7%D8%B7%D9%84%D8%A7%D8%B9%D8%A7%D8%AA-%DB%8C%DA%A9-%D9%87%DA%A9%D8%B1-%D8%A7%DB%8C%D8%B1%D8%A7%D9%86%DB%8C/a-68473972
علم داده (Data Science) و حاکمیت داده (Data Governance) دو موضوع بسیار مهم در سازمان‌های داده‌محور (data-driven Organization) هستند.

با این حال، افرادی یا تیم‌هایی که در سازمان‌ها این موضوعات را پیاده‌سازی می‌کنند، تیم‌های متفاوتی هستند و خیلی وقت‌ها تعاملات خوبی هم با یکدیگر ندارند! این موضوع می‌تواند یک مشکل اساسی باشد، چراکه تیم‌های علم داده اگر میخواهند تحلیل‌های موثر و کارایی را ارائه دهند، نیاز به داده‌های پاکسازی شده و با کیفیتی دارند که توسط تیم‌های حاکمیت داده مدیریت و کنترل می‌شوند.

بنابراین اگر می‌خواهیم سازمانی پیشرو و داه‌محوری داشته باشیم باید تعاملات خوبی بین ساختار ایجاد شده توسط حاکمیت داده و تحلیل‌های ارائه شده توسط علم داده داشته باشیم.

ما در اینجا قصد داریم به معرفی ابعاد و قسمت‌های مختلف حاکمیت داده بپردازیم و در 10 ویدیو که زمانبندی آن در ویدیو اول مشخص شده است را خدمتتان ارائه نمائیم.

لطفا با ما همراه باشید و با نظرات و انتقادات و پیشنهادات خودتون به بهبود این مسیر که هدف آن افزایش فرهنگ سواد داده‌ای جامعه است، کمک کنید.
👍2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
با ما هر روز با یک موضوع در جهان داده قدم بردارید:

1) Data Management
2) Data Management Frameworks
3) Data Governance
4) Data Strategy
5) Meta Data Management
6) Data Quality
7) Develop a Business Glossary
8) Data Dictionary and Data Catalog
9) Data Lineage
10) Master Data and Reference Data
👍3👌1
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت :
Data Management

- تعاریف مدیریت داده
- معرفی فریم ورک های مدیریت داده
- تفاوت مدیریت داده و حاکمیت داده
- چارچوب های مدیریت داده (مدیریت افراد، فرآیندها و سیاست ها)
- معرفی منابع جهت آشنایی بیشتر با مدیریت داده
👍3
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت :
Data Management Frameworks

چارچوب مدیریت داده:
- چیستی و چرایی؟
- چگونگی اجرای چارچوب مدیریت داده
- بررسی چارچوب های مطرح دنیا
- نکات با اهمیت در استفاده از این چارچوب
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت :
Data Governance

حاکمیت داده:
(حاکمیت داده به عنوان یک چتر برروی سازمان)
- تعریف حاکمیت داده
- ضرورت استقرار نظام حاکمیت داده
- مزایای استقرار نظام حاکمیت داده
- افراد موثر در اجرای حاکمیت داده
- اجزای چارچوب حاکمیت داده
- مراحل اجرای حاکمیت داده
- چارچوب حاکمیت داده (افراد - فرآیند - فناوری)
- ایجاد یک برنامه حاکمیت داده در سازمان
- بررسی یک نمونه فریمورک حاکمیت داده
- معرفی منابع در خصوص حاکمیت داده
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت :
Data Strategy

استراتژی داده:
- تعریف استراتژی داده
- اهمیت استراتژی داده
- استراتژی داده به عنوان راه‌حلی برای چالش‌های مدیریت داده
- اجزاء اصلی استراتژی داده
- کاربران اجرا کننده استراتژی داده
- معرفی دو رویکرد تدافعی و تهاجمی
- مقایسه دو رویکرد تدافعی و تهاجمی
- راه حلی برای انتخاب بهترین رویکرد
- معرفی منابع در خصوص استراتژی داده