متخصصان علم داده ها data scientists
1.35K subscribers
1.22K photos
206 videos
190 files
419 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
🕸چرا سامانه دفاع موشکی اسرائیل، به درستی عمل نکرد؟
⬅️واکنش آمریکا و وزارت خزانه داری به هک سیستم‌های دفاع موشکی اسرائیل...

BREAKING: IRANIAN CYBER ATTACK SHUTS DOWN ISRAEL'S ELECTRIC GRID.

Iranian-linked "Cyber Avengers" hacker group has claimed they orchestrated widespread blackouts in Israel, impacting cities like Tel Aviv, Netanya, and more.

The group accused Israeli authorities of dismissing these incidents as mere technical glitches while secretly losing control over their electrical systems.

Asserting dominance, the group warned of additional, potent cyber-attacks on vital Israeli infrastructure.

https://home.treasury.gov/news/press-releases/jy2072
📽یک فیلم سینمایی کاملا ساخته شده توسط Midjourney و Runway ML تابستان امسال اکران خواهد شد.

این فیلم یک کمدی رمانتیک در مورد دو آمریکایی خواهد بود که در قطاری به پاریس با هم آشنا می شوند...

مراحل تولید فیلم توسط استودیوی فیلمسازی TCL انجام شد و استفاده از هوش مصنوعی را به عنوان یک ویژگی متمایز تبلیغ کردند.

موسیقی پس زمینه توسط یک گروه موسیقی واقعی اجرا شد، فیلمنامه توسط یک انسان نوشته شد و صداها توسط صداپیشه های واقعی ضبط شد.

با این حال، تمام فریم ها در Midjourney ساخته شده و در Runway ML متحرک شده اند...
deep learning python computer vision.pdf
9.7 MB
کتاب یادگیری عمیق با پایتون در حوزه بینایی ماشین

https://t.me/toobabigdatascience
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و استفاده از ۱۵ تریلیون توکن داده (۷ برابر بزرگ‌تر از داده‌ی استفاده‌شده در Llama 2) آموزش دیده‌ و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).

ارزیابی‌های انجام‌شده روی مجموعه‌داده‌های مختلف حاکی از عمل‌کرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است.
جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و ۷۰ میلیاردی منتشر شد!

❗️این مدل با استفاده از ۱۵ تریلیون توکن دیتا (۷ برابر بزرگ‌تر از داده‌ی استفاده‌شده در Llama 2) آموزش دیده‌ و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).

ارزیابی‌های انجام‌شده روی مجموعه‌داده‌های مختلف حاکی از عمل‌کرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است :
https://ai.meta.com/blog/meta-llama-3

🔆برای آزمون عمل‌کرد این مدل می‌توانید از دستیار هوشمند (چت‌بات) شرکت متا به آدرس زیر استفاده کنید:
https://www.meta.ai

#LLMs
#AI
💸 Data scientist Vs. Data engineer
مقایسه شرح وظایف , پیش نیازها، توانمندی‌ها، ابزارها و حقوق سالانه دانشمند داده و مهندس داده

https://t.me/toobabigdatascience
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت:
Business Glossary

واژه‌نامه کسب‌وکار:
- تعریف واژه‌نامه کسب‌وکار
- اجزاء مهم واژه‌نامه کسب‌وکار
- دلایل نیاز به واژه‌نامه کسب‌وکار
- مراحل ایجاد یک واژه‌نامه کسب‌وکار
- ابزارهای مدیریت واژه‌نامه کسب‌وکار
- انتخاب ابزار مناسب برای سازمان
- کاربردهای واژه‌نامه کسب‌وکار
- بهترین تجربه‌های تعریف واژه‌نامه کسب‌وکار
- منابع مرتبط با واژه‌نامه کسب‌وکار

#datagovernance
#datamanagement
#businessglossary
#metadata
#masterdata
#کارتون :
عواقب و مسئولیت بکارگیری الگوریتمهای هوش مصنوعی را در برخی از موارد مثل حل مسائل و معضلات اجتماعی، سلامت و بهداشت، سیاست، دیپلماسی و...نمی توان براحتی پذیرفت یا به عهده گرفت!
جایی که پای جان و سلامت انسان بمیان بیآید، قوانین حقوقی_اخلاقی هوش مصنوعی باید صریح، بدون بایاس و سوگیری، و...لازم‌الاجرا باشند.
#AI
#ethical
#algorithms
نسخه‌ی سوم مدل زبانی کوچک مایکروسافت (Microsoft Phi-3) با ۳/۸ میلیارد پارامتر و عملکردی بی‌ نظیر، منتشر شد.

👌معرفی:
https://news.microsoft.com/source/features/ai/the-phi-3-small-language-models-with-big-potential/

♨️دموی مدل روی هاگینگ‌فیس:
https://huggingface.co/chat/models/microsoft/Phi-3-mini-4k-instruct
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت:
Data Dictionary & Data Catalog

دیکشنری داده و کاتالوگ داده:
- تعریف کاتالوگ داده
- ارتباط کاتالوگ داده و متادیتا
- مزایای کاتالوگ داده
- بررسی کاتالوگ داده بعنوان نوعی متادیتا
- ابزارهای کاتالوگ داده
- نحوه پیاده‌سازی کاتالوگ داده
- دیکشنری داده
- مشخصه‌های یک کاتالوگ داده خوب
- منابع مرتبط با دیکشنری داده و کاتالوگ داده

#datadictionary
#datacatalog
#datagovernance
#datamanagement
#دیکشنری_داده #کاتالوگ_داده
Media is too big
VIEW IN TELEGRAM
ورود به جهانِ داده، این قسمت:
Data Lineage

اصل و نسب داده:

- معرفی Data Lineage
- اهداف اصلی Data Lineage
- تعریف Data Lineage
- مشکلات نبودن Data Lineage
- پیاده سازی Data Lineage
- مزایای اصلی Data Lineage
- ایجاد ارزش بیشتر از Data Lineage
- بهره برداران Data Lineage
- روش های رایج برای ترسیم Data Lineage
- معرفی ابزارهای Data Lineage
- منابع Data Lineage

#datalineage #data #lineage
#datagovernance #datamanagement
#businessintelligence #datascience
This media is not supported in your browser
VIEW IN TELEGRAM
🦚روز معلم مبارک...🌼
قصه های مجید، قصه های مدرسه است و مدرسه پر از زندگی و پر از قصه های تلخ و شیرین
بچه هایی که با رویای دکتر-مهندس-خلبان-دانشمند! شدن می آیند و گاها بدون هیچکدام ازین شدن ها، می روند... از نگاه آنها، معلم شان قهرمانی همه_چیز_دان است که هر چه را آنها نمی دانند او بلد است ، امکان اشتباه در مورد او منتفی ست، او هیچ دغدغه ای بجز آموزش در زندگی ندارد، آرزوی بچه ها دیدن خانه معلم شان بود فکر می کردند خیلی فرق دارد با خانه خودشان، افتخارشان کمک به او در تصحیح اوراق کلاس های دیگر، اگر معلم آنها را در کلاس تشویق می کرد، احساس می کردند پادشاه عالم اند، و اگر روزی معلم بیمار بود، مشکل داشت، و اتفاقی حواسش به آنها نبود، دل کوچک شان پر از غم می شد...برای بچه های دبستانی درک این موضوع سخت بود که معلم آنها هم، مثل خود ِ آنها، هزار و یک مشکل ریز و درشت دارد، مثل والدین آنها، گرفتاری مالی و معیشتی دارد، گاهی هم حوصله ندارد، مثل همه آدمهاست معلم، با این تفاوت که در باره مشکلات ش گله و شکایت نمی کند و مشکلات همه را هم می شنود و در دل نگه می دارد...
او عهد کرده است تا ما را از دنیای تاریکی، به روشنایی ببرد
🤓5 megabytes of data - 62500 punch cards, 1955
https://t.me/toobabigdatascience
چگونه یک سیستم عامل مناسب حالمان! را انتخاب کنیم؟
😳🤓
#os
#windows
#linuxsecurity
https://t.me/toobabigdatascience
Oracle Database is bringing the future of data and #AI to developers and enterprises today.
اصول ِ طراحی پایگاه‌های داده_۳واحد_
یک پایگاه داده ای متعلق به یک سازمان در سایز بزرگ با هزاران کارمند و کارگر، می پذیرد که ساعت ِ خروج یک کارمند قبل از ساعت ورود او ( در یک تاریخ و روز یونیک) ثبت شود.
این دقیقا مشکل دهه ۹۰ سایت گلستان یکی از دانشگاه‌های مطرح کشور بود که در آن، می شُد تاریخ فارغ التحصیلی یک دانشجو را قبل از تاریخ ورود اش به دانشگاه ثبت کرد!!!
طراحان ما، دیتا بیس های را می آفرینند که تمام اصول اساسی اولیه ی طراحی ِ دیتا بیسِ بنده خدا را کلا انکار می کند...
آنها دانای کل اند.
چه ایرادی در طراحی این دیتا بیس وجود دارد؟
فرض کنید دیتا بیس تاخیرات و ورود/خروج قطارها دچار این مشکل است( فرض نیست!، واقعا دچار است)
مثلا قطار شماره ۱۴۶۷۸، می تواند ساعت ۱۱ ظهر به ایستگاه آپرین وارد شود
در حالیکه ۸ صبح همانروز! از آن خارج شده بوده است!.
آیا ما توانایی سفر در زمان را توسط این دیتابیس ها پیدا کرده ایم؟
آیا خطا در data entry, را هیچ dbms ایی می تواند تشخیص دهد؟
و اینکه اینگونه دیتابیس ها چه سودی برای برخی مدیران دارند؟
در پست بعدی، معجزه ای از #اوراکل را می بینیم.