متخصصان علم داده ها data scientists
1.35K subscribers
1.22K photos
206 videos
190 files
419 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و استفاده از ۱۵ تریلیون توکن داده (۷ برابر بزرگ‌تر از داده‌ی استفاده‌شده در Llama 2) آموزش دیده‌ و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).

ارزیابی‌های انجام‌شده روی مجموعه‌داده‌های مختلف حاکی از عمل‌کرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است.
جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و ۷۰ میلیاردی منتشر شد!

❗️این مدل با استفاده از ۱۵ تریلیون توکن دیتا (۷ برابر بزرگ‌تر از داده‌ی استفاده‌شده در Llama 2) آموزش دیده‌ و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).

ارزیابی‌های انجام‌شده روی مجموعه‌داده‌های مختلف حاکی از عمل‌کرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است :
https://ai.meta.com/blog/meta-llama-3

🔆برای آزمون عمل‌کرد این مدل می‌توانید از دستیار هوشمند (چت‌بات) شرکت متا به آدرس زیر استفاده کنید:
https://www.meta.ai

#LLMs
#AI
💸 Data scientist Vs. Data engineer
مقایسه شرح وظایف , پیش نیازها، توانمندی‌ها، ابزارها و حقوق سالانه دانشمند داده و مهندس داده

https://t.me/toobabigdatascience
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت:
Business Glossary

واژه‌نامه کسب‌وکار:
- تعریف واژه‌نامه کسب‌وکار
- اجزاء مهم واژه‌نامه کسب‌وکار
- دلایل نیاز به واژه‌نامه کسب‌وکار
- مراحل ایجاد یک واژه‌نامه کسب‌وکار
- ابزارهای مدیریت واژه‌نامه کسب‌وکار
- انتخاب ابزار مناسب برای سازمان
- کاربردهای واژه‌نامه کسب‌وکار
- بهترین تجربه‌های تعریف واژه‌نامه کسب‌وکار
- منابع مرتبط با واژه‌نامه کسب‌وکار

#datagovernance
#datamanagement
#businessglossary
#metadata
#masterdata
#کارتون :
عواقب و مسئولیت بکارگیری الگوریتمهای هوش مصنوعی را در برخی از موارد مثل حل مسائل و معضلات اجتماعی، سلامت و بهداشت، سیاست، دیپلماسی و...نمی توان براحتی پذیرفت یا به عهده گرفت!
جایی که پای جان و سلامت انسان بمیان بیآید، قوانین حقوقی_اخلاقی هوش مصنوعی باید صریح، بدون بایاس و سوگیری، و...لازم‌الاجرا باشند.
#AI
#ethical
#algorithms
نسخه‌ی سوم مدل زبانی کوچک مایکروسافت (Microsoft Phi-3) با ۳/۸ میلیارد پارامتر و عملکردی بی‌ نظیر، منتشر شد.

👌معرفی:
https://news.microsoft.com/source/features/ai/the-phi-3-small-language-models-with-big-potential/

♨️دموی مدل روی هاگینگ‌فیس:
https://huggingface.co/chat/models/microsoft/Phi-3-mini-4k-instruct
Media is too big
VIEW IN TELEGRAM
ورود به جهان داده این قسمت:
Data Dictionary & Data Catalog

دیکشنری داده و کاتالوگ داده:
- تعریف کاتالوگ داده
- ارتباط کاتالوگ داده و متادیتا
- مزایای کاتالوگ داده
- بررسی کاتالوگ داده بعنوان نوعی متادیتا
- ابزارهای کاتالوگ داده
- نحوه پیاده‌سازی کاتالوگ داده
- دیکشنری داده
- مشخصه‌های یک کاتالوگ داده خوب
- منابع مرتبط با دیکشنری داده و کاتالوگ داده

#datadictionary
#datacatalog
#datagovernance
#datamanagement
#دیکشنری_داده #کاتالوگ_داده
Media is too big
VIEW IN TELEGRAM
ورود به جهانِ داده، این قسمت:
Data Lineage

اصل و نسب داده:

- معرفی Data Lineage
- اهداف اصلی Data Lineage
- تعریف Data Lineage
- مشکلات نبودن Data Lineage
- پیاده سازی Data Lineage
- مزایای اصلی Data Lineage
- ایجاد ارزش بیشتر از Data Lineage
- بهره برداران Data Lineage
- روش های رایج برای ترسیم Data Lineage
- معرفی ابزارهای Data Lineage
- منابع Data Lineage

#datalineage #data #lineage
#datagovernance #datamanagement
#businessintelligence #datascience
This media is not supported in your browser
VIEW IN TELEGRAM
🦚روز معلم مبارک...🌼
قصه های مجید، قصه های مدرسه است و مدرسه پر از زندگی و پر از قصه های تلخ و شیرین
بچه هایی که با رویای دکتر-مهندس-خلبان-دانشمند! شدن می آیند و گاها بدون هیچکدام ازین شدن ها، می روند... از نگاه آنها، معلم شان قهرمانی همه_چیز_دان است که هر چه را آنها نمی دانند او بلد است ، امکان اشتباه در مورد او منتفی ست، او هیچ دغدغه ای بجز آموزش در زندگی ندارد، آرزوی بچه ها دیدن خانه معلم شان بود فکر می کردند خیلی فرق دارد با خانه خودشان، افتخارشان کمک به او در تصحیح اوراق کلاس های دیگر، اگر معلم آنها را در کلاس تشویق می کرد، احساس می کردند پادشاه عالم اند، و اگر روزی معلم بیمار بود، مشکل داشت، و اتفاقی حواسش به آنها نبود، دل کوچک شان پر از غم می شد...برای بچه های دبستانی درک این موضوع سخت بود که معلم آنها هم، مثل خود ِ آنها، هزار و یک مشکل ریز و درشت دارد، مثل والدین آنها، گرفتاری مالی و معیشتی دارد، گاهی هم حوصله ندارد، مثل همه آدمهاست معلم، با این تفاوت که در باره مشکلات ش گله و شکایت نمی کند و مشکلات همه را هم می شنود و در دل نگه می دارد...
او عهد کرده است تا ما را از دنیای تاریکی، به روشنایی ببرد
🤓5 megabytes of data - 62500 punch cards, 1955
https://t.me/toobabigdatascience
چگونه یک سیستم عامل مناسب حالمان! را انتخاب کنیم؟
😳🤓
#os
#windows
#linuxsecurity
https://t.me/toobabigdatascience
Oracle Database is bringing the future of data and #AI to developers and enterprises today.
اصول ِ طراحی پایگاه‌های داده_۳واحد_
یک پایگاه داده ای متعلق به یک سازمان در سایز بزرگ با هزاران کارمند و کارگر، می پذیرد که ساعت ِ خروج یک کارمند قبل از ساعت ورود او ( در یک تاریخ و روز یونیک) ثبت شود.
این دقیقا مشکل دهه ۹۰ سایت گلستان یکی از دانشگاه‌های مطرح کشور بود که در آن، می شُد تاریخ فارغ التحصیلی یک دانشجو را قبل از تاریخ ورود اش به دانشگاه ثبت کرد!!!
طراحان ما، دیتا بیس های را می آفرینند که تمام اصول اساسی اولیه ی طراحی ِ دیتا بیسِ بنده خدا را کلا انکار می کند...
آنها دانای کل اند.
چه ایرادی در طراحی این دیتا بیس وجود دارد؟
فرض کنید دیتا بیس تاخیرات و ورود/خروج قطارها دچار این مشکل است( فرض نیست!، واقعا دچار است)
مثلا قطار شماره ۱۴۶۷۸، می تواند ساعت ۱۱ ظهر به ایستگاه آپرین وارد شود
در حالیکه ۸ صبح همانروز! از آن خارج شده بوده است!.
آیا ما توانایی سفر در زمان را توسط این دیتابیس ها پیدا کرده ایم؟
آیا خطا در data entry, را هیچ dbms ایی می تواند تشخیص دهد؟
و اینکه اینگونه دیتابیس ها چه سودی برای برخی مدیران دارند؟
در پست بعدی، معجزه ای از #اوراکل را می بینیم.
Oracle Database 11g - The Complete Reference - DevTwitter.pdf
9.2 MB
یک راهنما از دانای کلّ ِ جهان ِ دیتابیس، #اوراکل:
چرا در اصول مشکل داریم؟
روند ِ بخوان، حفظ کن، پاس کن...
هنوز و کماکان در دانشگاه‌های ما برقرار است.
و روند اصولی ِ "بخوان، بیآموز، به کارببر
غریب و محجور.

در این راهنمای ِ ساده، اوراکل به اصول می پردازد.
همان اصولی که دانشجویان ما معتقدند:" یک ریال در دنیای به کار بردن، نمی ارزد"
آنها وقتی از دانشگاه به سازمانی پناه می برند، (با هزار نذر و نیاز و سفره پهن کردن و سپس با کمک تلفن و سفارش و...) در اولین برخورد با اولین مسائل عملیاتی، شگفت زده و حیران می شوند که :" هر چه در دانشگاه خواندیم بی خودی بود!"
خیر...چنین نیست.
آنها در دانشگاه همه را دیده اند! ولی مشغول روند حفظ کردن و پاس کردن شان بوده اند!
و خوشه ی انگور، فقط یک سَر دارد
یا یادگیری و بکاربردن
یا روند منحط حفظ/پاس کردن
آنها نمی توانند در برابر یک مهندس کشاورزی که رئیس دپارتمان آی.تی شده
تکان از تکان بخورند در حالیکه مهندسِ کامپیوتر اند!
اصول...
مشکل اصول است
اصول را نیاموخته ایم.
که کارمان به اینجا رسیده است.
اوراکل به GDPR
می پردازد
به چالش کانسیستنسی
در ddb ها
اما اصول را سرلوحه قرار می دهد.
لایحه حفاظت از داده های شخصی، سرانجام به تصویب رسید...