متخصصان علم داده ها data scientists
1.35K subscribers
1.22K photos
206 videos
190 files
419 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
Oracle Database is bringing the future of data and #AI to developers and enterprises today.
اصول ِ طراحی پایگاه‌های داده_۳واحد_
یک پایگاه داده ای متعلق به یک سازمان در سایز بزرگ با هزاران کارمند و کارگر، می پذیرد که ساعت ِ خروج یک کارمند قبل از ساعت ورود او ( در یک تاریخ و روز یونیک) ثبت شود.
این دقیقا مشکل دهه ۹۰ سایت گلستان یکی از دانشگاه‌های مطرح کشور بود که در آن، می شُد تاریخ فارغ التحصیلی یک دانشجو را قبل از تاریخ ورود اش به دانشگاه ثبت کرد!!!
طراحان ما، دیتا بیس های را می آفرینند که تمام اصول اساسی اولیه ی طراحی ِ دیتا بیسِ بنده خدا را کلا انکار می کند...
آنها دانای کل اند.
چه ایرادی در طراحی این دیتا بیس وجود دارد؟
فرض کنید دیتا بیس تاخیرات و ورود/خروج قطارها دچار این مشکل است( فرض نیست!، واقعا دچار است)
مثلا قطار شماره ۱۴۶۷۸، می تواند ساعت ۱۱ ظهر به ایستگاه آپرین وارد شود
در حالیکه ۸ صبح همانروز! از آن خارج شده بوده است!.
آیا ما توانایی سفر در زمان را توسط این دیتابیس ها پیدا کرده ایم؟
آیا خطا در data entry, را هیچ dbms ایی می تواند تشخیص دهد؟
و اینکه اینگونه دیتابیس ها چه سودی برای برخی مدیران دارند؟
در پست بعدی، معجزه ای از #اوراکل را می بینیم.
Oracle Database 11g - The Complete Reference - DevTwitter.pdf
9.2 MB
یک راهنما از دانای کلّ ِ جهان ِ دیتابیس، #اوراکل:
چرا در اصول مشکل داریم؟
روند ِ بخوان، حفظ کن، پاس کن...
هنوز و کماکان در دانشگاه‌های ما برقرار است.
و روند اصولی ِ "بخوان، بیآموز، به کارببر
غریب و محجور.

در این راهنمای ِ ساده، اوراکل به اصول می پردازد.
همان اصولی که دانشجویان ما معتقدند:" یک ریال در دنیای به کار بردن، نمی ارزد"
آنها وقتی از دانشگاه به سازمانی پناه می برند، (با هزار نذر و نیاز و سفره پهن کردن و سپس با کمک تلفن و سفارش و...) در اولین برخورد با اولین مسائل عملیاتی، شگفت زده و حیران می شوند که :" هر چه در دانشگاه خواندیم بی خودی بود!"
خیر...چنین نیست.
آنها در دانشگاه همه را دیده اند! ولی مشغول روند حفظ کردن و پاس کردن شان بوده اند!
و خوشه ی انگور، فقط یک سَر دارد
یا یادگیری و بکاربردن
یا روند منحط حفظ/پاس کردن
آنها نمی توانند در برابر یک مهندس کشاورزی که رئیس دپارتمان آی.تی شده
تکان از تکان بخورند در حالیکه مهندسِ کامپیوتر اند!
اصول...
مشکل اصول است
اصول را نیاموخته ایم.
که کارمان به اینجا رسیده است.
اوراکل به GDPR
می پردازد
به چالش کانسیستنسی
در ddb ها
اما اصول را سرلوحه قرار می دهد.
لایحه حفاظت از داده های شخصی، سرانجام به تصویب رسید...
به دلایل متقن، به روش های مختلف می توان اثبات کرد که داده ها، امروز تنها سکه ی رایج ِ ارزشمند در سازمانهای مترقی جهان هستند! تنها سکه و ارز ارزشمند برای ایجاد ارزش و مبادله( مبادله مهم است ،به 💱 فکر کنید و نه فقط به اکسچنج کردن و معنای رایج مبادله)!!!. فرقی هم نمی کند سازمان شما یک ابر شرکت بزرگ بین المللی باشد یا از جرگه کوچک_متوسط ها، دولتی باشد یا خصوصی، در واقع هیچ فرقی نمی کند!
🦚خبر خوش اینکه، کف ِ سازمانها ازین سکه ها ریخته است، اما اکثریت مدیران آنها را در حد پول خرد ته جیب شان هم نمی بینند
💸خبر بد اینکه، این سکه های طلای دیجیتال حفاظت می خواهند تا امنیت و جامعیت و درستی و صحت شان حفظ شود.
در ذیل خبر خوش باید اذعان کرد دیدن این ثروت های عظیم دیجیتال( به مبادله فکر کنید)، چشم می خواهد👁‍🗨
و ذیل خبر بد باید عرض کنم ، حفظ آنها و تجمیع شان و تحلیل شان و استخراج و صیقل دادنشان، نیاز به سواد، تجربه و دانشی عمیق دارد. این مهم در استعداد بسیاری از بخش ها نیست و باید قطعا برون‌سپاری شود، به کجا؟ عمدتا دانشگاه های مطرح کشور به اساتیدی که ۲۰ سال پیش اینها را سر کلاس ها به امثال بنده، فقط نگفتند، که هشدار دادند... حرص و جوش آنرا خوردند، تحقیق و پژوهش کردند، آنها به شایستگی و به درستی، امروز را می دیدند، با همان داده ها پیشگویی کرده بودند و درست هم پیش‌بینی کرده بودند.
🪩Active ChatGPT Users in Top Countries
لیست کشورهایی که کاربران فعال ChatGPT در آنها ساکن هستند
متخصصان علم داده ها data scientists
اصول ِ طراحی پایگاه‌های داده_۳واحد_ یک پایگاه داده ای متعلق به یک سازمان در سایز بزرگ با هزاران کارمند و کارگر، می پذیرد که ساعت ِ خروج یک کارمند قبل از ساعت ورود او ( در یک تاریخ و روز یونیک) ثبت شود. این دقیقا مشکل دهه ۹۰ سایت گلستان یکی از دانشگاه‌های…
توضیح و تصحیح :
4خاصیتی که علل وجودی پایگاه های داده هستند عبارتند از
۱ ) Reduce Redundancy
۲ ) Apply Security
۳) Maintain Integrity
۴ ) Avoid Inconsistency
مورد سوم حفظ جامعیّت داده ها در مطلبی با عنوان ( طراحی پایگاه داده_۳ واحد) عرض شد
مشکل اساسی دیگر عدم حفظ،جامعیت دیتا ست
هفته گذشته در یکی از سایت های ارسال مقالات کنفرانسی دقیقا این مورد دیده می شد:
تاریخ شروع کنفرانس ۱۰_۴_۱۴۰۳
تاریخ پایان کنفرانس ۱۰_۳_۱۴۰۳
و این سیستم قبول کرده بود که کنفرانسی دهم تیرماه آغاز و ده خرداد پایان یافته باشد!
پایگاه داده ای می پذیرد که در سال ۱۴۰۰، تاریخ تولد دانشجویی ۱۴۰۱ باشد!!!!!
این نشان می دهد طراحان پایگاه داده اصلا و اساسا مساله ی Maintain Integrity را بلد نبوده اند.
وقتی محدودیت ِ جامعیت دیتا رعایت نشود، یعنی در طراحی پایگاه مشکل وجود دارد.
ظاهرا طراحان ما، قابلیت های DBMS را اصلا نمی شناسند و قرار دارند همه چیز را برنامه نویسی کنند!!!.
یعنی می خواهند در لایه APP. PROGRAMMING
حل اش کنند این باعث همین شبهه می شود
این باعث می شود تا محدودیت های جامعیت در سطح DBMS
به مشکل بر بخورد!
ابتدا باید محدودیت های جامعیتی را بشناسیم که عموما بدلیل فقدان آموزش یا آموزش ناقص، نمی شناسیم
مثلا اینکه DBMS ضمانت می کند تا:
جلوی ناسازگاری را بگیرد
تا اگر طراح!!! قواعد جامعیتی را تعریف کرد ، حتما اعمالش کند
همچنین گارانتی می کند کنترل همروندی را
و...
قابلیت های بی نظیر آن هستند.
با تشکر
تغییر یا با بحران ایجاد می شود یا با استدلال

تجارب ارزشمند یک مدیرعامل!!
بنام ِسم آلتمن، مدیرعامل OpenAI

https://blog.samaltman.com/what-i-wish-someone-had-told-me
🐚...Bayesian methods are used as solutions for a wide variety of" clinical trial challenges".
The adoption of historical and external data into a clinical trial to supplement regulatory submissions is a growing use of Bayesian methods. Similarly, in therapeutic areas like oncology, where standard of care might evolve during the course of a clinical trial, statisticians trained in Bayesian methods can help salvage data collected during a clinical trial.

The nature of statistics is such that many common problems can be solved using both Frequentist or Bayesian methods, but with different investment of time and resources depending on the situation.

I believe that statisticians ought to be well-versed in both Bayesian and Frequentist statistical paradigms(hybrid approach), so that they can apply the best solutions for customers’ specific needs...
📚Bayesian Data Analysis :
By Andrew Gelman
Professor, Department of Statistics
Professor, Department of Political Science
1016 Social Work Bldg (Amsterdam Ave. at 122 St.), 212-851-2142, dept. fax 851-2164
Columbia University, New York, NY 10027
gelman@stat.columbia.edu
📈Important Pandas & Spark Commands for Data Science
کلُّ مَنْ عَلیها فَان وَ یبقَی وَجْهُ رَبِّک ذوالجلالِ والاکرامِ...
السلام علیک یا اباعبدالله و علی الارواح التی حلت بفنائک....
از دست ِ پرسش های مردم رو گرفتم!
من سالها، با خاطراتت، خو گرفتم
همسایه مان می گفت:"برگشتت، خیال است!!"
می گفت :" دست از ت. بردارم...."
محال است.
ایران_____تسلیت