مهندسی و علم داده
4K subscribers
387 photos
174 videos
169 files
112 links
در مورد ادمین کانال :
- محمد عالیشاهی
- دکترای هوش مصنوعی دانشگاه تهران
-نائب رئیس هیات مدیره شرکت فناوران هوش مصنوعی
- مدیر ارشد پروژه های هوش مصنوعی و علم داده
-دبیر شورای حکمرانی داده انجمن هوش مصنوعی ایران
Download Telegram
Forwarded from Deleted Account
کلید های طبیعی مورد استفاده در سیستم های عملیاتی معمولا از قوانین کسب و کار خارج از فضای سیستم DW/BI تبعیت و پیروی میکنند . برای مثال کد پرسنلی برای یک فرد خاص ممکن است تغییر کند . چطور ؟ اگر کارمندی استعفا داده و بعد از مدتی مجددا استخدام گردد در اکثر سیستم های عملیاتی کد پرسنلی جدیدی به او اختصاص میابد .
Forwarded from Deleted Account
در Data Warehouse هنگامیکه بخواهیم برای جداول مثلا DimEmployee یک کلید منحصر بفرد (primary key ) ایجاد کنیم بایستی این کلید پایدار (durable) بوده و مثلا در موقعیت هایی نظیر مثال فوق تغییر نکند .
Forwarded from Deleted Account
نتیجه
بهترین کلید جهت primary key کلیدی خواهد بود که فرمت آن مستقل از فرآیند های کسب و کار سیستم های عملیاتی بوده و در ضمن پیجیده نباشند .
Forwarded from Deleted Account
خلاصش اینکه نیاییم مثلا natural key رو با مقدار DateTime ترکیب کنیم و یک کلید جدید بسازبم . !
Forwarded from Deleted Account
Dimension Surrogate Key کلید جانشین
در جداول Dimension یک فیلد بایستی بعنوان کلید اصلی primary key معرفی گردد تا بعنوان Foreign Key در جداول Fact مرتبط با آن استفاده گردد .
Forwarded from Deleted Account
کلید طبیعی( natural key) نمی تواند بعنوان primary key انتخاب گردد . به چند دلیل :

- عدم وابستگی کلید اصلی به قوانین کسب و کار سیستم های عملیاتی که در بالا به تفضیل توضیح داده شد .
- اگر بخواهیم تغییرات یک ویژگی موجود در یک جدول Dimension را در طول زمان ردیابی کنیم
( مثلا محل خدمت پرسنل در جدول DimEmployee ) ممکن هست چند رکورد ( اصطلاحا میگیم ورژن ) با مقدار natural key یکسان ایجاد شود ( SCD Type 2 ) .
Forwarded from Deleted Account
- ممکن هست جدول Dimension مقادیر خود را از چند سیستم عملیاتی مختلف بگیرد که ابن امر ممکن موجب شود کلیدهای طبیعی ناسازگار گردیده ( مثلا data type های مختلف داشته باشند ) و یا تکراری باشند .
Forwarded from Deleted Account
راه حل
برای اینکه در طول حیات DW کلید های اصلی جداول Dimension تحت کنترل سیستم DW باشند میتوان از همان روش ساده مرسوم استفاده کرد و از روش های پیچیده اجتناب کرد . یک فیلد جدید با Data Type از نوع integer ایجاد میکنیم که با مقدار یک شروع شده و بصورت متوالی افزایش یابد و پیچیدگی ها را به سیستم ETL انتقال میدهیم . البته در جداول کلید های طبیعی رو هم بعنوان یک ویژگی در جداول Dimension میاوریم
Forwarded from Deleted Account
این کلید اصلی جدید ( و مستقل ) کلید جانشن Surrogate Key نامیده میشود .
در سیستم های ETL و در فاز Load میتوان بااستفاده از کلید طبیعی جدوال Fact را با مقادیر کلید های جانشین load کرد .
Forwarded from Deleted Account
یکی از اهداف سیستم های DW/BI نمایش صحیح تاریخچه (history) اطلاعات میباشد . مثلا اگر در زمان های مختلف از یک بازه زمانی خاص گزارش ( مثلا گزارش فروش بر اساس دپارتمانها ) بگیریم مقادیر مندرج در این گزارش نبایستی با گذشت زمان تغیبر یابد .
Forwarded from Deleted Account
تکنیک SCD Type 2 جهت پشتیبانی از این نیازمندی ابداع گردیده است .
تخصص و ابزارهای لازم جهت پیاده سازی هوش تجاری در یک سازمان بزرگ @BIMining
This media is not supported in your browser
VIEW IN TELEGRAM
5 موردی که درباره فین تک ها باید بدانید
@BIMining
معنی فین تک دقیقا چیست؟ چه شرکتها و سازمانهایی از آن استفاده می کنند؟ فین تک ها چه کاری میکنند؟ در چه موضوعاتی فین تک ها فعالیت دارند؟
Forwarded from ***S@££D***
هوش تجاری اجتماعی ( social business intelligence)

BI‌ اجتماعی (SBI) که با تعبیر هوش کسب و کار ۲ (BI 2.0) نیز شناخته می شود. سیستمی مبتنی بر وب است که با استفاده از تحلیل اطلاعات تولید شده توسط کاربران در رسانه‌های اجتماعی و سایر محتوای موجود در بستر وب، انواع گزارشات مرتبط با یک برند، محصول، کسب و کار، روند یا رخداد اجتماعی سیاسی و موارد مشابه را تولید می کند. در واقع SBI به مثابه پلی است که رهبران بنگاه ها و سازمان ها را به میان مشتریان و مصرف کنندگان می برد. در حال حاضر صنعت SBI یکی از زمینه های رشد است که داده های بدون ساختار و نیمه ساخت یافته را از سایت های رسانه های اجتماعی در SBI می آورد و یکی از بسیار دلیل برای انجام این کار این است که، سایت های رسانه های اجتماعی مانند فیس بوک ، توییتر ، یوتیوب، وبلاگ ، مای اسپیس، و LinkedIn منابع با ارزش از هوش مشتری هستند.
از مزیت های SBI می توان به موارد زیر اشاره کرد :
۱٫ کاهش هزینه، صرفه جویی در زمان جمع آوری و پردازش اطلاعات و کاهش نیاز به تعداد زیادی تحلیلگر برای همه شرکت هایی که دچار محدودیت زمان، منابع مالی و منابع انسانی هستند.
۲٫ تسهیل فرآیندهای جمع آوری و تحلیل اطلاعات و گزارش دهی.
۳٫ کمک به کاهش ریسک صاحبان کسب و کار از طریق شناخت محیط و اقتضائات موجود.
۴٫ ارائه گزارش ها و تحلیل های به هنگام.
۵٫ ایجاد دسترسی بسیار گسترده به منابع متعدد اطلاعاتی.
۶٫ افزایش قابل توجه کارآیی و بازدهی به دلیل سرعت، دقت و گستردگی فعالیت و تحلیل های هوشمندانه برمبنای آن.
Forwarded from ***S@££D***
مدل کامل BI
سالیان زیادی است که دانشمندان فناوری به دنبال یافتن راه‌هایی هستند که بتوانند بیشترین حجم اطلاعات را بر روی فضایی بسیار کوچک، ذخیره کنند. این تلاش‌ها دستاوردهای زیادی به همراه داشته و در نمونه اخیر، آنها موفق شدند تا 2860 سال ویدئوی با کیفیت HD را تنها بر روی 1 گرم DNA ذخیره کنند!

یانیو الریش از دانشگاه کلمبیا با همکاری دینا زیلینسکی از مرکز ژنوم نیویورک این روش را طراحی کرده‌اند. آنها در این زمینه از روش جدید رمزگذاری دی‌ان‌ای استفاده کردند که بیشترین میزان اطلاعات به ازای هر نوکلئوتید را ذخیره می‌کند. این دو دانشمند در آزمایش‌ها با استفاده از الگوریتمی به نام DNA Fountain، شش فایل (یک فیلم کوتاه، کل یک رایانه OS و یک کارت هدیه آمازون) را درون یک ذره دی‌ان‌ای ذخیره کردند. الریش در این باره می گوید: «روش رمزگذاری ما ۱۰۰ بار کارآمدتر از روش‌هایی است که در سال ۲۰۱۲ ساخته شد و می‌تواند ۲۱۵ پتابایت اطلاعات را در یک گرم دی‌ان‌ای ذخیره کند.

هرچند این روش برای ذخیره سازی اطلاعات بسیار کارآمد است؛ اما باید در نظر داشت که هزینه‌های ذخیره و خوانش اطلاعات در دی‌ان‌ای بسیار زیاد است. برای ذخیره این پکیج اطلاعاتی ۲ مگابایتی در دی‌ان‌ای، هفت هزار دلار برای سنتز دی‌ان‌ای و دو هزار دلار دیگر برای انجام توالی آن هزینه شده است. به عقیده الریش یک دهه طول خواهد کشید تا ذخیره اطلاعات در دی‌ان‌ای برای عموم مردم قابل دسترس باشد.این روش درحقیقت حفظ اطلاعات پایه توالی دی‌ان‌ای است. این فناوری با استفاده از دی‌ان‌ای‌‌‌‌‌‌ مصنوعی انجام می‌‌شود که در ماشین‌های الیگونوکلئوتیدی به کار می‌رود.

ماشین‌های الیگونوکلئوتیدی نیز به نوبه خود برای ذخیره‌سازی و بازیابی اطلاعات دی‌ان‌ای به کار می‌رود. این نوع سیستم ذخیره، فشرده‌تر از نوارهای مغناطیسی و هارد درایوهاست، زیرا در دی‌ان‌ای اطلاعات بیشتری ذخیره می‌شود. دانشمندان معتقدند با استفاده از همین روش می‌توان به طور موثر تمام اطلاعات جهان را درون یک اتاق فشرده و ذخیره کرد! هر پتابایت معادل ۱۳.۳ سال ویدئو با کیفیت HD است.

@BIMining
10 فناوری اساسی و نوظهور که آینده ما را تغییر خواهند داد
@BIMining
آخرین آمارهای بانک مرکزی نشان می‌دهد که میزان بدهی بانک‌ها به بانک مرکزی دردی‌ماه سال‌جاری نسبت به مدت مشابه سال قبل ۱/ ۳۰ درصد افزایش یافته است @BIMining
اولویت‌های هزینه‌ای حوزه‌ی IT در مؤسسات مالی @BIMining