پایتون مالی
4.85K subscribers
165 photos
94 videos
52 files
318 links
این کانال برای یادگیری پایتون با رویکرد مالی ایجاد شده است.
در اینجا مطالب آموزشی علم داده، هوش مصنوعی، پایتون مالی و معاملات الگوریتمی به اشترک گذاشته خواهد شد.
سپاس بابت همراهیتان
Admin:
علی رئوفی - دکتری اقتصاد مالی و اقتصادسنجی
@raoofiali
Download Telegram
📑 مفهوم کلان‌داده‌

امروزه با داده‌های بسيار زياد، مختلف، و با پيچيدگي بالا سروکار داريم که مديريت، سازمان‌دهی، و نگهداری آن‌ها مساله مهمي است.

طبق آمار، ۹۰ درصد داده‌های موجود در جهان تنها در دو سال اخیر ایجاد شده‌اند. رشد داده‌ها در سال ۲۰۰۹ چیزی در حدود ۰.۸ زتابایت (۰.۸ ZB) بوده است که پیش‌بینی مي‌شود اين مقدار در سال ۲۰۲۰ به ۳۲ ZB افزايش يابد.

رشد داده‌ها همچنان مانند گذشته ادامه دارد و رشد آن‌ها روزه به روز سریعتر می‌شود.

مشکل اصلی البته این است که رشد داده‌ها بیشتر در زمینه‌ی داده‌های غیرِ ساخت یافته صورت می‌گیرد.

امروزه #کلان‌داده‌ توسط منابع مختلفی مانند دستگاه‌های موبایل، GPS، RFID، شبکه‌های اجتماعی، مشتریان و بسیاری از منابع دیگر توليد مي‌شود.

🔰 تعریف کلان‌داده

برای کلان‌داده‌ها تعاریف متعددی ارائه شده است که در زیر به چند مورد از آن‌ها اشاره می‌شود:

به طور عمومی کلان‌داده عبارت است از مجموعه داده‌هایی که به روش‌های سنتی موجود در فناوری اطلاعات، نرم‌افزارها و سخت‌افزار و در یک زمان قابل قبول قادر به جمع‌آوری، درک، و مدیريت نباشند.

تعریف Apache Hadoop در سال ۲۰۱۰ برای کلان‌داده: کلان‌داده عبارت است از مجموعه داده‌هایی که باتوجه به کامپیوترهای موجود براحتی قابل جمع‌آوری، مدیريت، و پردازش نباشند.

برای کلان‌داده‌ها یکسری چالش و فرصت معرفی شده که به صورت مدل ۳V بیان می‌شود و شامل افزایش حجم، شتاب، و تنوع می‌باشد.

۱. حجم (Volume): با تولید و جمع‌آوری داده‌ها در نهایت به انبوهی از داده‌ها دست می‌یابیم که گستره‌ی آن‌ها بسیار زياد است.

۲. شتاب (Velocity): داده‌ها با سرعت زیادی تولید می‌شوند و نیاز به تحلیل سریع و به موقع است.

۳. تنوع (Variety): به معنی وجود انواع مختلف داده‌ها است که خود شامل داده‌های ساخت یافته، نیمه ساخت یافته و غیرساخت یافته است مانند ویدئو، صوت، متن، و صفحات وب.

چرخه‌ی حیات کلان‌داده

چرخه‌ی حیات کلان‌داده را می‌توان یک حلقه از چهار عملیات زیر در نظر گرفت:

۱. جمع‌آوری (Collection): شامل جمع‌آوری داده‌های مناسب از مجموعه‌ی داده‌ای مناسب است. برای مثال جمع‌آوری داده‌ها می‌توانند از یک شبکه‌ي اجتماعي يا شبکه‌هاي حسگر بي‌سيم باشند.

۲. یکپارچه‌سازی (Integrate): داده‌های جمع‌آوری شده با یکدیگر یکپارچه و سازماندهی (Organize) می‌شوند. گاهي ممکن است مجبور شويم آن‌ها را با مجموعه‌ي داده‌اي خود منطبق کنيم.

۳. تحلیل (Analysis): در این بخش می‌توان تحلیل‌های ساده و یا تحلیل‌های پیشرفته‌ي آماري بر روي داده‌ها انجام داد.

۴. تصمیم‌گیری‌ها و اقدامات (Actions Decisions): بعد از جمع‌آوری، یکپارچه‌سازی، و تحلیل داده‌ها می‌توان آن‌ها را به مدیر تحويل داد و بر اساس اين داده‌ها مدير مي‌تواند اقدامات لازم و مفيد را اجرا کند. براي مثال اگر شما يک کتاب در زمينه‌ي علوم کامپيوتر از آمازون خريداري کنيد، ممکن است به شما پيشنهاد خريد کتابي در زمينه‌ي کلان‌داده نيز ارائه شود.

🌐 ما را در تلگرام دنبال کنید.

افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
👍1
یکی از نگرانی های که در ذهن بسیاری از دانش پذیران #علم_داده_در_مالی وجود دارد این‌است که از کجا باید شروع کرد؟؟؟

-اول تئوری را یاد بگیریم؟
-اول برنامه‌نویسی یاد بگیریم؟
-آیا کسی که رشته تخصصی اش ریاضی و آمار نیست امکان یادگیری این علم را دارد؟

در پاسخ به این سوالات از تجربه شخصی و بسیاری از دانش پذیران موفق دوره های گذشته وام میگیرم.

#یادگیری_ماشین ابزاری است که بدون پیاده سازی بر روی داده های متفاوت و #برنامه_نویسی عملاً یاد گیری آن‌ناقص است. به بیانی دیگر این ابزار زمانی معنی پیدا میکند که عملا بر روی داده ها اعمال شوند و نتایج آن مشاهده شود. بنا بر این اگر فردی صرفا بر تئوری این موضوع چه بسا تسلط مناسبی داشته باشد نمیتواتد از آن به صورت عملی صرفاً بر روی کاغذ استفاده کند.

از طرفی صرفاً دانستن نام تعدادی الگوریتم معروف در یک کتاب خانه ای که صرفا یک ماژول از پیش آماده در اختیار مدل ساز قرار میدهد در بسیاری از مواقع نمیتواند یک پاسخ کاملاً هوشمندانه باشد. دلیل آن هم ندانستم ماهیت محاسبات آن الگوریتم و ندانستن تطابق ماهیت الگوریتم با ماهیت داده های مورد بررسی است.

در این‌شرایط بهترین شیوه برای یادگیری این‌مفاهیم پیش بردن ابعاد تئوری و عملی آن به صورت موازی است. به این‌معنی که به صورت نسبی تئوری را آموزش دیده و بلا فاصله به پیاده سازی و آزمایش های متعدد پرداخته شود. در این شیوه نه تنها هر دو بعد تئوری و عملی این علم پوشش داده میشود بلکه ارتباط تئوری و عمل به شکلی ملموس برای دانش پذیر نهادینه‌میشود.

در پایان، این نکته حائز اهمیت است که علم #یادگیری_ماشین امروزه آنقدر محبوب است که توجه افراد زیادی از رشته های متفاوت را به خود جلب‌کرده است و با اختصاص زمان کافی و شیوه آموزش مناسب، فارق از تخصص دانشگاهی، میتوان در آن به موفقیت دست یافت.

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
This media is not supported in your browser
VIEW IN TELEGRAM
بیایید امروز با یکی از پروژه‌های هوش مصنوعی GANs آشنا بشیم و اونو تست کنیم.
در سایت زیر عکس خود را وارد کنید و اونو به تصویر کارتنی تبدیل کنید.

https://huggingface.co/spaces/akhaliq/AnimeGANv2

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
داده‌های پرت بعضی مواقع دردسر ساز هستند و ما به دنبال حذف آنها قبل از مدل‌سازی هستیم و در بعضی مواقع هم مساله اصلی تشخیص و مدلسازی همین داده‌های پرت به عنوان ناهنجاری (Anomaly Detection) است.

فرض کنید میانگین حقوق در یک شرکت ۴میلیون است.آیا این بدان معنی است که اکثر افراد در آن شرکت ۴میلیون (یا نزدیک به آن)حقوق می‌گیرند.در نگاه یک متخصص داده‌کاوی قطعا جواب خیر است چرا که در کنار شاخص‌های مرکزی مانند میانگین باید شاخص‌های پراکندگی نیز مورد ارزیابی قرار گیرد.ممکن است ۹۸درصد افراد حاضر در آن شرکت ۱میلیون حقوق بگیرند و ۲ درصد بقیه حقوقشان ۲۰میلیون باشد.در واقع این ۲درصد نوعی داده پرت هستند که میانگین را به نفع خود جا به جا کرده‌اند!

فرض کنید میانگین ثروت کارمندان ماکروسافت ۱۰۰میلیون دلار است.طبیعتا شخصی مانند بیل گیتس که ثروت او به اندازه چندین کشور است،میانگین را به بسیار بالاتر از میانگین واقعی تبدیل کرده ‌است و یک متخصص داده‌کاوی باید بتواند این این مسئله را تشخیص دهد.در واقع ثروت بیل گیتس یک داده پرت یا همان Outlier در میان ثروت کارکنان و مدیران مایکروسافت است.

🌐 دانش مالی با پایتون
https://t.me/pyfinance
👍2
وبینار «کاربرد علم داده در کسب و کار مالی»
این وبینار به صورت آنلاین برگزار می‌شود و برای ۱۰۰ نفر اول رایگان است.

لینک شرکت در دوره:
www.ifc.ir/213

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام 👇
https://t.me/pyfinance
Media is too big
VIEW IN TELEGRAM
🔵مقدمات زبان برنامه نویسی #پایتون

#درس_دوم
تغییر جنس متغیر های تعریف شده در پایتون

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
Media is too big
VIEW IN TELEGRAM
چگونه از یک اقتصادخوانده به یک دانشمند داده تبدیل شویم؟

- در یک تخمین ابتدایی، ۱۳ درصد دیتاساینتیست‌های جهان، دارای مدرک اقتصاد هستند.
- افراد اقتصادخوانده به دلیل آشنایی مناسب با داده‌ها، روابط علّی و همبستگی، روش‌های رگرسیون خطی و لجستیک، گزینه‌های مناسبی برای تبدیل شدن به دانشمندان داده هستند.
- اقتصادخوانده‌ها معمولا با ریاضیات، آمار، جبرخطی میانه خوبی دارند، علاوه بر این مهارت‌هایی مانند روانشناسی و سیاست نیز در مواقعی در علم داده مورد نیاز است، که افراد اقتصادخوانده با آن آشنا هستند.
- در سال‌های اخیر به دلیل افزایش خیره کننده مشاغل مربوط به تحلیل داده در بازارهای مالی، افراد زیادی تمایل دارند که به این حوزه ورود کنند.

در این ویدئوی بسیار جالب، فرآیند تبدیل شدن از یک اقتصادخوانده به دانشمند داده به زبان ساده تشریح شده است.

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
Media is too big
VIEW IN TELEGRAM
🔵مقدمات زبان برنامه نویسی #پایتون

#درس_سوم
ساخت لیست

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
معرفی کتاب Python Algorithmic Trading Cookbook

این کتاب، مستقیم وارد فضای عملی شده و کمتر به بحث‌های تئوری می‌پردازد و برای کسانی که می‌خواهند خیلی سریع تکنیک‌ها را یاد بگیرند مناسب است.

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
@Pyfinance AlgoTrading Cookb_2020 .pdf
34.6 MB
دانلود کتاب Python Algorithmic Trading Cookbook

#معرفی_کتاب


🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
متخصصان علم داده تا چه مقطعی تحصیل کر‌ده‌اند؟


🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
Media is too big
VIEW IN TELEGRAM
🔵مقدمات زبان برنامه نویسی #پایتون

#درس_چهارم
ساخت دیکشنری پایتون

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
This media is not supported in your browser
VIEW IN TELEGRAM
اهمیت مصورسازی در #داده_کاوی.

شاید یک دایناسور در #داده های شما باشد!

آماره‌های توصیفی تمام واقعیت را به شما نشان نمی‌دهند.

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
دوره معاملات الگوریتمی با پایتون

📣 ۳۵ درصد #تخفیف فقط تا پایان امروز!
🔔 امکان پرداخت به صورت #اقساط

طول دوره: ۲۰ساعت + ۴ساعت پرسش و پاسخ و تمرین

مدرس:
علی رئوفی- دکتری اقتصادسنجی و مالی

نحوه برگزاری:
آنلاین + ویدئو به صورت #مادام‌العمر

برای کسب اطلاعات بیشتر و دریافت سرفصل‌ها به ایدی تلگرامی @abedizohreh پیام ارسال فرمایید.
.
متخصصان #علم_داده از چه زبان برنامه‌نویسی استفاده می‌کنند؟


🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
امین امینی مهر
دانشجو ارشد - مهندسی مالی

مقالات چاپ شده

The Role of Feature Engineering in Prediction of Tehran Stock Exchange Index Based on LSTM - Iranian Journal of Economic Studies - 2021 link

ParsBERT Post-Training for Sentiment Analysis of Tweets Concerning Stock Market - 26th International Computer Conference, Computer Society of Iran (CSICC) - IEEE - 2021 link

A Time Step Cascade CNN-LSTM neural network for predicting adjusted close price of 5 largest firms in Tehran stock exchange - The International Conference on Interdisciplinary Studies in Management and Engineering - 2021 link

مقالات پذیرفته شده

A study on the characteristics of TSE index return data and introducing a regime switching prediction method based on neural networks - Journal of Financial Management Perspective

A comprehensive study of market prediction from Efficient Market Hypothesis up to late intelligent market prediction approaches

لینک گیت هاب من:
https://github.com/aminaminimehr
John_Hull_Machine_Learning_in_Business_1637339483.pdf
14.8 MB
یادگیری ماشین در تجارت: مقدمه‌ای بر دنیای #علم_داده

#معرفی_کتاب

بسیاری از دانشجویان #مالی در ایران پروفسور #جان_هال را به‌واسط کتاب فوق‌العاده «اختیارهای خریدوفروش، قراردادهای آتی و سایر #مشتقات» می‌شناسند. ایشان در جولای سال ۲۰۱۹ میلادی و در سن ۷۳ سالگی کتابی با عنوان «#یادگیری_ماشین در تجارت: مقدمه‌ای بر دنیای #علم_داده» نگارش کرده‌اند که خواندنش برای علاقه‌مندان به دنیای علم داده خالی از لطف نیست.
.

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
🔵مقالات تخصصی من در زمینه پیش‌بینی بازارهای مالی در ژورنال‌های داخلی و خارجی
*علی رئوفی- دکتری اقتصاد مالی

1- Empirical Study on the Existence of Long-term Memory In Tehran Stock Exchange Returns: Rolling Window Approach
در این مقاله وجود حافظه در داده‌های تاریخی بورس اوراق بهادار بررسی شده است. به زبان ساده اینکه آیا می‌توان با استفاده از داده‌های روزهای گذشته، آینده بازار را پیش‌بینی کرد؟ بر اساس نتایج بدست آمده داده‌های بورسی دارای حافظه حدودا سه روزه هستند و می‌توان از اطلاعات سه روز گذشته برای پیش‌بینی استفاده کرد. البته به مرور زمان این حافظه کوتاه شده و به بورس ایران به بازار کارا نزدیکتر شده است.
2- Forecasting Tehran Stock Exchange Index Returns Using a Combination of Wavelet Decomposition and Adaptive Neural Fuzzy Inference Systems
در این مقاله تلاش شده کرده‌ایم تا شاخص کل بورس اوراق بهادار را با استفاده از ترکیب ابزارهای پیشرفته نظیر شبکه عصبی مصنوعی، تجزیه موجک و منطق فازی پیش‌بینی کنیم. در این روش، نویزها با استفاده از تجزیه موجک حذف شده تا نوسانات اصلی راحت‌تر قابل پیش‌بینی باشد. در نهایت یک مدل با دقت پیش‌بینی بالا ارائه شده است.
3- Assessment of Gold Price Predictability and Comparison of Predictions made by Linear and Nonlinear Methods
در این مقاله پیش‌بینی‌پذیری قیمت طلا مورد بررسی قرار گرفته است و مشخص شده است و بهترین روش برای پیش‌بینی قیمت طلا معرفی شده است.
4- Comparison of Several Combined Methods for Forecasting Tehran Stock Exchange Index
در این مقاله انواع روش‌های پیشرفته پیش‌بینی مورد ارزیابی و مقایسه قرار گرفته‌اند. و در نهایت روش ترکیبی شبکه عصبی مصنوعی-فازی به عنوان روش برگزیده معرفی گردیده است. در این روش جهت بازار (مثبت و منفی بودن بازده) با دقت 72 درصد قابل پیش‌بینی است.
5- Assessment and Comparison of linear and non- linear Methods for Forecasting Returns on Stock Market Index
در این مقاله روش‌های خطی و غیرخطی برای پیش‌بینی سهام مورد بررسی و مقایسه قرار گرفت. در ابتدا اثبات شد که رفتار بازار سهام ایران غیرخطی و آشوبی است. رفتار آشوبی رفتاری است که علیرغم وجود بی نظمی در ساختار خود، از یک نظم پیچیده که شاید در ظاهر قابل مشاهده نباشد پیروی می‌کند. سپس روش‌های پیش‌بینی پیشرفته با روش‌های خطی مقایسه شده است. نتایج مطابق انتظار نشان داد که روش‌هایی که توانایی مدلسازی رفتار غیرخطی را دارند بهتر از روش‌های خطی پیش‌بینی می‌کنند.
6- Forecasting OPEC Crude Oil Price Using Fuzzy Autoregressive Integrated Moving Average (FARIMA) Model
در این مقاله تلاش شده است تا قیمت نفت با استفاده از یک الگوی رگرسیون فازی مورد پیش‌بینی قرار گیرد. در نهایت مشخص شد که این روش توانایی قابل قبولی در پیش‌بینی بازار نفت نسبت به سایر روش‌ها دارد.
7- Identifying Data Generator Process of Tehran Stock Exchange, Modeling and forecasting using Soft Computing
در این مقاله داده‌های تاریخی بورس از جهات مختلف مورد بررسی قرار گرفته است. با شناسایی خصوصیات مختلف شامل حافظه‌مند بودن، کارا بودن، آشوبی بودن و نامتقارن بودن یک الگوی پیش‌بینی قابل قبول ارائه گردد. در نهایت مشخص شد که شوک‌های مثبت و منفی در بازار سهام متقارن نیستند و شوک‌های منفی بزرگتر از شوک‌های مثبت است. همینطور بازار سهام یک بازار آشوبی و حافظه‌مند است و مدلی که قرار است پیش‌بینی بازار را بر عهده بگیرد باید این خصوصیات را مدل کند.
8- Evaluation and comparison of performance of ANFIS and ARIMA in forecasting the daily gold prices
در این مقاله دو روش مختلف آریما (اقتصادسنجی) و شبکه عصبی فازی (محاسبات نرم) برای پیش‌بینی قیمت سکه تمام بهار آزادی مورد استفاده و مقایسه قرار گرفت که روش شبکه عصبی فازی با دقت بسیار بالایی توانایی خود را در پیش‌بینی این بازار نشان داد
9- The Existence of Long Memory Property in OPEC Oil Prices
در این مقاله قیمت نفت اوپک مورد ارزیابی قرار گرفته است و پیش‌بینی پذیری آن سنجش شده است. نتایج نشان می‌دهد که پیش‌بینی پذیری بازار نفت اگرچه کار دشواری است با این حال غیر ممکن نیست.
10- Evaluation and Comparison of Forecast Performance of Linear and Non-linear Methods for Daily Returns of Tehran Stock Exchange
در این مقاله انواع روش‌های نوین پیش‌بینی بازار سهام مورد بررسی قرار گرفته است و مهمترین روش‌ها با یکدیگر مقایسه شده است.
11- The Role of Feature Engineering in Prediction of Tehran Stock Exchange Index Based on LSTM
.
لیست کامل مقالات را اینجا (+) مطالعه بفرمایید
الگوریتم های یادگیری ماشین.pdf
6.2 MB
یک چیت شیت عالی برای مصاحبه های کاری به عنوان دانشمند داده.

فقط در ۱۴ صفحه.

#cheat_sheet

🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
معرفی کتاب «استادی در pandas برای بازارهای مالی»

تحلیل بازارهای مالی با استفاده از کتابخانه pandas

تحلیل و آنالیز بازارهای مالی جزو داغ‌ترین مباحث روز جهان است که می‌توان با استفاده از برنامه‌نویسی و الگوریتم‌های یادگیری ماشین اینکار را دقیق‌تر و سریع‌تر انجام داد.


🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.
Michael_Heydt_Mastering_pandas_for_Finance_Master_pandas,_an_open.pdf
7 MB
معرفی کتاب «استادی در pandas برای بازارهای مالی»

Mastering Pandas for Finance

#معرفی_کتاب


🌐 ما را در تلگرام دنبال کنید.
افزایش دانش مالی با پایتون در تلگرام

https://t.me/pyfinance
.