⭕️فریمورکها و کتابخانههای دیتاساینسی در زبان پایتون
1. NumPY
2. SciPY
3. TensorFlow
4. Keras
5. Matplotlib
6. Pandas
@python_rd
1. NumPY
2. SciPY
3. TensorFlow
4. Keras
5. Matplotlib
6. Pandas
@python_rd
PyCoders (پایتون)
Photo
بدینوسیله با افتخار اعلام میکنم داکیومنت پروژه ی رمزگشایی کتیبه های باستانی گیلگمش (eBL) رو نوشتم.
مدتی بود که روی این پروژه کلی کار کردم و در مدیوم هم مقاله نوشتم و آخر سر به پروفسور انریکه جیمنز ایمیل زدم و به ایشون اطلاع دادم که برای ریپازیتوری داکیومنت پروژه اشون (پروژه مون🥺) پول رکئوست زدم و ایشون هم رکوئست من رو merge کردند و الان من یکی از contributor های این پروژه هستم! اصلا خودم باورم نمیشه🥺.
پروفسور انریکه جیمنز پاسخ ایمیلم هم دادند؛ چقدر با گرمی ازم استقبال کردند🥰.
خدایا شکرت💖
به وقت ۱۳ ژون ۲۰۲۴ میلادی
لینک پروژه:
https://github.com/Melanee-Melanee/Electronic-Babylonian-Library-eBL-documentation
مدتی بود که روی این پروژه کلی کار کردم و در مدیوم هم مقاله نوشتم و آخر سر به پروفسور انریکه جیمنز ایمیل زدم و به ایشون اطلاع دادم که برای ریپازیتوری داکیومنت پروژه اشون (پروژه مون🥺) پول رکئوست زدم و ایشون هم رکوئست من رو merge کردند و الان من یکی از contributor های این پروژه هستم! اصلا خودم باورم نمیشه🥺.
پروفسور انریکه جیمنز پاسخ ایمیلم هم دادند؛ چقدر با گرمی ازم استقبال کردند🥰.
خدایا شکرت💖
به وقت ۱۳ ژون ۲۰۲۴ میلادی
لینک پروژه:
https://github.com/Melanee-Melanee/Electronic-Babylonian-Library-eBL-documentation
✅ خطا ها در زبان پایتون
◽️ در زبان پایتون، خطاها به دو دسته تقسیم میشوند: خطاهای معمولی (Exceptions) و خطاهای زمان اجرا (Runtime Errors). اینجا چند خطا اصلی همراه با معانیشان آمده است:
1. خطای (SyntaxError): زمانی رخ میدهد که کد نوشته شده با قواعد زبان پایتون مغایرت داشته باشد.
2. خطای فاصله گذاری (IndentationError): وقتی فاصلهگذاری در کد ناقص یا نادرست باشد.
3. خطای (NameError): وقتی یک نام متغیر یا فراخوانی وجود نداشته باشد.
4. خطای (TypeError): وقتی عملیاتی روی نوع اشیاء نامناسب باشد.
5. خطای (IndexError): وقتی شاخصی برای دسترسی به یک عنصر در یک لیست یا رشته وجود نداشته باشد.
6. خطای (ValueError): زمانی اتفاق میافتد که یک عملیات با یک مقدار نامناسب انجام شود.
7. خطای (KeyError): وقتی یک کلید در یک دیکشنری وجود نداشته باشد.
8. خطای (FileNotFoundError): وقتی یک پرونده مورد نظر برای عملیات فایل مورد نظر پیدا نشود.
9. خطای (ModuleNotFoundError): وقتی یک ماژولی که قرار استفاده شود پیدا نشود.
10. خطای (ZeroDivisionError): وقتی تلاش برای تقسیم عددی بر صفر انجام شود.
@python_rd
◽️ در زبان پایتون، خطاها به دو دسته تقسیم میشوند: خطاهای معمولی (Exceptions) و خطاهای زمان اجرا (Runtime Errors). اینجا چند خطا اصلی همراه با معانیشان آمده است:
1. خطای (SyntaxError): زمانی رخ میدهد که کد نوشته شده با قواعد زبان پایتون مغایرت داشته باشد.
2. خطای فاصله گذاری (IndentationError): وقتی فاصلهگذاری در کد ناقص یا نادرست باشد.
3. خطای (NameError): وقتی یک نام متغیر یا فراخوانی وجود نداشته باشد.
4. خطای (TypeError): وقتی عملیاتی روی نوع اشیاء نامناسب باشد.
5. خطای (IndexError): وقتی شاخصی برای دسترسی به یک عنصر در یک لیست یا رشته وجود نداشته باشد.
6. خطای (ValueError): زمانی اتفاق میافتد که یک عملیات با یک مقدار نامناسب انجام شود.
7. خطای (KeyError): وقتی یک کلید در یک دیکشنری وجود نداشته باشد.
8. خطای (FileNotFoundError): وقتی یک پرونده مورد نظر برای عملیات فایل مورد نظر پیدا نشود.
9. خطای (ModuleNotFoundError): وقتی یک ماژولی که قرار استفاده شود پیدا نشود.
10. خطای (ZeroDivisionError): وقتی تلاش برای تقسیم عددی بر صفر انجام شود.
@python_rd
مدل YOLO v10 هم منتشر شد!
مدل های YOLO جزو قوی ترین مدل های پردازش دیتای تصویری هستند که تا الان ده تا ورژن از این مدل دولوپ شده.
این مدل در ۶ سایز معرفی شده:
نانو (N): ۲/۳ میلیون پارامتر
کوچک (S): ۷/۲ میلیون پارامتر
متوسط (M): ۱۵/۴ میلیون پارامتر
بزرگ (B): ۱۹/۱ میلیون پارامتر
بزرگ (L): ۲۴/۴ میلیون پارامتر
خیلی بزرگ (X): ۲۹/۵ میلیون پارامتر
این مدل، دقت (mAP) بهتری روی دیتاست عظیم COCO داشته و بهخاطر عدم استفاده از NMS به مراتب سریعتر هست؛ به صورتیکه کوچکترین سایز هر تصویر رو در یک میلیثانیه پردازش میکنه.
https://github.com/THU-MIG/yolov10/
mPA: mean Pixel Accuracy
#پردازش_تصویر
مدل های YOLO جزو قوی ترین مدل های پردازش دیتای تصویری هستند که تا الان ده تا ورژن از این مدل دولوپ شده.
این مدل در ۶ سایز معرفی شده:
نانو (N): ۲/۳ میلیون پارامتر
کوچک (S): ۷/۲ میلیون پارامتر
متوسط (M): ۱۵/۴ میلیون پارامتر
بزرگ (B): ۱۹/۱ میلیون پارامتر
بزرگ (L): ۲۴/۴ میلیون پارامتر
خیلی بزرگ (X): ۲۹/۵ میلیون پارامتر
این مدل، دقت (mAP) بهتری روی دیتاست عظیم COCO داشته و بهخاطر عدم استفاده از NMS به مراتب سریعتر هست؛ به صورتیکه کوچکترین سایز هر تصویر رو در یک میلیثانیه پردازش میکنه.
https://github.com/THU-MIG/yolov10/
mPA: mean Pixel Accuracy
#پردازش_تصویر
🌷 تأثیر لحن مؤدبانه بر هوش مصنوعی؛ با چتباتها مهربان باشیم!!!
⬅️ محققان نحوه دریافت پاسخ از چتباتها با پرامپتهای احساسی رو زیر ذرهبین قرار دادهاند.
⬅️ پژوهشگران مدتها است فرآیند مطالعه روی این موضوع را آغاز کردهاند تا بیشتر با سازوکار چتباتها آشنا شوند.
⬅️ نوها دزیری، پژوهشگر مؤسسه هوش مصنوعی آلن، معتقد است که دستورات احساسی اساساً مکانیزمهای احتمالی یک مدل رو «دستکاری» میکنن.
⬅️ به بیانی دیگر، این دستورات بخشهایی از مدل را فعال میکنن که معمولاً با دستورات معمولی و بدون احساس فعال نمیشن.
#هوش_مصنوعی #ChatGPT
@python_rd
⬅️ محققان نحوه دریافت پاسخ از چتباتها با پرامپتهای احساسی رو زیر ذرهبین قرار دادهاند.
⬅️ پژوهشگران مدتها است فرآیند مطالعه روی این موضوع را آغاز کردهاند تا بیشتر با سازوکار چتباتها آشنا شوند.
⬅️ نوها دزیری، پژوهشگر مؤسسه هوش مصنوعی آلن، معتقد است که دستورات احساسی اساساً مکانیزمهای احتمالی یک مدل رو «دستکاری» میکنن.
⬅️ به بیانی دیگر، این دستورات بخشهایی از مدل را فعال میکنن که معمولاً با دستورات معمولی و بدون احساس فعال نمیشن.
#هوش_مصنوعی #ChatGPT
@python_rd
Data Scientist Roadmap
|
|-- 1. Basic Foundations
| |-- a. Mathematics
| | |-- i. Linear Algebra
| | |-- ii. Calculus
| | |-- iii. Probability
| | -- iv. Statistics
| |
| |-- b. Programming
| | |-- i. Python
| | | |-- 1. Syntax and Basic Concepts
| | | |-- 2. Data Structures
| | | |-- 3. Control Structures
| | | |-- 4. Functions
| | | -- 5. Object-Oriented Programming
| | |
| | -- ii. R (optional, based on preference)
| |
| |-- c. Data Manipulation
| | |-- i. Numpy (Python)
| | |-- ii. Pandas (Python)
| | -- iii. Dplyr (R)
| |
| -- d. Data Visualization
| |-- i. Matplotlib (Python)
| |-- ii. Seaborn (Python)
| -- iii. ggplot2 (R)
|
|-- 2. Data Exploration and Preprocessing
| |-- a. Exploratory Data Analysis (EDA)
| |-- b. Feature Engineering
| |-- c. Data Cleaning
| |-- d. Handling Missing Data
| -- e. Data Scaling and Normalization
|
|-- 3. Machine Learning
| |-- a. Supervised Learning
| | |-- i. Regression
| | | |-- 1. Linear Regression
| | | -- 2. Polynomial Regression
| | |
| | -- ii. Classification
| | |-- 1. Logistic Regression
| | |-- 2. k-Nearest Neighbors
| | |-- 3. Support Vector Machines
| | |-- 4. Decision Trees
| | -- 5. Random Forest
| |
| |-- b. Unsupervised Learning
| | |-- i. Clustering
| | | |-- 1. K-means
| | | |-- 2. DBSCAN
| | | -- 3. Hierarchical Clustering
| | |
| | -- ii. Dimensionality Reduction
| | |-- 1. Principal Component Analysis (PCA)
| | |-- 2. t-Distributed Stochastic Neighbor Embedding (t-SNE)
| | -- 3. Linear Discriminant Analysis (LDA)
| |
| |-- c. Reinforcement Learning
| |-- d. Model Evaluation and Validation
| | |-- i. Cross-validation
| | |-- ii. Hyperparameter Tuning
| | -- iii. Model Selection
| |
| -- e. ML Libraries and Frameworks
| |-- i. Scikit-learn (Python)
| |-- ii. TensorFlow (Python)
| |-- iii. Keras (Python)
| -- iv. PyTorch (Python)
|
|-- 4. Deep Learning
| |-- a. Neural Networks
| | |-- i. Perceptron
| | -- ii. Multi-Layer Perceptron
| |
| |-- b. Convolutional Neural Networks (CNNs)
| | |-- i. Image Classification
| | |-- ii. Object Detection
| | -- iii. Image Segmentation
| |
| |-- c. Recurrent Neural Networks (RNNs)
| | |-- i. Sequence-to-Sequence Models
| | |-- ii. Text Classification
| | -- iii. Sentiment Analysis
| |
| |-- d. Long Short-Term Memory (LSTM) and Gated Recurrent Units (GRU)
| | |-- i. Time Series Forecasting
| | -- ii. Language Modeling
| |
| -- e. Generative Adversarial Networks (GANs)
| |-- i. Image Synthesis
| |-- ii. Style Transfer
| -- iii. Data Augmentation
|
|-- 5. Big Data Technologies
| |-- a. Hadoop
| | |-- i. HDFS
| | -- ii. MapReduce
| |
| |-- b. Spark
| | |-- i. RDDs
| | |-- ii. DataFrames
| | -- iii. MLlib
| |
| -- c. NoSQL Databases
| |-- i. MongoDB
| |-- ii. Cassandra
| |-- iii. HBase
| -- iv. Couchbase
|
|-- 6. Data Visualization and Reporting
| |-- a. Dashboarding Tools
| | |-- i. Tableau
| | |-- ii. Power BI
| | |-- iii. Dash (Python)
| | -- iv. Shiny (R)
| |
| |-- b. Storytelling with Data
| -- c. Effective Communication
|
|-- 7. Domain Knowledge and Soft Skills
| |-- a. Industry-specific Knowledge
| |-- b. Problem-solving
| |-- c. Communication Skills
| |-- d. Time Management
| -- e. Teamwork
|
-- 8. Staying Updated and Continuous Learning
|-- a. Online Courses
|-- b. Books and Research Papers
|-- c. Blogs and Podcasts
|-- d. Conferences and Workshops
`-- e. Networking and Community Engagement
@python_rd
|
|-- 1. Basic Foundations
| |-- a. Mathematics
| | |-- i. Linear Algebra
| | |-- ii. Calculus
| | |-- iii. Probability
| | -- iv. Statistics
| |
| |-- b. Programming
| | |-- i. Python
| | | |-- 1. Syntax and Basic Concepts
| | | |-- 2. Data Structures
| | | |-- 3. Control Structures
| | | |-- 4. Functions
| | | -- 5. Object-Oriented Programming
| | |
| | -- ii. R (optional, based on preference)
| |
| |-- c. Data Manipulation
| | |-- i. Numpy (Python)
| | |-- ii. Pandas (Python)
| | -- iii. Dplyr (R)
| |
| -- d. Data Visualization
| |-- i. Matplotlib (Python)
| |-- ii. Seaborn (Python)
| -- iii. ggplot2 (R)
|
|-- 2. Data Exploration and Preprocessing
| |-- a. Exploratory Data Analysis (EDA)
| |-- b. Feature Engineering
| |-- c. Data Cleaning
| |-- d. Handling Missing Data
| -- e. Data Scaling and Normalization
|
|-- 3. Machine Learning
| |-- a. Supervised Learning
| | |-- i. Regression
| | | |-- 1. Linear Regression
| | | -- 2. Polynomial Regression
| | |
| | -- ii. Classification
| | |-- 1. Logistic Regression
| | |-- 2. k-Nearest Neighbors
| | |-- 3. Support Vector Machines
| | |-- 4. Decision Trees
| | -- 5. Random Forest
| |
| |-- b. Unsupervised Learning
| | |-- i. Clustering
| | | |-- 1. K-means
| | | |-- 2. DBSCAN
| | | -- 3. Hierarchical Clustering
| | |
| | -- ii. Dimensionality Reduction
| | |-- 1. Principal Component Analysis (PCA)
| | |-- 2. t-Distributed Stochastic Neighbor Embedding (t-SNE)
| | -- 3. Linear Discriminant Analysis (LDA)
| |
| |-- c. Reinforcement Learning
| |-- d. Model Evaluation and Validation
| | |-- i. Cross-validation
| | |-- ii. Hyperparameter Tuning
| | -- iii. Model Selection
| |
| -- e. ML Libraries and Frameworks
| |-- i. Scikit-learn (Python)
| |-- ii. TensorFlow (Python)
| |-- iii. Keras (Python)
| -- iv. PyTorch (Python)
|
|-- 4. Deep Learning
| |-- a. Neural Networks
| | |-- i. Perceptron
| | -- ii. Multi-Layer Perceptron
| |
| |-- b. Convolutional Neural Networks (CNNs)
| | |-- i. Image Classification
| | |-- ii. Object Detection
| | -- iii. Image Segmentation
| |
| |-- c. Recurrent Neural Networks (RNNs)
| | |-- i. Sequence-to-Sequence Models
| | |-- ii. Text Classification
| | -- iii. Sentiment Analysis
| |
| |-- d. Long Short-Term Memory (LSTM) and Gated Recurrent Units (GRU)
| | |-- i. Time Series Forecasting
| | -- ii. Language Modeling
| |
| -- e. Generative Adversarial Networks (GANs)
| |-- i. Image Synthesis
| |-- ii. Style Transfer
| -- iii. Data Augmentation
|
|-- 5. Big Data Technologies
| |-- a. Hadoop
| | |-- i. HDFS
| | -- ii. MapReduce
| |
| |-- b. Spark
| | |-- i. RDDs
| | |-- ii. DataFrames
| | -- iii. MLlib
| |
| -- c. NoSQL Databases
| |-- i. MongoDB
| |-- ii. Cassandra
| |-- iii. HBase
| -- iv. Couchbase
|
|-- 6. Data Visualization and Reporting
| |-- a. Dashboarding Tools
| | |-- i. Tableau
| | |-- ii. Power BI
| | |-- iii. Dash (Python)
| | -- iv. Shiny (R)
| |
| |-- b. Storytelling with Data
| -- c. Effective Communication
|
|-- 7. Domain Knowledge and Soft Skills
| |-- a. Industry-specific Knowledge
| |-- b. Problem-solving
| |-- c. Communication Skills
| |-- d. Time Management
| -- e. Teamwork
|
-- 8. Staying Updated and Continuous Learning
|-- a. Online Courses
|-- b. Books and Research Papers
|-- c. Blogs and Podcasts
|-- d. Conferences and Workshops
`-- e. Networking and Community Engagement
@python_rd
PyCoders (پایتون)
Photo
چون حجم پروژه زبان فارسی باستان زیاده و در آینده قراره وسیع تر بشه و خب مسلما در یک ریپازیتوری گیتهاب جا نمیشه؛ به همین علت براش یک اورگانیزیشن (organization) ساختم.
اگه کسی علاقه داشته باشه میتونه روی این پروژه کار کنه؛ بهم ایمیل بزنید تا من در آینده شما رو عضو لیست People کنم، خیلی هم خوشحال میشم🥰.
کارهای غیر فنی و غیر کدی هم زیاد دارم؛ مثلا پیدا کردن کتاب های خوب، مقاله، ساختن world list برای این زبان، جمع آوری دیتای عکس از کتیبه ها یا دیتای متنی از زبان فارسی باستان و ....
فکر کنم این اورگانیزیشن قراره با ارزش ترین دستاورد زندگیم باشه.
الهی به امید تو❤🙏
آدرس ایمیلم:
melaneepython@gmail.com
لینک گیتهاب این اورگانیزیشن:
https://github.com/Electronic-Persian-Old-Library
اگه کسی علاقه داشته باشه میتونه روی این پروژه کار کنه؛ بهم ایمیل بزنید تا من در آینده شما رو عضو لیست People کنم، خیلی هم خوشحال میشم🥰.
کارهای غیر فنی و غیر کدی هم زیاد دارم؛ مثلا پیدا کردن کتاب های خوب، مقاله، ساختن world list برای این زبان، جمع آوری دیتای عکس از کتیبه ها یا دیتای متنی از زبان فارسی باستان و ....
فکر کنم این اورگانیزیشن قراره با ارزش ترین دستاورد زندگیم باشه.
الهی به امید تو❤🙏
آدرس ایمیلم:
melaneepython@gmail.com
لینک گیتهاب این اورگانیزیشن:
https://github.com/Electronic-Persian-Old-Library
چرا باید از پایتون برای تجزیه و تحلیل بیگ دیتا استفاده کرد؟
1. سرعت پردازش مناسب
2. قابلیت کار در تمامی پلتفرم ها
3. با داده های ساختار یافته و بدون ساختار به خوبی برخورد میکند
4. میتواند الگوریتم های ماشین لرنینگ را مدیریت کند.
@python_rd
1. سرعت پردازش مناسب
2. قابلیت کار در تمامی پلتفرم ها
3. با داده های ساختار یافته و بدون ساختار به خوبی برخورد میکند
4. میتواند الگوریتم های ماشین لرنینگ را مدیریت کند.
@python_rd
PyCoders (پایتون)
چون حجم پروژه زبان فارسی باستان زیاده و در آینده قراره وسیع تر بشه و خب مسلما در یک ریپازیتوری گیتهاب جا نمیشه؛ به همین علت براش یک اورگانیزیشن (organization) ساختم. اگه کسی علاقه داشته باشه میتونه روی این پروژه کار کنه؛ بهم ایمیل بزنید تا من در آینده شما…
سلام دوستان عزیزم🥰
من دارم یک دیتاست کامل از کتیبه های باستانی به زبان فارسی باستان (Persian Old) جمع آوری میکنم، هم دیتای Image و هم دیتای Text.
خیلی خوشحال میشم همکاری کنید و تصاویر و یا متون کتیبه های فارسی باستان رو سرچ کنید و برام ایمیل شون کنید با ذکر مشخصات و جزییات؛ یا مستقیما در ریپازیتوری Dataset پروژه در گیت هاب بزاریدشون.
خیلی ممنونم🙏🌸
لینک گیت هاب پروژه مربوط به دیتاست:
https://github.com/Electronic-Persian-Old-Library/Persian-Old-Dataset
آدرس ایمیلم:
melaneepython@gmail.com
#EPOL
#Datagathing
من دارم یک دیتاست کامل از کتیبه های باستانی به زبان فارسی باستان (Persian Old) جمع آوری میکنم، هم دیتای Image و هم دیتای Text.
خیلی خوشحال میشم همکاری کنید و تصاویر و یا متون کتیبه های فارسی باستان رو سرچ کنید و برام ایمیل شون کنید با ذکر مشخصات و جزییات؛ یا مستقیما در ریپازیتوری Dataset پروژه در گیت هاب بزاریدشون.
خیلی ممنونم🙏🌸
لینک گیت هاب پروژه مربوط به دیتاست:
https://github.com/Electronic-Persian-Old-Library/Persian-Old-Dataset
آدرس ایمیلم:
melaneepython@gmail.com
#EPOL
#Datagathing