Ciência de Dados Complexos
4.7K subscribers
223 photos
118 files
1.16K links
Canal sobre Ciência de Dados e IA, onde divulgamos livros, tutoriais, cursos, palestras e muito mais. Tudo gratuito. Gerenciado pelo prof. Francisco Rodrigues (USP). Aulas online sobre Estatística e CD no Youtube: https://youtube.com/franciscorodrigues
Download Telegram
Um dos principais desafios na Ciência de Dados é o desbalanceamento dos dados. Por exemplo, em bases de dados de instituições financeiras, apenas uma pequena parcela dos usuários comete fraudes. Para lidar com o desbalanceamento, existem diversas técnicas disponíveis. A seguir, apresentamos uma lista de materiais úteis:

📚 Book: Machine Learning for Imbalanced Data
https://lnkd.in/devmVFi3

📑 Papers:
🔴 Learning from Imbalanced Data
https://lnkd.in/dMPp-kGj

🔴 A Survey of Predictive Modeling on Imbalanced Domains
https://lnkd.in/dqbCDkAQ

🔴 A Systematic Review on Imbalanced Data Challenges in Machine Learning: Applications and Solutions
https://lnkd.in/dp2Pwmzi

💻 Library:
imbalanced-learn https://lnkd.in/d_pHc5hB
13👍4
Esses são os artigos sobre dados desbalanceados que citei acima. 👇
👍3
Livro online sobre Inferência Estatística:
https://lakens.github.io/statistical_inferences/
10👍1💯1
𝐋𝐄𝐀𝐑𝐍𝐈𝐍𝐆 𝐓𝐇𝐄𝐎𝐑𝐘 𝐅𝐑𝐎𝐌 𝐅𝐈𝐑𝐒𝐓 𝐏𝐑𝐈𝐍𝐂𝐈𝐏𝐋𝐄𝐒
Livro em pdf: https://www.di.ens.fr/~fbach/ltfp_book.pdf
8👍2
Ferramenta nova do Pandas: Generative AI to Pandas
https://github.com/sinaptik-ai/pandas-ai
14👍3😱1
Curso gratuito oferecido pela Microsoft:
🚀 Generative AI for Beginners
https://microsoft.github.io/generative-ai-for-beginners/#/
11👍3
📚 A Amazon está com promoção de alguns livros. Segue uma lista que recomendo fortemente:

Storytelling com Dados
https://amzn.to/4fcdrI7
R$ 53

Fora de série - Outliers
https://amzn.to/4d9izur
R$ 29

Os números não mentem
https://amzn.to/3zKUxHY
R$ 34

A navalha de Ockham
https://amzn.to/4bR3e0O
R$ 23

Uma senhora toma chá
https://amzn.to/3zGZAsQ
R$ 51

O andar do bêbado:
https://amzn.to/3zObkKa
R$41

O poder do infinito: Como o cálculo revela os segredos do universo
https://amzn.to/3xT4K4H
R$ 33

Subliminar: Como o inconsciente influencia nossas vidas
https://amzn.to/4d88mhU
R$ 45

Elástico: Como o pensamento flexível pode mudar nossas vidas
https://amzn.to/4danknP
R$ 41

Factfulness
https://amzn.to/3YfSQfE
R$ 55

A próxima onda: Inteligência artificial, poder e o maior dilema do século XXI
https://amzn.to/3W8AL0w
R$ 52

Superfreakonomics
https://amzn.to/3zK4Bkt
R$ 63

Freakonomics
https://amzn.to/3SbyRet
R$ 44

Todo Mundo Mente
https://amzn.to/3W3Qjme
R$ 48

Análise Prática de Séries Temporais
https://amzn.to/4bNXKUj
R$ 59

A ciência da sorte: A matemática e o mundo das apostas: de loterias e cassinos ao mercado financeiro
https://amzn.to/3W9P0Cd
R$ 59

As leis do acaso: Como a probabilidade pode nos ajudar a compreender a incerteza
https://amzn.to/4cOblwr
R$ 68

A arte da estatística: Como aprender a partir de dados
https://amzn.to/3Wc6ZYL
R$ 68
18👍6👏1
10👍2💯1
9
7👍1
10
Tutorial online: Da Teoria à Prática: Modelos de IA Generativa com R e Python
https://magnotairone.github.io/tutorial_sinape_2024/tutorial
10
Mathematical Foundations of Reinforcement Learning .pdf
18.9 MB
Mathematical Foundations of Reinforcement Learning
9👍2
Na criação de gráficos para CD, é importante usar as cores corretas. Esse site oferece ótimas paletas de cores. https://coolors.co/palettes/popular
11👍3
Descrição interessante sobre preparação dos dados. Há uma boa descrição sobre as transformações que podemos realizar.

https://www.davidzeleny.net/anadat-r/doku.php/en:data_preparation
5👍5
Curso gratuito de Python para Ciência de Dados oferecido pela USP-São Carlos.

https://saocarlos.usp.br/inscreva-se-em-curso-gratuito-da-usp-sobre-python-aplicado-a-ciencia-de-dados/
10👍5💯1
ML-review.pdf
15.1 MB
Essa é uma das melhores revisões sobre aprendizado de máquina.


"Learning = Representation + Evaluation + optimization"
17