Ciência de Dados Complexos
4.7K subscribers
223 photos
118 files
1.16K links
Canal sobre Ciência de Dados e IA, onde divulgamos livros, tutoriais, cursos, palestras e muito mais. Tudo gratuito. Gerenciado pelo prof. Francisco Rodrigues (USP). Aulas online sobre Estatística e CD no Youtube: https://youtube.com/franciscorodrigues
Download Telegram
Excelente livro sobre inferência Bayesiana disponível online:

http://www.stat.columbia.edu/~gelman/book/
12👍3
Pessoal, estamos próximos de 10k inscritos. Em breve deve sair novos vídeos. Se inscrevam e compartilhem o conhecimento: https://www.youtube.com/franciscorodrigues
👏141👍1
A base Datasaurus Dozen é uma base muito interessante, pois os dados apresentam a mesma média, correlação e variância, mas quando mostramos os pontos em um scatterplot, vemos que os dados são muito diferentes. Por isso, é fundamental usarmos medidas adicionais para descrever os dados, tais como curtose, entropia de Shannon.

https://www.autodesk.com/research/publications/same-stats-different-graphs
👍113😱2👏1
Livro disponível online. Esse livro introduz como descrever a estrutura de redes complexas usando estatística. Redes complexas descrevem os mais variados sistemas, como a Internet, redes sociais, cadeias alimentares e o nosso cérebro. Para quem trabalha ou está interessado em dados de redes, recomendo a leitura.

https://www.nowpublishers.com/Article/BookDetails/9781638280507
👍62
O Método de Monte Carlo é fundamental para gerarmos amostras de distribuições de probabilidade ou realizar inferência Bayesiana. Essa é uma ótima introdução a esses métodos em Python.

Monte Carlo Methods

https://people.duke.edu/~ccc14/sta-663/MonteCarlo.html

Quem quiser ver uma aula sobre esses métodos, uma opção é:

Métodos de Monte Carlo: introdução

https://www.youtube.com/watch?v=rNOe62Z3zZg&t=1s&ab_channel=FranciscoRodrigues
14
Mapa que mostra as diferentes áreas de Aprendizado de Máquina. Ótimo guia para estudo.
16
Este artigo faz uma boa revisão sobre Transformers e descreve algumas das principais arquiteturas.

Transformer models: an introduction and catalog

https://arxiv.org/abs/2302.07730
👍6
Uma das grandes barreiras para estudar Ciência de Dados é formada pela parte matemática. No entanto, não é necessário conhecer a fundo os conceitos, mas ter uma intuição e conhecer as principais ferramentas. Uma delas é cálculo diferencial e integral. Esse post mostra como ter uma boa intuição sobre derivadas e integrais no Python:

https://machinelearningmastery.com/calculus-for-machine-learning-7-day-mini-course/

Essas aulas da Univesp também permitem uma excelente introdução a esses conceitos:

https://www.youtube.com/playlist?list=PLxI8Can9yAHcXiEq9tNy7oYOMhuYYdRrP
17
A plataforma Kaggle é uma das melhores opções para se aprender e praticar Ciência de Dados. Atualmente, são disponibilizadas mais de 200k bases de dados. Recomendo ver as soluções que são apresentadas para os mais diversos problemas, desde regressão até deep learning.

https://www.kaggle.com
8👍7
A terceira versão do livro "Forecasting: Principles and Practice" está disponível. Agora com vídeos associados às aulas. Para quem programa em R, é uma ótima opção, pois os códigos estão disponíveis nessa linguagem. No entanto, mesmo para quem não programa em R, é possível acompanhar o conteúdo e fazer a implementação em Python, por exemplo.
https://otexts.com/fpp3/
9👍3💯3
Linha do tempo com a história da inteligência artificial. Muito interessante:
https://thehistoryof.ai/
👍64
Livro online bastante completo sobre deep learning: https://udlbook.github.io/udlbook/
8👍4