Ciência de Dados Complexos
4.7K subscribers
223 photos
118 files
1.16K links
Canal sobre Ciência de Dados e IA, onde divulgamos livros, tutoriais, cursos, palestras e muito mais. Tudo gratuito. Gerenciado pelo prof. Francisco Rodrigues (USP). Aulas online sobre Estatística e CD no Youtube: https://youtube.com/franciscorodrigues
Download Telegram
O método da máxima verossimilhança é um dos mais importantes em inferência estatística. Esse artigo aborda esse método e sua história. Para quem está interessando em aprender os fundamentos de como inferir os parâmetros de uma população, sugiro a leitura:

The Epic Story of Maximum Likelihood
https://twitter.com/docmilanfar/status/1620292922313945089
8👍4
Texto interessante sobre o Teorema Central do Limite, extraída do livro de Sheldon Ross.
👍117
Algumas funções de ativação usadas em redes neurais.
👍131
Para quem prefere usar a linguagem R, esse livro disponível online é bastante completo
Hands-On Machine Learning with R

https://bradleyboehmke.github.io/HOML/
10
Excelente livro sobre inferência Bayesiana disponível online:

http://www.stat.columbia.edu/~gelman/book/
12👍3
Pessoal, estamos próximos de 10k inscritos. Em breve deve sair novos vídeos. Se inscrevam e compartilhem o conhecimento: https://www.youtube.com/franciscorodrigues
👏141👍1
A base Datasaurus Dozen é uma base muito interessante, pois os dados apresentam a mesma média, correlação e variância, mas quando mostramos os pontos em um scatterplot, vemos que os dados são muito diferentes. Por isso, é fundamental usarmos medidas adicionais para descrever os dados, tais como curtose, entropia de Shannon.

https://www.autodesk.com/research/publications/same-stats-different-graphs
👍113😱2👏1
Livro disponível online. Esse livro introduz como descrever a estrutura de redes complexas usando estatística. Redes complexas descrevem os mais variados sistemas, como a Internet, redes sociais, cadeias alimentares e o nosso cérebro. Para quem trabalha ou está interessado em dados de redes, recomendo a leitura.

https://www.nowpublishers.com/Article/BookDetails/9781638280507
👍62
O Método de Monte Carlo é fundamental para gerarmos amostras de distribuições de probabilidade ou realizar inferência Bayesiana. Essa é uma ótima introdução a esses métodos em Python.

Monte Carlo Methods

https://people.duke.edu/~ccc14/sta-663/MonteCarlo.html

Quem quiser ver uma aula sobre esses métodos, uma opção é:

Métodos de Monte Carlo: introdução

https://www.youtube.com/watch?v=rNOe62Z3zZg&t=1s&ab_channel=FranciscoRodrigues
14
Mapa que mostra as diferentes áreas de Aprendizado de Máquina. Ótimo guia para estudo.
16
Este artigo faz uma boa revisão sobre Transformers e descreve algumas das principais arquiteturas.

Transformer models: an introduction and catalog

https://arxiv.org/abs/2302.07730
👍6
Uma das grandes barreiras para estudar Ciência de Dados é formada pela parte matemática. No entanto, não é necessário conhecer a fundo os conceitos, mas ter uma intuição e conhecer as principais ferramentas. Uma delas é cálculo diferencial e integral. Esse post mostra como ter uma boa intuição sobre derivadas e integrais no Python:

https://machinelearningmastery.com/calculus-for-machine-learning-7-day-mini-course/

Essas aulas da Univesp também permitem uma excelente introdução a esses conceitos:

https://www.youtube.com/playlist?list=PLxI8Can9yAHcXiEq9tNy7oYOMhuYYdRrP
17