O Método de Monte Carlo é fundamental para gerarmos amostras de distribuições de probabilidade ou realizar inferência Bayesiana. Essa é uma ótima introdução a esses métodos em Python.
Monte Carlo Methods
https://people.duke.edu/~ccc14/sta-663/MonteCarlo.html
Quem quiser ver uma aula sobre esses métodos, uma opção é:
Métodos de Monte Carlo: introdução
https://www.youtube.com/watch?v=rNOe62Z3zZg&t=1s&ab_channel=FranciscoRodrigues
Monte Carlo Methods
https://people.duke.edu/~ccc14/sta-663/MonteCarlo.html
Quem quiser ver uma aula sobre esses métodos, uma opção é:
Métodos de Monte Carlo: introdução
https://www.youtube.com/watch?v=rNOe62Z3zZg&t=1s&ab_channel=FranciscoRodrigues
YouTube
Métodos de Monte Carlo: introdução
Nessa aula apresentamos alguns métodos de Monte Carlo. Mostramos como gerar números pseudo-aleatórios no computador e mostramos como simular alguns experimentos, inclusive como calcular o valor de pi usando número aleatórios.
Código em Python:
https://g…
Código em Python:
https://g…
❤14
Material muito bom sobre aprendizado de máquina, com videos e notebooks: https://github.com/trekhleb/homemade-machine-learning
GitHub
GitHub - trekhleb/homemade-machine-learning: 🤖 Python examples of popular machine learning algorithms with interactive Jupyter…
🤖 Python examples of popular machine learning algorithms with interactive Jupyter demos and math being explained - trekhleb/homemade-machine-learning
❤8👏8
Este artigo faz uma boa revisão sobre Transformers e descreve algumas das principais arquiteturas.
Transformer models: an introduction and catalog
https://arxiv.org/abs/2302.07730
Transformer models: an introduction and catalog
https://arxiv.org/abs/2302.07730
👍6
Uma das grandes barreiras para estudar Ciência de Dados é formada pela parte matemática. No entanto, não é necessário conhecer a fundo os conceitos, mas ter uma intuição e conhecer as principais ferramentas. Uma delas é cálculo diferencial e integral. Esse post mostra como ter uma boa intuição sobre derivadas e integrais no Python:
https://machinelearningmastery.com/calculus-for-machine-learning-7-day-mini-course/
Essas aulas da Univesp também permitem uma excelente introdução a esses conceitos:
https://www.youtube.com/playlist?list=PLxI8Can9yAHcXiEq9tNy7oYOMhuYYdRrP
https://machinelearningmastery.com/calculus-for-machine-learning-7-day-mini-course/
Essas aulas da Univesp também permitem uma excelente introdução a esses conceitos:
https://www.youtube.com/playlist?list=PLxI8Can9yAHcXiEq9tNy7oYOMhuYYdRrP
❤17
A plataforma Kaggle é uma das melhores opções para se aprender e praticar Ciência de Dados. Atualmente, são disponibilizadas mais de 200k bases de dados. Recomendo ver as soluções que são apresentadas para os mais diversos problemas, desde regressão até deep learning.
https://www.kaggle.com
https://www.kaggle.com
❤8👍7
A terceira versão do livro "Forecasting: Principles and Practice" está disponível. Agora com vídeos associados às aulas. Para quem programa em R, é uma ótima opção, pois os códigos estão disponíveis nessa linguagem. No entanto, mesmo para quem não programa em R, é possível acompanhar o conteúdo e fazer a implementação em Python, por exemplo.
https://otexts.com/fpp3/
https://otexts.com/fpp3/
Otexts
Forecasting: Principles and Practice (3rd ed)
3rd edition
❤9👍3💯3
Linha do tempo com a história da inteligência artificial. Muito interessante:
https://thehistoryof.ai/
https://thehistoryof.ai/
👍6❤4
Inteligência artificial no prograrama Last Week Tonight. É possível colocar tradução automática, que gera legendas em Português. Muito engraçado! 😁
https://www.youtube.com/watch?v=Sqa8Zo2XWc4&ab_channel=LastWeekTonight
https://www.youtube.com/watch?v=Sqa8Zo2XWc4&ab_channel=LastWeekTonight
YouTube
Artificial Intelligence: Last Week Tonight with John Oliver (HBO)
Artificial intelligence is increasingly becoming part of our lives, from self-driving cars to ChatGPT. John Oliver discusses how AI works, where it might be heading next, and, of course, why it hates the bus.
Connect with Last Week Tonight online...
Subscribe…
Connect with Last Week Tonight online...
Subscribe…
👍4
Aprendizado por reforço é uma área fundamental da Ciência de Dados e vem guiando muitos dos algoritmos mais modernos. Esse livro é uma ótima referência sobre o assunto. Está disponível em pdf online: http://incompleteideas.net/book/the-book.html
❤12👏3👍2
ICTP-SAIFR_APS.pdf
335.6 KB
Evento gratuito e online para quem tiver interesse em sistemas complexos.
March 21: 19:00-21:00 (online) Network Dynamics and Synchronization
https://www.ictp-saifr.org/apsmarch23/
March 21: 19:00-21:00 (online) Network Dynamics and Synchronization
https://www.ictp-saifr.org/apsmarch23/
👏3
O raciocínio Bayesiano é fundamental em Ciência de Dados. No entanto, estudar livros de estatística, sobre inferência Bayesiana, pode ser bastante desencorajador. O ideal é sempre considerar livros que apresentem o raciocínio Bayesiano, mas com ênfase nas tarefas de classificação ou regressão. Após esse primeiro contato, o leitor pode sempre recorrer os livros mais específicos, mas é sempre bom começar com algo aplicado. Esse livro, disponível online é uma ótima referência para estudar métodos Bayesianos baseados em grafos.
http://web4.cs.ucl.ac.uk/staff/D.Barber/pmwiki/pmwiki.php?n=Brml.Online
http://web4.cs.ucl.ac.uk/staff/D.Barber/pmwiki/pmwiki.php?n=Brml.Online
👏12👍6
Predição de séries temporais é uma área extremamente importante de Ciência de Dados. No entanto, encontrar material de qualidade na internet não é fácil. Essa é uma excelente aula que mostra como usar o método XGBoost para predizer séries temporais. É possível colocar a legenda em Português.
https://www.youtube.com/watch?v=vV12dGe_Fho&list=PL7f0Gy2DLA9kR-Gl32DOjSZ2qIoaHNknP&index=111&t=305s&ab_channel=RobMulla
https://www.youtube.com/watch?v=vV12dGe_Fho&list=PL7f0Gy2DLA9kR-Gl32DOjSZ2qIoaHNknP&index=111&t=305s&ab_channel=RobMulla
YouTube
Time Series Forecasting with XGBoost - Use python and machine learning to predict energy consumption
In this video tutorial we walk through a time series forecasting example in python using a machine learning model XGBoost to predict energy consumption with python. We walk through this project in a kaggle notebook (linke below) that you can copy and explore…
❤9👍1
2108.02497.pdf
1.9 MB
Erros em Ciência de Dados podem comprometer os resultados e inviabilizar projetos. Nesse artigo são descritos os principais erros que podem ser cometidos na análise de dados. São descritas cinco fases do processo de aprendizagem da máquina: o que fazer antes da construção de modelos, como construir modelos de forma confiável, como avaliar robustamente modelos, como comparar modelos de forma justa, e como publicar os resultados.
How to avoid machine learning pitfalls: a guide for academic researchers
Link: https://arxiv.org/abs/2108.02497
How to avoid machine learning pitfalls: a guide for academic researchers
Link: https://arxiv.org/abs/2108.02497
❤13👏1
Feliz dia Internacional das Mulheres! 👏 🥂
Para comemorar, um livro sobre cientistas (pdf gratuito):
https://www.uclpress.co.uk/products/211143
Para comemorar, um livro sobre cientistas (pdf gratuito):
https://www.uclpress.co.uk/products/211143
UCL Press
Women in the History of Science - UCL Press
Women in the History of Science brings together primary sources that highlight women’s involvement in scientific knowledge production around the world. Drawing on texts, images and objects, each primary source is accompanied by an explanatory text, questions…
❤11👍2
Para quem trabalha com dados urbanos, esse é um excelente livro. É possível não apenas estudar o conteúdo, mas também reproduzir os códigos desenvolvidos na linguagem R:
https://ipeagit.github.io/intro_access_book/en/index.en.html
https://ipeagit.github.io/intro_access_book/en/index.en.html
👍6❤2
Para quem tem interesse em Bioinformática, essa é uma excelente sequência de vídeos. Um curso completo que ensina a usar as principais ferramentas, como a BLAST. Alguns exemplos estão em Python:
Introductory Bioinformatics
https://www.youtube.com/playlist?list=PLRbOsyrFi8C4ZKSPRuL9DnCw-xuQlyVXz
Introductory Bioinformatics
https://www.youtube.com/playlist?list=PLRbOsyrFi8C4ZKSPRuL9DnCw-xuQlyVXz
❤14
s43586-022-00184-w.pdf
3.5 MB
Análise dos componentes principais (PCA) é uma das principais técnicas para redução de dimensionalidade em Ciência de Dados. Essa técnica permite-nos projetar os dados em um espaço de menor dimensão, onde o primeiro eixo é o de maior variação nos dados, o segundo é o segundo de maior variação perpendicular ao primeiro e assim sucessivamente. O resultado da projeção é um conjunto de dados onde os atributos são não-correlacionados (não independentes!). Essa é uma excelente revisão e tutorial sobre PCA.
❤6👍1
3447755.pdf
1.8 MB
Essa é outra excelente revisão e tutorial sobre PCA.
https://dl.acm.org/doi/abs/10.1145/3447755?casa_token=NAMiHH34-KMAAAAA:FT1-8KdxXjzQhsK_SYbFNE62c712wtrkyiUHfMDNGi1JMCSsfTxlI_4Jt_afGFJ8SJhZRUHIZmXm3g
https://dl.acm.org/doi/abs/10.1145/3447755?casa_token=NAMiHH34-KMAAAAA:FT1-8KdxXjzQhsK_SYbFNE62c712wtrkyiUHfMDNGi1JMCSsfTxlI_4Jt_afGFJ8SJhZRUHIZmXm3g
❤8