Pizza de Dados
750 members
1 photo
23 links
Notícias do primeiro e mais querido podcast sobre ciência de dados do Brasil!
Download Telegram
to view and join the conversation
Um tutorial todo fofo pra aprender a usar biopython pra desvendar a genética! Pra quem nuns ouviu falar disso, vale a pena dar uma olhada pra ver como funciona parte do trabalho da galera de bioinformática 😉

https://www.floripacodegurus.com.br/tutoriais/bio_001.html
Pizza de Dados
Photo
Ontem usamos pela primeira vez os microfones que compramos com os apoios que recebemos!! Todos vocês ajudam o Pizza a ser cada vez melhor 😍😍 Também queremos agradecer o Data Bootcamp que é nosso parceiro de longa data e acredita no nosso trabalho!!
Mandaram aqui pra gente o link pro Grupo Jupyter LatAm aqui no telegram! https://t.me/jupyter_latam

Ótima oportunidade de conhecer mais gente que ama Jupyter.
Desparramen la info 😉
Gracias!
A British Airways pode receber uma multa de £183.000 por vazamento de dados de cerca de 500 mil consumidores. A companhia tem ainda 28 dias para recorrer da decisão.

https://www.theverge.com/2019/7/8/20685830/british-airways-data-breach-fine-information-commissioners-office-gdpr
Dica do Diogo Munaro:
O Instituto de Pesquisa em Inteligência Artificial de Berkley lançou um novo framework para Data Augmentation que chega a ser 1000x mais rápidos que os algoritmos atuais.

Data Augmentation é uma estratégia para aumentar a quantidade de dados em um conjunto de dados (dataset) gerando novos dados a partir de dados antigos. Isso é especialmente útil em análise de imagens.

https://bair.berkeley.edu/blog/2019/06/07/data_aug/
Tem episódio novo no ar!!!

Ciência de dados aplicada à saúde? Tem sim, senhora! Chamamos a bioinformata Thais Sarraf Sabedot, pesquisadora do Hospital Henry Ford, para falar sobre ciência de dados na detecção e tratamento de câncer de cérebro… e com R! Sim! Finalmente!

https://podcast.pizzadedados.com/e/episodio-023
GENTE PARA TUDO! Ultrapassamos 12 mil downloads no último mês! Essa pizza está gigantescaaaaaa!

Muito obrigada por todo amor e carinho de quem nos acompanha! É uma honra fazer parte do dia a dia (ou mês a mês) de vocês! Amamos vocês!

😘😘😘😘😘😘
New Horizons for a Data-Driven Economy https://amzn.to/308j82h (de R$ 219,93 por R$ 0,00)

Big Data in Context https://amzn.to/2FN4Dt4 (de R$ 78,02 por R$ 0,00)

Efficient Learning Machines https://amzn.to/2Xk89WI (de R$ 153,91 por R$ 0,00)

Programming for Computations - MATLAB/Octave https://amzn.to/2J5f90D (de R$ 219,93 por R$ 0,00)

Programming for Computations - Python https://amzn.to/2ROZCVq (de R$ 219,93 por R$ 0,00)
Pessoal! Dica quentinha direto do Data Bootcamp e pra quem gosta de sistema de recomendação.

O paper "Are We Really Making Much Progress? A Worrying Analysis ofRecent Neural Recommendation Approaches" refuta a reprodutibilidade de vários papers que saíram nos últimos anos (RecSys, KDD, WWW e SIGIR)

Esses papers refutados, além de serem difíceis de reproduzir, tiveram desempenho comparáveis a baselines mais simples (Most Popular, ItemKNN, etc.) quando aplicados a outros datasets.

Quem tiver mais interesse o link para o artigo:
https://arxiv.org/pdf/1907.06902.pdf e mais informações serão apresentadas na RecSys em Setembro: https://recsys.acm.org/
Aproveitando o gancho do último episódio: a Fundação Chan Zuckerberg está com inscrições abertas para projetos de software de código aberto que são essenciais para a pesquisa biomédica conseguirem uma bolsa de pesquisa. Os candidatos podem solicitar financiamento entre $ 50k e $ 250k por um ano!

https://chanzuckerberg.com/rfa/essential-open-source-software-for-science/
Pra galera que quer saber mais de R da uma chegada no blog do RLadies BH que tá muito massa!

https://medium.com/rladiesbh
Mais uma dica incrível do Data Bootcamp!

O Paco Nathan, um dos grandes evangelistas de Data Science (diretor da O'reilly e ex-Databricks), fez uma apresentação incrível sobre passado e futuro do AI.

Vale a pena conferir!

Link para a palestra:
https://www.youtube.com/watch?v=dwvbKzdq1NI

Link para os slides:
https://drive.google.com/file/d/1M6WGW2aUT4E-T9AFqcXti0H0iaOjgwaH/view
A Natáliza Mazzote da Escola de Dados traduziu para português o texto da Andrea Jones-Rooy, professora de Ciência de Dados na NYU sobre cetismo em relação a dados. O título, em português, é Sou uma cientista de dados cética quanto aos dados.

O texto fala sobre os tipos de erros que os dados podem conter e como nós, como cientistas de dados, não podemos nos esquecer desses erros, mas ao mesmo tempo não podemos deixar de usar dados para embasar nossas decisões.

https://escoladedados.org/2019/08/sou-uma-cientista-de-dados-cetica-quanto-aos-dados/
gente, passando aqui pra reforçar e fazer aquela última chamada: amanhã é o último dia pra submeter atividades pro coda deste ano, vamos construir essa programação juntas! mandem propostas, vamos analisar com carinho, levando em conta a diversidade de temas, gênero, raça, backgrounds de palestrantes e claro, a qualidade da proposta. E eu sugiro que vcs mandem temas do cotidiano mesmo, tem coisas que podem ser muito simples pra gente, mas não são pra grande maioria. Bora que eu to na missão de uma programação 50/50 em gênero. https://coda.escoladedados.org/ :) https://docs.google.com/forms/d/e/1FAIpQLScwK543RzxXib_yWoeuO9DnJPp5-6BkK36cfk7WNSbkAHsHsA/viewform
Quer saber sobre as regras que o Google definiu como boas práticas para produtos de machine learning (aprendizado de máquina)? Da uma conferida nesse Tweet do Diogo Munaro do Data Bootcamp! https://twitter.com/diogomvieira/status/1171779190699548674