Machine Learning Clustering: DBSCAN Determine The Optimal Value For Epsilon (EPS) Python Example
🔗 Machine Learning Clustering: DBSCAN Determine The Optimal Value For Epsilon (EPS) Python Example
Density-Based Spatial Clustering of Applications with Noise, or DBSCAN for short, is an unsupervised machine learning algorithm…
🔗 Machine Learning Clustering: DBSCAN Determine The Optimal Value For Epsilon (EPS) Python Example
Density-Based Spatial Clustering of Applications with Noise, or DBSCAN for short, is an unsupervised machine learning algorithm…
Towards Data Science
Machine Learning Clustering: DBSCAN Determine The Optimal Value For Epsilon (EPS) Python Example
Density-Based Spatial Clustering of Applications with Noise, or DBSCAN for short, is an unsupervised machine learning algorithm…
Log Book —Guide to Excel & Outlook email Delivery Automation via Python
🔗 Log Book —Guide to Excel & Outlook email Delivery Automation via Python
This article is divided into 2 parts, first part deals with the generation of image/PDF from an excel and next part attaching the same in…
🔗 Log Book —Guide to Excel & Outlook email Delivery Automation via Python
This article is divided into 2 parts, first part deals with the generation of image/PDF from an excel and next part attaching the same in…
Towards Data Science
Log Book —Guide to Excel & Outlook email Delivery Automation via Python
This article is divided into 2 parts, first part deals with the generation of image/PDF from an excel and next part attaching the same in…
Tips, Tricks, Hacks, and Magic: How to Effortlessly Optimize Your Jupyter Notebook
🔗 Tips, Tricks, Hacks, and Magic: How to Effortlessly Optimize Your Jupyter Notebook
The complete beginner’s guide to making Jupyter Notebooks better, faster, stronger, smoother, and just plain awesome
🔗 Tips, Tricks, Hacks, and Magic: How to Effortlessly Optimize Your Jupyter Notebook
The complete beginner’s guide to making Jupyter Notebooks better, faster, stronger, smoother, and just plain awesome
Towards Data Science
Tips, Tricks, Hacks, and Magic: How to Effortlessly Optimize Your Jupyter Notebook
The complete beginner’s guide to making Jupyter Notebooks better, faster, stronger, smoother, and just plain awesome
Authors: Dmitriy Smirnov, Mikhail Bessmeltsev, Justin Solomon
Abstract : smooth shapes and, to counter the ambiguity, put manually-designed priors on the 3D shape; they also typically require clean, vectorized input. Recent approaches attempt to learn those priors from data but often produce low-quality output.
https://arxiv.org/abs/1906.12337
🔗 Deep Sketch-Based Modeling of Man-Made Shapes
Sketch-based modeling aims to model 3D geometry using a concise and easy to create---but extremely ambiguous---input: artist sketches. Most conventional sketch-based modeling systems target smooth shapes and, to counter the ambiguity, put manually-designed priors on the 3D shape; they also typically require clean, vectorized input. Recent approaches attempt to learn those priors from data but often produce low-quality output. Focusing on piecewise-smooth man-made shapes, we address these issues by presenting a deep learning-based system to infer a complete man-made 3D shape from a single bitmap sketch. Given a sketch, our system infers a set of parametric surfaces that realize the drawing in 3D. To capture the piecewise smooth geometry of man-made shapes, we learn a special shape representation---a deformable parametric template composed of Coons patches. Naively training such a system, however, would suffer from lack of data and from self-intersections of the parametric surfaces. To address this, we introduc
Abstract : smooth shapes and, to counter the ambiguity, put manually-designed priors on the 3D shape; they also typically require clean, vectorized input. Recent approaches attempt to learn those priors from data but often produce low-quality output.
https://arxiv.org/abs/1906.12337
🔗 Deep Sketch-Based Modeling of Man-Made Shapes
Sketch-based modeling aims to model 3D geometry using a concise and easy to create---but extremely ambiguous---input: artist sketches. Most conventional sketch-based modeling systems target smooth shapes and, to counter the ambiguity, put manually-designed priors on the 3D shape; they also typically require clean, vectorized input. Recent approaches attempt to learn those priors from data but often produce low-quality output. Focusing on piecewise-smooth man-made shapes, we address these issues by presenting a deep learning-based system to infer a complete man-made 3D shape from a single bitmap sketch. Given a sketch, our system infers a set of parametric surfaces that realize the drawing in 3D. To capture the piecewise smooth geometry of man-made shapes, we learn a special shape representation---a deformable parametric template composed of Coons patches. Naively training such a system, however, would suffer from lack of data and from self-intersections of the parametric surfaces. To address this, we introduc
Two Sigma: Using News to Predict Stock Movements
🔗 Two Sigma: Using News to Predict Stock Movements
Use news analytics to predict stock price performance
🔗 Two Sigma: Using News to Predict Stock Movements
Use news analytics to predict stock price performance
Kaggle
Two Sigma: Using News to Predict Stock Movements
Use news analytics to predict stock price performance
Explainability-the next frontier
🔗 Explainability-the next frontier
Why uncertainty is a feature of AI, not a bug
🔗 Explainability-the next frontier
Why uncertainty is a feature of AI, not a bug
Towards Data Science
Explainability-the next frontier
Why uncertainty is a feature of AI, not a bug
Яндекс открывает датасеты Толоки для исследователей
Толока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов оценок. Для любых исследований и экспериментов, связанных с машинным обучением, необходимы большие объёмы качественных данных. Поэтому мы начинаем публиковать открытые датасеты для академических исследований в разных предметных областях.
Сегодня мы поделимся ссылками на первые публичные датасеты и расскажем о том, как они собирались. А ещё подскажем, где же правильно ставить ударение в названии нашей платформы
https://habr.com/ru/company/yandex/blog/458326/
🔗 Яндекс открывает датасеты Толоки для исследователей
Толока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов...
Толока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов оценок. Для любых исследований и экспериментов, связанных с машинным обучением, необходимы большие объёмы качественных данных. Поэтому мы начинаем публиковать открытые датасеты для академических исследований в разных предметных областях.
Сегодня мы поделимся ссылками на первые публичные датасеты и расскажем о том, как они собирались. А ещё подскажем, где же правильно ставить ударение в названии нашей платформы
https://habr.com/ru/company/yandex/blog/458326/
🔗 Яндекс открывает датасеты Толоки для исследователей
Толока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов...
Хабр
Яндекс открывает датасеты Толоки для исследователей
Толока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов...
max-andr/provably-robust-boosting
🔗 max-andr/provably-robust-boosting
Provably Robust Boosted Decision Stumps and Trees against Adversarial Attacks [preprint, June 2019] - max-andr/provably-robust-boosting
🔗 max-andr/provably-robust-boosting
Provably Robust Boosted Decision Stumps and Trees against Adversarial Attacks [preprint, June 2019] - max-andr/provably-robust-boosting
GitHub
GitHub - max-andr/provably-robust-boosting: Provably Robust Boosted Decision Stumps and Trees against Adversarial Attacks [NeurIPS…
Provably Robust Boosted Decision Stumps and Trees against Adversarial Attacks [NeurIPS 2019] - max-andr/provably-robust-boosting
Linear Algebra. Polynoms. Interpolation. Least squares
🔗 Linear Algebra. Polynoms. Interpolation. Least squares
In this part of lectures we will talk about simplest “ml models” — polynoms.
🔗 Linear Algebra. Polynoms. Interpolation. Least squares
In this part of lectures we will talk about simplest “ml models” — polynoms.
Medium
Linear Algebra. Polynoms. Interpolation. Least squares
In this part of lectures we will talk about simplest “ml models” — polynoms.
TJBOT как иллюстрация IBM Watson services
#Машинноеобучение,
Весной 2019 года прошел очередной Think Developers Workshop, на котором все желающие могли собрать картонного робота TJBota под управлением IBM Watson Services. Под катом находится подробная инструкция, из чего и как собрать такого робота, полезные ссылки и простейшие рецепты, демонстрирующие некоторые когнитивные возможности сервисов Watson, а также небольшой анонс двух июльских семинаров о Watson Services в московском офисе IBM.
https://habr.com/ru/company/ibm/blog/458374/
🔗 TJBOT как иллюстрация IBM Watson services
Привет, Хабр! Весной 2019 года прошел очередной Think Developers Workshop, на котором все желающие могли собрать картонного робота TJBota под управлением IBM Wat...
#Машинноеобучение,
Весной 2019 года прошел очередной Think Developers Workshop, на котором все желающие могли собрать картонного робота TJBota под управлением IBM Watson Services. Под катом находится подробная инструкция, из чего и как собрать такого робота, полезные ссылки и простейшие рецепты, демонстрирующие некоторые когнитивные возможности сервисов Watson, а также небольшой анонс двух июльских семинаров о Watson Services в московском офисе IBM.
https://habr.com/ru/company/ibm/blog/458374/
🔗 TJBOT как иллюстрация IBM Watson services
Привет, Хабр! Весной 2019 года прошел очередной Think Developers Workshop, на котором все желающие могли собрать картонного робота TJBota под управлением IBM Wat...
Хабр
TJBOT как иллюстрация IBM Watson services
Привет, Хабр! Весной 2019 года прошел очередной Think Developers Workshop, на котором все желающие могли собрать картонного робота TJBota под управлением IBM Watson Services. Под катом находится...
How to Develop a GAN for Generating Small Color Photographs of Objects
https://machinelearningmastery.com/how-to-develop-a-generative-adversarial-network-for-a-cifar-10-small-object-photographs-from-scratch/
🔗 How to Develop a GAN for Generating Small Color Photographs of Objects
Generative Adversarial Networks, or GANs, are an architecture for training generative models, such as deep convolutional neural networks for generating images. Developing a GAN for generating images requires both a discriminator convolutional neural network model for classifying whether a given image is real or generated and a generator model that uses inverse convolutional layers to …
https://machinelearningmastery.com/how-to-develop-a-generative-adversarial-network-for-a-cifar-10-small-object-photographs-from-scratch/
🔗 How to Develop a GAN for Generating Small Color Photographs of Objects
Generative Adversarial Networks, or GANs, are an architecture for training generative models, such as deep convolutional neural networks for generating images. Developing a GAN for generating images requires both a discriminator convolutional neural network model for classifying whether a given image is real or generated and a generator model that uses inverse convolutional layers to …
AI Differential Privacy and Federated Learning
🔗 AI Differential Privacy and Federated Learning
Use of Artificial Intelligence on users sensitive data has recently raised many concerns. Different solutions are now being investigated.
🔗 AI Differential Privacy and Federated Learning
Use of Artificial Intelligence on users sensitive data has recently raised many concerns. Different solutions are now being investigated.
Towards Data Science
AI Differential Privacy and Federated Learning
Use of Artificial Intelligence on users sensitive data has recently raised many concerns. Different solutions are now being investigated.
Press Coverage of the early 2020 Primary
🔗 Press Coverage of the early 2020 Primary
Observations of the early press coverage in the 2020 Democratic presidential primary race
🔗 Press Coverage of the early 2020 Primary
Observations of the early press coverage in the 2020 Democratic presidential primary race
Towards Data Science
Press Coverage of the Early 2020 Primary
Observations of the early press coverage in the 2020 Democratic presidential primary race
Опыт разработки требований к профессиональным качествам data scientist
Сегодня практически любой бизнес ощущает потребность в исследовании данных. Data science не воспринимается как нечто новое. Тем не менее, не для всех очевидно, каким должен быть нанимаемый специалист.
Данная статья написана не HR-специалистом, а дата сайнтистом, поэтому стилистика изложения весьма специфична, но в этом есть и преимущество – это взгляд изнутри, позволяющий понять, какие качества data scientist являются необходимыми для профессии, для того, чтобы компания могла положиться на такого человека.
Пролог
Пришло время, когда data science стартап вырос из пеленок — число задач для анализа возросло с непредвиденной скоростью, и эта скорость сразу же перестала компенсироваться автоматизацией. Стало очевидно, что нужны новые мозги в команду…
Как мне сначала казалось, человек требовался вполне определенный: всего лишь обычный дата-что-то-там… программист, аналитик, статистик. Так в чем же сложность составить список требований?
“В инженерном деле, если не знаете, что делаете — не стоит этого делать.”
Ричард Хэмминг
Подошел я к делу как обычно. Достал два листа бумаги. Один озаглавил «Технические навыки», другой — «Профессиональные качества». После этого возникло желание полезть на какой-нибудь ресурс, найти там пачку резюме, выписать списки качеств, выбрать те, что понравятся. Но что-то меня остановило. “Это не мой способ, — сказал я себе. — Я в этом не разбираюсь. Я разбираюсь в задачах..”
https://habr.com/ru/post/457630/
🔗 Опыт разработки требований к профессиональным качествам data scientist
Сегодня практически любой бизнес ощущает потребность в исследовании данных. Data science не воспринимается как нечто новое. Тем не менее, не для всех очевидно, к...
Сегодня практически любой бизнес ощущает потребность в исследовании данных. Data science не воспринимается как нечто новое. Тем не менее, не для всех очевидно, каким должен быть нанимаемый специалист.
Данная статья написана не HR-специалистом, а дата сайнтистом, поэтому стилистика изложения весьма специфична, но в этом есть и преимущество – это взгляд изнутри, позволяющий понять, какие качества data scientist являются необходимыми для профессии, для того, чтобы компания могла положиться на такого человека.
Пролог
Пришло время, когда data science стартап вырос из пеленок — число задач для анализа возросло с непредвиденной скоростью, и эта скорость сразу же перестала компенсироваться автоматизацией. Стало очевидно, что нужны новые мозги в команду…
Как мне сначала казалось, человек требовался вполне определенный: всего лишь обычный дата-что-то-там… программист, аналитик, статистик. Так в чем же сложность составить список требований?
“В инженерном деле, если не знаете, что делаете — не стоит этого делать.”
Ричард Хэмминг
Подошел я к делу как обычно. Достал два листа бумаги. Один озаглавил «Технические навыки», другой — «Профессиональные качества». После этого возникло желание полезть на какой-нибудь ресурс, найти там пачку резюме, выписать списки качеств, выбрать те, что понравятся. Но что-то меня остановило. “Это не мой способ, — сказал я себе. — Я в этом не разбираюсь. Я разбираюсь в задачах..”
https://habr.com/ru/post/457630/
🔗 Опыт разработки требований к профессиональным качествам data scientist
Сегодня практически любой бизнес ощущает потребность в исследовании данных. Data science не воспринимается как нечто новое. Тем не менее, не для всех очевидно, к...
Хабр
Опыт разработки требований к профессиональным качествам data scientist
Сегодня практически любой бизнес ощущает потребность в исследовании данных. Data science не воспринимается как нечто новое. Тем не менее, не для всех очевидно, к...
Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear B
https://arxiv.org/abs/1906.06718
🔗 Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear B
In this paper we propose a novel neural approach for automatic decipherment of lost languages. To compensate for the lack of strong supervision signal, our model design is informed by patterns in language change documented in historical linguistics. The model utilizes an expressive sequence-to-sequence model to capture character-level correspondences between cognates. To effectively train the model in an unsupervised manner, we innovate the training procedure by formalizing it as a minimum-cost flow problem. When applied to the decipherment of Ugaritic, we achieve a 5.5% absolute improvement over state-of-the-art results. We also report the first automatic results in deciphering Linear B, a syllabic language related to ancient Greek, where our model correctly translates 67.3% of cognates.
https://arxiv.org/abs/1906.06718
🔗 Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear B
In this paper we propose a novel neural approach for automatic decipherment of lost languages. To compensate for the lack of strong supervision signal, our model design is informed by patterns in language change documented in historical linguistics. The model utilizes an expressive sequence-to-sequence model to capture character-level correspondences between cognates. To effectively train the model in an unsupervised manner, we innovate the training procedure by formalizing it as a minimum-cost flow problem. When applied to the decipherment of Ugaritic, we achieve a 5.5% absolute improvement over state-of-the-art results. We also report the first automatic results in deciphering Linear B, a syllabic language related to ancient Greek, where our model correctly translates 67.3% of cognates.
arXiv.org
Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear B
In this paper we propose a novel neural approach for automatic decipherment of lost languages. To compensate for the lack of strong supervision signal, our model design is informed by patterns in...
New version of our open STT dataset - 0.5, now in beta
https://github.com/snakers4/open_stt/releases/tag/v0.5-beta
🔗 snakers4/open_stt
Russian open STT dataset. Contribute to snakers4/open_stt development by creating an account on GitHub.
https://github.com/snakers4/open_stt/releases/tag/v0.5-beta
🔗 snakers4/open_stt
Russian open STT dataset. Contribute to snakers4/open_stt development by creating an account on GitHub.
GitHub
Release New major release - radio / youtube / data quality distillation · snakers4/open_stt
TLDR:
855 GB (in .wav format in int16) non archived;
(new!) A new domain - radio;
(new!) A larger YouTube dataset with 1000+ additional hours;
(new!) A small (300 hours) YouTube dataset downloaded...
855 GB (in .wav format in int16) non archived;
(new!) A new domain - radio;
(new!) A larger YouTube dataset with 1000+ additional hours;
(new!) A small (300 hours) YouTube dataset downloaded...
Deploying Models to Flask
🔗 Deploying Models to Flask
A walk-through on how to deploy machine learning models for user interaction using Python and Flask
🔗 Deploying Models to Flask
A walk-through on how to deploy machine learning models for user interaction using Python and Flask
Towards Data Science
Deploying Models to Flask
A walk-through on how to deploy machine learning models for user interaction using Python and Flask
Deep (Learning+Random) Forest и разбор статей
Конференции
Продолжаем рассказывать про конференцию по статистике и машинному обучению AISTATS 2019. В этом посте разберем статьи про глубокие модели из ансамблей деревьев, mix регуляризацию для сильно разреженных данных и эффективную по времени аппроксимацию кросс-валидации.
https://habr.com/ru/company/ru_mts/blog/458388/
🔗 Deep (Learning+Random) Forest и разбор статей
Продолжаем рассказывать про конференцию по статистике и машинному обучению AISTATS 2019. В этом посте разберем статьи про глубокие модели из ансамблей деревьев,...
Конференции
Продолжаем рассказывать про конференцию по статистике и машинному обучению AISTATS 2019. В этом посте разберем статьи про глубокие модели из ансамблей деревьев, mix регуляризацию для сильно разреженных данных и эффективную по времени аппроксимацию кросс-валидации.
https://habr.com/ru/company/ru_mts/blog/458388/
🔗 Deep (Learning+Random) Forest и разбор статей
Продолжаем рассказывать про конференцию по статистике и машинному обучению AISTATS 2019. В этом посте разберем статьи про глубокие модели из ансамблей деревьев,...
Хабр
Deep (Learning+Random) Forest и разбор статей
Продолжаем рассказывать про конференцию по статистике и машинному обучению AISTATS 2019. В этом посте разберем статьи про глубокие модели из ансамблей деревьев, mix регуляризацию для сильно...
AI, Truth, and Society: Deepfakes at the front of the Technological Cold War
🔗 AI, Truth, and Society: Deepfakes at the front of the Technological Cold War
Developments, implications, and strategies
🔗 AI, Truth, and Society: Deepfakes at the front of the Technological Cold War
Developments, implications, and strategies
Medium
AI, Truth, and Society: Deepfakes at the front of the Technological Cold War
Developments, implications, and strategies