Neural Networks | Нейронные сети
11.9K subscribers
755 photos
163 videos
170 files
9.41K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
​Обфускация данных для тестов производительности

Пользователи ClickHouse знают, что его главное преимущество — высокая скорость обработки аналитических запросов. Но как мы можем выдвигать такие утверждения? Это должно подтверждаться тестами производительности, которым можно доверять. О них мы сегодня и поговорим.

Такие тесты мы начали проводить в 2013 году, задолго до того, как продукт стал доступным в опенсорсе. Как и сейчас, тогда нас больше всего интересовала скорость работы данных сервиса Яндекс.Метрика. Мы уже хранили данные в ClickHouse с января 2009 года. Часть данных записывалась в базу с 2012 года, а часть — была переконвертирована из OLAPServer и Metrage — структур данных, которые использовались в Яндекс.Метрике раньше. Поэтому для тестов мы взяли первое попавшееся подмножество из 1 миллиарда данных о просмотрах страниц. Запросов в Метрике ещё не было, и мы придумали запросы, больше всего интересные нам самим (всевозможные виды фильтрации, агрегации и сортировки).

ClickHouse тестировался в сравнении с похожими системами, например, Vertica и MonetDB. Для честности тестирования его проводил сотрудник, который до этого не был разработчиком ClickHouse, а частные случаи в коде не оптимизировались до получения результатов. Похожим образом мы получили набор данных и для функциональных тестов.

После того, как ClickHouse вышел в опенсорс в 2016 году, к тестам стало больше вопросов.
https://habr.com/ru/company/yandex/blog/457354/

🔗 Обфускация данных для тестов производительности
Пользователи ClickHouse знают, что его главное преимущество — высокая скорость обработки аналитических запросов. Но как мы можем выдвигать такие утверждения? Это...
​Вакансия: Data Scientist в команду Financial Crime Russia
Компания: Revolut Россия
Город: Москва
Вилка: гибкая, по результатам собеседования, компенсация кэш + опционы

О компании: Мы одна из самый быстрорастущих финтех компаний в мире (https://www.revolut.com/), по сути строим глобальный онлайн-банк без границ. Уже работаем на территории всего Евросоюза и Австралии. Недавно пробили 5 млн пользователей по миру. В планах на этот год запуск в России, США, Канаде, Сингапуре и Японии.
Что делать: Под запуск в России набираем выделенную команду Financial Crime - разработка моделей для выявления сомнительных финансовых операций, анализ изображений ID документов на подделки и много другого очень интересного. Много инструментов уже разработаны на глобальном уровне, нужна будет адаптация и развертывание в российском бэке + написание специфичных моделей под Россию.

Формальное описание вакансии тут:
https://www.revolut.com/careers/location/moscow#data-scientist-f5b9776f-5975-42a1-b8ba-787c27ff2843

🔗 Your Digital Banking Alternative | Revolut
A world beyond banking - a secure, mobile-based current account that allows you to hold, exchange and transfer without fees in 29 different currencies.
🎥 Что такое bias-variance tradeoff? Погружение в свёрточные нейронные сети. Часть 5.
👁 2 раз 850 сек.
Введение в свёрточные нейронные сети (Convolutional Neural Networks)

Вводная часть к 5 главе курса.

- Что такое bias?
- Что такое variance?
- Что такое bias-variance tradeoff?
- 4 этапа "развития" обучающей модели (от необученной модели до переобученной)
- Почем именно компромисс и между чем?
- Что занимает 90% времени специалиста по машинному обучению?

💡 Меня интересуют следующие темы, а значит про них ты здесь и найдёшь больше всего информации:
- Технологии (разработка, программное обеспечение, МЛ,
🎥 Hidde Hovenkamp: SHAP and Beyond | PyData Amsterdam 2019
👁 1 раз 1905 сек.
Single-image super-resolution (ISR) addresses the problem of reconstructing high-resolution images given their low-resolution (LR) counterparts. ISR finds use in various computer vision applications: from security and surveillance imaging, satellite imaging, medical imaging to object recognition. This ill-posed problem has multiple solutions for any LR input. Deep learning approaches, specifically convolutional neural networks (CNN) have proven to be able to achieve better results than the classic interpola
🎥 Sebenz.ai: Alex Conway | PyData Amsterdam 2019
👁 1 раз 1349 сек.
Sebenza means "work" in isiXhosa and isiZulu, two popular languages in South Africa. Our mission is to create 1 million jobs in Africa. There is 28% unemployment in South Africa right now. Most of those people have a smartphone and they all have free time.

Sebenz.ai has 2 parts: 1. A machine learning (ML) labeling game that creates jobs for people in Africa who earn money on their phones by labeling training data for ML models 2. An interface where customers upload their own unlabelled data and we train a
​Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение

Представляю вашему вниманию перевод статьи «Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение» о том, как искусственный интеллект применяется для создания музыки. Автор не использует нейронные сети для генерации музыки, а подходит к задаче, исходя из знания теории музыки, на основе мелодии и гармонии. Другой особенностью статьи является метод сравнения музыкальных произведений на основе матриц самоподобия. Такой подход, конечно, не является исчерпывающим, но он полезен как промежуточный шаг для генерации качественной музыки методами машинного обучения.
https://habr.com/ru/company/lanit/blog/455742/

🔗 Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение
Представляю вашему вниманию перевод статьи «Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение» о том, как искусственный интелл...
Нейронные сети

Наш телеграм канал - tglink.me/ai_machinelearning_big_data
Нейронные сети 1 Введение
Нейронные сети 2 Немного биологии
Нейронные сети 3 В целом об искусственной нейронной сети 1
Нейронные сети 4 Искусственный нейрон
Нейронные сети 5 Структура нейронной сети
Нейронные сети 6 Нюансы работы нейронной сети
Нейронные сети 7 Обучение сети
Нейронные сети 8 Технология обучения сети Часть 1
Нейронные сети 9 Технология обучения сети Часть 2
Нейронные сети 10 Работа одного нейрона
#ии #Нейронныесети

🎥 Нейронные сети 10 Работа одного нейрона
👁 3348 раз 1003 сек.


🎥 Нейронные сети 9 Технология обучения сети Часть 2
👁 1510 раз 905 сек.


🎥 Нейронные сети 8 Технология обучения сети Часть 1
👁 1246 раз 1367 сек.


🎥 Нейронные сети 7 Обучение сети
👁 1260 раз 1077 сек.


🎥 Нейронные сети 6 Нюансы работы нейронной сети
👁 1362 раз 1396 сек.


🎥 Нейронные сети 5 Структура нейронной сети
👁 1709 раз 905 сек.


🎥 Нейронные сети 4 Искусственный нейрон
👁 1999 раз 601 сек.


🎥 Нейронные сети 2 Немного биологии
👁 2862 раз 488 сек.


🎥 Нейронные сети 3 В целом об искусственной нейронной сети 1
👁 2724 раз 535 сек.
Видео взято с https://www.youtube.com/channel/UC5dqkmvoovlmFsFZ3ACAVTw

🎥 Нейронные сети 1 Введение
👁 6407 раз 509 сек.
Видео взято с канала https://www.youtube.com/channel/UC5dqkmvoovlmFsFZ3ACAVTw
🎥 Machine Learning Software Engineering
👁 1 раз 1010 сек.
Machine learning is the next generation of software engineering, and this means we need a start a cultural shift towards data scientists becoming active and productive participants in the software engineering process. A key part of this is reducing the friction for data scientists to think about coding “non-interactively” and building models and behavioural tests that can run as part of a DevOps pipeline.

Praneet Solanki from the Azure CAT team has been building out a reference architecture for this patte
🎥 Credit Card Fraud Detection using Machine Learning from Kaggle
👁 1 раз 1114 сек.
The Credit Card Fraud Detection Problem includes modeling past credit card transactions with the knowledge of the ones that turned out to be fraud. This model is then used to identify whether a new transaction is fraudulent or not.

Github Url: https://github.com/krishnaik06/Credit-Card-Fraudlent

Data Science Interview Question playlist: https://www.youtube.com/watch?v=820Qr4BH0YM&list=PLZoTAELRMXVPkl7oRvzyNnyj1HS4wt2K-

Data Science Projects playlist: https://www.youtube.com/watch?v=5Txi0nHIe0o&list=PLZoT