Neural Networks | Нейронные сети
11.8K subscribers
760 photos
166 videos
170 files
9.41K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
​Release: CCNet is our new tool for extracting high-quality and large-scale monolingual corpora from CommonCraw in more than a hundred languages.
Paper:
https://arxiv.org/abs/1911.00359
Tool:
https://github.com/facebookresearch/cc_net

🔗 CCNet: Extracting High Quality Monolingual Datasets from Web Crawl Data
Pre-training text representations have led to significant improvements in many areas of natural language processing. The quality of these models benefits greatly from the size of the pretraining corpora as long as its quality is preserved. In this paper, we describe an automatic pipeline to extract massive high-quality monolingual datasets from Common Crawl for a variety of languages. Our pipeline follows the data processing introduced in fastText (Mikolov et al., 2017; Grave et al., 2018), that deduplicates documents and identifies their language. We augment this pipeline with a filtering step to select documents that are close to high quality corpora like Wikipedia.
​Intel приглашает на OpenVINO хакатон

Думаем, что вам известно о существовании полезного продукта Intel под названием Open Visual Inference & Neural Network Optimization (OpenVINO) toolkit — набора библиотек, средств оптимизации и информационных ресурсов для разработки ПО, использующего машинное зрение и Deep Learning. Также наверняка вы в курсе, что лучший способ изучить какой-либо инструмент — попробовать сделать с его помощью что-либо с нуля. Если оба тезиса не вызывают у вас возражений, значит вы морально готовы принять участие в OpenVINO хакатоне, который Intel проводит в Нижнем Новгороде с 30 ноября по 1 декабря.
А Нижний Новгород, кстати, находится менее чем в 4 часах «Ласточкой» от Москвы. Это еще один аргумент в пользу.

🔗 Intel приглашает на OpenVINO хакатон
Думаем, что вам известно о существовании полезного продукта Intel под названием Open Visual Inference & Neural Network Optimization (OpenVINO) toolkit — набора...
​Хакни пайплайн: хакатон по разметке данных от Ozon, Яндекс.Толоки и Нетологии
У нас есть много, очень много данных, функционал Яндекс.Толоки — и призовой фонд. Что предстоит делать? Придумать решение для разметки большого массива данных. Встречаемся 1 декабря на хакатоне «Хакни пайплайн».

🔗 Хакни пайплайн: хакатон по разметке данных от Ozon, Яндекс.Толоки и Нетологии
У нас есть много, очень много данных, функционал Яндекс.Толоки — и призовой фонд. Что предстоит делать? Придумать решение для разметки большого массива данных. В...
​Topcoder PINS Master & PINS Explorer — Дмитрий Кулагин

🔗 Topcoder PINS Master & PINS Explorer — Дмитрий Кулагин
Дмитрий Кулагин рассказывает про серию соревнований на площадке Topcoder: PINS Master, в котором он занял победное первое место, а также PINS Explorer, в котором Дмитрий занял второе место. Из этого видео вы сможете узнать: - Стоит ли принимать участие в конкурсе по теме, про которую ты ничего не знаешь - Всегда ли нужно делать сложное решение или good-enough тоже нормальный вариант - Что можно найти интересного в правилах, если их прочитать - А также возможно что про ионосферу и высокочастотный анализ Уз
Видеоуроки по BIG DATA. Основы работы с массивами больших данных.
Презентации: yadi.sk/d/NRCupnST3LNR5d
Дополнительные материалы и книги: yadi.sk/d/F2xBwxce3LNR5b
#bigdata
Наш телеграм канал - tglink.me/ai_machinelearning_big_data

🎥 Big Data. Занятие 1.1 и 1.2 Что такое большие данные, их виды и как их получить.
👁 4165 раз 13016 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 1.3. Дополнительная лекция
👁 259 раз 7859 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 2.1. Основные характеристики больших данных и виды анализа данных
👁 218 раз 6628 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 2.2. Основные методы анализа больших данных
👁 125 раз 6959 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 2.3. Продвинутые методы анализа больших данных
👁 94 раз 6922 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 3.1. Технологии работы с большими данными
👁 78 раз 7246 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 3.2. Введение в Hadoop и NoSQL
👁 75 раз 5602 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 3.3. Работа в Hadoop и MadReduce
👁 75 раз 5018 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования


🎥 Занятие 4 (2.4). Разбор практического задания по аналитике данных
👁 99 раз 4544 сек.
Physics.Math.Code.Books. Самое полезное и интересное из физики, математики, программирования, техники. ══════════════════════════
vk.com/physics_math
══════════════════════════
Видеоуроки, книги(техническая литература), интересные статьи, факты. Всё для любителей физ-мата и программирования
Р.В. Шамин. Искусственный интеллект и машинное обучение

Лекция №1. Метод отжига
Лекция №2. Обучение персептрона
Лекция № 3. Нейронная сеть Хопфилда
Лекция №3. Пример работы программы
Лекция № 4. Классификация сетью Кохонена
Лекция № 5. Самоорганизующиеся карты Кохонена
Лекция № 6. Генетические алгоритмы
Лекция № 7. Обучение с подкреплением
Лекция № 8. EM - кластеризация

🎥 Р.В. Шамин. Лекция №1. Метод отжига
👁 18 раз 1103 сек.
Проект AI.lector.ru
Лекция по искусственному интеллекту и машинному обучению. № 1 "Метод отжига".

Дополнительная информация и примеры программ см....


🎥 Р.В. Шамин. Лекция №2. Обучение персептрона
👁 5 раз 1083 сек.
Рассматривается задача обучения персептрона для линейной бинарной классификации данных

🎥 Р.В. Шамин. Лекция № 3. Нейронная сеть Хопфилда
👁 3 раз 957 сек.
Нейронная сеть Хопфилда.

🎥 Р.В. Шамин. Лекция №3. Пример работы программы
👁 5 раз 81 сек.
Пример работы программы, реализующей сеть Хопфилда

🎥 Р.В. Шамин. Лекция № 4. Классификация сетью Кохонена
👁 1 раз 1017 сек.
Классификация сетью Кохонена

🎥 Р.В. Шамин. Лекция № 5. Самоорганизующиеся карты Кохонена
👁 1 раз 791 сек.


🎥 Р.В. Шамин. Лекция № 6. Генетические алгоритмы
👁 1 раз 1093 сек.
Генетические алгоритмы

🎥 Р.В. Шамин. Лекция № 7. Обучение с подкреплением
👁 1 раз 952 сек.
Обучение с подкреплением

🎥 Р.В. Шамин. Лекция № 8. EM - кластеризация
👁 1 раз 406 сек.
Алгоритм EM-кластеризации
Очень нужен преподаватель по машинному обучению (BigData), пишите!!!
🎥 Data Science and Machine Learning Bootcamp with R - Part 18 // Neural Networks
👁 1 раз 2382 сек.
Download Files here - https://drive.google.com/file/d/1F-SOFIh8-8RGHg8qj9VGK1dhNqnS_Z08/view?usp=sharing

This comprehensive course is comparable to other Data Science bootcamps that usually cost thousands of dollars, but now you can learn all that information at a fraction of the cost! With over 100 HD video lectures and detailed code notebooks for every lecture this is one of the most comprehensive course for data science and machine learning on Udemy!

We'll teach you how to program with R, how to create
​Understanding the generalization of ‘lottery tickets’ in neural networks

https://ai.facebook.com/blog/understanding-the-generalization-of-lottery-tickets-in-neural-networks/

One ticket to win them all: generalizing lottery ticket initializations across datasets and optimizers

https://arxiv.org/pdf/1906.02773.pdf

https://arxiv.org/pdf/1906.02768.pdf

🔗 Understanding the generalization of ‘lottery tickets’ in neural networks
The lottery ticket hypothesis suggests that by training DNNs from “lucky” initializations, we can train networks which are 10-100x smaller with minimal performance losses. In new work, we extend our understanding of this phenomenon in several ways.
​Второй чемпионат по программированию: разбираем задачи ML-трека
В октябре состоялся второй чемпионат по программированию. Мы получили 12 500 заявок, более 6000 человек попробовали свои силы в соревнованиях. В этот раз участники могли выбрать один из следующих треков: бэкенд, фронтенд, мобильную разработку и машинное обучение. В каждом треке требовалось пройти квалификационный этап и финал.

По традиции мы опубликуем разборы треков на Хабре. Начнём с задач квалификационного этапа по машинному обучению. Команда подготовила пять таких задач, из которых составила два варианта по три задачи: в первом варианте были задачи A1, B1 и C, во втором — A2, B2 и C. Варианты случайно распределялись между участниками. Автор задачи C — наш разработчик Павел Пархоменко, остальные задачи составил его коллега Никита Сендерович.

За первую простую алгоритмическую задачу (A1/A2) участники могли получить 50 баллов, правильно реализовав перебор по ответу. За вторую задачу (B1/B2) мы давали от 10 до 100 баллов — в зависимости от эффективности решения. Чтобы получить 100 баллов, требовалось реализовать метод динамического программирования. Третья задача была посвящена построению кликовой модели по предоставленным обучающим данным. В ней требовалось применить методы работы с категориальными признаками и воспользоваться нелинейной моделью обучения (например, градиентным бустингом). За задачу можно было получить до 150 баллов — в зависимости от значения функции потерь на тестовой выборке.

🔗 Второй чемпионат по программированию: разбираем задачи ML-трека
В октябре состоялся второй чемпионат по программированию. Мы получили 12 500 заявок, более 6000 человек попробовали свои силы в соревнованиях. В этот раз участни...
​Data Engineer – самая сексуальная профессия XXI века
Недавно в разговоре с HR’ами одной крупной компании прозвучало «Каждый data engineer, приходящий к нам на интервью, мечтает стать data scientist’ом». Меня это тогда сильно удивило и стало очень обидно за дата инженера, честно говоря.

Мы здесь (и не только) уже публиковали несколько материалов про data engineer’ов и их ценность для бизнеса – например, интервью с Николаем Марковым или «4 причины стать data engineer», но это было давно. Время идет, материал накапливается, мир развивается, поэтому есть что рассказать.

Возможно, надо сначала коротко напомнить, из чего складывается круг задач дата инженера (плюс-минус, конечно, т.к. каждая компания может добавлять что-то свое\ что-то из перечисленного может выполняться другими сотрудниками):

🔗 Data Engineer – самая сексуальная профессия XXI века
Недавно в разговоре с HR’ами одной крупной компании прозвучало «Каждый data engineer, приходящий к нам на интервью, мечтает стать data scientist’ом». Меня это то...
​Вертикальная и горизонтальная карьера в сфере Data Science
В любой сфере деятельности, как правило, выделяют два типа карьеры: вертикальная и горизонтальная. Вертикальная означает, что человек все меньше делает что-либо руками, а занимается организационными задачами. Горизонтальная означает, что человек растет как специалист, разбираясь во все большем количестве вещей и/или как можно глубже. В этом посте мы пообщались с различными экспертами о тех или иных ролях и позициях, чтобы показать весь ландшафт карьеры сфере Data Science.

🔗 Вертикальная и горизонтальная карьера в сфере Data Science
В любой сфере деятельности, как правило, выделяют два типа карьеры: вертикальная и горизонтальная. Вертикальная означает, что человек все меньше делает что-либо...
​Выставка SPS-2019 в выставочном центре Нюрнберга
Всем интересующимся хотелось бы сообщить или просто напомнить, что сегодня (во вторник 26.11.19) в выставочном центре г. Нюрнберг стартует одна из самых крупных международных выставок в сфере автоматизации промышленности — SPS-2019.

🔗 Выставка SPS-2019 в выставочном центре Нюрнберга
Всем интересующимся хотелось бы сообщить или просто напомнить, что сегодня (во вторник 26.11.19) в выставочном центре г. Нюрнберг стартует одна из самых крупных...
​Наблюдения о применении ML в бизнесе на акции ŽijemeIT
Несколько недель назад я посетил акцию для студентов Технического университета в Брно (Чехия) под названием ŽijemeIT. Это ежегодная миниконференция для студентов, на которой ряд крупных и известных ИТ компаний города Брно представляют обзорные презентации о своей деятельности, интересных направлениях и проектах. В этом году была заметна тенденция компаний по использованию машинного обучения и искусственного интеллекта для решения различных бизнес задач. В этом кратком обзоре я бы хотел поделиться некоторыми интересными наблюдениями на эту тему. Кому интересно, прошу под кат

🔗 Наблюдения о применении ML в бизнесе на акции ŽijemeIT
Несколько недель назад я посетил акцию для студентов Технического университета в Брно (Чехия) под названием ŽijemeIT. Это ежегодная миниконференция для студентов...