#teaching Штука с прошлой картинки называется Learning Pyramid и периодически вызывает обоснованные нападки людей, связанных с психологией и образованием. Например, вот статья на этот счет в Washington Post: https://www.washingtonpost.com/news/answer-sheet/wp/2013/03/06/why-the-learning-pyramid-is-wrong/ а вот просто неплохая запись в блоге: https://theeffortfuleducator.com/2017/11/29/the-pyramid-of-myth/
Я нарисовал ее даже чуть помягче - в оригинальной версии есть еще довольно смелые проценты на каждом уровне, якобы отражающие долю усваиваемой информации. Проблема здесь в том, что люди иногда воспринимают всё слишком буквально. Возможно, можно придумать более-менее адекватный эксперимент, который оценит какие-то такие проценты для разных видов активности. Но в жизни все равно будут не лабораторные условия, поэтому к числам в таких экспериментах не надо относиться слишком уж серьезно. Но вот что точно имеет ценность - это качественное наблюдение, что эффективность разных видов образовательных активностей отранжирована «как-то так». Примерно. Без особых гарантий. По субъективным ощущениям 🙂 И если отдельные уровни еще можно переставлять местами, то преподавание, если это делать честно и основательно, - точно самый действенный способ разобраться в области еще лучше. Только про остальные варианты надо тоже не забывать.
Я нарисовал ее даже чуть помягче - в оригинальной версии есть еще довольно смелые проценты на каждом уровне, якобы отражающие долю усваиваемой информации. Проблема здесь в том, что люди иногда воспринимают всё слишком буквально. Возможно, можно придумать более-менее адекватный эксперимент, который оценит какие-то такие проценты для разных видов активности. Но в жизни все равно будут не лабораторные условия, поэтому к числам в таких экспериментах не надо относиться слишком уж серьезно. Но вот что точно имеет ценность - это качественное наблюдение, что эффективность разных видов образовательных активностей отранжирована «как-то так». Примерно. Без особых гарантий. По субъективным ощущениям 🙂 И если отдельные уровни еще можно переставлять местами, то преподавание, если это делать честно и основательно, - точно самый действенный способ разобраться в области еще лучше. Только про остальные варианты надо тоже не забывать.
#cases Буквально 45 минут назад на Хабре вышел пост о том, как у нас в Такси качество машин оценивается дистанционно с помощью компьютерного зрения. И если у вас возник в голове ироничный ответ «так себе оценивается», то вы поспешили 🙂 Пока эта вещь только внедряется в использование, но уже есть серьезные надежды, что это позволит гораздо лучше следить за качеством автомобилей - ведь по сравнению с людьми нейросетка может делать эту работу мгновенно, причем даже более качественно.
Если кратко - мы итак просим водителей раз в некоторый период времени присылать фотографии машины, и у нас есть специальные асессоры, которые оценивают качество автомобиля - чистый ли, нет ли вмятин и так далее. Получается, за большой период времени мы уже накопили неплохую обучающую выборку. Остается только определиться, как ставить задачу в терминах машинного обучения, как оценивать и как применять результат. Об этом можно узнать в статье: https://habr.com/company/yandex/blog/433386/
Автор поста Никита Селезнев руководит направлением Deep Learning на курсе Data Mining in Action и отвечает за применение DL в дистанционном контроле качества Такси, и, я думаю, еще не раз порадует нас хорошими курсами и статьями про DL и его применение 🙂
Если кратко - мы итак просим водителей раз в некоторый период времени присылать фотографии машины, и у нас есть специальные асессоры, которые оценивают качество автомобиля - чистый ли, нет ли вмятин и так далее. Получается, за большой период времени мы уже накопили неплохую обучающую выборку. Остается только определиться, как ставить задачу в терминах машинного обучения, как оценивать и как применять результат. Об этом можно узнать в статье: https://habr.com/company/yandex/blog/433386/
Автор поста Никита Селезнев руководит направлением Deep Learning на курсе Data Mining in Action и отвечает за применение DL в дистанционном контроле качества Такси, и, я думаю, еще не раз порадует нас хорошими курсами и статьями про DL и его применение 🙂
Habr
Как с помощью компьютерного зрения оценить состояние автомобиля. Опыт Яндекс.Такси
Мы стремимся к тому, чтобы после заказа такси к пользователю приезжал чистый, исправный автомобиль той марки, того цвета и с тем номером, которые отображаются в приложении. И для этого мы...
До Нового Года остается четыре часа, у кого-то все уже приготовлено к празднованию, кто-то еще бегает и суетится, но большая часть приготовлений в любом случае позади. Пока все еще не начали отмечать, поздравляю всех с наступающим! 🙂
Очень надеюсь, что для многих из вас какие-то приятные события в 2019 году будут связаны и с Data Science. Кто-то успешно внедрит новые решения на основе Machine Learning в своей компании, кто-то устроится на новую любимую работу или продолжит с удовольствием работать на старой, кто-то выиграет в соревнованиях, а кто-то просто будет наслаждаться красотой всей той магии, которую можно делать с помощью анализа данных (и, я считаю, нам очень повезло жить в это замечательное время). Мы с партнерами и коллегами по образовательным проектам со своей стороны постараемся помочь вам в этих достижениях.
Уже в феврале мы планируем новый запуск Data Mining in Action, в этот раз с четырьмя направлениями, и каждое с лекциями, семинарами и заданиями: общий поток (про основы ML), соревновательный анализ данных (про то, как участвовать и побеждать в контестах), анализ данных в индустрии (с большим количеством кейсов из компаний и разных примеров из жизни Data Scientist’ов в компаниях) и глубокое обучение (где можно будет с самого начала последовательно узнать все то, что сейчас актуально в deep learning, включая некоторые свежие результаты из 2018, а возможно, и 2019 года : ) Примерно тогда же в феврале планируется запуск сразу трёх онлайн-курсов, которые, как мне кажется, заинтересуют очень многих подписчиков, т.к. эти курсы призваны решить одну очень серьезную проблему, которая возникает сейчас при знакомстве с Data Science. И на весь 2019 год у нас приготовлено много всего интересного.
Ну а сейчас, пока праздничные дни только начинаются, желаю всем замечательно отдохнуть и провести побольше времени с близкими. С Новым годом, уже почти наступившим!
Очень надеюсь, что для многих из вас какие-то приятные события в 2019 году будут связаны и с Data Science. Кто-то успешно внедрит новые решения на основе Machine Learning в своей компании, кто-то устроится на новую любимую работу или продолжит с удовольствием работать на старой, кто-то выиграет в соревнованиях, а кто-то просто будет наслаждаться красотой всей той магии, которую можно делать с помощью анализа данных (и, я считаю, нам очень повезло жить в это замечательное время). Мы с партнерами и коллегами по образовательным проектам со своей стороны постараемся помочь вам в этих достижениях.
Уже в феврале мы планируем новый запуск Data Mining in Action, в этот раз с четырьмя направлениями, и каждое с лекциями, семинарами и заданиями: общий поток (про основы ML), соревновательный анализ данных (про то, как участвовать и побеждать в контестах), анализ данных в индустрии (с большим количеством кейсов из компаний и разных примеров из жизни Data Scientist’ов в компаниях) и глубокое обучение (где можно будет с самого начала последовательно узнать все то, что сейчас актуально в deep learning, включая некоторые свежие результаты из 2018, а возможно, и 2019 года : ) Примерно тогда же в феврале планируется запуск сразу трёх онлайн-курсов, которые, как мне кажется, заинтересуют очень многих подписчиков, т.к. эти курсы призваны решить одну очень серьезную проблему, которая возникает сейчас при знакомстве с Data Science. И на весь 2019 год у нас приготовлено много всего интересного.
Ну а сейчас, пока праздничные дни только начинаются, желаю всем замечательно отдохнуть и провести побольше времени с близкими. С Новым годом, уже почти наступившим!
#teaching
История про два курса
Когда я учился в университете, в определенный момент у меня в программе был курс функционального анализа - раздела анализа, в котором изучаются топологические пространства (в основном бесконечномерные) и их отображения. Такое вот высокоуровневое развитие привычного всем мат.анализа. Приятная особенность этого предмета в том, что в курсах по нему почти не бывает задач вида «вычислить что-то», только задачи на доказательства и построение примеров довольно абстрактных конструкций. Я, без иронии, был счастлив, что такой курс есть. Меня всегда восхищала красота абстракций, возникающих в математике, и строгих доказательств их свойств при определенных условиях. Разбираться с этим было очень увлекательно и приятно. А вот арифметику я так никогда и не освоил, поэтому радовался, что в кои-то веки на предмете кафедры высшей математики мне не нужно подражать калькулятору.
По этому предмету в моем университете существовало два хорошо сформировавшихся курса, которые читали два разных лектора. Курс более молодого лектора был крайне насыщенным. В нем действительно рассказывалось и доказывалось очень много, как на лекциях, так и на семинарах. Знать все то, что было на этом курсе, было сродни обладанию каким-то невероятным сокровищем, а сам процесс обучения - какое-то запредельное счастье постоянных открытий. И, несмотря на то, что скорость изложения материала зашкаливала, а воспринимать такой плотный поток в принципе затруднительно, предмет был так красив и эстетичен, что награда стоила этих сложностей. Это определенно был очень крутой курс.
Но у меня функциональный анализ вёл другой лектор, существенно старше. Объем материала в его курсе был заметно меньше. И сам курс не производил впечатление очень интенсивного. Звучит хуже? А вот как бы не так. Если первый курс был крутым, то этот курс был гениальным, он был произведением преподавательского искусства. Вместо того, чтобы впихнуть в курс как можно больше, наш лектор (он же был моим семинаристом) оставил время для общения со студентами на занятиях. Нам давали возможность предлагать идеи доказательств, обсуждали с нами возникающие проблемы, давали нам совершать ошибки и помогали учиться на них. Это помогло многим студентам научиться рассуждать на языке математики. Кроме того, курс был насыщен запоминающимися образами. Например, можно было просто формально сообщить слушателям, что значит предъявить эпсилон-сеть для некоторого множества, а можно кроме этого ещё и объяснить, что это то же самое, что целиком осветить парк фонарями, которые освещают круглый пятачок радиусом эпсилон вокруг себя. Детский сад? Может быть. Но образность и осмысленность происходящего позволяла и понимать, и вовлекаться в предмет. И научить нас это помогало.
Последние полгода я часто вспоминаю эти два взгляда на курс. И все чаще задумываюсь, что больше - не значит лучше, ведь «знать» много всего - это, конечно, здорово, но надо же что-то и понимать 🙂 Кроме того, у фокуса на понимание есть приятный бонус: часто достаточно понять совсем немного, чтобы всё остальное стало очевидно и уже не требовало запоминания. Об этом полезно задумываться и преподавателям при подготовке материалов, и слушателям при выборе курсов и траектории обучения в целом.
История про два курса
Когда я учился в университете, в определенный момент у меня в программе был курс функционального анализа - раздела анализа, в котором изучаются топологические пространства (в основном бесконечномерные) и их отображения. Такое вот высокоуровневое развитие привычного всем мат.анализа. Приятная особенность этого предмета в том, что в курсах по нему почти не бывает задач вида «вычислить что-то», только задачи на доказательства и построение примеров довольно абстрактных конструкций. Я, без иронии, был счастлив, что такой курс есть. Меня всегда восхищала красота абстракций, возникающих в математике, и строгих доказательств их свойств при определенных условиях. Разбираться с этим было очень увлекательно и приятно. А вот арифметику я так никогда и не освоил, поэтому радовался, что в кои-то веки на предмете кафедры высшей математики мне не нужно подражать калькулятору.
По этому предмету в моем университете существовало два хорошо сформировавшихся курса, которые читали два разных лектора. Курс более молодого лектора был крайне насыщенным. В нем действительно рассказывалось и доказывалось очень много, как на лекциях, так и на семинарах. Знать все то, что было на этом курсе, было сродни обладанию каким-то невероятным сокровищем, а сам процесс обучения - какое-то запредельное счастье постоянных открытий. И, несмотря на то, что скорость изложения материала зашкаливала, а воспринимать такой плотный поток в принципе затруднительно, предмет был так красив и эстетичен, что награда стоила этих сложностей. Это определенно был очень крутой курс.
Но у меня функциональный анализ вёл другой лектор, существенно старше. Объем материала в его курсе был заметно меньше. И сам курс не производил впечатление очень интенсивного. Звучит хуже? А вот как бы не так. Если первый курс был крутым, то этот курс был гениальным, он был произведением преподавательского искусства. Вместо того, чтобы впихнуть в курс как можно больше, наш лектор (он же был моим семинаристом) оставил время для общения со студентами на занятиях. Нам давали возможность предлагать идеи доказательств, обсуждали с нами возникающие проблемы, давали нам совершать ошибки и помогали учиться на них. Это помогло многим студентам научиться рассуждать на языке математики. Кроме того, курс был насыщен запоминающимися образами. Например, можно было просто формально сообщить слушателям, что значит предъявить эпсилон-сеть для некоторого множества, а можно кроме этого ещё и объяснить, что это то же самое, что целиком осветить парк фонарями, которые освещают круглый пятачок радиусом эпсилон вокруг себя. Детский сад? Может быть. Но образность и осмысленность происходящего позволяла и понимать, и вовлекаться в предмет. И научить нас это помогало.
Последние полгода я часто вспоминаю эти два взгляда на курс. И все чаще задумываюсь, что больше - не значит лучше, ведь «знать» много всего - это, конечно, здорово, но надо же что-то и понимать 🙂 Кроме того, у фокуса на понимание есть приятный бонус: часто достаточно понять совсем немного, чтобы всё остальное стало очевидно и уже не требовало запоминания. Об этом полезно задумываться и преподавателям при подготовке материалов, и слушателям при выборе курсов и траектории обучения в целом.
Пару часов назад в «Физиках и лириках» Пушного и Митрофановой обсудили кучу общих вопросов про машинное обучение :) Александр оказался глубоко в теме и был бесконечным источником релевантных вопросов, а Маргарита мастерски помогла нам не заболтаться и не уйти в обсуждение совсем абстрактных материй. В результате, как мне кажется, обсуждение получилось довольно простым для восприятия в целях «послушать что-то про машинное обучение», если ваша профессия с ним не связана :) А если связана - можно дать послушать родственникам и друзьям, которым интересно, чем вы занимаетесь. Ссылка на запись: http://radiomayak.ru/shows/show/id/62250/
Кстати, сейчас полным ходом идёт подготовка мини-курса с очень плавным и безболезненным введением в основные понятия ML, так что для аудитории, которой хочется развлекательного знакомства с ML, скоро будут анонсы :) Ну а для тех, кто хочет хардкора, мы уже почти всё подготовили к старту набора на Data Mining in Action, в который возвращаются направления соревновательного и индустриального анализа данных, а также глубокого обучения. Этот анонс следует ожидать уже на следующей неделе.
Кстати, сейчас полным ходом идёт подготовка мини-курса с очень плавным и безболезненным введением в основные понятия ML, так что для аудитории, которой хочется развлекательного знакомства с ML, скоро будут анонсы :) Ну а для тех, кто хочет хардкора, мы уже почти всё подготовили к старту набора на Data Mining in Action, в который возвращаются направления соревновательного и индустриального анализа данных, а также глубокого обучения. Этот анонс следует ожидать уже на следующей неделе.
#how_to_ml #ml_courses #dmia
Когда вам нужно применить машинное обучение так, чтобы все заработало, с приемлемым качеством и не с запредельными вложениями сил, если говорить об алгоритмах, выбор довольно понятный. Либо линейные модели (если у вас тексты или другие данные с большим количеством признаков, особенно разреженных), либо ансамбли деревьев (если есть время и память на обучение и вас не смущает меньшая интерпретируемость), либо нейросетки (если работаете с картинками, либо строите более «умную» модель на текстах, либо анализируете звук или какие-то еще данные с интересной внутренней структурой). Иногда, например, в некоторых банках, еще любят строить одиночные решающие деревья, по большей части - просто потому, что они очень уж наглядно визуализируются. Конкретно с нейросетками неплохо быть в курсе существующих архитектур для разных задач, чтобы просто применять их, но в целом, столкнувшись с конкретной задачей вы можете просто хорошо погуглить и изучить статьи. Но по крайней мере понимать, какие идеи сейчас активно развиваются в Deep Learning и как это работает - в 2019 году точно нужно.
Еще пару лет назад у меня был показательный случай: меня привлекали для обновления программы курса ML в одном университете и компании-партнеры ВУЗа, формировавшие требования к программе, недовольно восклицали «представляешь, у нас в 2017 году курс машинного обучения все еще без введения в deep learning!». Конечно, это не подразумевало добавление в курс рассказа за 2-3 лекции полноценного курса по DL, но полная неосведомленность уже тогда не устраивала тех, кто хантил DS’ов.
Кроме того, конечно машинное обучение начинается отнюдь не с выбора алгоритма.
С одной стороны, нужно подготовить данные, на которых модель будет обучаться, а значит что-то понимать в feature engineering (или иметь хорошую интуицию на этот счет, а лучше - и то и другое). Если модель должна приносить какую-то пользу - например, зарабатывать или экономить деньги компании или максимизировать некоторое «счастье пользователя» в вашем сервисе - нужно также адекватно выбрать способ оценки качества. Да и вообще вопрос, что должна прогнозировать модель и где там возникает какой-то эффект от её внедрения - отдельная и не всегда очевидная история.
На нашем курсе Data Mining in Action базовое направление знакомит слушателей именно со всем необходимым для быстрого старта в машинном обучении в 2019 году - есть и про классические методы, и про работу с признаками и оценку качества, и неплохое введение про нейросетки. Для тех, кто уже имеет неплохую базу в ML есть специализированные направления - индустриальное (применение ML в компаниях), спортивное (о том, как участвовать и побеждать в соревнованиях по анализу данных) и, конечно, направление deep learning. Отбор на курс уже идет полным ходом, запись на курс и отборочные задания направлений будут еще как минимум до 7 февраля доступны по ссылке: https://goo.gl/forms/Z5QvN6UR1wJRTeKg1 Организационные детали можно найти там же.
Торжественное открытие курса планируется 9 февраля, с 16 февраля начнутся лекции и семинары.
Когда вам нужно применить машинное обучение так, чтобы все заработало, с приемлемым качеством и не с запредельными вложениями сил, если говорить об алгоритмах, выбор довольно понятный. Либо линейные модели (если у вас тексты или другие данные с большим количеством признаков, особенно разреженных), либо ансамбли деревьев (если есть время и память на обучение и вас не смущает меньшая интерпретируемость), либо нейросетки (если работаете с картинками, либо строите более «умную» модель на текстах, либо анализируете звук или какие-то еще данные с интересной внутренней структурой). Иногда, например, в некоторых банках, еще любят строить одиночные решающие деревья, по большей части - просто потому, что они очень уж наглядно визуализируются. Конкретно с нейросетками неплохо быть в курсе существующих архитектур для разных задач, чтобы просто применять их, но в целом, столкнувшись с конкретной задачей вы можете просто хорошо погуглить и изучить статьи. Но по крайней мере понимать, какие идеи сейчас активно развиваются в Deep Learning и как это работает - в 2019 году точно нужно.
Еще пару лет назад у меня был показательный случай: меня привлекали для обновления программы курса ML в одном университете и компании-партнеры ВУЗа, формировавшие требования к программе, недовольно восклицали «представляешь, у нас в 2017 году курс машинного обучения все еще без введения в deep learning!». Конечно, это не подразумевало добавление в курс рассказа за 2-3 лекции полноценного курса по DL, но полная неосведомленность уже тогда не устраивала тех, кто хантил DS’ов.
Кроме того, конечно машинное обучение начинается отнюдь не с выбора алгоритма.
С одной стороны, нужно подготовить данные, на которых модель будет обучаться, а значит что-то понимать в feature engineering (или иметь хорошую интуицию на этот счет, а лучше - и то и другое). Если модель должна приносить какую-то пользу - например, зарабатывать или экономить деньги компании или максимизировать некоторое «счастье пользователя» в вашем сервисе - нужно также адекватно выбрать способ оценки качества. Да и вообще вопрос, что должна прогнозировать модель и где там возникает какой-то эффект от её внедрения - отдельная и не всегда очевидная история.
На нашем курсе Data Mining in Action базовое направление знакомит слушателей именно со всем необходимым для быстрого старта в машинном обучении в 2019 году - есть и про классические методы, и про работу с признаками и оценку качества, и неплохое введение про нейросетки. Для тех, кто уже имеет неплохую базу в ML есть специализированные направления - индустриальное (применение ML в компаниях), спортивное (о том, как участвовать и побеждать в соревнованиях по анализу данных) и, конечно, направление deep learning. Отбор на курс уже идет полным ходом, запись на курс и отборочные задания направлений будут еще как минимум до 7 февраля доступны по ссылке: https://goo.gl/forms/Z5QvN6UR1wJRTeKg1 Организационные детали можно найти там же.
Торжественное открытие курса планируется 9 февраля, с 16 февраля начнутся лекции и семинары.
Google Docs
Data Mining in Action: весна 2019
Начинается отбор на оффлайн курс Data Mining in Action (занятия очные).
Отбор будет производится на основе вступительного задания направления и небольшого мотивационного письма (не более 1000 символов), которое нужно ввести в этой форме. Ссылки на вступительные…
Отбор будет производится на основе вступительного задания направления и небольшого мотивационного письма (не более 1000 символов), которое нужно ввести в этой форме. Ссылки на вступительные…
После перерыва в полтора месяца, предсказуемым образом совпавшего с началом занятий на Data Mining in Action, канал продолжает свою работу. Сейчас я в поиске новых, более полезных для аудитории форматов канала, чем «пишу что приходит в голову», поэтому хочу понимать, что интересно тем, кто уже присоединился к каналу в качестве подписчика. Поэтому первая новая рубрика - Q&A. В гугл форме по ссылке можно задать мне вопрос или предложить тему поста для канала: https://goo.gl/forms/Rr8I42qr40gV7ZSi1
#edu
Моя мечта - чтобы компьютерные игры, довольно успешно конкурирующие за время людей с образованием и другими полезными активностями, делали ощутимый вклад в развитие у человека каких-то навыков, и сами могли использоваться в образовательных целях. Причем речь не про то что мы привыкли понимать под геймификацией в образовании - приделать к курсу сбоку систему уровней, ачивок и мини-игр, а про погружение в полноценную игру с некоторыми позитивными последствиями для знаний. Год назад, например, была новость о том, что RPG игра Kindom Come: Deliverance из-за своей историчности и точности воспроизведения показанной в ней эпохи, будет использоваться для обучения студентов истории в университете в Брно (интересно, осталось ли это только лишь новостью). С историей действительно есть такой эффект: играешь в игры с историческим контекстом - хоть что-то узнаешь, только вот с исторической достоверностью у игр часто все довольно плохо.
Я видел много примеров, когда люди, которые что-то хорошо умеют, очень легко и результативно играют в игры по своей тематике, причем зачастую прямо с первой игры. Например, те, кто хорошо умеют обращаться с деньгами, сразу справляются с какими-нибудь экономическими симуляторами или стратегиями с упором на экономику. Вроде логично: жизнь сложнее урезанной и ограниченной игровой симуляции, поэтому можешь в жизни - разберешься и в игре. Но все не так просто. Бывают и обратные примеры, когда в игре человеку наоборот сложнее, т.к. нет всего многообразия возможных действий, которое в жизни помогает выкрутиться из сложных ситуаций.
Примеры, о которых я очень хочу узнать, изучить их под микроскопом и понять, как это работает - это случаи, когда опыт, полученный в компьютерной игре, получилось успешно перенести в реальную жизнь. Если вы можете рассказать что-нибудь такое - напишите пожалуйста напрямую мне в телеграм ( @vkantor ). Если вы скажете, что компьютерные игры вряд ли могут научить чему-то про реальный мир, а скорее приучают разбираться с существующими механиками и применять их, это тоже подойдет, при наличии конкретных примеров, с чем получилось лучше разобраться, потренировавшись на играх. У меня есть несколько примеров, но они (на мой взгляд) очень сильно притянуты за уши и даже близко не стоят и 10% времени, потраченного на игру, если конечно не брать в расчет развлекательную составляющую.
Кстати, ссылка на ту самую новость из 2018 года про Kindom Come: Deliverance - https://kanobu.ru/news/kingdom-come-budut-ispolzovat-dlya-prepodavaniya-studentam-istorii-v-cheshskom-universitete-402886/
Моя мечта - чтобы компьютерные игры, довольно успешно конкурирующие за время людей с образованием и другими полезными активностями, делали ощутимый вклад в развитие у человека каких-то навыков, и сами могли использоваться в образовательных целях. Причем речь не про то что мы привыкли понимать под геймификацией в образовании - приделать к курсу сбоку систему уровней, ачивок и мини-игр, а про погружение в полноценную игру с некоторыми позитивными последствиями для знаний. Год назад, например, была новость о том, что RPG игра Kindom Come: Deliverance из-за своей историчности и точности воспроизведения показанной в ней эпохи, будет использоваться для обучения студентов истории в университете в Брно (интересно, осталось ли это только лишь новостью). С историей действительно есть такой эффект: играешь в игры с историческим контекстом - хоть что-то узнаешь, только вот с исторической достоверностью у игр часто все довольно плохо.
Я видел много примеров, когда люди, которые что-то хорошо умеют, очень легко и результативно играют в игры по своей тематике, причем зачастую прямо с первой игры. Например, те, кто хорошо умеют обращаться с деньгами, сразу справляются с какими-нибудь экономическими симуляторами или стратегиями с упором на экономику. Вроде логично: жизнь сложнее урезанной и ограниченной игровой симуляции, поэтому можешь в жизни - разберешься и в игре. Но все не так просто. Бывают и обратные примеры, когда в игре человеку наоборот сложнее, т.к. нет всего многообразия возможных действий, которое в жизни помогает выкрутиться из сложных ситуаций.
Примеры, о которых я очень хочу узнать, изучить их под микроскопом и понять, как это работает - это случаи, когда опыт, полученный в компьютерной игре, получилось успешно перенести в реальную жизнь. Если вы можете рассказать что-нибудь такое - напишите пожалуйста напрямую мне в телеграм ( @vkantor ). Если вы скажете, что компьютерные игры вряд ли могут научить чему-то про реальный мир, а скорее приучают разбираться с существующими механиками и применять их, это тоже подойдет, при наличии конкретных примеров, с чем получилось лучше разобраться, потренировавшись на играх. У меня есть несколько примеров, но они (на мой взгляд) очень сильно притянуты за уши и даже близко не стоят и 10% времени, потраченного на игру, если конечно не брать в расчет развлекательную составляющую.
Кстати, ссылка на ту самую новость из 2018 года про Kindom Come: Deliverance - https://kanobu.ru/news/kingdom-come-budut-ispolzovat-dlya-prepodavaniya-studentam-istorii-v-cheshskom-universitete-402886/
Канобу
Kingdom Come будут использовать для преподавания студентам истории в чешском университете
Основатель Warhorse Даниэль Вавра рассказал, что его игра Kingdom Come: Deliverance будет использоваться в преподавании средневековой истории в чеш...
Сегодня у меня две новости.
Во-первых у Data Mining in Action появился сайт: http://dmia.space На нем есть описание направлений и программы, так что теперь можно скидывать ссылку на него в качестве какого-то базового объяснения, чем мы занимаемся. Также в самом низу лендинга есть запись на новости про запуск онлайн-версии DMIA. Она, в отличие от оффлайна, будет платной, т.к. производство онлайн-курсов и запись в студии не самое дешевое удовольствие. Однако по моим ощущениям это будет лучший русскоязычный онлайн-курс для быстрого погружения в ML. Почему я так думаю, а также какие вообще еще курсы есть - буду писать здесь до выхода онлайна DMIA.
Во-вторых наконец-то близко еще одно событие, которого я давно ждал. Меня очень много раз звали в самые разные места прочитать вводную лекцию про ML - топам компаний, менеджерам, разработчикам, студентам, школьникам, в клубы по интересам, в лекторий level one, и так далее и так далее. В зависимости от аудитории она была то более хардкорной, то более бизнесовой, то более развлекательной. Наконец-то я собрал лучшие фрагменты вместе, записал их в студии и запускаю онлайн-курс «Машинное обучение для всех» с введением в самые основы для тех, кто просто хочет разобраться, что такое ML.
Сразу предупрежу, что если у вас или ваших знакомых, которым этот курс будет интересен, есть время на просмотр кучи релевантных и не очень лекций на youtube по теме - этот мини-курс вряд ли очень подойдет. Основная его задача - как раз сэкономить время на поиск и просмотр большого количества материалов и собирание из них сути по крупицам. Цель курса - понятно рассказать о самом основном, не скатываясь в лекцию по математике или программированию и не начиная рассказывать маркетинговые сказки про всемогучий AI - причем всего за 75 минут минут видео-лекций по 3-15 минут каждая. Для того, чтобы слушатель мог самостоятельно проверить понимание рассказанного, видео сопровождаются семью несложными тестами и, надеюсь, будут сопровождаться обсуждениями на форуме между слушателями.
Также предупрежу, что если вы работаете Data Scientist’ом - этот курс тоже не для вас, вам могут быть полезны только более объемные и технические, а максимальная польза для вас от этого курса - посмотреть, как можно объяснять какие-то вещи просто (если мне это, конечно удалось 🙂).
Зато все остальные люди, которые не хотят кучи формул, не хотят проходить долгий и тяжелый курс, но хотят получить хорошее представление о машинном обучении - те, для кого этот курс создан. Курс уже прошел успешный бета-тест с десятком слушателей-добровольцев, а на грядущей неделе я надеюсь запустить еще один тест курса, теперь уже предложив тестерам купить курс за 50% цены (750 рублей). И если даже заплатившие за курс люди будут отзываться о нем позитивно, курс будет запущен для всех 🙂 Записываться в добровольцы здесь: https://forms.gle/ZqNX9C3whj9FnZxKA
Во-первых у Data Mining in Action появился сайт: http://dmia.space На нем есть описание направлений и программы, так что теперь можно скидывать ссылку на него в качестве какого-то базового объяснения, чем мы занимаемся. Также в самом низу лендинга есть запись на новости про запуск онлайн-версии DMIA. Она, в отличие от оффлайна, будет платной, т.к. производство онлайн-курсов и запись в студии не самое дешевое удовольствие. Однако по моим ощущениям это будет лучший русскоязычный онлайн-курс для быстрого погружения в ML. Почему я так думаю, а также какие вообще еще курсы есть - буду писать здесь до выхода онлайна DMIA.
Во-вторых наконец-то близко еще одно событие, которого я давно ждал. Меня очень много раз звали в самые разные места прочитать вводную лекцию про ML - топам компаний, менеджерам, разработчикам, студентам, школьникам, в клубы по интересам, в лекторий level one, и так далее и так далее. В зависимости от аудитории она была то более хардкорной, то более бизнесовой, то более развлекательной. Наконец-то я собрал лучшие фрагменты вместе, записал их в студии и запускаю онлайн-курс «Машинное обучение для всех» с введением в самые основы для тех, кто просто хочет разобраться, что такое ML.
Сразу предупрежу, что если у вас или ваших знакомых, которым этот курс будет интересен, есть время на просмотр кучи релевантных и не очень лекций на youtube по теме - этот мини-курс вряд ли очень подойдет. Основная его задача - как раз сэкономить время на поиск и просмотр большого количества материалов и собирание из них сути по крупицам. Цель курса - понятно рассказать о самом основном, не скатываясь в лекцию по математике или программированию и не начиная рассказывать маркетинговые сказки про всемогучий AI - причем всего за 75 минут минут видео-лекций по 3-15 минут каждая. Для того, чтобы слушатель мог самостоятельно проверить понимание рассказанного, видео сопровождаются семью несложными тестами и, надеюсь, будут сопровождаться обсуждениями на форуме между слушателями.
Также предупрежу, что если вы работаете Data Scientist’ом - этот курс тоже не для вас, вам могут быть полезны только более объемные и технические, а максимальная польза для вас от этого курса - посмотреть, как можно объяснять какие-то вещи просто (если мне это, конечно удалось 🙂).
Зато все остальные люди, которые не хотят кучи формул, не хотят проходить долгий и тяжелый курс, но хотят получить хорошее представление о машинном обучении - те, для кого этот курс создан. Курс уже прошел успешный бета-тест с десятком слушателей-добровольцев, а на грядущей неделе я надеюсь запустить еще один тест курса, теперь уже предложив тестерам купить курс за 50% цены (750 рублей). И если даже заплатившие за курс люди будут отзываться о нем позитивно, курс будет запущен для всех 🙂 Записываться в добровольцы здесь: https://forms.gle/ZqNX9C3whj9FnZxKA
Наконец-то разобрался с техническими трудностями запуска общеобразовательного экспресс-курса по ML. Комментировать не буду, просто прикреплю описание впечатлений диаграммой Эйлера (54-фз - это закон об использовании кассовой техники в том числе при продажах онлайн). Записавшимся начинаю волнами рассылать ссылку на курс, пока письмо получили все записавшиеся до 18:20 24 мая, проверьте пожалуйста спам на всякий случай. Протестируем функционал с первой группой и продолжим запуск курса волнами. А онлайн DMIA пока продолжаем готовить.
Ранее у меня было в голове более-менее чёткое разделение дата саентистов по уровням компетентности и иерархии в компании (об этом были посты в группе курса dmia.space в VK: https://vk.com/wall-78553823_1754 - часть 1, https://vk.com/wall-78553823_1771 - часть 2). Но, к сожалению, как и многие другие вещи, с опытом эта картина выглядит все менее стройно.
Например, не всем DS’ам даже на уровне senior/lead надо ставить задачи машинного обучения на основе потребностей бизнеса. Если в бизнесе одна большая задача, где все уже сформулировано, что прогнозировать понятно, а метрики качества выбраны сто лет назад, и никто их переосмыслять не согласится, работа может сводиться к улучшению качества в 3-4 знаке после запятой. Вы возможно скажете: «Какое бесполезное занятие!», но если это даёт экономию в несколько миллионов в месяц и делается одним человеком всего за квартал - бизнес с вами может не согласиться :) Чем же тогда отличается более квалифицированный специалист от менее квалифицированного? Да просто стоимостью своей работы для компании - ошибаешься реже, код пишешь хорошо, помощь коллег нужна меньше - вот и повод считать тебя более опытным, заплатить чуть больше денег и получать тот же результат от тебя условно не за квартал, а за месяц. Отсюда, в частности, возникают запросы к кандидатам на те умения, которые они не всегда связывают с Data Science. Например, быть ещё и хорошим разработчиком на C++/Java или чем-то ещё, на чем пишут в этой компании, или знать какую-нибудь древнюю как останки динозавра библиотеку, которую по-прежнему используют в продуктах.
Главный вывод здесь - если вы нанимаете сотрудников или если устраиваетесь на работу, не всегда несоответствие представлений бизнеса и кандидата о необходимых навыках связано с тем, что кандидаты слабые/собеседующие неадекватные и как там ещё любят жаловаться люди (и первые и вторые). В рамках одного только Data Science нужный набор компетенций уже сильно плавает от задач, которые человек должен решать. Раньше я с удивлением смотрел на топовые российские компании, которые при уходе человека в Гугл на ту же позицию любили внутри комментировать «а нам он и не подходит, нам такие не нужны», намекая на нехватку каких-то скиллов. «Ребята, ну где вы, а где Гугл? Вернитесь с небес на землю!» - думал я. Но, смешно сказать, теперь понимаю, что это отчасти было верным тезисом. У каждой компании свои процессы и свои задачи и, совершенно серьёзно, человек, очень ценный для более крупной и успешной компании, может быть бесполезен в компании поменьше - просто потому что не вписывается в ее процессы и ее задачи.
Как же быть и как понять какая компания и какой сотрудник «круче»? А никто не круче, просто кто-то больше других подходит именно вам.
Например, не всем DS’ам даже на уровне senior/lead надо ставить задачи машинного обучения на основе потребностей бизнеса. Если в бизнесе одна большая задача, где все уже сформулировано, что прогнозировать понятно, а метрики качества выбраны сто лет назад, и никто их переосмыслять не согласится, работа может сводиться к улучшению качества в 3-4 знаке после запятой. Вы возможно скажете: «Какое бесполезное занятие!», но если это даёт экономию в несколько миллионов в месяц и делается одним человеком всего за квартал - бизнес с вами может не согласиться :) Чем же тогда отличается более квалифицированный специалист от менее квалифицированного? Да просто стоимостью своей работы для компании - ошибаешься реже, код пишешь хорошо, помощь коллег нужна меньше - вот и повод считать тебя более опытным, заплатить чуть больше денег и получать тот же результат от тебя условно не за квартал, а за месяц. Отсюда, в частности, возникают запросы к кандидатам на те умения, которые они не всегда связывают с Data Science. Например, быть ещё и хорошим разработчиком на C++/Java или чем-то ещё, на чем пишут в этой компании, или знать какую-нибудь древнюю как останки динозавра библиотеку, которую по-прежнему используют в продуктах.
Главный вывод здесь - если вы нанимаете сотрудников или если устраиваетесь на работу, не всегда несоответствие представлений бизнеса и кандидата о необходимых навыках связано с тем, что кандидаты слабые/собеседующие неадекватные и как там ещё любят жаловаться люди (и первые и вторые). В рамках одного только Data Science нужный набор компетенций уже сильно плавает от задач, которые человек должен решать. Раньше я с удивлением смотрел на топовые российские компании, которые при уходе человека в Гугл на ту же позицию любили внутри комментировать «а нам он и не подходит, нам такие не нужны», намекая на нехватку каких-то скиллов. «Ребята, ну где вы, а где Гугл? Вернитесь с небес на землю!» - думал я. Но, смешно сказать, теперь понимаю, что это отчасти было верным тезисом. У каждой компании свои процессы и свои задачи и, совершенно серьёзно, человек, очень ценный для более крупной и успешной компании, может быть бесполезен в компании поменьше - просто потому что не вписывается в ее процессы и ее задачи.
Как же быть и как понять какая компания и какой сотрудник «круче»? А никто не круче, просто кто-то больше других подходит именно вам.
Как возможно многие знают, у меня очень много работы для преподавателей - как в вузах и на Data Mining in Action, так и в корпоративных курсах. Сейчас я ищу людей, знающих Data Science, имевших любой удачный опыт преподавания (а еще, кстати, людей знающих и преподающих С++ и Алгоритмы и структуры данных), и желающих в течение года начать зарабатывать преподаванием деньги, сравнимые с рыночными зп специалистов. Если вы или ваши знакомые из таких - пишите мне в личку ( @vkantor )
Спойлер: придётся работать, т.к. готовить материалы и проводить занятия в сегменте с нормальными ценами нужно очень качественно и никаких «не успел подготовиться получше» или «не смог нормально ответить аудитории на вопросы» там быть не может. Но я готов со всем этим помогать тем, кто правда хочет быть крут в преподавании и видит в этом интересное и приятное занятие :)
Спойлер: придётся работать, т.к. готовить материалы и проводить занятия в сегменте с нормальными ценами нужно очень качественно и никаких «не успел подготовиться получше» или «не смог нормально ответить аудитории на вопросы» там быть не может. Но я готов со всем этим помогать тем, кто правда хочет быть крут в преподавании и видит в этом интересное и приятное занятие :)
7 августа выступаю на митапе Data Talk в офисе Mail.ru ( https://habr.com/ru/company/odnoklassniki/blog/459458/ ). Там будет ряд совершенно прекрасных спикеров по теме встречи - образованию в Data Science. Возможно, уже смогу рассказать, что делаю сейчас с Мейлом, и уж точно успею затронуть вопрос образования для тех, кто уже преодолел знакомство с анализом данных на базовом уровне. Приходите, должно быть очень неплохо.
Хабр
ok.tech: Data Толк #2
7 августа в московском офисе Одноклассников состоится ok.tech: Data Толк #2. В этот раз мероприятие будет посвящено образованию в Data Science. Сейчас вокруг работы с данным такой хайп, что только...
В октябре пройдет первый хакатон на Полярном круге, и когда меня позвали побыть экспертом в жюри, я не мог отказаться :) Я вообще не часто соглашаюсь сидеть где-то в жюри - только если история достаточно интересная и в чем-то необычная. Это как раз тот случай.
Для участников, кроме собственно Хакатона, это будет неплохое путешествие - возможность узнать о культуре и быте народов Севера, попробовать аутентичную еду и в целом ощутить на себе местный колорит. Для жителей Ямала хакатон, внезапно, тоже может оказаться полезен – основные кейсы хакатона (насколько мне известно сейчас) посвящены благотворительности и сохранению культуры народов севера. Участникам предстоит работать над заданиями по трём направлениям: социальному, технологическому и культурному.
На регистрацию можно ещё успеть - она до 1 августа: http://hackathon.yanao.ru
Для участников, кроме собственно Хакатона, это будет неплохое путешествие - возможность узнать о культуре и быте народов Севера, попробовать аутентичную еду и в целом ощутить на себе местный колорит. Для жителей Ямала хакатон, внезапно, тоже может оказаться полезен – основные кейсы хакатона (насколько мне известно сейчас) посвящены благотворительности и сохранению культуры народов севера. Участникам предстоит работать над заданиями по трём направлениям: социальному, технологическому и культурному.
На регистрацию можно ещё успеть - она до 1 августа: http://hackathon.yanao.ru
Наконец, после повторного тестирования вводного мини-курса по ML без питона и математики (в желающие поучаствовать записалось 90 человек, в итоге курс проходило 28) мне не страшно запостить сюда ссылку на страницу курса: https://aiducation.ru
Рекомендую всем, кто хочет простое, понятное и содержательное объяснение, что такое машинное обучение. Материал обкатан на какой только можно аудитории (см. лендинг) и хорошо воспринимается. Делитесь с друзьями, которые еще не в Data Science, но которым уже интересно, чем вы занимаетесь. На подходе Deep Learning (там прям очень интересно, уже доделываем) и кейсы применения ML в бизнесе.
Рекомендую всем, кто хочет простое, понятное и содержательное объяснение, что такое машинное обучение. Материал обкатан на какой только можно аудитории (см. лендинг) и хорошо воспринимается. Делитесь с друзьями, которые еще не в Data Science, но которым уже интересно, чем вы занимаетесь. На подходе Deep Learning (там прям очень интересно, уже доделываем) и кейсы применения ML в бизнесе.
IMG_9792.JPG
503.5 KB
Как выбирать алгоритм ML - руководство для начинающих (для продолжающих будет посложнее). Кислотные цвета в угоду моде, но в более подробной схеме будет поспокойнее :)
#новости_и_анонсы_канала
1) Судя по динамике количества подписчиков, идея рисовать для канала картинки (не рискну это называть инфографикой) про data science понравилась аудитории. Поэтому буду продолжать. Если вдруг кому-то интересно помогать с отрисовкой - пишите, это может сильно ускорить выход новых постов.
2) Уже собралось достаточно нового фидбека на курс aiducation.ru, и в августе будет обновление материалов: новые версии видео, дополнительные разделы (в частности, о том, что можно изучать дальше, в зависимости от ваших целей), некоторое обновление тестов. Всем, кто купил курс ранее, обновлённая версия тоже будет доступна. Большое спасибо всем слушателям за обратную связь и просто за прохождение курса!
3) Сегодня вечером участвую в дискуссии про образование в Data Science на Data Толк в московском офисе одноклассников (об этом уже писал), в завтрашнем посте в канале поделюсь впечатлениями от мероприятия и ключевыми на мой взгляд тезисами.
4) После поста про поиск преподавателей я получил очень, очень много ответов, и это очень приятно - здорово, что столь многим людям интересна эта тема. При этом я оказался не готов быстро обработать все ответы. Если я вам ещё не успел ответить - постараюсь это исправить в течение ближайшей недели.
1) Судя по динамике количества подписчиков, идея рисовать для канала картинки (не рискну это называть инфографикой) про data science понравилась аудитории. Поэтому буду продолжать. Если вдруг кому-то интересно помогать с отрисовкой - пишите, это может сильно ускорить выход новых постов.
2) Уже собралось достаточно нового фидбека на курс aiducation.ru, и в августе будет обновление материалов: новые версии видео, дополнительные разделы (в частности, о том, что можно изучать дальше, в зависимости от ваших целей), некоторое обновление тестов. Всем, кто купил курс ранее, обновлённая версия тоже будет доступна. Большое спасибо всем слушателям за обратную связь и просто за прохождение курса!
3) Сегодня вечером участвую в дискуссии про образование в Data Science на Data Толк в московском офисе одноклассников (об этом уже писал), в завтрашнем посте в канале поделюсь впечатлениями от мероприятия и ключевыми на мой взгляд тезисами.
4) После поста про поиск преподавателей я получил очень, очень много ответов, и это очень приятно - здорово, что столь многим людям интересна эта тема. При этом я оказался не готов быстро обработать все ответы. Если я вам ещё не успел ответить - постараюсь это исправить в течение ближайшей недели.
Оказалось, что у Data Толк есть трансляция: https://ok.ru/live/2298825809515
Очень честный и качественный пост выпускницы ФИВТа про первые месяцы работы разработчиком в Яндексе :) Про адаптацию sad but true, хотя возможно многие в российских компаниях и не хотели бы чтобы их как-то тревожил HR в целях адаптации. Кстати, у себя в канале Саша также пишет про стажировки и работу в других компаниях. Периодически читаю ее посты и очень рекомендую тем, кому тоже интересно, как все устроено в разных местах.