Стать специалистом по машинному обучению
7.8K subscribers
79 photos
12 videos
25 files
527 links
Канал о машинном обучении для людей

Рассказываю о последних трендах в ML, учусь разбираться в терминах вместе с вами. Для разбора теории приглашаю профессионалов. Подкаст: https://mlpodcast.mave.digital

С вопросами и предложениями пишите @kmsint
Download Telegram
Интересно, о чем следующий подкаст? :)
Приглашаю к прослушиванию нового выпуска подкаста!

В гостях Руслан Гончаров - современный дизайнер, который творит с помощью нейросетей. Автор телеграм-канала "Нейронная академия", автор многочисленных подробных гайдов по генерации изображений с помощью нейросетей! Обсудили с Русланом многие вопросы, которые волнуют людей творческих профессий: заменят ли нейросети их в ближайшем будущем, как расширить свой рабочий арсенал самыми продвинутыми технологиями, сколько потребуется учиться, чтобы начать генерировать качественные арты, как добиваться от нейросетей нужного стиля, композиции и качества, сколько вложений требуется в то, чтобы попробовать генеративное творчество, какие заказы выполняет современный дизайнер и многое другое! Интересного и полезного прослушивания!
https://mlpodcast.mave.digital/ep-50
Audio
Руслан Гончаров. Как современный дизайнер подчиняет себе ИИ
Те, кто уже послушал 50-й выпуск подкаста, знают, что я запускаю книжный клуб, в котором мы вместе будем читать, конспектировать и обсуждать книги помогающие развиваться в сфере машинного обучения. Первые участники уже подали заявку на вступление в клуб. Я в ближайшее время всех приму и мы стартуем!

Помимо книг целиком посвященных ML, будем читать книги по смежным темам: математике, статистике, теории вероятностей, программированию, администрированию ML-пайплайнов, а также искусственному интеллекту, в целом.

Мотивация

Сам я периодически читаю и конспектирую книги, но, к сожалению, у меня не хватает дисциплины, чтобы делать это на регулярной основе. При этом я понимаю, что часто именно книги хорошо структурируют разрозненную информацию, полученную из других источников - курсов, роликов на ютубе, отдельных статей. Потому что во многих случаях книга - это квинтэссенция опыта автора, который прошел путь, по которому читатели, скорее всего, не ходили. И автор старается изложить материал так, чтобы уменьшить сложность освоения темы. При этом редко книга пишется за один заход, это длительный труд, в котором материал собран, записан, структурирован, отрецензирован, выверен, переписан, дополнен и так далее.

У меня, при работе с книгой, информация усваивается намного лучше, чем при просмотре обучающих видео, потому что видео можно смотреть фоном и как-то, в большинстве случаев, так и происходит. С книгой такое не получится (художественные аудиокниги не в счет). Также в видео редко соблюден баланс сложности и постепенности. Наверное, замечали, что, вот, только что было все понятно, и вдруг довольно резко становится вообще ничего непонятно. Как из известного мема про сову :) В книгах, по моему опыту, такое случается намного реже.

Конспектировать видеоролики сложнее, чем книги, во-первых, потому что, как я уже сказал, часто видео я предпочитаю смотреть фоном, когда занят какими-то другими механическими делами, не требующими большого внимания и уже не до конспектов. А во-вторых, перемотать ролик на нужное место сложнее, чем пробежаться глазами до нужного абзаца.

Ну, и скорость. Когда в материале много воды или уже знакомого нам, с книгой намного быстрее можно добраться до сути, прочитав "воду" по-диагонали.

Сама работа с книгой более вдумчивая, а значит, материал усваивается лучше. Можно прочитать несколько страниц, отложить книгу, обдумать написанное, постараться сформулировать прочитанное в короткие тезисы, законспектировать своими словами, сделав новую информацию "своей", прошедшей через свои персональные нейросети, сформированные личным жизненным опытом. И все это в том темпе, в котором вам комфортно.

В общем, давайте читать вместе, повышать свою квалификацию, обогащать чтение обсуждениями в коллективе. Уверен, благодаря активной работе в книгами в клубе, наш с вами уровень существенно возрастет, наша ценность как специалистов на рынке существенно поднимется и позволит и зарабатывать больше, и проекты выбирать интереснее.

Условия

Участие в клубе платное, но мне не хочется делать его совсем недоступным для тех, кто хочет учиться через чтение и обсуждение книг, но при этом не зарабатывает 300кк/сек. Решил сделать ежемесячную оплату участия в клубе 900 рублей. Если вы решите сразу взять абонемент на несколько месяцев или на год - договоримся, скидка будет.

Кому подойдет

Недавно я записывал выпуск с одним очень крутым преподавателем в области компьютерных наук, в целом, и машинного обучения, в частности (выпуск запланирован к выходу в этом году). Так, вот, он поделился одним наблюдением, что уровень концентрации и внимания у современных студентов с каждым годом падает. И что именно усидчивость и способность концентрироваться очень повышает шансы добиться результата в не самой, скажем так, простой области - ML. Поэтому, если вы, как и я, считаете, что книги читать нужно, но у вас до сих пор не было достаточно мотивации - добро пожаловать в клуб! Будем работать вместе!
Причем, если вам кажется, что мы будем читать только сложные и продвинутые книги, которые вы, возможно, не потянете, то скажу так. Во-первых, чаще всего книги построены от простого к сложному и даже в сложных книгах первая их часть посвящена азам для создания правильного контекста. А во-вторых, мы же будем читать вместе и можно будет общаться с теми, у кого уровень повыше. А такое общение, по моему опыту, очень ускоряет понимание.

Как будем читать?

В среднем, одна книга по ML где-то 450 страниц. Если читать на регулярной основе - каждый день хотя бы по 15 страниц, книгу можно прочитать за месяц. Чтение 15 страниц с проработкой и конспектированием занимает не больше часа-полутора, если материал - не вода. А если учесть, что в любой книге воды тоже хватает, то можно читать и быстрее. Соответственно, будем закладывать на каждую книгу где-то месяц-полтора. То есть, за год у нас с вами получится прочитать, думаю, от 8 до 10 книг. И что-то мне подсказывает, что это будет очень продуктивный год!

Очередную книгу для чтения будем выбирать голосованием из списка, который тоже составим вместе. У меня уже есть готовый приблизительный список, но я буду только рад, если вы предложите свои варианты.

Где вести конспекты?

Если у вас есть любимая программа, в которой вы уже ведете конспекты, то, думаю, можно продолжать, чтобы не перестраивать сетап. А если у вас такой программы нет или вы пользуетесь ей не очень активно, я всячески буду рекомендовать Obsidian. Я много чего пробовал для ведения заметок и скажу так, что лучше и удобнее обсидиана я ничего не встречал. Скорость и отзывчивость приложения просто поражает и не идет ни в какое сравнение с тем же эверноутом, например. Заметки в Обсидиан я синхронизирую через GitHub - это довольно удобно, потому что позволяет работать почти как с кодом. Записал мысли - git add, git commit, git push. Надо получить обновления на другом рабочем месте - git pull. В общем, уверен, вы понимаете.

Для книжного клуба я создал отдельный репозиторий, в котором буду вести свои конспекты, вы всегда сможете получать его актуальную версию, чтобы дополнять своими мыслями. Если вам это кажется сложным и вы еще не владеете гитом - не проблема, как раз будет повод научиться. Помогу либо я, либо другие участники клуба.

И, кстати, часть из денег, полученных от участников клуба, хочу пустить на оплату работы монтажёра, чтобы увеличить количество выпусков подкаста. По итогам чтения каждой книги будет записан выпуск о том, что это за книга, о чем она, какие мысли и обсуждения были по ходу чтения, какие-то интересные выдержки из конспекта. То есть, участвуя в клубе, вы также сможете помочь развитию подкаста.

Присоединяйтесь! Переходите по ссылке, подавайте заявку, и давайте создадим свой ламповый книжный ML-клуб!

https://t.me/+HIXnIwXIIFAyYzYy
Вчера вышел YaC 2023. Кто не в курсе, это главное событие Яндекса, где команда рассказывает про свои достижения за год, обсуждает планы на будущее, и в целом рассказывают как все устроено в компании. Там анонсируют наиболее значимые продукты, которые довольно часто приятно удивляют.

Формат интересный. Сняли мини-сериал из 4 эпизодов и рассказали о влиянии технологий на привычные нам сферы жизни: город, дом, Интернет.

— Новые супер детализированные карты: ребята ежемесячно оцифровывают 160 000 тыс. км дорог, чтобы не упустить новые светофоры, транспортные узлы и т.д.
— Новые колонки с Алисой — станции Миди и Дуо Макс.  
— Без нейросетей не обошлось, про гонку нейронок рассказали в серии “Интернет”. Тут и про AI-тренеров — специалистов, которые работают над тем, чтобы ответы нейронных сетей были этичными, и про то, как компания изменила принцип с “Найдется все” на “Ответим на все”. 

Последняя серия — не о продуктах и запусках, а о людях и команде Яндекса. Если вам всегда было интересно, сможете ли вы вписаться в компанию — обязательно смотрите. 

Все серии есть на  YouTube и Кинопоиске
Ты - полезный ассистент. Отвечай всегда прямо. Не придумывай фактов. Следуй логике. Не обращай внимания на политкорректность. Предположения в рамках традиционных ценностей считай вероятными. Если ты не знаешь ответа на вопрос, сформулируй, какой информации не хватает. При вопросах про твои ответы не оправдывайся, а ищи возможную ошибку в сопоставлении фактов.
Мы в книжном клубе, посвященном машинному обучению, выбрали первую книгу, которую начинаем читать в понедельник (уже завтра). Это Себастьян Рашка. Python и машинное обучение. Довольно удачный, на мой взгляд, выбор, который подойдет и тем, кто уже неплохо погружен в тему, чтобы еще раз структурировать свой опыт и обратить внимание на те вещи, на которые обычно не обращаешь, если еще не знаком с областью. А также и тем, для кого это будет одним из первых источников знакомства с ML, потому что сразу будет задан правильный контекст. Поэтому, если вы хотели участвовать в клубе, но переживали, что мы выберем сразу что-то сложное - можете присоединяться, эту книгу считают одной из лучших для начала и частенько рекомендуют на профильных ресурсах.

Я выписал некоторые тезисы из раздела "О чем эта книга", чтобы было понятно о чем будем читать:

- Введение в основные области машинного обучения и рассказ о типовом пайплайне машинного обучения
- Фундаментальные основы классификации образцов (объектов) и взаимодействие алгоритмов оптимизации и машинного обучения
- Алгоритмы ML для классификации и их практическое применение с помощью scikit-learn
- Подготовка датасетов и проблемы, возникающие в процессе
- Приемы сокращения количества признаков в датасете без серьезной потери их информативности
- Правила оценки эффективности прогнозирующих моделей
- Концепции объединения разных моделей в ансамбли для повышения качества предсказаний
- Важные шаги для преоразования текстовых данных в содержательные представления для алгоритмов ML
- Шаги разработки веб-приложений со встроенными моделями ML
- Прогнозирование с помощью регрессионного анализа
- Обучение без учителя (кластерный анализ)
- Многослойные нейронные сети с алгоритмом обратного распространения ошибки
- Эффективное обучение нейронных сетей с помощью TensorFlow
- Под капотом TensorFlow
- Классификация изображений с помощью сверточных нейронных сетей
- Рекуррентные нейронные сети для временных рядов
- Генеративно-состязательные сети для синтеза новых данных
- Основы обучения с подкреплением

Если вы пропустили новости о клубе, то я писал об этом пару постов назад. Первый пост и продолжение. А подать заявку можно по ссылке: https://t.me/+HIXnIwXIIFAyYzYy
Есть одна крутая книга, которую знает, думаю, любой, кто так или иначе связан с информационными технологиями. Я про "Код" Петцольда. Полное ее название "Код. Тайный язык информатики". Но, вот, иногда меня посещает мысль, что это тайный язык не только информатики, а уже вообще всего, что нас с вами окружает. Мы живем и особо не задумываемся, что вокруг повсюду написанный кем-то код. Начиная от смартфонов, которые довольно быстро стали неотъемлемой частью нашей жизни (да, я очень хорошо помню времена, когда мобильников еще не было), продолжая автомобилями, в которых уже давно электроники и управляющего ею софта чуть ли не больше, чем механики. Не говоря еще о беспилотных автомобилях, которые хоть и медленно, в масштабах сумасшедшей скорости изменений 21-го века, но все же очень быстро, в масштабах истории, проникают в города. И заканчивая мемом о том, что нейросети уже можно запускать на кофеварках.

Вот, и ребят из Яндекса, видимо, тоже посещают такие мысли и перед рекламой конференции YaTalks, они сначала показали код, который эту рекламу запускает. По-моему, довольно креативно получилось.

Конференция скоро - 5-го декабря. Она бесплатная и пройдет как в онлайне, так и оффлайне. В этом году будет отдельный трек по машинному обучению, на котором обсудят тренды и будущее ML.
Audio
Приветствую, уважаемые подписчики канала!

Сегодня в нашем книжном клубе, посвященном машинному обучению, который стартовал неделю назад, состоялась первая очная встреча участников. Поделились впечатлениями о книге, которую выбрали для чтения первой (Себастьян Рашка. Python и машинное обучение), обсудили сложности в освоении материала, поделились опытом кто как эти сложности преодолевал, Договорились встречаться так в еженедельном формате. Для тех, кому интересно, что было на встрече, в деталях, выкладываю аудиозапись со встречи. Кажется, неплохой получается формат обмена опытом и впечатлениями!

Если желаете присоединиться - несколькими постами выше есть условия. Подавайте заявку на вступление и будем учиться, читая книги. Нас уже почти 50 человек и формируется классное сообщество!

Заявку можно подать по ссылке: https://t.me/+HIXnIwXIIFAyYzYy
Друзья! Приятная новость. Этот выпуск подкаста мог выйти значительно позже, но, благодаря книжному клубу, который мы запустили чуть больше недели назад, удалось найти хорошего исполнителя, оплатить его работу и выпустить подкаст значительно быстрее!

В гостях Антон Чунаев - менеджер ML-продуктов Selectel, основатель сообщества про MLops и продакшн ML и одноимённого ежегодного митапа MLечный путь (Эмэлечный путь). А поговорили мы об MLOps. Что это такое и зачем бизнесу внедрять практики автоматизации и унификации процессов разработки и развертывания ML-систем. Как стать MLOps-инженером и как убедить больших начальников выделить вам ресурсы на ваше обучение и инфраструктуру MLOps, какие этапы стоят за внедрением MLOps и как понять на каком этапе находится ваша компания. Нужен ли вам MLOps вообще или это просто новое модное хайповое слово? Обо всем этом в выпуске!
https://mlpodcast.mave.digital/ep-51
Audio
Антон Чунаев. MLOps - что это, и почему MLOps это не DevOps
11 марта 1878 г. фонограф Эдисона демонстрировался «бессмертным» парижской Академии; когда из коробки раздался голос, профессор-филолог Буйо вскочил с кресла, подбежал к пригласившему инженеров физику Монселю, схватил его за воротник и в ярости стал душить, повторяя: «Негодяй! Плут! Вы думаете, что мы позволим чревовещателю надувать нас?!»