ML Career
214 subscribers
121 photos
4 videos
2 files
148 links
Branched from @data_career
Download Telegram
Моя DS-карьера началась с Kaggle, а потом резко свернула ближе к Data Engineer / Product Analyst. Мои ML скиллы почти нигде мне не пригодились: я либо парсил и складывал, либо автоматизировал SQL. Конечно, у меня есть запатентованный ML-алгоритм, но там тупо Random Forrest. К тому же, ничего умнее пары эвристик на SQL не взлетело в @ffmemesbot. А больше нигде ML мне как будто не нужен был.

Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫

Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
На горизонте бесплатный курс по генеративным большим языковым моделям от deeplearning.ai (который Эндрю Ын основал).

Подписался, но не уверен, что дослушаю. Зато знаю, что среди вас есть те, кому точно будет интересно и полезно 😉

Помню, когда-то я слушал курс от Эндрю Ына по основам глубоких нейронных сетей лет 6 назад…
Forwarded from Data Secrets
Мы нашли редкость: схему с алгоритмическими сложностями основных алгоритмов машинного обучения

Любителям алгоритмов посвящается

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Красота же! :)
Вместо 1000 слов, «а как, а что, а куда» 🙂
Представляю вам очень интересную и полезную статью про сбор и предобработку данных.

В ней представлен короткий перечень пунктов, по которым вы сможете улучшить качество своих моделей в итоге.

Конечно, это не всеобъемлющий список, но основной, и во многих задачах от него можно опираться.

Если ещё не успели “набить руку” на предобработке данных, то от себя лично рекомендую для ознакомления.
Enthought-v1.0.2.pdf
2.4 MB
Шпаргалка по библиотеке pandas
Polars_cheat_sheet.pdf
391.5 KB
Шпаргалка по библиотеке polars
Российский бизнес больше всего нуждается в кадрах, которые могут внедрить ИИ в бизнес - процессы - опрос Университета Иннополис.
Forwarded from Клуб CDO (PostoplanBot)
Вышел отчет AI, ML, and Data Engineering InfoQ Trends Report - September 2023

- Generative AI (модели GPT-3 и GPT-4) занимает ведущие позиции в индустрии AI и ML, и широко применяется в технологиях.
- Внимание уделяется векторным базам данных и хранилищам векторных представлений в связи с их ролью в улучшении наблюдаемости в приложениях генеративного AI.
- Растет интерес к ответственному и этичному AI созиданию, и возрастает требование принятия более строгих мер по обеспечению безопасности при работе с большими моделями генеративного обучения.
- Современная инженерия данных переходит к децентрализованным и гибким подходам, с развитием концепции Data Mesh, выступающей в пользу федеративных платформ для данных, разделенных по областям.

В статье так же отмечается, что стоимость роботов снижается, а Robot Operating System (ROS) по-прежнему является ведущей программной платформой в этой области.

https://www.infoq.com/articles/ai-ml-data-engineering-trends-2023/?utm_source=pocket_reader
Forwarded from Вek Nassyrov
Как получить оффер во Франции и какие тренды искусственного интеллекта нас ждут?
ВЫПУСК DataBoom подкаста с Алибеком Джакуповым 😍
Алибек Джакупов —
😎Microsoft MVP по Искусственному Интеллекту (ИИ)
😎ML инженер, Data Scientist кто делал проекты для Louis Vuitton, BiC, презентовал свои разработки 2 министрам Франции
😎Знает в совершенстве казахский, французский, английский, русский, Python
😎 и просто Қазақ халқының мақтанышы, человек который постоянно поддерживает DATA community, делится пользой и развивает ИИ на родном языке 🇰🇿

Смотреть выпуск:
https://www.youtube.com/watch?v=yW9LyCqDDcg
Forwarded from ODS Courses
🔥Эта неделя была богата на запуски!

Стартовали сразу три курса:
- в четверг открылись первые лекции курсов Deep Reinforcement Learning и Natural Language Processing
- сегодня стала доступна первая лекция обновленного курса Open ML Course: Линейные модели

Продолжается:
👍Курс по ML System Design уже перешел в фазу активной работы над проектами, где остались только самые активные и заинтересованные студенты 🌞

Ожидаем:
👀А в середине октября запускаем долгожданное продолжение Open ML Course про Деревья и их ансамбли!
Среди самых быстрорастущих AI-навыков в профилях в LinkedIn присутствует рекомендательные системы🔥
Бесплатные курсы по генеративным AI

Я недавно писал про курс по использованию chatGPT и решил пройти остальные бесплатные короткие курсы

Вот небольшие отзывы на них:
- ChatGPT Prompt Engineering for Developers - курс не показался интересным, курс по использованию chatGPT куда полезнее и практичнее
- Building Systems with the ChatGPT API - курс поинтереснее, рассказывает про проектирование систем в основе которых лежат LLM
- LangChain for LLM Application Development - курс крутой и полезный, если вы еще не юзали LangChain в своих проектах, то этот курс поможет понять как использовать LangChain. Работать с контекстом, памятью и многим другим.
- LangChain: Chat with Your Data - тоже полезный курс, по сути расширяет предыдущий. Рассказывают и показывают как использовать свои данные для ChatGPT№
- Finetuning Large Language Models - тут всё понятно, показывают как тюнить модель для вашего домена
- Building Generative AI Applications with Gradio - крутой курс, после которого я задумался юзать для демок не streamlit, а Gradio

Отмечу, что во всех этих миникурсах есть Jupyter ноутбук в котором можно удобно поиграться.
Forwarded from Pavel Snurnitsyn
Какой всё-таки термин для FS на русском?
Anonymous Poll
43%
Фичастор
31%
Хранилище признаков
6%
Магазин функций
19%
Торжище фич
Знакомый хороший ML специалист из EPAM рекомендует такие ресурсы:
Core ML and statistic:

1. Тревор Хасти "Основы статистического обучения"

2. Орель Жерон "Прикладное машинное обучение с помощью Scikit-Learn и Tensorflow"

3. Курс "Основы статистики. Часть 1" https://stepik.org/course/76

4. Курс "Основы статистики. Часть 2" https://stepik.org/course/524

5. Курс "Основы статистики. Часть 3" https://stepik.org/course/2152

6. Курс "Введение в Data Science и машинное обучение" https://stepik.org/course/4852

7. Курс "Машинное обучение и анализ данных" https://www.coursera.org/specializations/machine-learning-data-analysis

8. Специализация "Advanced Machine Learning Specialization" https://www.coursera.org/specializations/aml

9. Специализация "Data Science Specialization" https://www.coursera.org/specializations/jhu-data-science

10. Цикл курсов от ODS https://mlcourse.ai/


Deep Learning:

1. Николенко "Глубокое обучение"

2. Франсуа Шоле "Глубокое обучение на Python"

3. Ян Гудфеллоу "Глубокое обучение"

4. Курс "Нейронные сети и компьютерное зрение" https://stepik.org/course/50352/promo

5. Курс "Нейронные сети и обработка текста" https://stepik.org/course/54098/promo

6. Специализация "Deep Learning Specialization" https://www.coursera.org/specializations/deep-learning

7. Специализация "Advanced Machine Learning with TensorFlow on Google Cloud Platform Specialization" https://www.coursera.org/specializations/advanced-machine-learning-tensorflow-gcp

8. Цикл курсов от ODS https://dlcourse.ai/

https://t.me/datajobs/352348
#Курс A2nced про DS/ML в маркетинге
▫️ Даты обучения: 13-17 ноября 2023 г.
▫️ Формат: онлайн (10:00-14:00 по Москве).

Cкоро запускается новый поток нашего интенсива «Продвинутая аналитика и машинное обучение в маркетинге», пока еще есть места.

Преподаватели — наши активные спикеры NoML:
▫️ Дмитрий Забавин, архитектор решений Data Science практики GlowByte Advanced Analytics.
▫️ Вадим Глухов, ведущий консультант направления клиентской аналитики практики GlowByte Advanced Analytics.

В программе интенсива:
▫️ Жизненный цикл клиента. Универсальный пайплайн обучения модели. Подготовка и оценка результатов пилота.
▫️ Оценка склонности клиента к продукту. Естественный трафик. Целевой трафик. Клиенты без истории.
▫️ Отклик клиента на продукт.
▫️ Отток клиентов. Определение оттока. Идентификация оттока. Удержание и реактивация клиентов.
▫️ Оценка эффекта модели.
▫️ Также наши эксперты поделятся профессиональными секретами эффективного решения этих задач исходя из опыта проектов GlowByte.

Интенсив подойдет:
▫️ Специалистам DS, желающим освоить предметную область клиентской аналитики.
▫️ Маркетинговым / продуктовым аналитикам, маркетологам, PO, PM, желающим погрузиться в область DS.
▫️ И всем специалистам, которые интересуются областью Data Science и хотят расширить свой кругозор эффективными приложениями ML/DS в решении различных бизнес-задач.

Вас ждет:
▫️ 5 дней обучения, 20 академических часов;
▫️ Живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ Практические задания по пройденному материалу;
▫️ 2 месяца доступ к записям и материалам обучения;
▫️ Сертификат от A2nced x GlowByte (это вам не диплом MIT);

Подробнее о программе→

Курс платный, узнать больше и записаться можно у Людмилы Локтевой @ldMiila.

https://t.me/noml_community/5020/6879