Forwarded from Dan Okhlopkov - канал
Моя DS-карьера началась с Kaggle, а потом резко свернула ближе к Data Engineer / Product Analyst. Мои ML скиллы почти нигде мне не пригодились: я либо парсил и складывал, либо автоматизировал SQL. Конечно, у меня есть запатентованный ML-алгоритм, но там тупо Random Forrest. К тому же, ничего умнее пары эвристик на SQL не взлетело в @ffmemesbot. А больше нигде ML мне как будто не нужен был.
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Forwarded from Магия данных | Артур Сапрыкин
На горизонте бесплатный курс по генеративным большим языковым моделям от deeplearning.ai (который Эндрю Ын основал).
Подписался, но не уверен, что дослушаю. Зато знаю, что среди вас есть те, кому точно будет интересно и полезно 😉
Помню, когда-то я слушал курс от Эндрю Ына по основам глубоких нейронных сетей лет 6 назад…
Подписался, но не уверен, что дослушаю. Зато знаю, что среди вас есть те, кому точно будет интересно и полезно 😉
Помню, когда-то я слушал курс от Эндрю Ына по основам глубоких нейронных сетей лет 6 назад…
Coursera
Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Specializations, & MOOCs in data science…
Forwarded from Data Secrets
Мы нашли редкость: схему с алгоритмическими сложностями основных алгоритмов машинного обучения
Любителям алгоритмов посвящается
😻 #advice
Любителям алгоритмов посвящается
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Магия данных | Артур Сапрыкин
This media is not supported in your browser
VIEW IN TELEGRAM
Красота же! :)
Вместо 1000 слов, «а как, а что, а куда» 🙂
Вместо 1000 слов, «а как, а что, а куда» 🙂
Forwarded from Магия данных | Артур Сапрыкин
Представляю вам очень интересную и полезную статью про сбор и предобработку данных.
В ней представлен короткий перечень пунктов, по которым вы сможете улучшить качество своих моделей в итоге.
Конечно, это не всеобъемлющий список, но основной, и во многих задачах от него можно опираться.
Если ещё не успели “набить руку” на предобработке данных, то от себя лично рекомендую для ознакомления.
В ней представлен короткий перечень пунктов, по которым вы сможете улучшить качество своих моделей в итоге.
Конечно, это не всеобъемлющий список, но основной, и во многих задачах от него можно опираться.
Если ещё не успели “набить руку” на предобработке данных, то от себя лично рекомендую для ознакомления.
Хабр
Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных
У Колумбийского университета есть хорошая история о плохих данных . Проект в сфере здравоохранения был нацелен на снижение затрат на лечение пациентов с пневмонией. В нём использовалось машинное...
Forwarded from Это разве аналитика?
Enthought-v1.0.2.pdf
2.4 MB
Шпаргалка по библиотеке pandas
Polars_cheat_sheet.pdf
391.5 KB
Шпаргалка по библиотеке polars
Forwarded from Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Российский бизнес больше всего нуждается в кадрах, которые могут внедрить ИИ в бизнес - процессы - опрос Университета Иннополис.
Forwarded from Клуб CDO (PostoplanBot)
Вышел отчет AI, ML, and Data Engineering InfoQ Trends Report - September 2023
- Generative AI (модели GPT-3 и GPT-4) занимает ведущие позиции в индустрии AI и ML, и широко применяется в технологиях.
- Внимание уделяется векторным базам данных и хранилищам векторных представлений в связи с их ролью в улучшении наблюдаемости в приложениях генеративного AI.
- Растет интерес к ответственному и этичному AI созиданию, и возрастает требование принятия более строгих мер по обеспечению безопасности при работе с большими моделями генеративного обучения.
- Современная инженерия данных переходит к децентрализованным и гибким подходам, с развитием концепции Data Mesh, выступающей в пользу федеративных платформ для данных, разделенных по областям.
В статье так же отмечается, что стоимость роботов снижается, а Robot Operating System (ROS) по-прежнему является ведущей программной платформой в этой области.
https://www.infoq.com/articles/ai-ml-data-engineering-trends-2023/?utm_source=pocket_reader
- Generative AI (модели GPT-3 и GPT-4) занимает ведущие позиции в индустрии AI и ML, и широко применяется в технологиях.
- Внимание уделяется векторным базам данных и хранилищам векторных представлений в связи с их ролью в улучшении наблюдаемости в приложениях генеративного AI.
- Растет интерес к ответственному и этичному AI созиданию, и возрастает требование принятия более строгих мер по обеспечению безопасности при работе с большими моделями генеративного обучения.
- Современная инженерия данных переходит к децентрализованным и гибким подходам, с развитием концепции Data Mesh, выступающей в пользу федеративных платформ для данных, разделенных по областям.
В статье так же отмечается, что стоимость роботов снижается, а Robot Operating System (ROS) по-прежнему является ведущей программной платформой в этой области.
https://www.infoq.com/articles/ai-ml-data-engineering-trends-2023/?utm_source=pocket_reader
Forwarded from Вek Nassyrov
Как получить оффер во Франции и какие тренды искусственного интеллекта нас ждут?
ВЫПУСК DataBoom подкаста с Алибеком Джакуповым 😍
Алибек Джакупов —
😎Microsoft MVP по Искусственному Интеллекту (ИИ)
😎ML инженер, Data Scientist кто делал проекты для Louis Vuitton, BiC, презентовал свои разработки 2 министрам Франции
😎Знает в совершенстве казахский, французский, английский, русский, Python
😎 и просто Қазақ халқының мақтанышы, человек который постоянно поддерживает DATA community, делится пользой и развивает ИИ на родном языке 🇰🇿
Смотреть выпуск:
https://www.youtube.com/watch?v=yW9LyCqDDcg
ВЫПУСК DataBoom подкаста с Алибеком Джакуповым 😍
Алибек Джакупов —
😎Microsoft MVP по Искусственному Интеллекту (ИИ)
😎ML инженер, Data Scientist кто делал проекты для Louis Vuitton, BiC, презентовал свои разработки 2 министрам Франции
😎Знает в совершенстве казахский, французский, английский, русский, Python
😎 и просто Қазақ халқының мақтанышы, человек который постоянно поддерживает DATA community, делится пользой и развивает ИИ на родном языке 🇰🇿
Смотреть выпуск:
https://www.youtube.com/watch?v=yW9LyCqDDcg
YouTube
Как получить оффер во Франции и какие тренды искусственного интеллекта нас ждут? | Алибек Жакупов
Хотите работать в Европе в сфере IT, но не знаете, с чего начать? Желаете узнать, какие навыки и знания нужны для этого, как подготовиться к собеседованию и как адаптироваться к новой культуре? Хотите быть в курсе последних тенденций и инноваций в сфере ИИ?…
Forwarded from ODS Courses
🔥Эта неделя была богата на запуски!
Стартовали сразу три курса:
- в четверг открылись первые лекции курсов Deep Reinforcement Learning и Natural Language Processing
- сегодня стала доступна первая лекция обновленного курса Open ML Course: Линейные модели
Продолжается:
👍Курс по ML System Design уже перешел в фазу активной работы над проектами, где остались только самые активные и заинтересованные студенты 🌞
Ожидаем:
👀А в середине октября запускаем долгожданное продолжение Open ML Course про Деревья и их ансамбли!
Стартовали сразу три курса:
- в четверг открылись первые лекции курсов Deep Reinforcement Learning и Natural Language Processing
- сегодня стала доступна первая лекция обновленного курса Open ML Course: Линейные модели
Продолжается:
👍Курс по ML System Design уже перешел в фазу активной работы над проектами, где остались только самые активные и заинтересованные студенты 🌞
Ожидаем:
👀А в середине октября запускаем долгожданное продолжение Open ML Course про Деревья и их ансамбли!
Forwarded from CRO & Персонализация
Среди самых быстрорастущих AI-навыков в профилях в LinkedIn присутствует рекомендательные системы🔥
Forwarded from Пристанище Дата Сайентиста
Бесплатные курсы по генеративным AI
Я недавно писал про курс по использованию chatGPT и решил пройти остальные бесплатные короткие курсы
Вот небольшие отзывы на них:
- ChatGPT Prompt Engineering for Developers - курс не показался интересным, курс по использованию chatGPT куда полезнее и практичнее
- Building Systems with the ChatGPT API - курс поинтереснее, рассказывает про проектирование систем в основе которых лежат LLM
- LangChain for LLM Application Development - курс крутой и полезный, если вы еще не юзали LangChain в своих проектах, то этот курс поможет понять как использовать LangChain. Работать с контекстом, памятью и многим другим.
- LangChain: Chat with Your Data - тоже полезный курс, по сути расширяет предыдущий. Рассказывают и показывают как использовать свои данные для ChatGPT№
- Finetuning Large Language Models - тут всё понятно, показывают как тюнить модель для вашего домена
- Building Generative AI Applications with Gradio - крутой курс, после которого я задумался юзать для демок не streamlit, а Gradio
Отмечу, что во всех этих миникурсах есть Jupyter ноутбук в котором можно удобно поиграться.
Я недавно писал про курс по использованию chatGPT и решил пройти остальные бесплатные короткие курсы
Вот небольшие отзывы на них:
- ChatGPT Prompt Engineering for Developers - курс не показался интересным, курс по использованию chatGPT куда полезнее и практичнее
- Building Systems with the ChatGPT API - курс поинтереснее, рассказывает про проектирование систем в основе которых лежат LLM
- LangChain for LLM Application Development - курс крутой и полезный, если вы еще не юзали LangChain в своих проектах, то этот курс поможет понять как использовать LangChain. Работать с контекстом, памятью и многим другим.
- LangChain: Chat with Your Data - тоже полезный курс, по сути расширяет предыдущий. Рассказывают и показывают как использовать свои данные для ChatGPT№
- Finetuning Large Language Models - тут всё понятно, показывают как тюнить модель для вашего домена
- Building Generative AI Applications with Gradio - крутой курс, после которого я задумался юзать для демок не streamlit, а Gradio
Отмечу, что во всех этих миникурсах есть Jupyter ноутбук в котором можно удобно поиграться.
Forwarded from Pavel Snurnitsyn
Какой всё-таки термин для FS на русском?
Anonymous Poll
43%
Фичастор
31%
Хранилище признаков
6%
Магазин функций
19%
Торжище фич
Знакомый хороший ML специалист из EPAM рекомендует такие ресурсы:
Core ML and statistic:
1. Тревор Хасти "Основы статистического обучения"
2. Орель Жерон "Прикладное машинное обучение с помощью Scikit-Learn и Tensorflow"
3. Курс "Основы статистики. Часть 1" https://stepik.org/course/76
4. Курс "Основы статистики. Часть 2" https://stepik.org/course/524
5. Курс "Основы статистики. Часть 3" https://stepik.org/course/2152
6. Курс "Введение в Data Science и машинное обучение" https://stepik.org/course/4852
7. Курс "Машинное обучение и анализ данных" https://www.coursera.org/specializations/machine-learning-data-analysis
8. Специализация "Advanced Machine Learning Specialization" https://www.coursera.org/specializations/aml
9. Специализация "Data Science Specialization" https://www.coursera.org/specializations/jhu-data-science
10. Цикл курсов от ODS https://mlcourse.ai/
Deep Learning:
1. Николенко "Глубокое обучение"
2. Франсуа Шоле "Глубокое обучение на Python"
3. Ян Гудфеллоу "Глубокое обучение"
4. Курс "Нейронные сети и компьютерное зрение" https://stepik.org/course/50352/promo
5. Курс "Нейронные сети и обработка текста" https://stepik.org/course/54098/promo
6. Специализация "Deep Learning Specialization" https://www.coursera.org/specializations/deep-learning
7. Специализация "Advanced Machine Learning with TensorFlow on Google Cloud Platform Specialization" https://www.coursera.org/specializations/advanced-machine-learning-tensorflow-gcp
8. Цикл курсов от ODS https://dlcourse.ai/
https://t.me/datajobs/352348
Core ML and statistic:
1. Тревор Хасти "Основы статистического обучения"
2. Орель Жерон "Прикладное машинное обучение с помощью Scikit-Learn и Tensorflow"
3. Курс "Основы статистики. Часть 1" https://stepik.org/course/76
4. Курс "Основы статистики. Часть 2" https://stepik.org/course/524
5. Курс "Основы статистики. Часть 3" https://stepik.org/course/2152
6. Курс "Введение в Data Science и машинное обучение" https://stepik.org/course/4852
7. Курс "Машинное обучение и анализ данных" https://www.coursera.org/specializations/machine-learning-data-analysis
8. Специализация "Advanced Machine Learning Specialization" https://www.coursera.org/specializations/aml
9. Специализация "Data Science Specialization" https://www.coursera.org/specializations/jhu-data-science
10. Цикл курсов от ODS https://mlcourse.ai/
Deep Learning:
1. Николенко "Глубокое обучение"
2. Франсуа Шоле "Глубокое обучение на Python"
3. Ян Гудфеллоу "Глубокое обучение"
4. Курс "Нейронные сети и компьютерное зрение" https://stepik.org/course/50352/promo
5. Курс "Нейронные сети и обработка текста" https://stepik.org/course/54098/promo
6. Специализация "Deep Learning Specialization" https://www.coursera.org/specializations/deep-learning
7. Специализация "Advanced Machine Learning with TensorFlow on Google Cloud Platform Specialization" https://www.coursera.org/specializations/advanced-machine-learning-tensorflow-gcp
8. Цикл курсов от ODS https://dlcourse.ai/
https://t.me/datajobs/352348
Stepik: online education
Основы статистики
Курс знакомит слушателей с основными понятиями и методами математической статистики. В течение трех недель мы рассмотрим наиболее широко используемые статистические методы и принципы, стоящие за ними. Полученных знаний будет достаточно для решения широкого…
#Курс A2nced про DS/ML в маркетинге
▫️ Даты обучения: 13-17 ноября 2023 г.
▫️ Формат: онлайн (10:00-14:00 по Москве).
Cкоро запускается новый поток нашего интенсива «Продвинутая аналитика и машинное обучение в маркетинге», пока еще есть места.
Преподаватели — наши активные спикеры NoML:
▫️ Дмитрий Забавин, архитектор решений Data Science практики GlowByte Advanced Analytics.
▫️ Вадим Глухов, ведущий консультант направления клиентской аналитики практики GlowByte Advanced Analytics.
В программе интенсива:
▫️ Жизненный цикл клиента. Универсальный пайплайн обучения модели. Подготовка и оценка результатов пилота.
▫️ Оценка склонности клиента к продукту. Естественный трафик. Целевой трафик. Клиенты без истории.
▫️ Отклик клиента на продукт.
▫️ Отток клиентов. Определение оттока. Идентификация оттока. Удержание и реактивация клиентов.
▫️ Оценка эффекта модели.
▫️ Также наши эксперты поделятся профессиональными секретами эффективного решения этих задач исходя из опыта проектов GlowByte.
Интенсив подойдет:
▫️ Специалистам DS, желающим освоить предметную область клиентской аналитики.
▫️ Маркетинговым / продуктовым аналитикам, маркетологам, PO, PM, желающим погрузиться в область DS.
▫️ И всем специалистам, которые интересуются областью Data Science и хотят расширить свой кругозор эффективными приложениями ML/DS в решении различных бизнес-задач.
Вас ждет:
▫️ 5 дней обучения, 20 академических часов;
▫️ Живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ Практические задания по пройденному материалу;
▫️ 2 месяца доступ к записям и материалам обучения;
▫️ Сертификат от A2nced x GlowByte (это вам не диплом MIT);
Подробнее о программе→
Курс платный, узнать больше и записаться можно у Людмилы Локтевой @ldMiila.
https://t.me/noml_community/5020/6879
▫️ Даты обучения: 13-17 ноября 2023 г.
▫️ Формат: онлайн (10:00-14:00 по Москве).
Cкоро запускается новый поток нашего интенсива «Продвинутая аналитика и машинное обучение в маркетинге», пока еще есть места.
Преподаватели — наши активные спикеры NoML:
▫️ Дмитрий Забавин, архитектор решений Data Science практики GlowByte Advanced Analytics.
▫️ Вадим Глухов, ведущий консультант направления клиентской аналитики практики GlowByte Advanced Analytics.
В программе интенсива:
▫️ Жизненный цикл клиента. Универсальный пайплайн обучения модели. Подготовка и оценка результатов пилота.
▫️ Оценка склонности клиента к продукту. Естественный трафик. Целевой трафик. Клиенты без истории.
▫️ Отклик клиента на продукт.
▫️ Отток клиентов. Определение оттока. Идентификация оттока. Удержание и реактивация клиентов.
▫️ Оценка эффекта модели.
▫️ Также наши эксперты поделятся профессиональными секретами эффективного решения этих задач исходя из опыта проектов GlowByte.
Интенсив подойдет:
▫️ Специалистам DS, желающим освоить предметную область клиентской аналитики.
▫️ Маркетинговым / продуктовым аналитикам, маркетологам, PO, PM, желающим погрузиться в область DS.
▫️ И всем специалистам, которые интересуются областью Data Science и хотят расширить свой кругозор эффективными приложениями ML/DS в решении различных бизнес-задач.
Вас ждет:
▫️ 5 дней обучения, 20 академических часов;
▫️ Живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ Практические задания по пройденному материалу;
▫️ 2 месяца доступ к записям и материалам обучения;
▫️ Сертификат от A2nced x GlowByte (это вам не диплом MIT);
Подробнее о программе→
Курс платный, узнать больше и записаться можно у Людмилы Локтевой @ldMiila.
https://t.me/noml_community/5020/6879