ML Career
213 subscribers
123 photos
4 videos
2 files
149 links
Branched from @data_career
Download Telegram
Представляю вам очень интересную и полезную статью про сбор и предобработку данных.

В ней представлен короткий перечень пунктов, по которым вы сможете улучшить качество своих моделей в итоге.

Конечно, это не всеобъемлющий список, но основной, и во многих задачах от него можно опираться.

Если ещё не успели “набить руку” на предобработке данных, то от себя лично рекомендую для ознакомления.
Enthought-v1.0.2.pdf
2.4 MB
Шпаргалка по библиотеке pandas
Polars_cheat_sheet.pdf
391.5 KB
Шпаргалка по библиотеке polars
Российский бизнес больше всего нуждается в кадрах, которые могут внедрить ИИ в бизнес - процессы - опрос Университета Иннополис.
Forwarded from Клуб CDO (PostoplanBot)
Вышел отчет AI, ML, and Data Engineering InfoQ Trends Report - September 2023

- Generative AI (модели GPT-3 и GPT-4) занимает ведущие позиции в индустрии AI и ML, и широко применяется в технологиях.
- Внимание уделяется векторным базам данных и хранилищам векторных представлений в связи с их ролью в улучшении наблюдаемости в приложениях генеративного AI.
- Растет интерес к ответственному и этичному AI созиданию, и возрастает требование принятия более строгих мер по обеспечению безопасности при работе с большими моделями генеративного обучения.
- Современная инженерия данных переходит к децентрализованным и гибким подходам, с развитием концепции Data Mesh, выступающей в пользу федеративных платформ для данных, разделенных по областям.

В статье так же отмечается, что стоимость роботов снижается, а Robot Operating System (ROS) по-прежнему является ведущей программной платформой в этой области.

https://www.infoq.com/articles/ai-ml-data-engineering-trends-2023/?utm_source=pocket_reader
Forwarded from Вek Nassyrov
Как получить оффер во Франции и какие тренды искусственного интеллекта нас ждут?
ВЫПУСК DataBoom подкаста с Алибеком Джакуповым 😍
Алибек Джакупов —
😎Microsoft MVP по Искусственному Интеллекту (ИИ)
😎ML инженер, Data Scientist кто делал проекты для Louis Vuitton, BiC, презентовал свои разработки 2 министрам Франции
😎Знает в совершенстве казахский, французский, английский, русский, Python
😎 и просто Қазақ халқының мақтанышы, человек который постоянно поддерживает DATA community, делится пользой и развивает ИИ на родном языке 🇰🇿

Смотреть выпуск:
https://www.youtube.com/watch?v=yW9LyCqDDcg
Forwarded from ODS Courses
🔥Эта неделя была богата на запуски!

Стартовали сразу три курса:
- в четверг открылись первые лекции курсов Deep Reinforcement Learning и Natural Language Processing
- сегодня стала доступна первая лекция обновленного курса Open ML Course: Линейные модели

Продолжается:
👍Курс по ML System Design уже перешел в фазу активной работы над проектами, где остались только самые активные и заинтересованные студенты 🌞

Ожидаем:
👀А в середине октября запускаем долгожданное продолжение Open ML Course про Деревья и их ансамбли!
Среди самых быстрорастущих AI-навыков в профилях в LinkedIn присутствует рекомендательные системы🔥
Бесплатные курсы по генеративным AI

Я недавно писал про курс по использованию chatGPT и решил пройти остальные бесплатные короткие курсы

Вот небольшие отзывы на них:
- ChatGPT Prompt Engineering for Developers - курс не показался интересным, курс по использованию chatGPT куда полезнее и практичнее
- Building Systems with the ChatGPT API - курс поинтереснее, рассказывает про проектирование систем в основе которых лежат LLM
- LangChain for LLM Application Development - курс крутой и полезный, если вы еще не юзали LangChain в своих проектах, то этот курс поможет понять как использовать LangChain. Работать с контекстом, памятью и многим другим.
- LangChain: Chat with Your Data - тоже полезный курс, по сути расширяет предыдущий. Рассказывают и показывают как использовать свои данные для ChatGPT№
- Finetuning Large Language Models - тут всё понятно, показывают как тюнить модель для вашего домена
- Building Generative AI Applications with Gradio - крутой курс, после которого я задумался юзать для демок не streamlit, а Gradio

Отмечу, что во всех этих миникурсах есть Jupyter ноутбук в котором можно удобно поиграться.
Forwarded from Pavel Snurnitsyn
Какой всё-таки термин для FS на русском?
Anonymous Poll
43%
Фичастор
31%
Хранилище признаков
6%
Магазин функций
19%
Торжище фич
Знакомый хороший ML специалист из EPAM рекомендует такие ресурсы:
Core ML and statistic:

1. Тревор Хасти "Основы статистического обучения"

2. Орель Жерон "Прикладное машинное обучение с помощью Scikit-Learn и Tensorflow"

3. Курс "Основы статистики. Часть 1" https://stepik.org/course/76

4. Курс "Основы статистики. Часть 2" https://stepik.org/course/524

5. Курс "Основы статистики. Часть 3" https://stepik.org/course/2152

6. Курс "Введение в Data Science и машинное обучение" https://stepik.org/course/4852

7. Курс "Машинное обучение и анализ данных" https://www.coursera.org/specializations/machine-learning-data-analysis

8. Специализация "Advanced Machine Learning Specialization" https://www.coursera.org/specializations/aml

9. Специализация "Data Science Specialization" https://www.coursera.org/specializations/jhu-data-science

10. Цикл курсов от ODS https://mlcourse.ai/


Deep Learning:

1. Николенко "Глубокое обучение"

2. Франсуа Шоле "Глубокое обучение на Python"

3. Ян Гудфеллоу "Глубокое обучение"

4. Курс "Нейронные сети и компьютерное зрение" https://stepik.org/course/50352/promo

5. Курс "Нейронные сети и обработка текста" https://stepik.org/course/54098/promo

6. Специализация "Deep Learning Specialization" https://www.coursera.org/specializations/deep-learning

7. Специализация "Advanced Machine Learning with TensorFlow on Google Cloud Platform Specialization" https://www.coursera.org/specializations/advanced-machine-learning-tensorflow-gcp

8. Цикл курсов от ODS https://dlcourse.ai/

https://t.me/datajobs/352348
#Курс A2nced про DS/ML в маркетинге
▫️ Даты обучения: 13-17 ноября 2023 г.
▫️ Формат: онлайн (10:00-14:00 по Москве).

Cкоро запускается новый поток нашего интенсива «Продвинутая аналитика и машинное обучение в маркетинге», пока еще есть места.

Преподаватели — наши активные спикеры NoML:
▫️ Дмитрий Забавин, архитектор решений Data Science практики GlowByte Advanced Analytics.
▫️ Вадим Глухов, ведущий консультант направления клиентской аналитики практики GlowByte Advanced Analytics.

В программе интенсива:
▫️ Жизненный цикл клиента. Универсальный пайплайн обучения модели. Подготовка и оценка результатов пилота.
▫️ Оценка склонности клиента к продукту. Естественный трафик. Целевой трафик. Клиенты без истории.
▫️ Отклик клиента на продукт.
▫️ Отток клиентов. Определение оттока. Идентификация оттока. Удержание и реактивация клиентов.
▫️ Оценка эффекта модели.
▫️ Также наши эксперты поделятся профессиональными секретами эффективного решения этих задач исходя из опыта проектов GlowByte.

Интенсив подойдет:
▫️ Специалистам DS, желающим освоить предметную область клиентской аналитики.
▫️ Маркетинговым / продуктовым аналитикам, маркетологам, PO, PM, желающим погрузиться в область DS.
▫️ И всем специалистам, которые интересуются областью Data Science и хотят расширить свой кругозор эффективными приложениями ML/DS в решении различных бизнес-задач.

Вас ждет:
▫️ 5 дней обучения, 20 академических часов;
▫️ Живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ Практические задания по пройденному материалу;
▫️ 2 месяца доступ к записям и материалам обучения;
▫️ Сертификат от A2nced x GlowByte (это вам не диплом MIT);

Подробнее о программе→

Курс платный, узнать больше и записаться можно у Людмилы Локтевой @ldMiila.

https://t.me/noml_community/5020/6879
Forwarded from ODS Courses
Всем привет!
Скоро мы анонсируем новый сезон курсов, а пока присоединяйтесь к чату сообщества в Mattermost 🙌
Forwarded from @DS_career
🔥ОТКРЫТА РЕГИСТРАЦИЯ НА КУРС🔥
MLOps и production в DS исследованиях 3.0

18 марта 2024г
при поддержке Open Data Science стартует запуск, открытого онлайн курса MLOps и production в DS исследованиях 3.0!

Мы учли ваши пожелания и предложения, внесли доработки, дополнили контент, разнообразили домашние задания, а так же, пригласили новых спикеров!

В рамках курса вы:
🤓Познакомитесь с концепцией воспроизводимых исследований;
🤓Научитесь автоматизировать процесс проведения стандартизированных исследований;
🤓Узнаете о методах организации командной работы над ML-проектами;
🤓Получите практические рекомендации по работе с кодом в DS исследованиях;
🤓Изучите полезные инструменты для автоматизации и обеспечения воспроизводимости исследований.

Следить за новостями, а так же, задавать любые вопросы, связанные с курсом, можно в нашем telegram чате для участников курса!

По всем вопросам @irinka_bekker