Forwarded from karpov.courses
Вы когда-нибудь задумывались, почему модель машинного обучения работает хорошо в теории, но сталкивается с проблемами в реальной жизни? Ответ может крыться в валидации данных.
Даня Картушов, автор контента Симулятора ML и Блога о Data Science, решил помочь нам разобраться в этом вопросе!
Даня Картушов, автор контента Симулятора ML и Блога о Data Science, решил помочь нам разобраться в этом вопросе!
Telegraph
Путешествие в мир валидации данных: почему это важно?
В 2016 году Tesla Motors была на гребне волны. Их инновационные электрокары вызывали восторг у покупателей, а функция автопилота представляла собой настоящий прорыв в автомобильной индустрии. Однако с течением времени начали возникать слухи о некоторых проблемах.…
Forwarded from Ilya Gordey
ML Career
https://youtu.be/5p248yoa3oE?si=moCj3i-e6KDHEECG
Andrew Ng: Opportunities in AI - 2023
Forwarded from Dan Okhlopkov - канал
Моя DS-карьера началась с Kaggle, а потом резко свернула ближе к Data Engineer / Product Analyst. Мои ML скиллы почти нигде мне не пригодились: я либо парсил и складывал, либо автоматизировал SQL. Конечно, у меня есть запатентованный ML-алгоритм, но там тупо Random Forrest. К тому же, ничего умнее пары эвристик на SQL не взлетело в @ffmemesbot. А больше нигде ML мне как будто не нужен был.
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Какой же ностальгический кайф я ощутил, разбирая нестандартные ML приемы из лекции Станислава Семенова, которую он дал после 2 лет работы квантом и за год до основания своего хедж фонда. Тут не будет многоуровневого стейкинга, только примеры из реального мира. Можно догадаться из какого. 😮🤫
Как увеличить скор ваших ML моделей:
🔗 okhlopkov.com/kaggle-tricks-from-grandmaster-hft-quant/
Forwarded from Магия данных | Артур Сапрыкин
На горизонте бесплатный курс по генеративным большим языковым моделям от deeplearning.ai (который Эндрю Ын основал).
Подписался, но не уверен, что дослушаю. Зато знаю, что среди вас есть те, кому точно будет интересно и полезно 😉
Помню, когда-то я слушал курс от Эндрю Ына по основам глубоких нейронных сетей лет 6 назад…
Подписался, но не уверен, что дослушаю. Зато знаю, что среди вас есть те, кому точно будет интересно и полезно 😉
Помню, когда-то я слушал курс от Эндрю Ына по основам глубоких нейронных сетей лет 6 назад…
Coursera
Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Specializations, & MOOCs in data science…
Forwarded from Data Secrets
Мы нашли редкость: схему с алгоритмическими сложностями основных алгоритмов машинного обучения
Любителям алгоритмов посвящается
😻 #advice
Любителям алгоритмов посвящается
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Магия данных | Артур Сапрыкин
This media is not supported in your browser
VIEW IN TELEGRAM
Красота же! :)
Вместо 1000 слов, «а как, а что, а куда» 🙂
Вместо 1000 слов, «а как, а что, а куда» 🙂
Forwarded from Магия данных | Артур Сапрыкин
Представляю вам очень интересную и полезную статью про сбор и предобработку данных.
В ней представлен короткий перечень пунктов, по которым вы сможете улучшить качество своих моделей в итоге.
Конечно, это не всеобъемлющий список, но основной, и во многих задачах от него можно опираться.
Если ещё не успели “набить руку” на предобработке данных, то от себя лично рекомендую для ознакомления.
В ней представлен короткий перечень пунктов, по которым вы сможете улучшить качество своих моделей в итоге.
Конечно, это не всеобъемлющий список, но основной, и во многих задачах от него можно опираться.
Если ещё не успели “набить руку” на предобработке данных, то от себя лично рекомендую для ознакомления.
Хабр
Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных
У Колумбийского университета есть хорошая история о плохих данных . Проект в сфере здравоохранения был нацелен на снижение затрат на лечение пациентов с пневмонией. В нём использовалось машинное...
Forwarded from Это разве аналитика?
Enthought-v1.0.2.pdf
2.4 MB
Шпаргалка по библиотеке pandas
Polars_cheat_sheet.pdf
391.5 KB
Шпаргалка по библиотеке polars
Forwarded from Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Российский бизнес больше всего нуждается в кадрах, которые могут внедрить ИИ в бизнес - процессы - опрос Университета Иннополис.
Forwarded from Клуб CDO (PostoplanBot)
Вышел отчет AI, ML, and Data Engineering InfoQ Trends Report - September 2023
- Generative AI (модели GPT-3 и GPT-4) занимает ведущие позиции в индустрии AI и ML, и широко применяется в технологиях.
- Внимание уделяется векторным базам данных и хранилищам векторных представлений в связи с их ролью в улучшении наблюдаемости в приложениях генеративного AI.
- Растет интерес к ответственному и этичному AI созиданию, и возрастает требование принятия более строгих мер по обеспечению безопасности при работе с большими моделями генеративного обучения.
- Современная инженерия данных переходит к децентрализованным и гибким подходам, с развитием концепции Data Mesh, выступающей в пользу федеративных платформ для данных, разделенных по областям.
В статье так же отмечается, что стоимость роботов снижается, а Robot Operating System (ROS) по-прежнему является ведущей программной платформой в этой области.
https://www.infoq.com/articles/ai-ml-data-engineering-trends-2023/?utm_source=pocket_reader
- Generative AI (модели GPT-3 и GPT-4) занимает ведущие позиции в индустрии AI и ML, и широко применяется в технологиях.
- Внимание уделяется векторным базам данных и хранилищам векторных представлений в связи с их ролью в улучшении наблюдаемости в приложениях генеративного AI.
- Растет интерес к ответственному и этичному AI созиданию, и возрастает требование принятия более строгих мер по обеспечению безопасности при работе с большими моделями генеративного обучения.
- Современная инженерия данных переходит к децентрализованным и гибким подходам, с развитием концепции Data Mesh, выступающей в пользу федеративных платформ для данных, разделенных по областям.
В статье так же отмечается, что стоимость роботов снижается, а Robot Operating System (ROS) по-прежнему является ведущей программной платформой в этой области.
https://www.infoq.com/articles/ai-ml-data-engineering-trends-2023/?utm_source=pocket_reader
Forwarded from Вek Nassyrov
Как получить оффер во Франции и какие тренды искусственного интеллекта нас ждут?
ВЫПУСК DataBoom подкаста с Алибеком Джакуповым 😍
Алибек Джакупов —
😎Microsoft MVP по Искусственному Интеллекту (ИИ)
😎ML инженер, Data Scientist кто делал проекты для Louis Vuitton, BiC, презентовал свои разработки 2 министрам Франции
😎Знает в совершенстве казахский, французский, английский, русский, Python
😎 и просто Қазақ халқының мақтанышы, человек который постоянно поддерживает DATA community, делится пользой и развивает ИИ на родном языке 🇰🇿
Смотреть выпуск:
https://www.youtube.com/watch?v=yW9LyCqDDcg
ВЫПУСК DataBoom подкаста с Алибеком Джакуповым 😍
Алибек Джакупов —
😎Microsoft MVP по Искусственному Интеллекту (ИИ)
😎ML инженер, Data Scientist кто делал проекты для Louis Vuitton, BiC, презентовал свои разработки 2 министрам Франции
😎Знает в совершенстве казахский, французский, английский, русский, Python
😎 и просто Қазақ халқының мақтанышы, человек который постоянно поддерживает DATA community, делится пользой и развивает ИИ на родном языке 🇰🇿
Смотреть выпуск:
https://www.youtube.com/watch?v=yW9LyCqDDcg
YouTube
Как получить оффер во Франции и какие тренды искусственного интеллекта нас ждут? | Алибек Жакупов
Хотите работать в Европе в сфере IT, но не знаете, с чего начать? Желаете узнать, какие навыки и знания нужны для этого, как подготовиться к собеседованию и как адаптироваться к новой культуре? Хотите быть в курсе последних тенденций и инноваций в сфере ИИ?…
Forwarded from ODS Courses
🔥Эта неделя была богата на запуски!
Стартовали сразу три курса:
- в четверг открылись первые лекции курсов Deep Reinforcement Learning и Natural Language Processing
- сегодня стала доступна первая лекция обновленного курса Open ML Course: Линейные модели
Продолжается:
👍Курс по ML System Design уже перешел в фазу активной работы над проектами, где остались только самые активные и заинтересованные студенты 🌞
Ожидаем:
👀А в середине октября запускаем долгожданное продолжение Open ML Course про Деревья и их ансамбли!
Стартовали сразу три курса:
- в четверг открылись первые лекции курсов Deep Reinforcement Learning и Natural Language Processing
- сегодня стала доступна первая лекция обновленного курса Open ML Course: Линейные модели
Продолжается:
👍Курс по ML System Design уже перешел в фазу активной работы над проектами, где остались только самые активные и заинтересованные студенты 🌞
Ожидаем:
👀А в середине октября запускаем долгожданное продолжение Open ML Course про Деревья и их ансамбли!
Forwarded from CRO & Персонализация
Среди самых быстрорастущих AI-навыков в профилях в LinkedIn присутствует рекомендательные системы🔥
Forwarded from Пристанище Дата Сайентиста
Бесплатные курсы по генеративным AI
Я недавно писал про курс по использованию chatGPT и решил пройти остальные бесплатные короткие курсы
Вот небольшие отзывы на них:
- ChatGPT Prompt Engineering for Developers - курс не показался интересным, курс по использованию chatGPT куда полезнее и практичнее
- Building Systems with the ChatGPT API - курс поинтереснее, рассказывает про проектирование систем в основе которых лежат LLM
- LangChain for LLM Application Development - курс крутой и полезный, если вы еще не юзали LangChain в своих проектах, то этот курс поможет понять как использовать LangChain. Работать с контекстом, памятью и многим другим.
- LangChain: Chat with Your Data - тоже полезный курс, по сути расширяет предыдущий. Рассказывают и показывают как использовать свои данные для ChatGPT№
- Finetuning Large Language Models - тут всё понятно, показывают как тюнить модель для вашего домена
- Building Generative AI Applications with Gradio - крутой курс, после которого я задумался юзать для демок не streamlit, а Gradio
Отмечу, что во всех этих миникурсах есть Jupyter ноутбук в котором можно удобно поиграться.
Я недавно писал про курс по использованию chatGPT и решил пройти остальные бесплатные короткие курсы
Вот небольшие отзывы на них:
- ChatGPT Prompt Engineering for Developers - курс не показался интересным, курс по использованию chatGPT куда полезнее и практичнее
- Building Systems with the ChatGPT API - курс поинтереснее, рассказывает про проектирование систем в основе которых лежат LLM
- LangChain for LLM Application Development - курс крутой и полезный, если вы еще не юзали LangChain в своих проектах, то этот курс поможет понять как использовать LangChain. Работать с контекстом, памятью и многим другим.
- LangChain: Chat with Your Data - тоже полезный курс, по сути расширяет предыдущий. Рассказывают и показывают как использовать свои данные для ChatGPT№
- Finetuning Large Language Models - тут всё понятно, показывают как тюнить модель для вашего домена
- Building Generative AI Applications with Gradio - крутой курс, после которого я задумался юзать для демок не streamlit, а Gradio
Отмечу, что во всех этих миникурсах есть Jupyter ноутбук в котором можно удобно поиграться.