Машинное обучение для инженеров / Machine learning for engineers
20 subscribers
56 photos
7 videos
1 file
37 links
Download Telegram
Forwarded from Data Secrets
Anthropic написали интересную статью о том, как нам на самом деле следует оценивать модели

Сейчас бенчмаркинг происходит довольно наивно: у нас есть список вопросов, на каждый из которых модель отвечает и получает за ответ определенный балл, а общая оценка обычно представляет из себя просто среднее по всем таким баллам. Но действительно ли нам интересно только среднее?

Антропики утверждают, что с точки зрения статистики такой классический эвал слишком упрощен, и дают пять советов о том, как сделать свои оценки статистически значимыми и более глубокими. В основе их подхода привычное предположение матстата: все вопросы, которые у нас есть – это какая-то случайная подвыборка генеральной совокупности всевозможных вопросов, которые вообще можно задать. А значит, называть среднее на каком-то бенчмарке оценкой навыка модели – слишком грубо. Вот что на самом деле стоит делать:

1. Использовать ЦПТ. Основываясь на центральной предельной теореме, средние значения нескольких выборок, взятых из одного и того же распределения, будут распределены нормально. А значит, мы можем взять из нашего бенчмарка несколько подмножеств (можно даже пересекающихся), оценить каждое из них, а на получившихся средних подсчитать SEM (стандартную ошибку среднего) и доверительный интервал.

2. Если вопросы в бенчмарке не независимы (например задаются вопросы по одному и тому же тексту), то ЦПТ исполользовать уже нельзя. Здесь предлагается вспомнить про Cluster standard errors.

3. Если дисперсия вашей модели высокая, то это важно учитывать в эвале, потому что дисперсия – это по сути оценка надежности модели. Поэтому исследователи предлагают также изменить стратегию оценки каждого отдельного вопроса. Вместо наивной оценки они предлагают двусоставную, состоящую из среднего балла (задаем вопрос много-много раз и считаем среднее) плюс ошибки отклонения (разница между реализованным баллов вопроса и средним баллом для этого вопроса).

4. Вместо обычного "больше-меньше" для сравнения двух моделей использовать статистические тесты. Однако использовать t-test все-таки не рекомендуется, вместо этого в статье предлагается более сложная формула, которая также учитывает корреляцию Пирсона и минимизирует mean difference error.

5. Не забывать про мощность критериев в оценках и формулировать правильные гипотезы для сравнения моделей.

Рекомендации, в общем, действительно стоящие. Другой вопрос – сколько времени постребуется, чтобы ресерчеры действительно стали соблюдать что-то подобное
Forwarded from TrendWatching
This media is not supported in your browser
VIEW IN TELEGRAM
Гарвард, Стэнфорд, MIT выкатили БЕСПЛАТНЫЕ онлайн-курсы для самостоятельного обучения.

Можно найти курс АБСОЛЮТНО по любой тематике: программирование, социальные науки, медицина. Вот весь список со ссылками:

• Гарвард: Широкий выбор курсов по различным дисциплинам.
MIT OpenCourseWare: Материалы с лекциями, заданиями и экзаменами.
Стэнфордский университет: Инновационные программы и бесплатные курсы.
Калифорнийский университет в Беркли: Разнообразные курсы высокого уровня.
Оксфордский университет: Образование мирового класса.
Кембриджский университет: Престижное образование и бесплатные курсы.

Платформы:
edX: Бесплатные курсы от ведущих университетов.
Coursera: Курсы от университетов и компаний.
Khan Academy: Курсы по точным наукам и программированию.
OpenLearn: Курсы от Открытого университета Великобритании.
FutureLearn: Совместные курсы с университетами.
• Udemy: Платные и бесплатные курсы от преподавателей.
LinkedIn Learning: Курсы для профессионального роста.


Сохраняем и пользуемся.
Forwarded from ИИ тебе
Нейросеть ответит на любой вопрос, опираясь только на научные исследования. Поддерживает множество языков, включая русский. Даёт общий суммированный ответ и ссылки на исследования, на которых он основан.

typeset
Forwarded from ИИ тебе
Сервис позволяет практиковать английский, общаясь с нейросетью. Напоминаю: 🍌🟰✍️

TalkNative
Forwarded from Machinelearning
🧠 Огромный гайд по по обучению с подкреплением

Свежее руководство по обучению с подкреплением, которое очень подробно объясняет всю теорию и детали реализации каждого алгоритма в этой области со множеством примеров и кодом.

Наслаждайтесь чтением)

📌 Читать

@ai_machinelearning_big_data


#ml #reinforcementlearning #rl #guide
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from TrendWatching
This media is not supported in your browser
VIEW IN TELEGRAM
Забирайте халявные курсы от Microsoft по нейросетям, библиотекам Python, защите данных, автоматизации и т.д. Внутри:

• Введение в машинное обучение для новичков тут
• Кодинг на Python для чайников с лучшей теорией тут
• Работа с БД и структурами данных тут
• Изучение концепции работы и возможностей ИИ для новичков тут
• Введение в науку о данных на Python тут
• Основы облачных вычислений Microsoft Azure тут
• Основы защиты данных и кибербезопасности тут
• Автоматизация разработки ПО с помощью GitHub для новичков тут
• Базовые принципы написания кода с синтаксисом и логикой кодирования на С# тут
• Тестирование моделей машинного обучения тут


По прохождению обучения вам выдадут электронный сертификат. Да, это бесплатно.

Сохраняйте и пересылайте тому самому другу, который собирается вкатиться в айти.
Forwarded from MotorControlRu
Начинаем публикацию докладов Трудов XXXII Всероссийского научно-технического семинара «Актуальные вопросы электропривода — 95 лет кафедре АЭП МЭИ»
Первый доклад «Физически информированные нейронные сети в задачах электропривода» Галины Львовны Демидовой, НИУ «МЭИ»/Университет ИТМО
Forwarded from Machinelearning
🔥 Бесплатный курс от Microsoft «ИИ-агенты для начинающих»

Курс содержит пошаговые инструкции с примерами кода, которые помогут научиться создавать автономных агентов с использованием машинного обучения.

Фокус на AI-агентах:
Если вас интересует именно разработка агентов — например, для симуляций, игр или интерактивных систем — данный курс будет полезен.

Каждый урок включает в себя:
- Лекцию, (видео уроки появятся в марте 2025 года)
- Примеры кода на Python с поддержкой Azure AI Foundry и Github Models
- Практические задания
- Ссылки на полезные дополнительные ресурсы

Если это ваш первый опыт работы с агентами, у Microsoft есть еще 1 курс «Генеративный ИИ для начинающих», который содержит 21 урок по построению моделей с помощью GenAI, лучше начать с него.

Переведен на 9 различных языков (русского нет).

Github

@ai_machinelearning_big_data

#course #Microsoft #aiagents #ai #ml #opensource #freecourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data Secrets
MIT перезапустили свой легендарный курс 6.S191: Introduction to Deep Learning

NLP, CV, LLM, приложения в медицине: тут все end-to-end, включая теорию и практику с актуальными версиями библиотек.

Подходит курс даже для тех, кто вкатывается с нуля: достаточно уметь брать производные и умножать матрицы, остальное обещают объяснить на ходу.

Лекции будут выходить в свободный доступ на YouTube по понедельникам, первая вышла вчера. Слайды, код и доп.материалы лежат здесь.

Такое не пропускаем
Forwarded from TrendWatching
This media is not supported in your browser
VIEW IN TELEGRAM
Забираем мощнейшую и максимально подробную шпаргалку по нейронкам от Стэнфорда. Это 4 страницы концентрированной базы из курса по ИИ для новичков и экспертов:

• Архитектура и методы трансформеров.
• Всё о LLM: промптинг, файнтюнинг и прочие настройки.
• Гайд по созданиям приложений: RAG, ИИ-агенты и ризонинг-модели.

Такое однозначно летит в сохранёнки. Забрать можно тут.