Машинное обучение для инженеров / Machine learning for engineers

Anthropic написали интересную статью о том, как нам на самом деле следует оценивать модели

Сейчас бенчмаркинг происходит довольно наивно: у нас есть список вопросов, на каждый из которых модель отвечает и получает за ответ определенный балл, а общая оценка обычно представляет из себя просто среднее по всем таким баллам. Но действительно ли нам интересно только среднее?

Антропики утверждают, что с точки зрения статистики такой классический эвал слишком упрощен, и дают пять советов о том, как сделать свои оценки статистически значимыми и более глубокими. В основе их подхода привычное предположение матстата: все вопросы, которые у нас есть – это какая-то случайная подвыборка генеральной совокупности всевозможных вопросов, которые вообще можно задать. А значит, называть среднее на каком-то бенчмарке оценкой навыка модели – слишком грубо. Вот что на самом деле стоит делать:

1. Использовать ЦПТ. Основываясь на центральной предельной теореме, средние значения нескольких выборок, взятых из одного и того же распределения, будут распределены нормально. А значит, мы можем взять из нашего бенчмарка несколько подмножеств (можно даже пересекающихся), оценить каждое из них, а на получившихся средних подсчитать SEM (стандартную ошибку среднего) и доверительный интервал.

2. Если вопросы в бенчмарке не независимы (например задаются вопросы по одному и тому же тексту), то ЦПТ исполользовать уже нельзя. Здесь предлагается вспомнить про Cluster standard errors.

3. Если дисперсия вашей модели высокая, то это важно учитывать в эвале, потому что дисперсия – это по сути оценка надежности модели. Поэтому исследователи предлагают также изменить стратегию оценки каждого отдельного вопроса. Вместо наивной оценки они предлагают двусоставную, состоящую из среднего балла (задаем вопрос много-много раз и считаем среднее) плюс ошибки отклонения (разница между реализованным баллов вопроса и средним баллом для этого вопроса).

4. Вместо обычного "больше-меньше" для сравнения двух моделей использовать статистические тесты. Однако использовать t-test все-таки не рекомендуется, вместо этого в статье предлагается более сложная формула, которая также учитывает корреляцию Пирсона и минимизирует mean difference error.

5. Не забывать про мощность критериев в оценках и формулировать правильные гипотезы для сравнения моделей.

Рекомендации, в общем, действительно стоящие. Другой вопрос – сколько времени постребуется, чтобы ресерчеры действительно стали соблюдать что-то подобное

46 views13:17

Forwarded from TrendWatching

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

Гарвард, Стэнфорд, MIT выкатили БЕСПЛАТНЫЕ онлайн-курсы для самостоятельного обучения.

Можно найти курс АБСОЛЮТНО по любой тематике: программирование, социальные науки, медицина. Вот весь список со ссылками:

• Гарвард: Широкий выбор курсов по различным дисциплинам.
• MIT OpenCourseWare: Материалы с лекциями, заданиями и экзаменами.
• Стэнфордский университет: Инновационные программы и бесплатные курсы.
• Калифорнийский университет в Беркли: Разнообразные курсы высокого уровня.
• Оксфордский университет: Образование мирового класса.
• Кембриджский университет: Престижное образование и бесплатные курсы.

Платформы:
• edX: Бесплатные курсы от ведущих университетов.
• Coursera: Курсы от университетов и компаний.
• Khan Academy: Курсы по точным наукам и программированию.
• OpenLearn: Курсы от Открытого университета Великобритании.
• FutureLearn: Совместные курсы с университетами.
• Udemy: Платные и бесплатные курсы от преподавателей.
• LinkedIn Learning: Курсы для профессионального роста.

Сохраняем и пользуемся.

57 views10:11

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from ИИ тебе

Нейросеть ответит на любой вопрос, опираясь только на научные исследования. Поддерживает множество языков, включая русский. Даёт общий суммированный ответ и ссылки на исследования, на которых он основан.

typeset

46 views10:55

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from ИИ тебе

Сервис позволяет практиковать английский, общаясь с нейросетью. Напоминаю: 🍌🟰✍️

TalkNative

39 views10:55

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from Machinelearning

🧠

Огромный гайд по по обучению с подкреплением

Свежее руководство по обучению с подкреплением, которое очень подробно объясняет всю теорию и детали реализации каждого алгоритма в этой области со множеством примеров и кодом.

Наслаждайтесь чтением)

📌 Читать

@ai_machinelearning_big_data

#ml #reinforcementlearning #rl #guide

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

54 views06:33

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from TrendWatching

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

Забирайте халявные курсы от Microsoft по нейросетям, библиотекам Python, защите данных, автоматизации и т.д. Внутри:

• Введение в машинное обучение для новичков тут
• Кодинг на Python для чайников с лучшей теорией тут
• Работа с БД и структурами данных тут
• Изучение концепции работы и возможностей ИИ для новичков тут
• Введение в науку о данных на Python тут
• Основы облачных вычислений Microsoft Azure тут
• Основы защиты данных и кибербезопасности тут
• Автоматизация разработки ПО с помощью GitHub для новичков тут
• Базовые принципы написания кода с синтаксисом и логикой кодирования на С# тут
• Тестирование моделей машинного обучения тут

По прохождению обучения вам выдадут электронный сертификат. Да, это бесплатно.

Сохраняйте и пересылайте тому самому другу, который собирается вкатиться в айти.

42 views16:45

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from MotorControlRu

Начинаем публикацию докладов Трудов XXXII Всероссийского научно-технического семинара «Актуальные вопросы электропривода — 95 лет кафедре АЭП МЭИ»
Первый доклад «Физически информированные нейронные сети в задачах электропривода» Галины Львовны Демидовой, НИУ «МЭИ»/Университет ИТМО

54 views15:49

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from MotorControlRu

22:05

Media is too big

VIEW IN TELEGRAM

45 views15:49

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from Machinelearning

🔥

Бесплатный курс от Microsoft «ИИ-агенты для начинающих»

Курс содержит пошаговые инструкции с примерами кода, которые помогут научиться создавать автономных агентов с использованием машинного обучения.

Фокус на AI-агентах:
Если вас интересует именно разработка агентов — например, для симуляций, игр или интерактивных систем — данный курс будет полезен.

Каждый урок включает в себя:
- Лекцию, (видео уроки появятся в марте 2025 года)
- Примеры кода на Python с поддержкой Azure AI Foundry и Github Models
- Практические задания
- Ссылки на полезные дополнительные ресурсы

Если это ваш первый опыт работы с агентами, у Microsoft есть еще 1 курс «Генеративный ИИ для начинающих», который содержит 21 урок по построению моделей с помощью GenAI, лучше начать с него.

Переведен на 9 различных языков (русского нет).

▪ Github

@ai_machinelearning_big_data

#course #Microsoft #aiagents #ai #ml #opensource #freecourse

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

71 views11:53

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from Data Secrets

MIT перезапустили свой легендарный курс 6.S191: Introduction to Deep Learning

NLP, CV, LLM, приложения в медицине: тут все end-to-end, включая теорию и практику с актуальными версиями библиотек.

Подходит курс даже для тех, кто вкатывается с нуля: достаточно уметь брать производные и умножать матрицы, остальное обещают объяснить на ходу.

Лекции будут выходить в свободный доступ на YouTube по понедельникам, первая вышла вчера. Слайды, код и доп.материалы лежат здесь.

Такое не пропускаем

79 views14:29

Машинное обучение для инженеров / Machine learning for engineers

Forwarded from TrendWatching

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Забираем мощнейшую и максимально подробную шпаргалку по нейронкам от Стэнфорда. Это 4 страницы концентрированной базы из курса по ИИ для новичков и экспертов:

• Архитектура и методы трансформеров.
• Всё о LLM: промптинг, файнтюнинг и прочие настройки.
• Гайд по созданиям приложений: RAG, ИИ-агенты и ризонинг-модели.

Такое однозначно летит в сохранёнки. Забрать можно тут.

78 views05:56

About

Blog

Apps

Platform