#Tip42 #EDA #Pandas
На прошлой неделе поучаствовал в хакатоне GO ALGO, организованный Московской фондовой биржей.
Для решения задачи нужно было анализировать биржевую информацию. И наконец-то мне мне удалось применить на практике очень редкий вид графиков — Спарклайны (Sparkline).
Спарклайны — это небольшие немаркированные графики. Обычно они не содержат ни осей ни подписей, поэтому в основном предназначены для передачи какой-то общей идеи.
А т.к. спарклайны очень маленькие, то они отлично помещаются в ячейках Pandas'а :)
Графики можно редактировать в определенных границах: менять их ширину/высоту, можно разукрасить на свое усмотрение. Также вы можете вывести другие типы графиков: барплоты, гистограммы и пр.
З.Ы. Сам хакатон проходил в интересном формате. С одной стороны это был обычный хактон - с чек-поинтами и общением с экспертами. С другой - он длился целых 10 дней (вместо обычных 2-3). А за это время можно было сделать неплохой продукт :)
На прошлой неделе поучаствовал в хакатоне GO ALGO, организованный Московской фондовой биржей.
Для решения задачи нужно было анализировать биржевую информацию. И наконец-то мне мне удалось применить на практике очень редкий вид графиков — Спарклайны (Sparkline).
Спарклайны — это небольшие немаркированные графики. Обычно они не содержат ни осей ни подписей, поэтому в основном предназначены для передачи какой-то общей идеи.
А т.к. спарклайны очень маленькие, то они отлично помещаются в ячейках Pandas'а :)
import base64
from io import BytesIO
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from IPython.display import HTML
def sparkline(data):
data = list(data)
fig, ax = plt.subplots(1, 1, figsize=(4, 0.25))
ax.plot(data)
# Убираем все лишнее с графика
ax.set_axis_off()
# Заливаем график
ax.fill_between(range(len(data)), data, len(data)*[min(data)], alpha=0.1)
# Выводим min/max
plt.plot(np.argmax(data), data[np.argmax(data)], 'r.')
plt.plot(np.argmin(data), data[np.argmin(data)], 'm.')
img = BytesIO()
plt.savefig(img)
img.seek(0)
plt.close()
return '<img src="data:image/png;base64,{}"/>'.format(base64.b64encode(img.read()).decode())
agg_df = df.groupby('tradedate', as_index=False)['pr_open'].agg(list)
agg_df['sparkline'] = agg_df['pr_open'].map(sparkline)
HTML(agg_df[['tradedate','sparkline']][-10:].to_html(escape=False))
Графики можно редактировать в определенных границах: менять их ширину/высоту, можно разукрасить на свое усмотрение. Также вы можете вывести другие типы графиков: барплоты, гистограммы и пр.
З.Ы. Сам хакатон проходил в интересном формате. С одной стороны это был обычный хактон - с чек-поинтами и общением с экспертами. С другой - он длился целых 10 дней (вместо обычных 2-3). А за это время можно было сделать неплохой продукт :)
⚡29👍1🔥1
#курс
После почти года доработок, я таки дописал последние два урока - про Градиентнный бустинг (регрессия и классификация). И теперь самый лучший в мире курс по ML (Алгоритмы Машинного обучения с нуля) перешел в релизную стадию (версия 1.0).
Напоминаю, что в курсе вам необходимо с нуля (на чистом Python, NumPy и Pandas) реализовать все основные алгоритмы машинного обучения:
1. Линейные модели:
- Линейная регрессия
- Логистическая регрессия
2. Метод ближайших соседей, kNN (классификация и регрессия)
3. Деревья решений (классификация и регрессия)
4. Ансамбли:
- Случайный лес (регрессия и классификация)
- Бэггинг (регрессия и классификация)
- Градиентный бустинг (регрессия и классификация)
5. Кластеризация:
- Метод k-средних (K-Means)
- Иерархическая агломеративная кластеризация
- DBSCAN
6. Снижение размерности (Метод главных компонент, PCA)
Курс находится на платформе степик: https://stepik.org/a/68260
З.Ы.1. По мере возможности буду дописывать и менее популярные темы из классического ML (рекомендашки, SVM и т.д.)
З.Ы.2. Градиентный бустинг оказался не таким простым как о нем рассказывают на вводных курсах :)
З.Ы.3. Спасибо всем кто помогал тестировать курс :)
После почти года доработок, я таки дописал последние два урока - про Градиентнный бустинг (регрессия и классификация). И теперь самый лучший в мире курс по ML (Алгоритмы Машинного обучения с нуля) перешел в релизную стадию (версия 1.0).
Напоминаю, что в курсе вам необходимо с нуля (на чистом Python, NumPy и Pandas) реализовать все основные алгоритмы машинного обучения:
1. Линейные модели:
- Линейная регрессия
- Логистическая регрессия
2. Метод ближайших соседей, kNN (классификация и регрессия)
3. Деревья решений (классификация и регрессия)
4. Ансамбли:
- Случайный лес (регрессия и классификация)
- Бэггинг (регрессия и классификация)
- Градиентный бустинг (регрессия и классификация)
5. Кластеризация:
- Метод k-средних (K-Means)
- Иерархическая агломеративная кластеризация
- DBSCAN
6. Снижение размерности (Метод главных компонент, PCA)
Курс находится на платформе степик: https://stepik.org/a/68260
З.Ы.1. По мере возможности буду дописывать и менее популярные темы из классического ML (рекомендашки, SVM и т.д.)
З.Ы.2. Градиентный бустинг оказался не таким простым как о нем рассказывают на вводных курсах :)
З.Ы.3. Спасибо всем кто помогал тестировать курс :)
🔥121❤8🥰1
#Tip43 #EDA
Leaderboard Probing - это различные техники, которые позволяют получить дополнительную информацию о таргете тестового датасета, на котором в соревнованиях производится оценка. И если правильно ею воспользоваться, то вы сможете получить преимущество перед другими участниками. Например, сможете собрать локальный тестовый датасет похожий на тот, что используется в соревновании. Или сможете навесить какую-нибудь дополнительную пост-обработку.
В основном все подходы сводятся к пониманию того, как рассчитываются метрики и манипуляции с их формулами. Но иногда встречаются и другие методы.
Рассмотрим пару примеров (см. картинки):
1. Если в соревновании используется метрика MSE, то выполнив всего два сабмита (один содержит все 0, а второй все 1), мы сможем вычислить среднее тестового датасета.
2. Можно попробовать оценить насколько тестовый датасет похож на тренировочный (и предугадать шейкап :). Допустим у нас многоклассовая классификация. Отправляем столько сабмитов - сколько классов. Каждый содержит только один класс. Тоже самое проделываем и на тренировочном датасете. Далее сравниваем их посредством графика.
З.Ы. Это некий PDP (https://t.me/ds_private_sharing/48).
Встречаются и другие "цели": вычисление количества строк, дисперсия и пр.
Но не все так радужно:
1. Обычно корги пытаются предотвратить такие трюки. Например, делят тестовую выборку на публичную и приватную. И если паблик = 5%, то пробинг становится бесполезным. Или вовсе тестируют на скрытом датасете.
2. Зачастую подход зависит не только от метрик, но и от структуры данных. Поэтому универсальных подходов не так много.
3. На такие вычисления может потребоваться много сабмитов, а они обычно сильно ограничены.
4. Иногда LB probing запрещают явно. А иногда неявно, под примерно такими формулировками: создание избыточной нагрузки на сервер, использование уязвимостей системы для получения преимущества и т.д.
Если знаете интересные примеры LB probing - пишите в комментариях.
Leaderboard Probing - это различные техники, которые позволяют получить дополнительную информацию о таргете тестового датасета, на котором в соревнованиях производится оценка. И если правильно ею воспользоваться, то вы сможете получить преимущество перед другими участниками. Например, сможете собрать локальный тестовый датасет похожий на тот, что используется в соревновании. Или сможете навесить какую-нибудь дополнительную пост-обработку.
В основном все подходы сводятся к пониманию того, как рассчитываются метрики и манипуляции с их формулами. Но иногда встречаются и другие методы.
Рассмотрим пару примеров (см. картинки):
1. Если в соревновании используется метрика MSE, то выполнив всего два сабмита (один содержит все 0, а второй все 1), мы сможем вычислить среднее тестового датасета.
2. Можно попробовать оценить насколько тестовый датасет похож на тренировочный (и предугадать шейкап :). Допустим у нас многоклассовая классификация. Отправляем столько сабмитов - сколько классов. Каждый содержит только один класс. Тоже самое проделываем и на тренировочном датасете. Далее сравниваем их посредством графика.
З.Ы. Это некий PDP (https://t.me/ds_private_sharing/48).
Встречаются и другие "цели": вычисление количества строк, дисперсия и пр.
Но не все так радужно:
1. Обычно корги пытаются предотвратить такие трюки. Например, делят тестовую выборку на публичную и приватную. И если паблик = 5%, то пробинг становится бесполезным. Или вовсе тестируют на скрытом датасете.
2. Зачастую подход зависит не только от метрик, но и от структуры данных. Поэтому универсальных подходов не так много.
3. На такие вычисления может потребоваться много сабмитов, а они обычно сильно ограничены.
4. Иногда LB probing запрещают явно. А иногда неявно, под примерно такими формулировками: создание избыточной нагрузки на сервер, использование уязвимостей системы для получения преимущества и т.д.
Если знаете интересные примеры LB probing - пишите в комментариях.
🔥15👍8😱5❤1
Написал на хабре статью, как с помощью Оптуны оптимизировать гиперпараметры RAG-системы (это такой карманный поисковик):
https://habr.com/ru/articles/811239/
https://habr.com/ru/articles/811239/
👍35🔥2
#contest
Дайджест ближайших соревнований (отсортированы по дате проведения, но обратите на дату окончания регистрации - она может быть сильно раньше):
[СОР] AvitoTech ML cup 2024
⏰ Даты: 5.11 - 5.12
🔜 [CLF] Задача: предсказать вероятность, что пользователь кликнет рекламу
💰 Приз: 600 т.р. (+10 мерч)
🏀 Участие: соло или команда до 4 человек
🌐 Формат: онлайн
[ХАК] Tender Hack
⏰ Даты: 8.11 - 10.11 (рег. до 8.11)
🔜 Задача: разработать сервис, осуществляющий мониторинг котировочных сессий на предмет корректности публикации
💰 Приз: 500 т.р.
🏀 Участие: команда 3-5 человек
🌐 Формат: офлайн в СПБ
[ХАК] ЦП. Международный хакатон
⏰ Даты: 08.11 - 10.11 (рег. до 04.11)
🔜 [NLP] Кейс 1: выделение именованных сущностей из электропочты и классификация сообщений
🔜 [CV, REC] Кейс 2: поиск смысловых копий изображений
🔜 [CV, NLP] Кейс 3: матчинг видеовизитки и описания вакансии
🔜 [CV, CLF] Кейс 4: поиск животных на фото и их классификация
🔜 [CV] Кейс 5: детекция и распознавание маркировки на изображении
🔜 [NLP] Кейс 6: качественный анализ документации на соответствие требованиям
🔜 [CLF] Кейс 7: детекция аномалий при строительстве жилых комплексов в части транспортной доступности
🔜 [CV] Кейс 8: поиск нарушений автотранспортом на видеозаписи
🔜 [CLF] Кейс 9: распознавания фазы глубокого сна и промежуточной фазы сна
🔜 [NLP, RAG] Кейс 10: чат-бот для поиска информации в агентской библиотеке материалов
💰 Приз: 10 млн. рублей
🏀 Участие: команда 3-5 человек
🌐 Формат: гибрид
[ХАК] BIV Hack
⏰ Даты: 15.11 - 17.11 (рег. до 12.11)
🔜 [CLF, NLP] Задача 1: Автоматизация разбора платежей
🔜 [NLP] Задача 2: Алгоритм выявления связей между контрагентами
💰 Приз: 300 т.р.
🏀 Участие: команда 3-5 человек
🌐 Формат: онлайн
[ХАК] TulaHackDays2024
⏰ Даты: 15.11 - 17.11 (рег. до 12.11)
🔜 [NLP] Трек 1: Контроль показателей здоровья пациентов, киберассистент (помощь) и связь с лечащим врачом
🔜 [CV] Трек 2: Мониторинг состояния контейнерных площадок на основе данных, в том числе фото- и видеофиксации
💰 Приз: 350 т.р. на каждый трек
🏀 Участие: команда 2-5 человек
🌐 Формат: гибрид
[ХАК] AgroCode Hack Genetics
⏰ Даты: 22.11 - 24.11 (рег. до 14.11)
🔜 [CLF] Задача 1: Система оценки племенной ценности радужной форели
🔜 [NLP] Задача 2: «Тиндер» для коров
🔜 [REG] Задача 3: Прогнозирование урожайности
🔜 [CLT] Задача 4: Историческая агроголоволомка
💰 Приз: 200 т.р. на задачу
🏀 Участие: команда 3-5 человек
🌐 Формат: онлайн
[ХАК] T1 | Импульс | Хакатон | Москва
⏰ Даты: 26.11 - 29.11 (рег. до 25.11)
🔜 [NLP] Трек 1: объединение данных пользователя в золотую запись
🔜 [NLP, RAG] Трек 2: цифровой ассистент базы знаний
💰 Приз: 600 т.р. на каждый трек
🏀 Участие: команда 3-5 человек
🌐 Формат: гибрид (Москва, минимум 2 участника на площадке)
[ХАК] ХАКАТОН ЕВРАЗА 3.0
⏰ Даты: 29.11 - 01.12 (рег. до 25.11)
🔜 [NLP] Задача: автоматический Code Review с помощью ИИ
💰 Приз: 500 т.р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
З.Ы. Здесь приведены только ML-задачи. Сами задачи могут включать и расширенные требования. Например, Frontend.
Дайджест ближайших соревнований (отсортированы по дате проведения, но обратите на дату окончания регистрации - она может быть сильно раньше):
[СОР] AvitoTech ML cup 2024
⏰ Даты: 5.11 - 5.12
🏀 Участие: соло или команда до 4 человек
🌐 Формат: онлайн
[ХАК] Tender Hack
⏰ Даты: 8.11 - 10.11 (рег. до 8.11)
🏀 Участие: команда 3-5 человек
🌐 Формат: офлайн в СПБ
[ХАК] ЦП. Международный хакатон
⏰ Даты: 08.11 - 10.11 (рег. до 04.11)
🏀 Участие: команда 3-5 человек
🌐 Формат: гибрид
[ХАК] BIV Hack
⏰ Даты: 15.11 - 17.11 (рег. до 12.11)
🏀 Участие: команда 3-5 человек
🌐 Формат: онлайн
[ХАК] TulaHackDays2024
⏰ Даты: 15.11 - 17.11 (рег. до 12.11)
💰 Приз: 350 т.р. на каждый трек
🏀 Участие: команда 2-5 человек
🌐 Формат: гибрид
[ХАК] AgroCode Hack Genetics
⏰ Даты: 22.11 - 24.11 (рег. до 14.11)
🏀 Участие: команда 3-5 человек
🌐 Формат: онлайн
[ХАК] T1 | Импульс | Хакатон | Москва
⏰ Даты: 26.11 - 29.11 (рег. до 25.11)
🏀 Участие: команда 3-5 человек
🌐 Формат: гибрид (Москва, минимум 2 участника на площадке)
[ХАК] ХАКАТОН ЕВРАЗА 3.0
⏰ Даты: 29.11 - 01.12 (рег. до 25.11)
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
З.Ы. Здесь приведены только ML-задачи. Сами задачи могут включать и расширенные требования. Например, Frontend.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤3🔥3
Дайджест соревнований до конца года (при необходимости будет пополняться):
[ХАК] ФИЦ
⏰ Даты: 29.11 - 4.12 (рег. до 26.11)
🔜 [NLP] Кейс 2 - БухПульс - Разработать алгоритм сбора обратной связи от пользователей сервисе «Бухэксперт8».
🔜 [CV] Кейс 3 - Классификации опор ЛЭП по фото.
🔜 [NLP] Кейс 4 - Погонщик нейронок - Как можно быстрее сделать react приложение по макету из Figma, используя любые ИИ помощники.
🔜 [NLP] Кейс 5 - Оценка уровня экспертности по резюме.
🔜 [NLP] Кейс 6 - Контекстный перевод названий научных работ.
🔜 [TS] Кейс 7 - Прогнозирование бизнес драйверов (трафик людей, количество чеков, количество проданных товаров и т.д).
🔜 [CV] Кейс 8 - Формирование фото и видео контента с использованием нейросетей на основе биографии и фото персоны.
🔜 [CV] Кейс 9 - Разработка алгоритма трекинга людей в видеопотоке с нескольких камер.
🔜 [NLP] Кейс 11 - Симуляция записи в расписание.
🔜 [CV] Кейс 12 - Сервис для ведения реестра зеленых насаждений города Москвы: подсчета их количества, определения породы и пр. по фото.
🔜 [CV] Кейс 14 - Определение доступа на объект с использованием модели распознавания лиц.
🔜 [NLP] Кейс 15 - Семантический делитель текстов.
🔜 [CLF] Кейс 17 - Стартовый (профилактический) комплаенс: предотвращение рисков с помощью AI.
🔜 [NLP] Кейс 20 - Цифровой помощник юриста.
💰 Приз: 6 000 000 р.
🏀 Участие: команда 2-6 человек
🌐 Формат: отборочный этап - онлайн, финал - офлайн (Москва)
[ХАК] Норникель: интеллектуальные горизонты
⏰ Даты: 6.12 - 8.12 (рег. до 2.12)
🔜 [TS] Трек 1 - Флотомашина времени. Поиск наиболее эффективных диапазонов работы оборудования для повышения объема извлечения руды.
🔜 [CV] Трек 2 - Грязные дела. Разработать метод определения степени загрязнения кадра, чтобы обеспечить надежную работу камер на производстве.
🔜 [NLP] Трек 3 - Мультимодальные RAG модели. Разработка RAG системы для поиска информации в текстовых документах и картинках.
💰 Приз: 1 500 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] Совкомбанк SecureHack
⏰ Даты: 6.12 - 15.12 (рег. до 4.12)
🔜 [NLP] Задача - необходимо создать продукт, который позволит разработчикам, аналитикам информационной безопасности и проектным менеджерам оценивать безопасность своих проектов, сервисов, задач на основе входных данных и предоставлять заключения с практическими рекомендациями по улучшению.
💰 Приз: 300 000 р.
🏀 Участие: команда 1-3 человек
🌐 Формат: онлайн
[ХАК] ТерраЛинк Code Fest
⏰ Даты: 9.12 - 15.12 (рег. до 6.12)
🔜 [NLP] Задача 1. Цифровой ассистент пользователя для исполнения функциональных команд.
🔜 [NLP] Задача 2. Нейросеть для проверки соответствия документации стандартам компании с выявлением рисков и отклонений.
🔜 [NLP] Задача 3. Нейросеть по распознавание текста (OCR), классификация документов, автоматическое извлечение данных, проверка орфографии, пунктуации, соответствии СТО компании.
💰 Приз: 600 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] XMAS HACK
⏰ Даты: 20.12 - 23.12 (рег. до 19.12)
💡 Кейс 1. Разработать алгоритм, который будет динамически подстраиваться под меняющиеся условия, выбирая оптимальный маршрут для транзакции.
💡 Кейс 3. Прогнозирование уровня риска нового клиента на основе данных о текущих клиентах банка, а также дополнительной информации из открытых источников.
💰 Приз: 1 000 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] ФИЦ
⏰ Даты: 29.11 - 4.12 (рег. до 26.11)
💰 Приз: 6 000 000 р.
🏀 Участие: команда 2-6 человек
🌐 Формат: отборочный этап - онлайн, финал - офлайн (Москва)
[ХАК] Норникель: интеллектуальные горизонты
⏰ Даты: 6.12 - 8.12 (рег. до 2.12)
💰 Приз: 1 500 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] Совкомбанк SecureHack
⏰ Даты: 6.12 - 15.12 (рег. до 4.12)
💰 Приз: 300 000 р.
🏀 Участие: команда 1-3 человек
🌐 Формат: онлайн
[ХАК] ТерраЛинк Code Fest
⏰ Даты: 9.12 - 15.12 (рег. до 6.12)
💰 Приз: 600 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] XMAS HACK
⏰ Даты: 20.12 - 23.12 (рег. до 19.12)
💡 Кейс 1. Разработать алгоритм, который будет динамически подстраиваться под меняющиеся условия, выбирая оптимальный маршрут для транзакции.
💡 Кейс 3. Прогнозирование уровня риска нового клиента на основе данных о текущих клиентах банка, а также дополнительной информации из открытых источников.
💰 Приз: 1 000 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
Начинаем коллекционировать соревнования января (пост будет дополняться по мере поступления):
[ХАК] GPT-4o-mini Hackathon
📅 Дата: 20.01.2025 - 27.01.2025
💡 Задача: разработать AI-ассистента с использованием модели GPT-4o-mini
💰 Призы: 1500$, 1000$ и 500$ (в виде подарков)
🏀 Участие: соло или команда
🌐 Формат: онлайн
[ХАК] GPT-4o-mini Hackathon
📅 Дата: 20.01.2025 - 27.01.2025
💡 Задача: разработать AI-ассистента с использованием модели GPT-4o-mini
🏀 Участие: соло или команда
🌐 Формат: онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍1
Плей-лист соревнований февраля (пополняемый):
[ХАК] Система Хак: Нижний Новгород
⏰ Даты: 15-16.02 (рег. до 13.02)
💡 [STT] Трек 1. Общение без барьеров. Задача – разработать систему генерации автоматических субтитров в реальном времени для интеграции на платформу МТС для видеозвонков, которая сделает онлайн-конференции доступнее для людей с особыми потребностями.
💡 [NLP] Трек 2. Удобный дом. Необходимо придумать и разработать улучшение для приложения, управляющего многоквартирным домом. Новая функция должна сделать сервис комфортнее для всех жильцов: например, автоматически включит домофон для ребенка или вызовет консьержа пожилому человеку.
💰 Приз: 750 000 р. + мерч всем участникам на площадке
🏀 Участие: команда 2-6 человек
🌐 Формат: гибрид , но больше половины участников команды должны быть на площадке (Нижний Новгород)
[СОР] Siam ML Hack
⏰ Даты: 28.02 - 19.03 (рег. до 27.02)
💡 [REG] Трек 1. Обнаружение бинарных характеристик в данных. Необходимо разработать модель для распознавания ключевых паттернов и их характеристик в дискретных данных, отображаемых на специализированном графике.
💡 [TS] Трек 2. Выделение полезных данных для анализа. Цель — разработать алгоритм, который выявляет самые информативные участки временных рядов и четко определяет их начало и конец, чтобы в дальнейшем проводить более глубокий анализ.
💰 Приз: 1 000 000 р.
🏀 Участие: команда 1-5 человек
🌐 Формат: онлайн
[СОР] Data Fusion Contest 2025
⏰ Даты: 13.02 - 07.04
💡 [NLP] Label Craft — необходимо предсказать категорию товаров на основе не полных данных о товаре (названиях и их описаний).
💡 [TS] 4cast — прогнозирование временных рядов для клиентов банка (юридических лиц) на основе их профилей и истории транзакций.
💡 [REG] Distribution — необходимо создать алгоритм, способный предсказывать распределение остатков на счетах клиента на 2 месяца вперед.
💰 Приз: 3 000 000 р. + мерч
🏀 Участие: соло или командой (до 4 человек)
🌐 Формат: онлайн
[ХАК] Система Хак: Нижний Новгород
⏰ Даты: 15-16.02 (рег. до 13.02)
💡 [STT] Трек 1. Общение без барьеров. Задача – разработать систему генерации автоматических субтитров в реальном времени для интеграции на платформу МТС для видеозвонков, которая сделает онлайн-конференции доступнее для людей с особыми потребностями.
💡 [NLP] Трек 2. Удобный дом. Необходимо придумать и разработать улучшение для приложения, управляющего многоквартирным домом. Новая функция должна сделать сервис комфортнее для всех жильцов: например, автоматически включит домофон для ребенка или вызовет консьержа пожилому человеку.
💰 Приз: 750 000 р. + мерч всем участникам на площадке
🏀 Участие: команда 2-6 человек
🌐 Формат: гибрид , но больше половины участников команды должны быть на площадке (Нижний Новгород)
[СОР] Siam ML Hack
⏰ Даты: 28.02 - 19.03 (рег. до 27.02)
💡 [REG] Трек 1. Обнаружение бинарных характеристик в данных. Необходимо разработать модель для распознавания ключевых паттернов и их характеристик в дискретных данных, отображаемых на специализированном графике.
💡 [TS] Трек 2. Выделение полезных данных для анализа. Цель — разработать алгоритм, который выявляет самые информативные участки временных рядов и четко определяет их начало и конец, чтобы в дальнейшем проводить более глубокий анализ.
💰 Приз: 1 000 000 р.
🏀 Участие: команда 1-5 человек
🌐 Формат: онлайн
[СОР] Data Fusion Contest 2025
⏰ Даты: 13.02 - 07.04
💡 [NLP] Label Craft — необходимо предсказать категорию товаров на основе не полных данных о товаре (названиях и их описаний).
💡 [TS] 4cast — прогнозирование временных рядов для клиентов банка (юридических лиц) на основе их профилей и истории транзакций.
💡 [REG] Distribution — необходимо создать алгоритм, способный предсказывать распределение остатков на счетах клиента на 2 месяца вперед.
💰 Приз: 3 000 000 р. + мерч
🏀 Участие: соло или командой (до 4 человек)
🌐 Формат: онлайн
❤7⚡1👍1
Соревнования марта (выше добавил февральское соревнование Data Fusion Contest 2025):
[ХАК] Kryptonite ML Challenget
⏰ Даты: 01.03 - 09.03, 16.03 питчинг (рег. до 01.03)
💡 [CV] Необходимо обучить модель распознавания лиц, которая корректно работает с задачей верификации и определяет фальшивые изображения, созданные с помощью DeepFake-технологий.
💰 Приз: 600 000 р.
🏀 Участие: соло или командой
🌐 Формат: онлайн
[ХАК] Марафон Цифровых Решений
⏰ Даты: 17.03 - 14.04 (рег. до 17.03)
💡 [КОМ] Кейс 1 - Оптимизация процесса паллетизации товаров.
💡 [REG] Кейс 2 - прогнозирование и оценка упущенных продаж.
💡 [CV] Кейс 4 - автоматической верификации наличия товара в видео-клипах.
💡 [CLF] Кейс 5 - прогнозироdание ситовых характеристик пульпы.
💡 [REG] Кейс 6 - создание предиктивной модели износа техники.
💰 Приз: индивидуально на кейс (до 1 миллиона).
🏀 Участие: соло или командой
🌐 Формат: онлайн
[ХАК] Kryptonite ML Challenget
⏰ Даты: 01.03 - 09.03, 16.03 питчинг (рег. до 01.03)
💡 [CV] Необходимо обучить модель распознавания лиц, которая корректно работает с задачей верификации и определяет фальшивые изображения, созданные с помощью DeepFake-технологий.
💰 Приз: 600 000 р.
🏀 Участие: соло или командой
🌐 Формат: онлайн
[ХАК] Марафон Цифровых Решений
⏰ Даты: 17.03 - 14.04 (рег. до 17.03)
💡 [КОМ] Кейс 1 - Оптимизация процесса паллетизации товаров.
💡 [REG] Кейс 2 - прогнозирование и оценка упущенных продаж.
💡 [CV] Кейс 4 - автоматической верификации наличия товара в видео-клипах.
💡 [CLF] Кейс 5 - прогнозироdание ситовых характеристик пульпы.
💡 [REG] Кейс 6 - создание предиктивной модели износа техники.
💰 Приз: индивидуально на кейс (до 1 миллиона).
🏀 Участие: соло или командой
🌐 Формат: онлайн
⚡2❤1
Дополнительные источники заработка на апрель :)
[СОР] Avito ML Cup 2025
⏰ Даты: 31.03 - 28.05
💡 [REC] Задача 1. Персональные рекомендации: создать модель, которая предскажет интересные для пользователя товары на основе его действий на платформе.
💡 [CV] Задача 2. Поиск дублей: разработать решение для обнаружения одинаковых товаров.
💰 Приз: 1 200 000 рублей
🏀 Участие: соло или командой (до 4 человек)
🌐 Формат: онлайн
[ХАК] Tender Hack Москва
⏰ Даты: 04.04 - 06.04 (рег. до 04.04)
💡 [NLP] Реализация ИИ-ассистента для анализа поисковых запросов пользователей в режиме чата.
💰 Приз: 500 000 рублей
🏀 Участие: командой (от 3 до 5 человек)
🌐 Формат: офлайн (отель «Лесная Сафмар»)
[ХАК] LLM Coding Challenge
⏰ Даты: 10.04 - 19.04
💡 [NLP] Сервис структурирования сообщений от агрономов - необходимо разработать решение, которое позволит полностью автоматизировать процесс получения и обработки сообщений (от агрономов) в единую базу данных.
💡 [NLP] Репортер качества кода разработчиков - разработать решение для автоматического ревью кода.
💰 Приз: 600 000 рублей
🏀 Участие: командой (от 2 до 3 человек)
🌐 Формат: онлайн
[СОР] IT_ONE Cup
⏰ Даты: 12.04 - 29.04 (рег. до 11.04)
💡 [NLP] Трек 1 - Динамические контекстные подсказки для системного аналитика.
💡 [NLP] Трек 2 - AI-генератор дизайн-макетов по описанию требований.
💡 [NLP] Трек 3 - Система визуализации BPMN-диаграмм.
💰 Приз: 1 500 000 рублей
🏀 Участие: соло или командой (до 5 человек)
🌐 Формат: онлайн
[ХАК] МТС True Tech Hack
⏰ Даты: 17.04 - 22.04 (рег. до 16.04)
💡 [CV] TouchVision: AI-ассистент для незрячих и слабовидящих пользователей.
💡 [NLP] MWS GPT: разработай компактную модель «ученик» для эффективной и быстрой классификации текста, которая будет дистиллирована знаниями из тяжелой модели «учителя».
💰 Приз: 1 500 000 рублей
🏀 Участие: командой (от 2 до 5 человек)
🌐 Формат: онлайн
[СОР] Avito ML Cup 2025
⏰ Даты: 31.03 - 28.05
💡 [REC] Задача 1. Персональные рекомендации: создать модель, которая предскажет интересные для пользователя товары на основе его действий на платформе.
💡 [CV] Задача 2. Поиск дублей: разработать решение для обнаружения одинаковых товаров.
💰 Приз: 1 200 000 рублей
🏀 Участие: соло или командой (до 4 человек)
🌐 Формат: онлайн
[ХАК] Tender Hack Москва
⏰ Даты: 04.04 - 06.04 (рег. до 04.04)
💡 [NLP] Реализация ИИ-ассистента для анализа поисковых запросов пользователей в режиме чата.
💰 Приз: 500 000 рублей
🏀 Участие: командой (от 3 до 5 человек)
🌐 Формат: офлайн (отель «Лесная Сафмар»)
[ХАК] LLM Coding Challenge
⏰ Даты: 10.04 - 19.04
💡 [NLP] Сервис структурирования сообщений от агрономов - необходимо разработать решение, которое позволит полностью автоматизировать процесс получения и обработки сообщений (от агрономов) в единую базу данных.
💡 [NLP] Репортер качества кода разработчиков - разработать решение для автоматического ревью кода.
💰 Приз: 600 000 рублей
🏀 Участие: командой (от 2 до 3 человек)
🌐 Формат: онлайн
[СОР] IT_ONE Cup
⏰ Даты: 12.04 - 29.04 (рег. до 11.04)
💡 [NLP] Трек 1 - Динамические контекстные подсказки для системного аналитика.
💡 [NLP] Трек 2 - AI-генератор дизайн-макетов по описанию требований.
💡 [NLP] Трек 3 - Система визуализации BPMN-диаграмм.
💰 Приз: 1 500 000 рублей
🏀 Участие: соло или командой (до 5 человек)
🌐 Формат: онлайн
[ХАК] МТС True Tech Hack
⏰ Даты: 17.04 - 22.04 (рег. до 16.04)
💡 [CV] TouchVision: AI-ассистент для незрячих и слабовидящих пользователей.
💡 [NLP] MWS GPT: разработай компактную модель «ученик» для эффективной и быстрой классификации текста, которая будет дистиллирована знаниями из тяжелой модели «учителя».
💰 Приз: 1 500 000 рублей
🏀 Участие: командой (от 2 до 5 человек)
🌐 Формат: онлайн
⚡2👍2🤔2❤1🔥1
Forwarded from LLM is all you need
Запилил на Степике курс - Разработка LLM с нуля
В курсе вам предстоит с нуля реализовать все основные компоненты LLM:
- Токенизатор (BPE)
- Эмбеддинги (Токенов и Позиционные)
- Блок Декодера:
- Multi-Head Attention
- FeedForward-слои
- Остаточные связи
- Вероятностная генерация
После чего мы соберем и подготовим датасет и обучим свою LLM (pre-train).
Разработка будет вестиcь на Python и низкоуровневых компонентах PyTorch.
Курс платный. Следующие две недели по промокоду FIRST предоставляется скидка 50%.
В курсе вам предстоит с нуля реализовать все основные компоненты LLM:
- Токенизатор (BPE)
- Эмбеддинги (Токенов и Позиционные)
- Блок Декодера:
- Multi-Head Attention
- FeedForward-слои
- Остаточные связи
- Вероятностная генерация
После чего мы соберем и подготовим датасет и обучим свою LLM (pre-train).
Разработка будет вестиcь на Python и низкоуровневых компонентах PyTorch.
Курс платный. Следующие две недели по промокоду FIRST предоставляется скидка 50%.
🔥39❤6👍3😁2🤔2
Соревнования на июль-сентябрь :)
[СОР] E-CUP 2025
⏰ Даты: 18.07 - 14.09 (рег. с 07.07)
💡 [REC] Задача 1. Предсказание следующей покупки пользователя Ozon.
💡 [OPT] Задача 2. Логистика: автопланирование работы курьеров.
💡 [ML/CV] Задача 3. Контроль качества: автоматическое выявление поддельных товаров по описанию и метаданным.
💰 Приз: 7 200 000 рублей
🏀 Участие: соло или командой (до 5 человек)
🌐 Формат: онлайн
[ХАК] ODS Pethathon 2025: Vibe Coding Challenge
Онлайн-соревновании, где участники объединяются в команды по интересам, чтобы под руководством менторов разработать с нуля продукт за столь сжатый срок, используя последние достижения в области ИИ для кодинга.
Это шанс не только прокачать навыки вайб-кодинга, но и узнать, как правильно использовать агентов: как и у любого инструмента, у них есть сильные и слабые стороны, особенности эксплуатации; обменяться ценными лайфхаками и получить практический опыт на проектах, приближенных к реальности.
Регистрация и темы проектов.
Таймлайн:
- 24 июля закрывается регистрация.
- 25 июля - вводные лекции, менторы создают чатики для команд в телеграмме.
- 27 июля - капитаны утверждают состав, название и тему.
- 3 августа команды проводят свои презентации. Призовых рубрики две - "Лучший проект" (определяется жюри), и "Лучшие лайфхаки" (определяется открытым голосованием среди участников).
[СОР] FlightRank 2025: Aeroclub RecSys Cup
⏰ Даты: 17.06 - 17.08
💡 [REC] Создайте модель ранжирования рейсов, которая предсказывает, какой вариант полета выберет бизнес-путешественник.
💰 Приз: $10,000 (в России также выплачиваются)
🏀 Участие: соло или командой
🌐 Формат: онлайн
[ХАК] MORE.Tech
⏰ Даты: 27.08 – 20.09
💡 [NLP] AI HR. ИИ-ассистент для проведения собеседований.
💰 Приз: 500 000 рублей
🏀 Участие: команда (2-5 человек)
🌐 Формат: онлайн
[ХАК] RLT.Tender_Guide
⏰ Даты: 06.09 - 07.09
💡 [NLP] Создание интеллектуальной системы для поддержки пользователей.
💰 Приз: 525 000 рублей
🏀 Участие: команда
🌐 Формат: гибридный (офлайн в Новосибирске должно быть 50% команды)
[ХАК] ЛЦТ
⏰ Даты: 18.08 – 23.09
💡 20 разнообразных задач
💰 Приз: 40 000 000 рублей
🏀 Участие: команда (2-5 человек)
🌐 Формат: онлайн
[ХАК] Tender Hack. Самара
⏰ Даты: 19.09 – 21.09
💡 [NLP] Умная поисковая строка: реализовать умную поисковую строку, позволяющую обрабатывать запросы на естественном языке и выполнять действия, соответствующие намерениям пользователей .
💰 Приз: 500 000 рублей
🏀 Участие: команда (3-5 человек)
🌐 Формат: офлайн (г. Самара)
[ХАК] Т1
⏰ Даты: 19.09 – 22.09
💡 [NLP] HR Консультант: разработай персонального ИИ-консультанта, который предлагает сотрудникам персонализированные карьерные сценарии и помогает HR искать внутренние таланты по умным фильтрам.
💰 Приз: 300 000 рублей
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн + финал на площадке
[СОР] E-CUP 2025
⏰ Даты: 18.07 - 14.09 (рег. с 07.07)
💡 [REC] Задача 1. Предсказание следующей покупки пользователя Ozon.
💡 [OPT] Задача 2. Логистика: автопланирование работы курьеров.
💡 [ML/CV] Задача 3. Контроль качества: автоматическое выявление поддельных товаров по описанию и метаданным.
💰 Приз: 7 200 000 рублей
🏀 Участие: соло или командой (до 5 человек)
🌐 Формат: онлайн
[ХАК] ODS Pethathon 2025: Vibe Coding Challenge
Онлайн-соревновании, где участники объединяются в команды по интересам, чтобы под руководством менторов разработать с нуля продукт за столь сжатый срок, используя последние достижения в области ИИ для кодинга.
Это шанс не только прокачать навыки вайб-кодинга, но и узнать, как правильно использовать агентов: как и у любого инструмента, у них есть сильные и слабые стороны, особенности эксплуатации; обменяться ценными лайфхаками и получить практический опыт на проектах, приближенных к реальности.
Регистрация и темы проектов.
Таймлайн:
- 24 июля закрывается регистрация.
- 25 июля - вводные лекции, менторы создают чатики для команд в телеграмме.
- 27 июля - капитаны утверждают состав, название и тему.
- 3 августа команды проводят свои презентации. Призовых рубрики две - "Лучший проект" (определяется жюри), и "Лучшие лайфхаки" (определяется открытым голосованием среди участников).
[СОР] FlightRank 2025: Aeroclub RecSys Cup
⏰ Даты: 17.06 - 17.08
💡 [REC] Создайте модель ранжирования рейсов, которая предсказывает, какой вариант полета выберет бизнес-путешественник.
💰 Приз: $10,000 (в России также выплачиваются)
🏀 Участие: соло или командой
🌐 Формат: онлайн
[ХАК] MORE.Tech
⏰ Даты: 27.08 – 20.09
💡 [NLP] AI HR. ИИ-ассистент для проведения собеседований.
💰 Приз: 500 000 рублей
🏀 Участие: команда (2-5 человек)
🌐 Формат: онлайн
[ХАК] RLT.Tender_Guide
⏰ Даты: 06.09 - 07.09
💡 [NLP] Создание интеллектуальной системы для поддержки пользователей.
💰 Приз: 525 000 рублей
🏀 Участие: команда
🌐 Формат: гибридный (офлайн в Новосибирске должно быть 50% команды)
[ХАК] ЛЦТ
⏰ Даты: 18.08 – 23.09
💡 20 разнообразных задач
💰 Приз: 40 000 000 рублей
🏀 Участие: команда (2-5 человек)
🌐 Формат: онлайн
[ХАК] Tender Hack. Самара
⏰ Даты: 19.09 – 21.09
💡 [NLP] Умная поисковая строка: реализовать умную поисковую строку, позволяющую обрабатывать запросы на естественном языке и выполнять действия, соответствующие намерениям пользователей .
💰 Приз: 500 000 рублей
🏀 Участие: команда (3-5 человек)
🌐 Формат: офлайн (г. Самара)
[ХАК] Т1
⏰ Даты: 19.09 – 22.09
💡 [NLP] HR Консультант: разработай персонального ИИ-консультанта, который предлагает сотрудникам персонализированные карьерные сценарии и помогает HR искать внутренние таланты по умным фильтрам.
💰 Приз: 300 000 рублей
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн + финал на площадке
❤5
Осень - время созревания хакатонов :)
[СОР] Up Great «Экспедиция. Data Science»
⏰ Даты: 15.09 – 31.12 (рег. до 14.10)
💡 [CV] Создай алгоритм для обнаружения археологических объектов (скрытых курганов, древних дорог и исторических артефактов) с помощью спутниковых снимков, LiDAR и аэрофотосъёмки.
💰 Приз: 5 000 000 ₽
🏀 Участие: команда (2-5 человек)
🌐 Формат: онлайн
[СОР] Wunder RNN Challenge
⏰ Даты: 15.09 – 01.12
💡 [ML] Соревнование по нейронкам от HFT-фонда Wunder Fund. Участникам предстоит создать модель, предсказывающую следующее состояние рынка на основе последовательности предыдущих состояний.
💰 Приз: 13 600 $
🏀 Участие: соло
🌐 Формат: онлайн
[СОР] RuCode
⏰ Даты: 01.09 – 26.10
💡 [ML] Контент-мейкер. Предсказать предсказывающую просмотр видео пользователями на основе истории просмотров, метаданных видео и демографических сведений.
💡 [ML] Найди инвестора. Предсказать готовность клиентов банка инвестировать в новые инновационные проекты, используя данные предыдущих предложений.
💡 [ML] Что посмотрим? Создать систему рекомендаций, формирующую для каждого пользователя упорядоченный топ-10 видеороликов, по его предпочтениям и истории просмотров.
💡 [ML] Тайна исчезнувших пассажиров. Ваша задача предсказать, кто из пассажиров оказался перемещён в другое измерение, используя данные бортового компьютера.
💡 [ML] Финансовый щит. Банку требуется классификатор транзакций в реальном времени, способный выявлять мошенничество среди потока поступающих данных с учётом изменения поведения пользователей.
💰 Приз: игровая приставка, умная колонка, внешний накопитель, мышь беспроводная
🏀 Участие: команда или соло
🌐 Формат: онлайн (в финале — очная защита)
[ХАК] Finam AI Trade Hack
⏰ Даты: 03.10 – 04.10 (рег. до 29.09)
💡 [NLP] Прогноз динамики цен с учетом новостей
💡 [NLP] LLM‑интерфейс к Trade API
💡 [NLP] Поиск горячих новостей на тему финансов
💰 Приз: 1 200 000 рублей
🏀 Участие: командное
🌐 Формат: онлайн
[СОР] AI Journey Contest 2025
⏰ Даты: 04.09 – 30.10
💡 [NLP] Agent-as-Judge: создай универсального «судью» для оценки текстов, сгенерированных ИИ.
💡 [NLP] Human-centered AI Assistant: разработай персонализированного ассистента на основе GigaChat.
💡 [NLP] GigaMemory: придумай механизм долговременной памяти для LLM.
💰 Приз: 6 500 000 ₽
🏀 Участие: команда или соло
🌐 Формат: онлайн
[ХАК] Т1 в Минске
⏰ Даты: 14.10 – 17.10 (рег. до 12.10)
💡 [NLP] Smart Support: поддержка нового поколения. Разработайте ИИ-ассистента для службы поддержки с real-time подсказками из базы знаний.
💰 Приз: 300 000 ₽
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн + очный финал (Минск, проспект Победителей, д. 2)
[ХАК] Открой#Моспром
⏰ Даты: 17.10 – 19.10 (рег. до 13.10)
💡 [NLP] ИИ-агент: прототип агентной системы для обработки обращений в техподдержку.
💰 Приз: 2 500 000 ₽
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн или офлайн (ОЭЗ «Технополис Москва»)
[ХАК] Т1 в Новосибирске
⏰ Даты: 23.10 – 26.10
💡 [CV] Цифровой дресс-код: необходимо разработать модель, которая сегментирует в видеопотоке человека от фона.
💰 Приз: 400 000 ₽
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн + очный финал (Новосибирск, Академгородок, ул. Пирогова, д. 3)
[СОР] Overnight Finance Challenge
⏰ Даты: 20.10 - продолжительность 1.5-2 месяца
💡 [ML] Разработать модель, которая решает задачу MultiClass Classification на 5 классов — то есть делать краткосрочные предсказания направления движения цены пары ETH/USDC (spot), разделяя исходы на пять категорий.
💰 Приз: 5000 USD (криптой)
🏀 Участие: команда или соло
🌐 Формат: онлайн
[СОР] Up Great «Экспедиция. Data Science»
⏰ Даты: 15.09 – 31.12 (рег. до 14.10)
💡 [CV] Создай алгоритм для обнаружения археологических объектов (скрытых курганов, древних дорог и исторических артефактов) с помощью спутниковых снимков, LiDAR и аэрофотосъёмки.
💰 Приз: 5 000 000 ₽
🏀 Участие: команда (2-5 человек)
🌐 Формат: онлайн
[СОР] Wunder RNN Challenge
⏰ Даты: 15.09 – 01.12
💡 [ML] Соревнование по нейронкам от HFT-фонда Wunder Fund. Участникам предстоит создать модель, предсказывающую следующее состояние рынка на основе последовательности предыдущих состояний.
💰 Приз: 13 600 $
🏀 Участие: соло
🌐 Формат: онлайн
[СОР] RuCode
⏰ Даты: 01.09 – 26.10
💡 [ML] Контент-мейкер. Предсказать предсказывающую просмотр видео пользователями на основе истории просмотров, метаданных видео и демографических сведений.
💡 [ML] Найди инвестора. Предсказать готовность клиентов банка инвестировать в новые инновационные проекты, используя данные предыдущих предложений.
💡 [ML] Что посмотрим? Создать систему рекомендаций, формирующую для каждого пользователя упорядоченный топ-10 видеороликов, по его предпочтениям и истории просмотров.
💡 [ML] Тайна исчезнувших пассажиров. Ваша задача предсказать, кто из пассажиров оказался перемещён в другое измерение, используя данные бортового компьютера.
💡 [ML] Финансовый щит. Банку требуется классификатор транзакций в реальном времени, способный выявлять мошенничество среди потока поступающих данных с учётом изменения поведения пользователей.
💰 Приз: игровая приставка, умная колонка, внешний накопитель, мышь беспроводная
🏀 Участие: команда или соло
🌐 Формат: онлайн (в финале — очная защита)
[ХАК] Finam AI Trade Hack
⏰ Даты: 03.10 – 04.10 (рег. до 29.09)
💡 [NLP] Прогноз динамики цен с учетом новостей
💡 [NLP] LLM‑интерфейс к Trade API
💡 [NLP] Поиск горячих новостей на тему финансов
💰 Приз: 1 200 000 рублей
🏀 Участие: командное
🌐 Формат: онлайн
[СОР] AI Journey Contest 2025
⏰ Даты: 04.09 – 30.10
💡 [NLP] Agent-as-Judge: создай универсального «судью» для оценки текстов, сгенерированных ИИ.
💡 [NLP] Human-centered AI Assistant: разработай персонализированного ассистента на основе GigaChat.
💡 [NLP] GigaMemory: придумай механизм долговременной памяти для LLM.
💰 Приз: 6 500 000 ₽
🏀 Участие: команда или соло
🌐 Формат: онлайн
[ХАК] Т1 в Минске
⏰ Даты: 14.10 – 17.10 (рег. до 12.10)
💡 [NLP] Smart Support: поддержка нового поколения. Разработайте ИИ-ассистента для службы поддержки с real-time подсказками из базы знаний.
💰 Приз: 300 000 ₽
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн + очный финал (Минск, проспект Победителей, д. 2)
[ХАК] Открой#Моспром
⏰ Даты: 17.10 – 19.10 (рег. до 13.10)
💡 [NLP] ИИ-агент: прототип агентной системы для обработки обращений в техподдержку.
💰 Приз: 2 500 000 ₽
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн или офлайн (ОЭЗ «Технополис Москва»)
[ХАК] Т1 в Новосибирске
⏰ Даты: 23.10 – 26.10
💡 [CV] Цифровой дресс-код: необходимо разработать модель, которая сегментирует в видеопотоке человека от фона.
💰 Приз: 400 000 ₽
🏀 Участие: команда (3-5 человек)
🌐 Формат: онлайн + очный финал (Новосибирск, Академгородок, ул. Пирогова, д. 3)
[СОР] Overnight Finance Challenge
⏰ Даты: 20.10 - продолжительность 1.5-2 месяца
💡 [ML] Разработать модель, которая решает задачу MultiClass Classification на 5 классов — то есть делать краткосрочные предсказания направления движения цены пары ETH/USDC (spot), разделяя исходы на пять категорий.
💰 Приз: 5000 USD (криптой)
🏀 Участие: команда или соло
🌐 Формат: онлайн
🔥6❤4
Крупное обновление в курсе Разработка LLM с нуля.
Добавил в курс разработку пяти новых моделей:
- GPT-2
- Llama
- Mistral
- Mixtral
- Gemma
В процессе их разработки мы изучим новые архитектурные фишки:
- Pre-norm, RMSNorm - новые способы нормализации
- GELU, SiLU, SwiGLU, GeGLU - новые функции активации
- KV-cache, SWA - механизмы, позволяющие оптимизировать инференс
- RoPE - новый способ кодирования позиционных эмбедингов
- GQA, MQA - новые экономичные механизмы внимания
- MoE - новая экономичная архитектура для FNN
По такому событию, следующие две недели по промокоду ALL предоставляется скидка 10%
Добавил в курс разработку пяти новых моделей:
- GPT-2
- Llama
- Mistral
- Mixtral
- Gemma
В процессе их разработки мы изучим новые архитектурные фишки:
- Pre-norm, RMSNorm - новые способы нормализации
- GELU, SiLU, SwiGLU, GeGLU - новые функции активации
- KV-cache, SWA - механизмы, позволяющие оптимизировать инференс
- RoPE - новый способ кодирования позиционных эмбедингов
- GQA, MQA - новые экономичные механизмы внимания
- MoE - новая экономичная архитектура для FNN
По такому событию, следующие две недели по промокоду ALL предоставляется скидка 10%
👍13🔥7☃3❤1