Dealer.AI
14.4K subscribers
673 photos
45 videos
16 files
701 links
Жоский ИИ Дядя
Твой личный поставщик AI 🦾🤖
Канал о мире интересного AI: GenAI, RecSys, поиск, classic ML, бизнес приклад и ai-meme👾

Для связи @dealer_ai
(реклама и консультации)

Head of ML, AI.
Kaggle: https://www.kaggle.com/andrilko

РКН: 6348592885
Download Telegram
Дневной вакансии пост.

Лето и период отпусков закончилось, а значит пришла пора подумать о карьерных возможностях. А тут как раз такая вот интересная вакансия от друзей подоспела.

Всем привет! Мы - развивающаяся IT-компания BrainShells, занимаемся разработкой и эксплуатацией инновационного продукта с использованием алгоритмов машинного обучения и искусственного интеллекта.

Находимся в поиске senior ML + Java разработчика.

Чем предстоит заниматься:

- Сбор и подготовка данных для обучения предиктивных моделей;
- Проведение исследований в области Data Science/ML;
- Статистический анализ и обработка данных;
- Построение и оптимизация моделей машинного обучения;
- Интеграция ML решений в существующие продукты;
- Проведение экспериментов и их последующее доведение до production состояния;
- Разработка алгоритмов искусственного интеллекта.

Требования:

- Опыт работы в области ML от 5 лет;
- Хороший алгоритмический бэкграунд: опыт создания алгоритмов, их оптимизации по быстродействию и потреблению памяти, применение многопоточности;
- Высшее профильное/техническое образование (физмат, информатика);
- Опыт работы с Java Core (фреймворки не нужны. Нужны структуры данных, многопоточность, алгоритмы).

Будет плюсом:

- Математический бэкграунд. Умение применить математический аппарат для решения задач.
- Опыт программирования на С++.

Что мы предлагаем:

- Сложные, нетиповые задачи;
- Полностью удаленный формат работы, можно работать из любой точки мира, релокация не предусмотрена. Юр.лицо компании зарегистрировано в Гонконге;
- Вилка вакансии от 4500$. Зарплата формируется исходя из ожиданий разработчика и технических скиллов, которые он покажет на тех.интервью;
- Проверенный и постоянно обновляемый набор обучающих материалов: развитие сотрудников - наш фокус;
- Позитивный эмоциональный климат в командах.

Порекомендуйте нам своего друга/знакомого и получите бонус (1500-2000$ в зависимости от кандидата)!

Для отклика или рекомендации пишите @valeriayanets
2
😁12
Прям мемасно чет пошло...

Спасибо @oulenspiegel_channel
💯15😁6🥴1
Суббота время собирать камни.

Сегодня рассказываю школьникам про Data science, Machine learning и AI.

Знаете какие топ-2 вопроса у детей?)

1. Дудь стайл: сколько вы зарабатываете?)
2. Как давно в этом работаете и что вообще сделали?
😁21🔥10👍42
⚠️ Острожно - спуфинг атаки от имени админов Сберлоги и других чатов/каналов (не только Сберлоги) - будьте внимательны !

Некоторые коллеги получили просьбы перевести 120к на карту , некоторые предварительно получив оборвавшийся звонок по телеграм. Якобы от имени админов. Будьте внимальны - админы Сберлоги (и, думаю, других каналов) не пишут в личку с такими просьбами ! Не переводите денег ! Мошенники часто создают похожий по имени экаунт (спуфинг) и пишут от его имени - будьте внимательны !
😱72👍2
Всем, привет, други.

Сорян за молчание, но весь в работе и делах.. Но как раз таки в чатиках, заметил пост от @seeyouall про "spark attention" (понравилась такая аналогия).

См. Тут https://arxiv.org/abs/2310.01889

И тут я вспомнил , как недавно смотрел RL для RecSys и наткнулся на то, что сегодня бы назвали BlockchainRLHF.

А чего? Хайпово, можно пару Валер-coin'ов на старте набрать.

Скрины ниже.
2
Spark Attention :)
BlockchainRLHF O.o

UPD. Ссылка для трудящихся
https://www.sciencedirect.com/science/article/pii/S1574013721000769
🔥4👍3
Неделя заканчивается с кофе соревок.

Есть теперь любителям шатать соревнования, чем заняться на выходных.

TG запускает контест по детекции кода на разных языках из тестовых сабжей. Можно юзать паблик датку.

https://t.me/contest/330
👍2
Всем привет, мы строили строили и наконец построили!

Первая супер-библиотека по spelling corruption SAGE.

Работа была не простой, вместе с ребятами из команды AGI NLP- мои герои снова:
@alenusch, @qwertysobaka, @go_bobert,
мы сделали оч крутой инструмент. Он позволяет атаковать тексты при помощи добавления опечаток, перестановок и пр., а также делать обратное - фиксить их.

UPD. Забыл совсем!? Мы выбили SOTA по spellcheking!!!

Интересно?
Го читать на хабр!


https://habr.com/ru/companies/sberdevices/articles/763932/

Наша библиотека SAGE:
https://github.com/ai-forever/sage

AI-service в Клауде:
https://cloud.ru/ru/datahub/generative-spell-checking
🔥395👍4
Закончился LLM Exam сорев на kaggle.

Постановка:
Задача состояла в том,чтобы по запросу провести ранжирование ответов A,B,C,D,E исходя из релевантности. Ничего не напоминает?)

От себя:
Мне так и не удалось на полную в нём поучаствовать, тк загрузка full. Но с удовольствием делился идеями с друзьями по цеху. Вот тут ссылка на топ решение. Мне оно не интересно, тк много "грубой силы". Посмотрите сами.

А вот, чтобы я выделил так это другие решения из топ10 (те что в золоте также). Их можно разделить на два типа, а третий я напишу от себя. Его пока никто не описал из участников.


Итак первый подход - каноничный RAG. Берём обкачиваем вики и в индекс кладём его: в Elastic и/или в FAISS, предварительно заэмбеддив с К энкодеров. Далее уже берём LLM претрен соту которой доверяем и по запросу идём в индексы, собираем с них выдачу и кидаем в контекст промта-запроса для LLM. Делаем генерацию для упорядочения ответов.

Метод два. Reward для бедных на DeBERTa в режиме multiple choice + индекс вики с Эластика, + к примеру ещё метаранкер можно кросс энкодер можно бустинг.

Мой вариант. Reward на LLM. Берём ту большую бабаху LLM которая по-вашему мнению или по MMLU лучшая по претрену. Далее выкачиваем с HF rlhf сеты для webgpt+wiki stem , учим reward поверх стейтов LLM. Далее берём пары промт + abсde варианты выдачи и кормим в эту reward LLM . Она выдаёт ранги, по ним сортируем.
Плохо? Берём вики обкачиваем крупный банк текстов также уже берём эластик или faiss+e5/mini-lm-mmarco и тп, кидаем уже доп подсказку для LLM reward. E2E дообучая, можно даже в LoRa , чтобы стейты заморозить и быстро до усадить.

Как-то так. Интересно, кто-нибудь такое сделал?

Ваши варианты в комментариях.
👍134
Схема каноничного RAG. Мне оч нравится. Классека уже. Запинтьте для ML system design.
👍15🤔8
Кхм... Спасибо. Но нет..
😁34👍1
Dealer.AI
Кхм... Спасибо. Но нет..
Отправлю Сене, а то чую его ждёт судьба того, кто на меме с ним... 👇
👍3👎1
ЗДЕСЬ ЛЕЖАТ ТРИ ЭКСПЕРИМЕНТА,
Я ПРОСИЛ ВЧЕРА 128 КАРТ, 128 КАРТ И ТРИ SOTA БЫЛИ БЫ ПОЛУЧЕНЫ!!!
😁21🤡4👍1🔥1😢1
Пошутили и хватит. Народ любит другой контент.

Тут мои коллеги скинули либ, где LLM общаются между собой на естественном языке для совместного решения задач.

А я уже рассказывал об дебатах LLM - тык. Наконец-то Microsoft реализовали похожую тему! Хочу уже попробовать!

Либа тут: https://github.com/microsoft/autogen
👍12
Я как-то оставил свой зелёный чай, своим коллегам в офисе... 🙈
😁36🤡1