Dealer.AI

RoPe'ни контекст лучшего паблик энкодера.

Тут энтузиаст из "Точка" порадовал дядю "новой" версией infloat/e5 с расширенным контекстом, но ток не лонгформером. Чел обрезал e5 на 100 языков до русского и расширил ее контекст за счет RoPE (а у лонгформера аля sliding window). Тоесть ротари эмбов позиций. При расширении клон е5 где-то сильно просел в метриках (мы же научились вообще не проседать) + вопросы остаются в оптимизации под прод. Скок будет держать rps.
В целом, хорошая работа для понимания. Дядя одобряет.

https://habr.com/ru/companies/tochka/articles/797561/

Хабр

Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась

Удлиняем и крутим - RoPEBert Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и...

👍12🔥4❤1⚡1🤯1🤡1

2.99K viewsedited 16:26

Dealer.AI

Червячок ~~Джимм~~ Morris II 🪱 - твой личный AI-вирус. И дело даже не в показе Dune II.

Создан первый GenAI вирус 👾.
В недавнем исследовании, авторы создали первый вредоносный ИИ-червь, способный самостоятельно плодиться в среде с AI-агентами. Добро пожаловать в AGI world и вот вам новый вид кибератак 😵

Чтобы продемонстрировать возможности червя, исследователи создали почтовую RAG (!!!) систему, которая может отправлять и получать сообщения подключаясь к апи ChatGPT, Gemini и LLaVA. Специалисты обнаружили два способа эксплуатации системы: с использованием текстового самовоспроизводящегося запроса и встраивая самовоспроизводящийся запрос в изображение.
При этом, дядя не шарит в безе, поэтому опишет, как он понимает механизмы атак и нафига тут RAG в системе 🕵‍♂.

RAG тут ИМХО необходим для того, чтобы использовать некую стартовую базу атак на представленный контекст, а также, чтобы хранить инфо о сообщениях с уже атакованных хостов в локальной (глобальной?) памяти системы. Те RAG тут про память в системе агентов и поиск по БД зловреда. Плюс, ходя вот так по хостам юзеров системы, можно подобные уже увиденные форматы личных/корп. данных прихранивать в памяти червя и юзать их для более эффективного поиска подобных записей/сообщений на основе RAG запросов. Мол вот найди LLM-агент из того, что ты сейчас "видишь" подобные форматы из подсказки (базы атак/уже атакованных сабжей) RAGа. Нашел? Прихрани в памяти агента, передай на сервак зловреда, сделай в сабж опасную инъекцию и пусти дальше по сети сабж к другим юзерам 🤯

Исследователи подчеркивают, что Gen.AI черви станут новым вызовом перед службами безопасности технологических компаний и разработчиками стартапов.

Поэтому крепитесь 🦾 И будьте готовы.

Please open Telegram to view this post

VIEW IN TELEGRAM

arXiv.org

Here Comes The AI Worm: Unleashing Zero-click Worms that Target...

In this paper, we show that when the communication between GenAI-powered applications relies on RAG-based inference, an attacker can initiate a computer worm-like chain reaction that we call...

👍15😈5🔥4👾4

25.7K viewsedited 20:08

Dealer.AI

Схема, мб кто сможет повторить 🙈

👍8🔥6🤡2

3.73K views20:09

Dealer.AI

Forwarded from Запрети мне псевдолейблить

Кстати о репостах:
Собрал из ретроспективы по Open Problems пост на хабр. Поддержите заливом лайков, пожалуйста 🔝

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Как машинлернеры мерили экспрессию генов от воздействия лекарств

Привет! Меня зовут Дима и я веду канал про соревновательный МЛ . Недавно мы выиграли приз в довольно престижном соревновании и я сделал обзор всех лучших решений Хочу вам рассказать о Open Problems,...

👍4🔥3❤1👌1

2.48K views19:45

Dealer.AI

LLM гамает в DOOM. 😠

Один энтузиаст тоже любит в выходные (и не только) гамать в игры. Тут он решил пригласить LLM на game рандеву в DOOM, заодно проверить как оно.

Для эксперимента автор не мог взять GPT-4 из-за ограничений с визуалом, поэтому выбор пал на GPT-4V. Но и тут не все так просто, нужно было придумать сетап для игры. Чтобы кормить нарезанные скрины мира он разработал приложуху VISION. Далее подкинул еще текстовое состояние и передавал это все в агента. Управление LLM также осуществлялось в текстовой форме и преобразованием текста в команды. Врубил память в агенте и прописал доп правила/инструкции на взаимодействие с игрой аля хождение по уровню, атаки и открывание дверей.

Что получилось?
Агент оказался не вполне полноценным, например, забывание, если враги оказались вне зоны видимости. Вороги тем временем оставались живы и могли и далее атаковать.
Также наблюдались зависания и повторения. Далее при попытке разобраться с ошибками поведения, автор просил объяснений от агента, но тот галлюционировал и слова порой связать не мог.

В любом случае, интересный эксперимент, показывающий возможности к симуляциям и поведению в среде LLM, как агентов. Думаю к версии GPT5+ все будет еще веселее и пугающе.👍

Please open Telegram to view this post

VIEW IN TELEGRAM

arXiv.org

Will GPT-4 Run DOOM?

We show that GPT-4's reasoning and planning capabilities extend to the 1993 first-person shooter Doom. This large language model (LLM) is able to run and play the game with only a few...

👍15🤯5👎2❤1🤔1👨‍💻1

3.14K viewsedited 19:57

Dealer.AI

https://t.me/lovedeathtransformers/7262

База, о которой я писал еще на заре канала и LLM хайпа. Воо туть.

😁6🔥3💯2

2.62K viewsedited 10:56

Dealer.AI

Вот это размерчик. 314b на MoE конечно.

https://github.com/xai-org/grok

источник:

https://twitter.com/itsandrewgao/status/1769447953708765198

😁11👍2❤1

2.84K viewsedited 20:05

Dealer.AI

Люблю опты на графах, а RL на графах как решение оптов - еще интереснее.

https://t.me/sberlogabig/386

(sci)Berloga Всех Наук и Технологий

🚀 @SBERLOGASCI вебинар/обсуждение :
👨‍🔬 Богдан Булатов, Ульяна Князюк, Михаил Ураков "Применение Q-learning и SARSA к задаче короткого пути на графах. Разбор ноутбуков"
⌚️ Вторник, 19 Марта, 19.00 по Москве

Add to Google Calendar

Вводное обсуждение по…

🔥9

2.78K viewsedited 09:51

Dealer.AI

"Квантизируй меня полностью" или мануал по квантизации от Yandex.

Тут ML-разработчик Яндекса выкатил подробнейшую статью на Хабре о том, что такое квантизация и как она работает.
Отличный гайд, который достоин закрепа во вкладках.

В статье представленны различные методы для уменьшения точности после зпт, как на инференсе, так и для обучения. Затронуты вопросы выбросов в тензорах, а также послойный/весовой/блочный и др. подходы. Во времена LLM не обошли и вопросы связанные с особенностями их квантизации.

Еще отмечу, везде, где возможно указаны ссылки на референс статьи и код методов. Тем самым, обзор позволяет потрогать указанные методы руками и выбрать подходящий именно под свои задачи. В общем, читаем, пробуем, учимся.

Хабр

Quantization Deep Dive, или Введение в современную квантизацию

Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая...

👍36🔥10❤7🤡1

6.21K views11:23

Dealer.AI

Мои в телевизоле ❤️👇

Please open Telegram to view this post

VIEW IN TELEGRAM

2.71K viewsedited 14:25

Dealer.AI

Forwarded from Salute AI (Alexander Gavrilov)

Прямо сейчас проходит международная конференция EACL 2024 👩‍🔬👨‍💻

На Мальте компания SberDevices в лице Team Lead AGI NLP Алены Феногеновой и NLP ML-инженера Марка Баушенко представляют исследование команды в области обработки естественного языка (NLP): "A Methodology for Generative Spelling Correction via Natural Spelling Errors Emulation across Multiple Domains and Languages".

В рамках работы над проектом SAGE команды R&D SberDevices разработали генеративной подход к коррекции орфографии.

Решение SberDevices вызвало большой интерес и дискуссию среди экспертов, так как оно опережает по качеству для русского языка:
- открытые решения (Yandex.Speller, HunSpell, JamSpell)
- модели OpenAI (gpt-3.5-turbo-0301, gpt-4-0314, text-davinci-003).
Подход также работает на английском языке и может быть адаптирован под другие.

🌐 Ребята расскажут научному сообществу об исследовании в рамках постерной сессии на EACL 2024 до 22.03. Подробно об исследовании команды можно прочитать в академической статье.

🔥 — если тоже гордишься, что труд коллег получает международное признание!

#EACL2024 #SberDevices #SAGE #AGI_NLP #NeuralNetworks #RND

P.S. в апреле выйдет обновление SAGE.
Подпишитесь, чтобы не пропустить 👉

канал/

группа

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥40👍11👎2

3.21K views14:25

Dealer.AI

Чья бы это не была грязная партия, погибли и пострадали люди. Террору нет места нигде.

Соболезнования пострадавшим и их родным.
Сейчас, если вы хотите помочь, нужна донорская кровь, инфо тут.
Берегите себя и близких, надеюсь с вами все хорошо.

ТАСС

Жителей Москвы и Подмосковья попросили сдать кровь для пострадавших в "Крокус сити холле"

Сделать это можно будет 23 марта с 08:00. Читайте ТАСС в. МОСКВА, 23 марта. /ТАСС/. Жителей Москвы и Московской области просят сдать донорскую кровь для пострадавших в результате теракта в "Крокус сити холле". "После сегодняшней трагедии в "Крокусе" многим…

👍51🕊41❤9😢5👌1

8.1K viewsedited 09:27

Dealer.AI

🫡 👇

2.74K viewsedited 15:48

Dealer.AI

Forwarded from эйай ньюз

Увидел в Threads анекдот: Bloomberg потратил ~$10 миллионов (в AWS SageMaker) на тренировку BloombergGPT (50B параметров на 700B токенов), специально для финансовых задач. Иииии.... модель всухую проиграла на этих же финансовых тасках GPT-4, которая вышла за две недели до этого.

И тут всё было бы очевидно: "нужно сдаваться GPT-4". Если бы не одна маленькая деталь — GPT-4 в свою очередь либо проигрывала либо еле-еле перегоняла (используя Chain of Thoughts) специализированные файнтюны таких динозавров как BERT (2018, 110 лямов параметров) и RoBERTa Large (2019, ~700 млн параметров).

Мораль басни такова: если вы не лидер AI гонки, то не соревнуйтесь с OpenAI в общих задачах, это дорого и трудно. Но если есть прямые руки и конкретный таск — перегнать даже SOTA general purpose модель вполне возможно. А, и ещё: тренировать в AWS безумно дорого 😂

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

😁33💯2

2.35K views15:48

Dealer.AI

Mera 🫡

🔥16😁3

3.05K viewsedited 08:36

Dealer.AI

Второй день подряд...

Как видят своего лида мои падаваны.
спасибо @qwertysobaka

👍18😁10

2.69K viewsedited 14:18

Dealer.AI

Внимание, возможны репутационные осадки в виде ~~фрикаделек~~ LLMок.

На прошедшей конференции EACL была статья про утечки тест сетов бенчей в LLMки. Между прочим получила приз.

Поэтому рынок LLM может сильно перевернуться, когда добавят оценку утечки данных на общепринятые бенчмарки. Многие модели потеряют репутацию, если обнаружится утечка, и многие компании начнут в скором времени переобучать свои LLM без утечек и вообще будет весело :)

😁22❤3🤔2

3.19K viewsedited 09:09

Dealer.AI

Тут буду я, гляну глазком

❤3👍2

2.45K viewsedited 11:13

Dealer.AI

Forwarded from Salute AI (Alexander Gavrilov)

👋

Приглашаем на «GIGA R&D DAY»
5 апреля | 12:00 | онлайн и офлайн в Москве

SberDevices зовёт в гости ML-разработчиков и Data Science-специалистов на конференцию R&D команд SberDevices по развитию GigaChat, NLP, Vision и Audio.

Будем изучать LLM и CV, распознавать жесты, генерировать вокал и 3D-модели, общаться с книгами и путешествовать по VR-галерее.

Программа:

👋

Сергей Марков, руководитель исследовательской программы GigaChat и R&D — «Открытие конференции»

👋

Валерий Терновский и Александр Капитанов — «R&D GigaChat: направления и фокусы»

👋

Никита Сидоров — «Исследования в alignment GigaChat»

👋

Прохор Гладких — «GigaSearch или RAG в GigaChat»

👋

Игорь Чурин и Мария Тихонова — «mGPT-модели для малых языков России»

👋

Артём Снегирёв — «Практические аспекты ранжирования ответов виртуального ассистента Салют»

👋

Алёна Феногенова, Альбина Ахметгареева и Мария Тихонова — «MERA: бенчмарк для оценки фундаментальных моделей»

👋

Никита Мартынов — «SAGE v1.1.0: мультиязычная правка орфографии и пунктуации»

👋

Сергей Марков — «Панельная дискуссия: GPT-5, как догнать и перегнать западных конкурентов в российских реалиях»

👋

Александр Нагаев — «Как научить модель понимать жестовую речь»

👋

Михаил Мазуров — «Генеративный 3D, быстрый синтез и реконструкция 3D-объектов»

👋

Марина Бессмертная — «Тихо! Сейчас будет та самая сцена: как автоматически находить цепляющие моменты в видео»

👋

Борис Жестков — «LLM-подходы в синтезе речи»

👋

Артемий Таразанов — «Управление речевыми характеристиками в модели синтеза речи и инструктивные данные»

👋

Максим Смоляков — «Не можешь сказать — спой! Синтез пения по нажатию одной кнопки»

👋 Афтерпати для офлайн-участников

🖥 Регистрируйтесь и выберите формат:
📹 Онлайн на YouTube
🕒 Офлайн в Москве. Приходите к 11:00.

‼️ Важно:
Адрес места проведения пришлем 4 апреля вместе с приглашением на митап.

#конференция_GIGA_RND_DAY

Подписывайтесь 💬Salute AI: канал/группа

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10👍4

2.26K views11:13

About

Blog

Apps

Platform