RoPe'ни контекст лучшего паблик энкодера.
Тут энтузиаст из "Точка" порадовал дядю "новой" версией infloat/e5 с расширенным контекстом, но ток не лонгформером. Чел обрезал e5 на 100 языков до русского и расширил ее контекст за счет RoPE (а у лонгформера аля sliding window). Тоесть ротари эмбов позиций. При расширении клон е5 где-то сильно просел в метриках (мы же научились вообще не проседать) + вопросы остаются в оптимизации под прод. Скок будет держать rps.
В целом, хорошая работа для понимания. Дядя одобряет.
https://habr.com/ru/companies/tochka/articles/797561/
Тут энтузиаст из "Точка" порадовал дядю "новой" версией infloat/e5 с расширенным контекстом, но ток не лонгформером. Чел обрезал e5 на 100 языков до русского и расширил ее контекст за счет RoPE (а у лонгформера аля sliding window). Тоесть ротари эмбов позиций. При расширении клон е5 где-то сильно просел в метриках (мы же научились вообще не проседать) + вопросы остаются в оптимизации под прод. Скок будет держать rps.
В целом, хорошая работа для понимания. Дядя одобряет.
https://habr.com/ru/companies/tochka/articles/797561/
Хабр
Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась
Удлиняем и крутим - RoPEBert Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и...
👍12🔥4❤1⚡1🤯1🤡1
Червячок Джимм Morris II 🪱 - твой личный AI-вирус. И дело даже не в показе Dune II.
Создан первый GenAI вирус 👾.
В недавнем исследовании, авторы создали первый вредоносный ИИ-червь, способный самостоятельно плодиться в среде с AI-агентами. Добро пожаловать в AGI world и вот вам новый вид кибератак😵
Чтобы продемонстрировать возможности червя, исследователи создали почтовую RAG (!!!) систему, которая может отправлять и получать сообщения подключаясь к апи ChatGPT, Gemini и LLaVA. Специалисты обнаружили два способа эксплуатации системы: с использованием текстового самовоспроизводящегося запроса и встраивая самовоспроизводящийся запрос в изображение.
При этом, дядя не шарит в безе, поэтому опишет, как он понимает механизмы атак и нафига тут RAG в системе 🕵♂.
RAG тут ИМХО необходим для того, чтобы использовать некую стартовую базу атак на представленный контекст, а также, чтобы хранить инфо о сообщениях с уже атакованных хостов в локальной (глобальной?) памяти системы. Те RAG тут про память в системе агентов и поиск по БД зловреда. Плюс, ходя вот так по хостам юзеров системы, можно подобные уже увиденные форматы личных/корп. данных прихранивать в памяти червя и юзать их для более эффективного поиска подобных записей/сообщений на основе RAG запросов. Мол вот найди LLM-агент из того, что ты сейчас "видишь" подобные форматы из подсказки (базы атак/уже атакованных сабжей) RAGа. Нашел? Прихрани в памяти агента, передай на сервак зловреда, сделай в сабж опасную инъекцию и пусти дальше по сети сабж к другим юзерам 🤯
Исследователи подчеркивают, что Gen.AI черви станут новым вызовом перед службами безопасности технологических компаний и разработчиками стартапов.
Поэтому крепитесь 🦾 И будьте готовы.
Создан первый GenAI вирус 👾.
В недавнем исследовании, авторы создали первый вредоносный ИИ-червь, способный самостоятельно плодиться в среде с AI-агентами. Добро пожаловать в AGI world и вот вам новый вид кибератак
Чтобы продемонстрировать возможности червя, исследователи создали почтовую RAG (!!!) систему, которая может отправлять и получать сообщения подключаясь к апи ChatGPT, Gemini и LLaVA. Специалисты обнаружили два способа эксплуатации системы: с использованием текстового самовоспроизводящегося запроса и встраивая самовоспроизводящийся запрос в изображение.
При этом, дядя не шарит в безе, поэтому опишет, как он понимает механизмы атак и нафига тут RAG в системе 🕵♂.
RAG тут ИМХО необходим для того, чтобы использовать некую стартовую базу атак на представленный контекст, а также, чтобы хранить инфо о сообщениях с уже атакованных хостов в локальной (глобальной?) памяти системы. Те RAG тут про память в системе агентов и поиск по БД зловреда. Плюс, ходя вот так по хостам юзеров системы, можно подобные уже увиденные форматы личных/корп. данных прихранивать в памяти червя и юзать их для более эффективного поиска подобных записей/сообщений на основе RAG запросов. Мол вот найди LLM-агент из того, что ты сейчас "видишь" подобные форматы из подсказки (базы атак/уже атакованных сабжей) RAGа. Нашел? Прихрани в памяти агента, передай на сервак зловреда, сделай в сабж опасную инъекцию и пусти дальше по сети сабж к другим юзерам 🤯
Исследователи подчеркивают, что Gen.AI черви станут новым вызовом перед службами безопасности технологических компаний и разработчиками стартапов.
Поэтому крепитесь 🦾 И будьте готовы.
Please open Telegram to view this post
VIEW IN TELEGRAM
arXiv.org
Here Comes The AI Worm: Unleashing Zero-click Worms that Target...
In this paper, we show that when the communication between GenAI-powered applications relies on RAG-based inference, an attacker can initiate a computer worm-like chain reaction that we call...
👍15😈5🔥4👾4
Forwarded from Запрети мне псевдолейблить
Кстати о репостах:
Собрал из ретроспективы по Open Problems пост на хабр. Поддержите заливом лайков, пожалуйста🔝
Собрал из ретроспективы по Open Problems пост на хабр. Поддержите заливом лайков, пожалуйста
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Как машинлернеры мерили экспрессию генов от воздействия лекарств
Привет! Меня зовут Дима и я веду канал про соревновательный МЛ . Недавно мы выиграли приз в довольно престижном соревновании и я сделал обзор всех лучших решений Хочу вам рассказать о Open Problems,...
👍4🔥3❤1👌1
LLM гамает в DOOM. 😠
Один энтузиаст тоже любит в выходные (и не только) гамать в игры. Тут он решил пригласить LLM на game рандеву в DOOM, заодно проверить как оно.
Для эксперимента автор не мог взять GPT-4 из-за ограничений с визуалом, поэтому выбор пал на GPT-4V. Но и тут не все так просто, нужно было придумать сетап для игры. Чтобы кормить нарезанные скрины мира он разработал приложуху VISION. Далее подкинул еще текстовое состояние и передавал это все в агента. Управление LLM также осуществлялось в текстовой форме и преобразованием текста в команды. Врубил память в агенте и прописал доп правила/инструкции на взаимодействие с игрой аля хождение по уровню, атаки и открывание дверей.
Что получилось?
Агент оказался не вполне полноценным, например, забывание, если враги оказались вне зоны видимости. Вороги тем временем оставались живы и могли и далее атаковать.
Также наблюдались зависания и повторения. Далее при попытке разобраться с ошибками поведения, автор просил объяснений от агента, но тот галлюционировал и слова порой связать не мог.
В любом случае, интересный эксперимент, показывающий возможности к симуляциям и поведению в среде LLM, как агентов. Думаю к версии GPT5+ все будет еще веселее и пугающе.👍
Один энтузиаст тоже любит в выходные (и не только) гамать в игры. Тут он решил пригласить LLM на game рандеву в DOOM, заодно проверить как оно.
Для эксперимента автор не мог взять GPT-4 из-за ограничений с визуалом, поэтому выбор пал на GPT-4V. Но и тут не все так просто, нужно было придумать сетап для игры. Чтобы кормить нарезанные скрины мира он разработал приложуху VISION. Далее подкинул еще текстовое состояние и передавал это все в агента. Управление LLM также осуществлялось в текстовой форме и преобразованием текста в команды. Врубил память в агенте и прописал доп правила/инструкции на взаимодействие с игрой аля хождение по уровню, атаки и открывание дверей.
Что получилось?
Агент оказался не вполне полноценным, например, забывание, если враги оказались вне зоны видимости. Вороги тем временем оставались живы и могли и далее атаковать.
Также наблюдались зависания и повторения. Далее при попытке разобраться с ошибками поведения, автор просил объяснений от агента, но тот галлюционировал и слова порой связать не мог.
В любом случае, интересный эксперимент, показывающий возможности к симуляциям и поведению в среде LLM, как агентов. Думаю к версии GPT5+ все будет еще веселее и пугающе.
Please open Telegram to view this post
VIEW IN TELEGRAM
arXiv.org
Will GPT-4 Run DOOM?
We show that GPT-4's reasoning and planning capabilities extend to the 1993 first-person shooter Doom. This large language model (LLM) is able to run and play the game with only a few...
👍15🤯5👎2❤1🤔1👨💻1
https://t.me/lovedeathtransformers/7262
База, о которой я писал еще на заре канала и LLM хайпа. Воо туть.
База, о которой я писал еще на заре канала и LLM хайпа. Воо туть.
😁6🔥3💯2
Вот это размерчик. 314b на MoE конечно.
https://github.com/xai-org/grok
источник:
https://twitter.com/itsandrewgao/status/1769447953708765198
https://github.com/xai-org/grok
источник:
https://twitter.com/itsandrewgao/status/1769447953708765198
😁11👍2❤1
Люблю опты на графах, а RL на графах как решение оптов - еще интереснее.
https://t.me/sberlogabig/386
https://t.me/sberlogabig/386
Telegram
(sci)Berloga Всех Наук и Технологий
🚀 @SBERLOGASCI вебинар/обсуждение :
👨🔬 Богдан Булатов, Ульяна Князюк, Михаил Ураков "Применение Q-learning и SARSA к задаче короткого пути на графах. Разбор ноутбуков"
⌚️ Вторник, 19 Марта, 19.00 по Москве
Add to Google Calendar
Вводное обсуждение по…
👨🔬 Богдан Булатов, Ульяна Князюк, Михаил Ураков "Применение Q-learning и SARSA к задаче короткого пути на графах. Разбор ноутбуков"
⌚️ Вторник, 19 Марта, 19.00 по Москве
Add to Google Calendar
Вводное обсуждение по…
🔥9
"Квантизируй меня полностью" или мануал по квантизации от Yandex.
Тут ML-разработчик Яндекса выкатил подробнейшую статью на Хабре о том, что такое квантизация и как она работает.
Отличный гайд, который достоин закрепа во вкладках.
В статье представленны различные методы для уменьшения точности после зпт, как на инференсе, так и для обучения. Затронуты вопросы выбросов в тензорах, а также послойный/весовой/блочный и др. подходы. Во времена LLM не обошли и вопросы связанные с особенностями их квантизации.
Еще отмечу, везде, где возможно указаны ссылки на референс статьи и код методов. Тем самым, обзор позволяет потрогать указанные методы руками и выбрать подходящий именно под свои задачи. В общем, читаем, пробуем, учимся.
Тут ML-разработчик Яндекса выкатил подробнейшую статью на Хабре о том, что такое квантизация и как она работает.
Отличный гайд, который достоин закрепа во вкладках.
В статье представленны различные методы для уменьшения точности после зпт, как на инференсе, так и для обучения. Затронуты вопросы выбросов в тензорах, а также послойный/весовой/блочный и др. подходы. Во времена LLM не обошли и вопросы связанные с особенностями их квантизации.
Еще отмечу, везде, где возможно указаны ссылки на референс статьи и код методов. Тем самым, обзор позволяет потрогать указанные методы руками и выбрать подходящий именно под свои задачи. В общем, читаем, пробуем, учимся.
Хабр
Quantization Deep Dive, или Введение в современную квантизацию
Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая...
👍36🔥10❤7🤡1
Мои в телевизоле ❤️ 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Salute AI (Alexander Gavrilov)
Прямо сейчас проходит международная конференция EACL 2024 👩🔬👨💻
На Мальте компания SberDevices в лице Team Lead AGI NLP Алены Феногеновой и NLP ML-инженера Марка Баушенко представляют исследование команды в области обработки естественного языка (NLP): "A Methodology for Generative Spelling Correction via Natural Spelling Errors Emulation across Multiple Domains and Languages".
В рамках работы над проектом SAGE команды R&D SberDevices разработали генеративной подход к коррекции орфографии.
Решение SberDevices вызвало большой интерес и дискуссию среди экспертов, так как оно опережает по качеству для русского языка:
- открытые решения (Yandex.Speller, HunSpell, JamSpell)
- модели OpenAI (gpt-3.5-turbo-0301, gpt-4-0314, text-davinci-003).
Подход также работает на английском языке и может быть адаптирован под другие.
🌐 Ребята расскажут научному сообществу об исследовании в рамках постерной сессии на EACL 2024 до 22.03. Подробно об исследовании команды можно прочитать в академической статье.
🔥 — если тоже гордишься, что труд коллег получает международное признание!
#EACL2024 #SberDevices #SAGE #AGI_NLP #NeuralNetworks #RND
P.S. в апреле выйдет обновление SAGE.
Подпишитесь, чтобы не пропустить 👉 канал/ группа
На Мальте компания SberDevices в лице Team Lead AGI NLP Алены Феногеновой и NLP ML-инженера Марка Баушенко представляют исследование команды в области обработки естественного языка (NLP): "A Methodology for Generative Spelling Correction via Natural Spelling Errors Emulation across Multiple Domains and Languages".
В рамках работы над проектом SAGE команды R&D SberDevices разработали генеративной подход к коррекции орфографии.
Решение SberDevices вызвало большой интерес и дискуссию среди экспертов, так как оно опережает по качеству для русского языка:
- открытые решения (Yandex.Speller, HunSpell, JamSpell)
- модели OpenAI (gpt-3.5-turbo-0301, gpt-4-0314, text-davinci-003).
Подход также работает на английском языке и может быть адаптирован под другие.
🔥 — если тоже гордишься, что труд коллег получает международное признание!
#EACL2024 #SberDevices #SAGE #AGI_NLP #NeuralNetworks #RND
Подпишитесь, чтобы не пропустить 👉
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍11👎2
Чья бы это не была грязная партия, погибли и пострадали люди. Террору нет места нигде.
Соболезнования пострадавшим и их родным.
Сейчас, если вы хотите помочь, нужна донорская кровь, инфо тут.
Берегите себя и близких, надеюсь с вами все хорошо.
Соболезнования пострадавшим и их родным.
Сейчас, если вы хотите помочь, нужна донорская кровь, инфо тут.
Берегите себя и близких, надеюсь с вами все хорошо.
ТАСС
Жителей Москвы и Подмосковья попросили сдать кровь для пострадавших в "Крокус сити холле"
Сделать это можно будет 23 марта с 08:00. Читайте ТАСС в. МОСКВА, 23 марта. /ТАСС/. Жителей Москвы и Московской области просят сдать донорскую кровь для пострадавших в результате теракта в "Крокус сити холле". "После сегодняшней трагедии в "Крокусе" многим…
👍51🕊41❤9😢5👌1
Forwarded from эйай ньюз
Увидел в Threads анекдот: Bloomberg потратил ~$10 миллионов (в AWS SageMaker) на тренировку BloombergGPT (50B параметров на 700B токенов), специально для финансовых задач. Иииии.... модель всухую проиграла на этих же финансовых тасках GPT-4, которая вышла за две недели до этого.
И тут всё было бы очевидно: "нужно сдаваться GPT-4". Если бы не одна маленькая деталь — GPT-4 в свою очередь либо проигрывала либо еле-еле перегоняла (используя Chain of Thoughts) специализированные файнтюны таких динозавров как BERT (2018, 110 лямов параметров) и RoBERTa Large (2019, ~700 млн параметров).
Мораль басни такова: если вы не лидер AI гонки, то не соревнуйтесь с OpenAI в общих задачах, это дорого и трудно. Но если есть прямые руки и конкретный таск — перегнать даже SOTA general purpose модель вполне возможно. А, и ещё: тренировать в AWS безумно дорого😂
@ai_newz
И тут всё было бы очевидно: "нужно сдаваться GPT-4". Если бы не одна маленькая деталь — GPT-4 в свою очередь либо проигрывала либо еле-еле перегоняла (используя Chain of Thoughts) специализированные файнтюны таких динозавров как BERT (2018, 110 лямов параметров) и RoBERTa Large (2019, ~700 млн параметров).
Мораль басни такова: если вы не лидер AI гонки, то не соревнуйтесь с OpenAI в общих задачах, это дорого и трудно. Но если есть прямые руки и конкретный таск — перегнать даже SOTA general purpose модель вполне возможно. А, и ещё: тренировать в AWS безумно дорого
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
😁33💯2
Внимание, возможны репутационные осадки в виде фрикаделек LLMок.
На прошедшей конференции EACL была статья про утечки тест сетов бенчей в LLMки. Между прочим получила приз.
Поэтому рынок LLM может сильно перевернуться, когда добавят оценку утечки данных на общепринятые бенчмарки. Многие модели потеряют репутацию, если обнаружится утечка, и многие компании начнут в скором времени переобучать свои LLM без утечек и вообще будет весело :)
На прошедшей конференции EACL была статья про утечки тест сетов бенчей в LLMки. Между прочим получила приз.
Поэтому рынок LLM может сильно перевернуться, когда добавят оценку утечки данных на общепринятые бенчмарки. Многие модели потеряют репутацию, если обнаружится утечка, и многие компании начнут в скором времени переобучать свои LLM без утечек и вообще будет весело :)
😁22❤3🤔2
Forwarded from Salute AI (Alexander Gavrilov)
5 апреля | 12:00 | онлайн и офлайн в Москве
SberDevices зовёт в гости ML-разработчиков и Data Science-специалистов на конференцию R&D команд SberDevices по развитию GigaChat, NLP, Vision и Audio.
Будем изучать LLM и CV, распознавать жесты, генерировать вокал и 3D-модели, общаться с книгами и путешествовать по VR-галерее.
Программа:
🖥 Регистрируйтесь и выберите формат:📹 Онлайн на YouTube🕒 Офлайн в Москве. Приходите к 11:00.
‼️ Важно:
Адрес места проведения пришлем 4 апреля вместе с приглашением на митап.
#конференция_GIGA_RND_DAY
Подписывайтесь
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍4