Forwarded from GigaDev — разработка GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.
Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.
Почему это интересно?
Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.
В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.
Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.
Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.
Цикл обучения включал:
Результаты:
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang
Motivation
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
❤73🌚16👍7🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
😁266❤31🔥12🫡5🌚3👍2
Сюжет достойный Гая Ричи: лопата для снега открыла хакерам доступ к корпоративной сети 😐
Два профессиональных пентестера приехали проверять физическую безопасность офиса крупной компании зимой. Заметив открытую дверь хозблока, они спокойно зашли внутрь, представились новыми сотрудниками IT без пропусков и вежливо предложили местным наивным рабочим помочь почистить снег и лед.
Пока один вовсю махал лопатой на улице, второй прошел вглубь здания, нашел конференц-зал и спрятал Raspberry Pi за мусорными ведрами, подключив его к активной сетевой розетке.
Дальше всё по классике — через малинку они нашли десятки аккаунтов с паролем вроде
Зато с уборкой помогли📹
Два профессиональных пентестера приехали проверять физическую безопасность офиса крупной компании зимой. Заметив открытую дверь хозблока, они спокойно зашли внутрь, представились новыми сотрудниками IT без пропусков и вежливо предложили местным наивным рабочим помочь почистить снег и лед.
Пока один вовсю махал лопатой на улице, второй прошел вглубь здания, нашел конференц-зал и спрятал Raspberry Pi за мусорными ведрами, подключив его к активной сетевой розетке.
Дальше всё по классике — через малинку они нашли десятки аккаунтов с паролем вроде
winter2023!, расковыряли Active Directory и в итоге получили domain admin.Зато с уборкой помогли
Please open Telegram to view this post
VIEW IN TELEGRAM
😁148🔥44❤11👍8
Forwarded from Яндекс
Media is too big
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚20😁6🔥3❤2👍1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁217❤31👍12🫡7
Найдена еще одна причина отказов на собесах — месть сисадминов 😁
Айтишник из России получил штраф за изощренную месть бывшей начальнице. После ссоры парень взломал ее аккаунт на HH, удалил все реальные заслуги и переписал резюме, щедро насыпав туда нелестных комментариев. Чтобы закрепить успех, мститель запустил веерную рассылку откликов по работодателям, сопровождая их оскорблениями.
Потерпевшая долго не могла понять, почему ее никто не зовет на собеседования, пока случайно не зашла в свой профиль. Суд оценил кибер-месть от бывшего коллеги в 55 тысяч рублей.
Не переходите дорогу программистам🤣
Айтишник из России получил штраф за изощренную месть бывшей начальнице. После ссоры парень взломал ее аккаунт на HH, удалил все реальные заслуги и переписал резюме, щедро насыпав туда нелестных комментариев. Чтобы закрепить успех, мститель запустил веерную рассылку откликов по работодателям, сопровождая их оскорблениями.
Потерпевшая долго не могла понять, почему ее никто не зовет на собеседования, пока случайно не зашла в свой профиль. Суд оценил кибер-месть от бывшего коллеги в 55 тысяч рублей.
Не переходите дорогу программистам
Please open Telegram to view this post
VIEW IN TELEGRAM
😁152❤15👍7
Cloud.ru выкатил в общий доступ новый сервис с ИИ-агентами OpenClaw и NemoClaw для работы в облаке — EvoClaw.
Агенты умеют взаимодействовать с файлами, сервисами и системами. Пользователи же могут заранее задать им специализацию, навыки и даже стиль общения👍
Это история не про «поиграться на пет-проекте»: с изоляцией сред и Zero Trust агентов спокойно можно пускать в чувствительные бизнес-задачи.
Агенты умеют взаимодействовать с файлами, сервисами и системами. Пользователи же могут заранее задать им специализацию, навыки и даже стиль общения
Это история не про «поиграться на пет-проекте»: с изоляцией сред и Zero Trust агентов спокойно можно пускать в чувствительные бизнес-задачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚24❤7😁4👍3🫡1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁142👨💻12🫡11👍4
Мда уж хех: из 444 iOS-приложений с ИИ-фичами, которые проверили в ходе исследования, 64% сливают данные разработчиков или вашу персональную инфу из-за дыр в безопасности 😂
54 приложения передавали plaintext API key напрямую, 92 имели backend proxy без нормальной авторизации, 136 светили переиспользуемые JWT/Bearer-токены.
Вайбкодинг, итоги🤣
54 приложения передавали plaintext API key напрямую, 92 имели backend proxy без нормальной авторизации, 136 светили переиспользуемые JWT/Bearer-токены.
Вайбкодинг, итоги
Please open Telegram to view this post
VIEW IN TELEGRAM
😁90👍7❤4🫡4👨💻2
Корпоративный софт в России начали оценивать почти как инвестиционный актив — по экономии, скорости и влиянию на бизнес-показатели.
Yandex B2B Tech провела первую премию Yandex B2B Tech Awards, куда поступило более 100 заявок. Победителями стали 16 компаний, средни которых Альфа-Банк, «Норникель», «Технониколь», AstraZeneca, ТюмГУ и «Брусника». Жюри оценивало бизнес-эффект от внедрения технологий Яндекс 360 и Yandex Cloud.
Самыми популярными направлениями конкурса стали генеративный ИИ, аналитика данных, облачная инфраструктура, информационная безопасность и автоматизация.
Цифровизация бизнеса продолжается🔨
Yandex B2B Tech провела первую премию Yandex B2B Tech Awards, куда поступило более 100 заявок. Победителями стали 16 компаний, средни которых Альфа-Банк, «Норникель», «Технониколь», AstraZeneca, ТюмГУ и «Брусника». Жюри оценивало бизнес-эффект от внедрения технологий Яндекс 360 и Yandex Cloud.
Самыми популярными направлениями конкурса стали генеративный ИИ, аналитика данных, облачная инфраструктура, информационная безопасность и автоматизация.
Цифровизация бизнеса продолжается
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚15🫡8❤5🔥1
Claude Fable 5 понерфили — качество ответов модели упало после перезапуска в РАЗЫ. Слишком строгие фильтры кибербезопасности не пропускают ничего сложнее print('Hello World') и перенаправляет все запросы на Claude Opus 4.8.
Неудивительно, что Fable разрешили выпустить. С такой-то мощью🥲
Неудивительно, что Fable разрешили выпустить. С такой-то мощью
Please open Telegram to view this post
VIEW IN TELEGRAM
😁139🫡18❤6👨💻3👍2
Цукерберг работает над соцсетью для вайбкодеров — Pocket 😐
Это приложение, где по текстовому запросу можно создавать слоп мини-игры и приложения, а затем публиковать их в общей ленте и скроллить, играть и сохранять чужие проекты. Приложение уже появилось в Google play, но пока доступно не всем.
Так вот на что уходят все ресурсы и ТРИЛЛИОНЫ токенов в месяц запрещенной в РФ Meta…
Это приложение, где по текстовому запросу можно создавать слоп мини-игры и приложения, а затем публиковать их в общей ленте и скроллить, играть и сохранять чужие проекты. Приложение уже появилось в Google play, но пока доступно не всем.
Так вот на что уходят все ресурсы и ТРИЛЛИОНЫ токенов в месяц запрещенной в РФ Meta…
Please open Telegram to view this post
VIEW IN TELEGRAM
😁99🌚12❤9👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Милота: разработчица с помощью Codex создала Pokémon Go для цветов 🌼
Наводите камеру на растение, а ИИ определяет его вид, создает карточку с описанием, и находка остается в вашей цифровой коллекции. Приложение бесплатное.
Идем коллекционировать и трогать траву после работы🚶♀️
Наводите камеру на растение, а ИИ определяет его вид, создает карточку с описанием, и находка остается в вашей цифровой коллекции. Приложение бесплатное.
Идем коллекционировать и трогать траву после работы
Please open Telegram to view this post
VIEW IN TELEGRAM
❤127👍39🔥20👨💻2😁1
Будущие DS-инженеры, готовимся: Авито запускает годовой Data Science Bootcamp — за год участники смогут вырасти до мидла, а лучших пригласят работать в Авито.
Во время буткемпа стажеры будут работать над реальными продуктами и технологиями Авито: рекомендациями, ранжированием объявлений, AI-ассистентами и другими сервисами. Можно выбрать один из двух треков: классический ML или NLP и LLM. Это отличная возможность получить опыт работы с настоящим продуктом!
На протяжении всей программы участников поддерживают наставники и целое комьюнити стажеров. Заявки принимаются из любого региона России — работать можно удаленно или в одном из пяти офисов Авито.
Бежим регистрироваться до 9 июля.
Во время буткемпа стажеры будут работать над реальными продуктами и технологиями Авито: рекомендациями, ранжированием объявлений, AI-ассистентами и другими сервисами. Можно выбрать один из двух треков: классический ML или NLP и LLM. Это отличная возможность получить опыт работы с настоящим продуктом!
На протяжении всей программы участников поддерживают наставники и целое комьюнити стажеров. Заявки принимаются из любого региона России — работать можно удаленно или в одном из пяти офисов Авито.
Бежим регистрироваться до 9 июля.
👍7😁4❤1🔥1🌚1
Forwarded from XOR
Полезное: у Anthropic появилась бесплатная библиотека промптов для Claude 🤩
Внутри уже десятки готовых промптов для анализа безопасности, отладки и ревью кода, автоматизации задач и многого другого. Каждый сопровождается пояснениями, почему и как он работает.
Забираем👌
@xor_journal
Внутри уже десятки готовых промптов для анализа безопасности, отладки и ревью кода, автоматизации задач и многого другого. Каждый сопровождается пояснениями, почему и как он работает.
Забираем
@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45❤15👍7😁4
This media is not supported in your browser
VIEW IN TELEGRAM
Самое время их объединить и создать Клодогон 🍺
Please open Telegram to view this post
VIEW IN TELEGRAM
😁134👍18🔥9❤4🌚3🫡3
Делаем архитектуру проекта понятной: нашел для системных аналитиков классный скилл Archify 🤩
Просто описываете, как у вас всё устроено в проекте, а агент рисует архитектуру, связи между сервисами, потоки данных и другие схемы. На выходе получается HTML-файл, который можно открыть в браузере или экспортировать.
Делаем документацию смотрибельной👍
Просто описываете, как у вас всё устроено в проекте, а агент рисует архитектуру, связи между сервисами, потоки данных и другие схемы. На выходе получается HTML-файл, который можно открыть в браузере или экспортировать.
Делаем документацию смотрибельной
Please open Telegram to view this post
VIEW IN TELEGRAM
😁29❤19👍9🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁226❤27🌚10🫡2