CodeCamp
185K subscribers
6.28K photos
2.02K videos
67 files
3.93K links
Канал, который читает твой сеньйор.

Здесь про разработку, технологии и гаджеты 🤘

Редакция: @camprobot
Сотрудничество: @todaycast

РКН: https://clck.ru/3FjTpV
Download Telegram
💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»


Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.

Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.

Почему это интересно?

Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.

В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.

Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.

Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.

Цикл обучения включал:
🔘адаптацию AR-модели к диффузионной генерации;
🔘постепенное увеличение размера блока;
🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM;
🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации.

Результаты:

🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B.
🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%.
🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации.
🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM.
🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.


➡️Подробности — в статье на Habr.
➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B
➡️GitVerse
Please open Telegram to view this post
VIEW IN TELEGRAM
73🌚16👍7🔥3
POV: джун выбирает будущий карьерный путь 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
😁26631🔥12🫡5🌚3👍2
Сюжет достойный Гая Ричи: лопата для снега открыла хакерам доступ к корпоративной сети 😐

Два профессиональных пентестера приехали проверять физическую безопасность офиса крупной компании зимой. Заметив открытую дверь хозблока, они спокойно зашли внутрь, представились новыми сотрудниками IT без пропусков и вежливо предложили местным наивным рабочим помочь почистить снег и лед.

Пока один вовсю махал лопатой на улице, второй прошел вглубь здания, нашел конференц-зал и спрятал Raspberry Pi за мусорными ведрами, подключив его к активной сетевой розетке.

Дальше всё по классике — через малинку они нашли десятки аккаунтов с паролем вроде winter2023!, расковыряли Active Directory и в итоге получили domain admin.

Зато с уборкой помогли 📹
Please open Telegram to view this post
VIEW IN TELEGRAM
😁148🔥4411👍8
Forwarded from Яндекс
Media is too big
VIEW IN TELEGRAM
«В Яндекс я попал только с третьего раза!». Побывали в офисе Яндекс Еды, потрогали самурайский меч и поговорили со старшим iOS-разработчиком Львом Бондаренко — обсудили его любимые проекты, тренды мобильной разработки и алгоритмы на собеседованиях.

↘️ Это «1х1» — формат, в котором яндексоиды проводят с вами личную встречу на работе. Смотрите здесь, на YouTube и в VK Видео.

👀 Присоединяйтесь к нашей команде
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚20😁6🔥32👍1
Я что, так много прошу? 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
😁21731👍12🫡7
Найдена еще одна причина отказов на собесах — месть сисадминов 😁

Айтишник из России получил штраф за изощренную месть бывшей начальнице. После ссоры парень взломал ее аккаунт на HH, удалил все реальные заслуги и переписал резюме, щедро насыпав туда нелестных комментариев. Чтобы закрепить успех, мститель запустил веерную рассылку откликов по работодателям, сопровождая их оскорблениями.

Потерпевшая долго не могла понять, почему ее никто не зовет на собеседования, пока случайно не зашла в свой профиль. Суд оценил кибер-месть от бывшего коллеги в 55 тысяч рублей.

Не переходите дорогу программистам 🤣
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15215👍7
Cloud.ru выкатил в общий доступ новый сервис с ИИ-агентами OpenClaw и NemoClaw для работы в облаке — EvoClaw.

Агенты умеют взаимодействовать с файлами, сервисами и системами. Пользователи же могут заранее задать им специализацию, навыки и даже стиль общения 👍

Это история не про «поиграться на пет-проекте»: с изоляцией сред и Zero Trust агентов спокойно можно пускать в чувствительные бизнес-задачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚247😁4👍3🫡1
Хотя бы по пятницам придерживайтесь 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
😁142👨‍💻12🫡11👍4
Мда уж хех: из 444 iOS-приложений с ИИ-фичами, которые проверили в ходе исследования, 64% сливают данные разработчиков или вашу персональную инфу из-за дыр в безопасности 😂

54 приложения передавали plaintext API key напрямую, 92 имели backend proxy без нормальной авторизации, 136 светили переиспользуемые JWT/Bearer-токены.

Вайбкодинг, итоги 🤣
Please open Telegram to view this post
VIEW IN TELEGRAM
😁90👍74🫡4👨‍💻2
Корпоративный софт в России начали оценивать почти как инвестиционный актив — по экономии, скорости и влиянию на бизнес-показатели.

Yandex B2B Tech провела первую премию Yandex B2B Tech Awards, куда поступило более 100 заявок. Победителями стали 16 компаний, средни которых Альфа-Банк, «Норникель», «Технониколь», AstraZeneca, ТюмГУ и «Брусника». Жюри оценивало бизнес-эффект от внедрения технологий Яндекс 360 и Yandex Cloud.

Самыми популярными направлениями конкурса стали генеративный ИИ, аналитика данных, облачная инфраструктура, информационная безопасность и автоматизация.

Цифровизация бизнеса продолжается 🔨
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚15🫡85🔥1
Claude Fable 5 понерфили — качество ответов модели упало после перезапуска в РАЗЫ. Слишком строгие фильтры кибербезопасности не пропускают ничего сложнее print('Hello World') и перенаправляет все запросы на Claude Opus 4.8.

Неудивительно, что Fable разрешили выпустить. С такой-то мощью 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
😁139🫡186👨‍💻3👍2
Цукерберг работает над соцсетью для вайбкодеров — Pocket 😐

Это приложение, где по текстовому запросу можно создавать слоп мини-игры и приложения, а затем публиковать их в общей ленте и скроллить, играть и сохранять чужие проекты. Приложение уже появилось в Google play, но пока доступно не всем.

Так вот на что уходят все ресурсы и ТРИЛЛИОНЫ токенов в месяц запрещенной в РФ Meta…
Please open Telegram to view this post
VIEW IN TELEGRAM
😁99🌚129👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Милота: разработчица с помощью Codex создала Pokémon Go для цветов 🌼

Наводите камеру на растение, а ИИ определяет его вид, создает карточку с описанием, и находка остается в вашей цифровой коллекции. Приложение бесплатное.

Идем коллекционировать и трогать траву после работы 🚶‍♀️
Please open Telegram to view this post
VIEW IN TELEGRAM
127👍39🔥20👨‍💻2😁1
Будущие DS-инженеры, готовимся: Авито запускает годовой Data Science Bootcamp — за год участники смогут вырасти до мидла, а лучших пригласят работать в Авито.

Во время буткемпа стажеры будут работать над реальными продуктами и технологиями Авито: рекомендациями, ранжированием объявлений, AI-ассистентами и другими сервисами. Можно выбрать один из двух треков: классический ML или NLP и LLM. Это отличная возможность получить опыт работы с настоящим продуктом!

На протяжении всей программы участников поддерживают наставники и целое комьюнити стажеров. Заявки принимаются из любого региона России — работать можно удаленно или в одном из пяти офисов Авито.

Бежим регистрироваться до 9 июля.
👍7😁41🔥1🌚1
Forwarded from XOR
Полезное: у Anthropic появилась бесплатная библиотека промптов для Claude 🤩

Внутри уже десятки готовых промптов для анализа безопасности, отладки и ревью кода, автоматизации задач и многого другого. Каждый сопровождается пояснениями, почему и как он работает.

Забираем 👌

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4515👍7😁4
This media is not supported in your browser
VIEW IN TELEGRAM
Самое время их объединить и создать Клодогон 🍺
Please open Telegram to view this post
VIEW IN TELEGRAM
😁134👍18🔥94🌚3🫡3
Делаем архитектуру проекта понятной: нашел для системных аналитиков классный скилл Archify 🤩

Просто описываете, как у вас всё устроено в проекте, а агент рисует архитектуру, связи между сервисами, потоки данных и другие схемы. На выходе получается HTML-файл, который можно открыть в браузере или экспортировать.

Делаем документацию смотрибельной 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2919👍9🔥2
Раз попробовал — пропал 🤣
Please open Telegram to view this post
VIEW IN TELEGRAM
😁22627🌚10🫡2