Code Mining
936 subscribers
90 photos
4 videos
8 files
172 links
ML4Code во всей красе, анализ кода и артефактов: лицензии, уязвимости, процессы. Комментарии к актуальным и не очень новостям, аналитика, эпизодический авторский контент, мемасики.

При поддержке: ods.ai, @codescoring
По вопросам — @alsmirn
Download Telegram
dukebarman_Generative AI for Security Engineers.pdf
2.7 MB
Спасибо всем кто пришел и смотрел. Рассказал о применении «модного» генеративного ИИ для задач инженера ИБ и фаззинге в частности.
Демосцена

Как-то слишком часто вокруг меня вспоминалась демосцена в последний месяц.

Начиная с прекрасной, но прекратившей свое существование финской Assembly, заканчивая питерским Chaos Constructions, который ещё жив. Ух, какая там когда-то (2000/1) была атмосфера, ночевка в спальниках на конференции, кодинг 24x2/3, нереальные демки и конкурсы по метанию винчестеров и т.п.

Это всё было суперлампово и клёво (слеза).

О технических подробностях того, как это всё делалось, ликбез по алгоритмам, принципам и архитектуре обнаружен в видео с докладом от Александра Кухаренко "Демосцена: в погоне за wow-фактором":
https://www.youtube.com/watch?v=gl_Ikc_tOe4

А для кого это слово новое, можно полистать вики :).

#видоснавыходные
Шу или Шен

Один мой добрый коллега любит докопаться до официантов в обычных кафе на тему зеленого чая, Шу у них или Шен пуэр. Интересно наблюдать за тем, как работает вычислительная машина в их головах, когда они пытаются вспомнить, какие пакетики чая они видели на кухне :).

Наверное также выглядело и мое лицо когда я познакомился с "очередным" языком функционального программирования SHEN. У языка ещё более десятка разных портов и можно оценить силу паттерн-матчинга, лямбд и т.п., если у вас их не было. Весело же!

Знакомство на 15 минут.

Сайт | Гитхаб
Code Mining
Иванниковские чтения 2024 CFP на Иванниковские чтения открыто, конференция, состоится 17-18 мая 2024 года в Великом Новгороде. Секция по анализу и трансформации программ посвящена методам оптимизации в компиляторе, кодогенерации, статическому и динамическому…
Иванниковские чтения 2024

Уже 17-18 мая в Великом Новгороде пройдет очередная конференция Иванниковские чтения, где будут представлены направления:
- Анализ, моделирование и трансформации программ
- Анализ данных в медицине
- Управление данными и информационные системы
+ круглые столы по эмуляции и разработке безопасного ПО

Программа опубликована на сайте.

В секции «Технологии анализа, моделирования и трансформации программ» докладов много разных, подсветим некоторые из названий докладов:
- Большие языковые модели в статическом анализе исходного кода
- Пользовательские детекторы в статическом анализе на основе символьного выполнения
- Статический анализ для языка Scala
- Статический анализ ассоциативных массивов в Go
- Классификация предупреждений статического анализа методами машинного обучения
- Обнаружение вредоносной активности в проектах с открытым исходным кодом с помощью методов машинного обучения
- О методах извлечения алгоритмов из бинарного кода
- Статическое распределение памяти для операционных систем реального времени
- Автоматизация выполнения регрессионных тестов на гонки по данным

А ещё целых 5 докладов о фаззинге и многое другое.

Приходите, приезжайте, будет интересно.

Участие бесплатное.
Регистрация обязательна (открыта до 13 мая).

Сайт конференции: https://www.ivannikov-ws.org/
Использование ML/Data-опенсорса в России

Тут коллеги из ИТМО выпустили результаты своих исследований по сабжу. Вышло довольно занимательно.
И про мнение рынка и про популярные проекты.

В нашем следующем исследовании мы решили расширить рамки и рассмотреть вопрос используемости открытых инструментов в знакомых нам областях ИИ, машинного обучения, Data Science и работы с данными в целом. Сегодня мы завершили работу над этим материалом и рады представить его публике.


Само исследование.
Обсудить в чате с авторами.
Митап "AI4SE: Искусственный Интеллект для Разработки Программного Обеспечения"

MTS AI проводит митап посвященный исследованиям и практическому применению искусственного интеллекта в сфере разработки программного обеспечения (Software Engineering).

План встречи:
1. Введение в AI4SE: Основные концепции и области применения AI в разработке ПО.
2. Инструменты и технологии: Обзор современных инструментов на базе AI, которые используют разработчики.
3. Кейсы и истории успеха: Практические примеры и кейсы использования AI для оптимизации процессов разработки.
4. Панельная дискуссия: Экспертное обсуждение текущих трендов и перспектив внедрения AI в Software Engineering.
5. Q&A сессия: Вопросы и ответы от участников и спикеров.

Кому будет интересно:
- Разработчикам программного обеспечения
- Инженерам-тестировщикам
- Дата-сайентистам
- Менеджерам проектов и продуктов
- IT-энтузиастам и исследователям в области AI

Участие бесплатное, регистрация на оффлайн обязательна.
https://mts-ai-2024.timepad.ru/event/3019734/

Дата: 29 октября
Время: 19:00
Место: Офис MTS AI, м. Курская

Пицца, интересные доклады, реальные кейсы и нетворкинг!

Будет и онлайн.
Code Mining
Митап "AI4SE: Искусственный Интеллект для Разработки Программного Обеспечения" MTS AI проводит митап посвященный исследованиям и практическому применению искусственного интеллекта в сфере разработки программного обеспечения (Software Engineering). План встречи:…
Опубликована программа митапа
"AI4SE: Искусственный Интеллект для Разработки Программного Обеспечения"

18:00 — 18:40: Валентин Малых — "Как мы делаем помощника программиста"

18:40 — 19:20: Алексей Смирнов — "Применение ML в задачах безопасной разработки"

Перерыв: 20 минут

19:40 — 20:20: Павел Плюснин — "Predictive test selection: ускоряем тестирование в десятки раз с помощью ML"

20:20 — 21:00: Дмитрий Пилецкий — "In IDE Code Retriever. RAG для кода, для AI ассистентов и тд"

21:00 — Саморганизовываемся на автопати в один из баров Москвы)

Регистрация на оффлайн здесь (онлайн тоже будет):
https://mts-ai-2024.timepad.ru/event/3019734/
Открытая конференция ИСП РАН 2024

11-12 декабря в Москве пройдет конференция ISPRASOpen посвященная 30-летию Института и 300-летию РАН.

Напомним, что Институт системного программирования известен своими технологиями и мощной экспертизой не только программной инженерии, но и исследованиях в области искусственного интеллекта и медицины.

В этом году вновь будут представлены доклады в секции Технологии анализа, моделирования и трансформации программ:
- обратная инженерия бинарного (исполняемого) кода
- выполнение программ в контролируемом окружении
- поиск ошибок и уязвимостей в исполняемом коде
- анализ сетевого трафика
- оптимизации в компиляторе и генерация кода
- статический и динамический анализ программ
- методы и инструменты анализа и тестирования программ
- запутывание программ (обфускация)

В прошлом году было более 1000 участников, интересные стенды и много-много полезного общения для предновогодней подзарядки. В этом году ожидается более полутора тысяч человек и ещё большие масштабы.

🗓 11 и 12 декабря 2024
📍 Инновационный кластер "Ломоносов"

Участие бесплатное, регистрация необходима (до 6 ноября).
- Сайт конференции
- Предварительная программа

А ещё вы можете даже успеть со статьей и тезисами до 7 ноября.

@codemining
Материалы AI SYNC MEETUP | 29.10

#видоснавыходные

Для тех, кто по каким-то причинам пропустил, но всё же захочет посмотреть, доступно видео с митапа: https://vk.com/video-212087550_456239193.

Вышло душевно и лампово, круто, что такие мероприятия появляются в большем объеме.

Подсветим тезисно:
1. [00:00] Валентин Малых рассказал о подходах и задачах, которые они у себя в МТС ИИ применяют в разработке технологии лежащей в основе помощника программиста (кстати, есть название - Kodify).

2. [44:00] Алексей Смирнов пояснил за задачи ML в задачах безопасной разработки. Про то, что успехи какие-то есть, но всем бы ещё подучиться ;).

3. [1:52:00] Павел Плюснин показал, как они в Т-Банке предсказывают какие тесты есть смысл запускать на выполненные коммиты и как это экономит время и мощности.

4. [2:36:00] Дмитрий Пилецкий вскрыл тему с поисками по коду для IDE, ну и при чем тут RAG вы тоже узнаете.

Организаторам - cпасибо!

@codemining
Code Mining pinned «Открытая конференция ИСП РАН 2024 11-12 декабря в Москве пройдет конференция ISPRASOpen посвященная 30-летию Института и 300-летию РАН. Напомним, что Институт системного программирования известен своими технологиями и мощной экспертизой не только программной…»
Forwarded from ИСП РАН
‼️ Напоминаем, что сегодня последний день приёма статей и тезисов на Открытую конференцию ИСП РАН, которая состоится 11-12 декабря в Москве, в инновационном кластере «Ломоносов».

✔️Если вы планируете выступить в рецензируемых секциях, загрузите материалы до 23:59 по московскому времени! Все подробности: https://www.isprasopen.ru/#Submission.

Напоминаем, что для прохода в здание нужно зарегистрироваться! Регистрация участников до 23:59 6 декабря: https://www.isprasopen.ru/#Registration.
Forwarded from ИСП РАН
‼️ Мы продлеваем срок регистрации на Открытую конференцию ИСП РАН до 23.59 8 декабря!

➡️ Регистрация по ссылке:
https://www.isprasopen.ru/#Registration

✔️Напоминаем, конференция пройдет в кластере «Ломоносов» по адресу Москва, Раменский бульвар, д. 1.
LLM-based agents for Software Engineering

В сентябре вышел большой труд от китайских коллег: "Large Language Model-Based Agents for Software Engineering: A Survey".

Статья рассматривает аспекты применения LLM-основанных агентов в разных задачах программной инженерии (скрин). Чего там только нет! Добрая сотня доменных инструментов, которые ещё и сравниваются между собой и идет дискуссия о том как эти вещи принято строить в разных случаях.

Будем смотреть согласно своим интересам и что-нибудь обозревать.

Если вы нашли что-то интересненькое — делитесь в комментариях.

Да, к статье прилагается репо с большим количеством ссылок по темам: https://github.com/FudanSELab/Agent4SE-Paper-List.
Генерация безопасного кода с LLM: эмпирический опыт

Спрос на генерацию кода с помощью моделей машинного обучения становится все выше. Вместе с тем растут и сомнения в качестве и безопасности полученного кода. Согласно опросу Stack Overflow 57% пользователей недовольны результатом работы AI-помощников.

На Открытой Конференции коллеги из ИСП РАН представили доклад об исправлении уязвимостей в сгенерированном коде с помощью разработанного расширения CodePatchLLM.

Как это работает? Используя статический анализатор Svace, инструмент получает обратную связь об уязвимых функциях и корректирует результат работы модели. В результате CodePatchLLM устраняет до 85% уязвимостей в коде на Python и Java, при этом не теряя производительности.

Прочитать подробнее про расширение можно в статье, а оценить самостоятельно – на Github.

Тайм-код для просмотра доклада: 1:01:50. Полную запись докладов можно найти на сайте конференции ИСП РАН.

@codemining
THE STATE OF SECRETS SPRAWL 2024

Известно, что захардкоженые секреты (пароли, токены, ключи и т.п.) в коде или конфигурациях могут доставить много разных неприятностей при их утечке.

GitGuardian, лидер в отрасли ловли секретов в декабре выпустила свежий отчет, который подсвечивает актуальные статистики, например:
- 12.8 млн. новых секретов обнаружено в публичных коммитах на GitHub за 2023 год;
- 90% секретов оставались валидными и через 5 дней после утечки;
- каждый десятый разработчик случайно добавляет секрет в код.

В отчете раскрываются какие виды секретов текут чаще, в каких индустриях и отраслях.

В частности, отмечается популярность OpenAI, ключики которого стали течь многократно чаще (с ростом популярности, понятное дело).

Приводится увлекательная статистика по расширениям файлов, откуда утечка может произойти (картинка) и много чего ещё.

Авторы не забыли дать рекомендаций по защите и управлению процессом. Полезно.

Подробнее можно почитать в пятидесятистраничном отчете, который прямо целиком годный.

@codemining
Innovation Graph

Кто читал годовой отчет Github The state of open source software мог обратить внимание на их Innovation Graph из которого было вытащено много интересной статы.

Внутри агрегированная информация про разработчиков, организации, репозитории, языки, лицензии и пр.

Из интересного, есть классификация данных по регионам и разделение по странам. Например, можно посмотреть какие лицензии более популярны в еврозоне, а какие в Америке или Азии. Или динамику прироста программистов в Африке.

👀 Покрутить в интерактивные графики.

Репо и данные. Обновляется раз в квартал.

@codemining
T-Meetup: AI в SWE

4 марта оффлайн в Москве пройдет митап от Т-Банка о применении ИИ в программной инженерии. Больше полезных митапов! 🤟

В программе заявлен доклад "Обзор применений ИИ в программной инженерии в российских реалиях" от Николая Бушкова. Помимо обзорной части ожидается реальный опыт разработки и внедрения ассистентов. Про то как сделать — интересно, а про то, как оно "поехало" — вдвойне. Так что ждем!

Круглый стол! За столом соберутся эксперты из Т-Банка, Сбера и MTS AI и поговорят о проблемах и рисках внедрения этой самой ИИшечки в разработку. Тема животрепещущая, интересно будет послушать реальный опыт коллег по цеху.

Участие бесплатное. Регистрация обязательна.
https://l.tbank.ru/t-meetup-ai-v-swe

@codemining
Please open Telegram to view this post
VIEW IN TELEGRAM
PHDays Fest CFP

Кстати вот. Крупнейшее событие по кибербезопасности в мае. И даже есть время податься.

Про работу с кодом в том или ином виде ожидается много разных треков:
- разработческий и опсовые треки
- безопасная разработка
- Open Source & Open Security
- AI Track
- ...

Форматы:
- полновесный доклад (50 мин)
- фаст-трек (15 мин)

Всего треков почти 20 штук, так что и погулять-послушать будет чего. Понятно, что раз CFP, то программы пока нет, но можно посмотреть прошлогоднюю.

28 февраля — дедлайн подачи:
https://phdays.com/ru/cfp/

@codemining
Иванниковские чтения CFP

Регулярно конференция собирает множество участников, чтобы пообщаться, обменяться опытом и представить результаты своих изысканий.

По технологиям анализа, моделирования и трансформации программ спектр материала как обычно широк:
- Обратная инженерия бинарного кода
- Выполнение программ в контролируемом окружении
- Поиск ошибок и уязвимостей в исполняемом коде
- Анализ сетевого трафика
- Оптимизации в компиляторе
- Статический и динамический анализ программ
- Методы и инструменты анализа и тестирования программ
- Безопасность и конфиденциальность в ОС
- Жизненный цикл разработки: стандарты и сертификация
- ОС реального времени, интернет вещей
- Сетевые стеки и технологии
- Архитектура операционных систем (в том числе ядра ОС)

Конференция пройдет в Иркутске 26-27 июня.

Податься со статьей или докладом: https://www.ivannikov-ws.org/#Submission

@codemining