WBTECH
12.5K subscribers
249 photos
10 videos
152 links
Разработчики Wildberries делятся опытом: полезные статьи и анонсы мероприятий

Ютуб: https://www.youtube.com/@wb_tech

Регистрация в Роскомнадзоре:
№ 4963508866
Download Telegram
Аналитик SOC: про скилы, карьерный рост и… медведей

Аналитик SOC (Security Operation Center) — это специалист по ИБ, который ловит хакера «за руку» и выпроваживает из инфраструктуры. Чтобы поимка состоялась, ему необходимо серьезно подготовиться: детально изучить «поле действий» и продумать механизмы реагирования.

Иван Дьячков прошел длинный путь от эникейщика в небольшом ритейле до руководителя центра мониторинга ИБ в Wildberries и делится секретами освоения профессии: какими знаниями нужно обладать на разных линиях SOC, с чего начать, как преуспеть, куда расти дальше.

Казалось бы, при чем тут медведи?

Подробности в статье на Хабре.

#wbtech #wbsecurity #wbsecurity_habr
This media is not supported in your browser
VIEW IN TELEGRAM
Пропустили июньский Data Fest 2024 — ничего страшного!

Собрали для вас выступления наших ребят в одном посте:

Retrieval-recsys: как использовать Sentence Transformer для персональных рекомендаций
Карина Романова, Lead of Alignment Language Models for RecSys in CoreLLM team рассказала, как делать рекомендательные модели на основе только текста без id пользователей или товаров.

LLM читает отзывы на маркетплейсе за вас
Максим Богданов, Team Lead Data Scientist рассказал о том, как мы в Wildberries используем LLM для чтения отзывов.

Оптимизация работы маркетплейса с помощью языковых моделей
Анастасия Янина, Team Lead LLM рассказала о том, как мы используем языковые модели для того, чтобы все работало оптимально и хорошо.

Advanced RAG Pipelines
Иван Насонов, Data Scientist занимается прогнозирование временных рядов заказов пользователей и рекомендациями в отделе LLM.
В докладе разобрали иерархию документов, графовый RAG, Hypothetical Document Embeddings, контекстные фильтры, компрессоры, Multi-Query Retrieval, RAG-Fusion, мультимодальный RAG и RAPTOR.

Хороших выходных ;-)
Когда строишь дата-центры без охлаждения, люди задают вопросы ;)

А если на улице жаркое лето? А если лютый мороз?
А что если с улицы ветер пыль в дата-центр принес?
Цунами, пожар, конденсат, НЛО и всех генераторов сбой
А если уборщица кабель заденет, то есть ли ЦОД запасной?

Сделали сайт про наши ЦОДы с румтурами и ответами на все вопросы.

#wbtech #wbdatacenters
Кошмарный сон iOS-мидла: не отличаешь WebSocket от Socket.IO, нет опыта с gRPC и в написании тестов, не используешь SwiftUI и до сих пор игнорируешь кодогенерацию.

Погрязнув в текущих задачах, так легко проспать новые возможности Swift (например, Typestate и Trigger Value паттерны, начиная с версии 5.9)!

Самое время объединиться в комьюнити с другими мидлами и поступить на курс «iOS-сеньор» от Техношколы.

Отличников и хорошистов позовем в команду Wildberries.

Какими скиллами надо обладать:
— опыт разработки iOS-приложений от 2 лет;
— уверенное знание языка Swift и основ ООП;
— iOS SDK, Auto Layout, Combine, UIKit, Core Animation;
— RESTful API и Alamofire, URLSession для взаимодействия с сетью и обмена данными;
— опыт интеграции сторонних библиотек и фреймворков (StoreKit, Adjust, OneSignal etc);
— архитектурные паттерны (MVC, MVVM).

Подать заявку можно здесь, но надо успеть до завтра.

#вбтехношкола
Media is too big
VIEW IN TELEGRAM
В кадре третьего эпизода #wbpeople Саша и Никита: руководитель отдела ранжирования и вчерашний выпускник Бауманки (но уже тимлид!).

Саша Самойлов пришел в IT лет 10 назад из ядерной физики, для Никиты Бульчука это первая работа после универа. Несмотря на разницу в опыте, оба признают, что им есть чему поучиться друг у друга.

Чем помогло фундаментальное образование и почему пришлось оставить ядерную физику, какую музыку предпочитают разработчики и любимый кофе у собаки, советы начинающим физикам-ядерщикам и что больше всего впечатляет в работе — ответы на эти и другие вопросы смотрите в новом выпуске.

PS. Еще у Саши Самойлова в этом ролике классные тапки, и он говорит «айтишка» :-)

#wbtech
Можно ли заменить QA-команду unit-тестами? Спросили об этом Chat GPT и получили настолько развернутый отрицательный ответ, что стало даже немножко страшно.

Ничего не планируйте на это лето — у нас для вас новый курс WB Техношколы: «Ручное тестирование».

Поможем стать уверенным QA-джуном и научим тестировать мобильные и веб-приложения, вести тестовую документацию и применять полученные знания в крупнейшей IT-компании.

Условия просты:
— хочешь тестить и полон драйва, внимателен к деталям и можешь посвящать обучению не менее 12 часов в неделю
— плюсик, если есть опыт в айтишке и тестировании.


6 месяцев знаний и опыта под руководством сеньоров своего дела:
— Мария Солдатова, QA Lead HR Tech, Wildberries
— Виктория Крестенкова, Senior QA Engineer HR Tech, Wildberries
— Наталья Малей, QA Lead, WB Drive
— Алена Свердлова, QA Lead, WB Partners

Стартуем 9 июля, но с заявкой надо поспешить.

#вбтехношкола
Краеугольные камни ClickHouse

Можно годами делать инсерты и апдейты в БД, не зная чем отличаются LSM-деревья от B-деревьев, но частые вставки с миллионами строк рано или поздно потребуют погружения в то, как это работает.

Большая хабростатья от Артемия Кравцова об особенностях в архитектуре ClickHouse и о том, как он хранит данные.

#wbtech #wbdatabases #wbdatabases_habr #clickhouse
Графовые сети в рекомендательных системах

Как работают свертки над графом, что такое Light Convolution, и как удалось победить popularity bias?

Большой гайд на Хабре от Александра Тришина о практическом применении сверточных графовых сетей на примере модели LightGCN.

#wbtech #wbds #wbds_habr
Строим свой PAM на основе Teleport

PAM — это Privileged Access Management система. Например, для обеспечения доступа к виртуальным машинам, серверам, кластерам Kubernetes и другим корпоративным ресурсам. Существует большое количество проприетарных PAM‑решений, однако большинство из них заточено под классическую Windows-инфраструктуру и не учитывают некоторые возможности Linux.

Большая статья на Хабре от Антона Жаболенко и Павла Пархомца о критериях идеального PAM и результатах внедрения PAM на основе Teleport в Wildberries.

#wbtech #wbsecurity #wbsecurity_habr
Увеличиваем выплаты по программе Bug Bounty

Привет, багхантеры!

У нас масштабные обновления — мы релизнули нашу новую политику. Что вас ждет?

Повышенные выплаты
🔵Теперь за Critical уязвимости можно получить в 2 раза больше — до 500 000 ₽, а за High уязвимости аж в 3 раза — до 200 000 ₽
🔵Легендарные баги за косарь остаются в прошлом — минимальная выплата увеличена в пять раз

Новые правила
🔵Мы разделили наши сервисы на 3 тира — и теперь вам доступен новый тир с повышенными выплатами
🔵У нас увеличился скоуп доменов второго уровня — встречайте *.wbwh.ru, *.wbwh.tech, *.wbheld.ru
🔵В программе появилось несколько новых исключений

Подробнее — в нашей политике.

PS. А ещё мы запустили официальный канал для багхантеров — там все подробности, подписывайтесь, чтобы не пропустить следующие обновления.

#wbtech #wbsecurity #bugbounty
Please open Telegram to view this post
VIEW IN TELEGRAM
Администрирование и разработка на PostgreSQL

Один из лучших форматов выступлений — тот, где спикер не ограничен по времени и участники никуда не спешат.

Ринат Сафаров, администратор баз данных в Wildberries, продержался у микрофона почти три часа и ответил на полторы сотни вопросов о Постгресе в Южном ИТ_парке.

Запись стрима доступна здесь.

#wbtech #dba #postgresql #southitpark
🎤 Приглашаем всех интересующихся DS/ML и применением современных решений в работе маркетплейса на первый ML Meetup Wildberries!

Когда? 11 сентября, в 18:00
Где? Москва, офис Wildberries в БЦ «Белые Сады». Адрес: ул. Лесная, 9, здание Б, 7 этаж, метро Белорусская

В программе митапа:
🟣«Применение ML в продуктах и внутренних процессах Wildberries», Александр Сидоров, Head of DS Wildberries
🟣«Графовые нейронные сети в рекомендациях», Александр Тришин, Data Scientist RecSys
🟣«Текстовый эмбеддер в похожих товарах», Георгий Соколов, Data Scientist RecSys
🟣«Жаргон и именованные сущности в спеллчеке», Анна Текучева, Data Scientist HML

Помимо докладов участников ждет ML Quiz и другие активности, за прохождение которых можно получить мерч Wildberries. А также нетворкинг, новые знакомства и вкусные угощения!

Регистрация уже открыта, а количество мест ограничено!

Подробности о мероприятии будут появляться в Telegram-канале WB Space — следите за новостями.

#wbtech #wbmeetups #wbspeakers #wbml
Please open Telegram to view this post
VIEW IN TELEGRAM
Пишем свой генератор ID для мобильных приложений

Задумывались ли вы о том, как использование UUID в UI влияет на производительность в мобильных приложениях?

Анализ и сравнение производительности популярных методов генерации уникальных идентификаторов, разработка собственного метода, пути оптимизации и дальнейшие исследования.

Обо всем этом в новой хабр-статье Андрея Богомолова, Android-разработчика в команде Performance приложения Wildberries.

#wbtech #kotlin #android #wbtech_habr
Всем привет!

21 октября в Техношколе Wildberries стартует курс «Data Science».

Ежедневная пользовательская активность на Wildberries измеряется десятками миллиардов событий, каждый день мы работаем с 15 миллионами заказов, испытывая в пике нагрузки в сотни тысяч RPS.


Что будет на курсе?

Бизнес-задачи для продуктов маркетплейса по направлениям: рекомендательные системы, research, репутация пользователей и языковые модели. Погружение в работу с большими данными с применением самых современных технологий машинного обучения.

Ждем начинающих специалистов и студентов со знанием базовых алгоритмов ML/DL, структур данных и Python.

Прием заявок открыт до 18 октября!

PS. Отличников и хорошистов позовем в команду Wildberries.
Привет, ребята!

28 октября в Техношколе Wildberries стартует курс «Hard аналитика».

Что будет на курсе?

Много теории и решение практического кейса на реальных данных маркетплейса, сценарии работы с данными и A/B-тесты, тонкости дизайна исследований и стек инструментов для хранения и сбора данных.

Ждем начинающих специалистов и студентов с хорошей математической подготовкой и знанием Python и SQL.

Прием заявок открыт до 25 октября!

PS. Лучших студентов пригласим на собеседование в команду Wildberries ;-)
Автотрекинг производительности Room Database

Основное назначение Room — упростить работу с БД SQLite в приложениях Android, предоставляя более высокоуровневый, удобный интерфейс для взаимодействия с данными. Но что, если из-за самой БД скорость старта приложения уменьшается?

Ответ на этот вопрос в новой хабростатье Александра Цыбина, Android-разработчика из команды мониторинга надежности и производительности (SRE) приложения Wildberries.

#wbtech #kotlin #android #wbtech_habr
Процесс рефакторинга в крупном проекте мобильной разработки | Анвар Губайдуллин, Android-разработчик, Wildberries

Растет маркетплейс, растет и количество фич в мобильном приложении — вместе с этим меняется и структура команды: нам приходится делиться на более мелкие продуктовые группы, каждая из которых стремится к тому, чтобы ее код был изолированным и максимально стабильным.

Не секрет также, что при разработке мобильного приложения Wildberries мы исповедуем подход «Offline first» — для нас важна работоспособность приложения в населенных пунктах с плохим Интернетом и даже в режиме полета. И, конечно же, нам приходится следить за синхронизацией и актуальностью данных, поддерживая большой пласт бизнес-логики на клиенте.

В сентябре в своем докладе на DevFest Анвар Губайдуллин рассказал о процессах подготовки к рефакторингу крупных модулей приложения, условиях для его реализации и правилах разработки, выявленных в ходе работы.

Запись доклада с конференции доступна на YouTube.

#wbtech #android #wbspeakers #devfest #android
В сентябре очередь осваивать формат «весь вечер на арене» выпала Андрею Жукову — руководителю отдела индексирования товаров Wildberries.

◦ Темные боги корпоративной архитектуры. Истории из недр Варпа

Как так оказывается, что совершенно разные подходы к организации корпоративной архитектуры порождают одинаково отвратительных демонов реализации. Почему рожденные в идеальном порядке или в искренней любви дизайн-документы все равно приводят нас в пучины отчаяния. Как приключение на один спринт заканчивается падением в черную дыру техдолга. Поговорили о том, что мешает развитию и реализации продукта через призму вселенной Warhammer 40,000.

◦ Дзен и искусство ухода за экселем. Почему ваша бигдата должна перестать ею быть

Мы живем в эпоху больших данных. Строим даталейки, датаплатформы, рассказываем об успехах в обработке больших данных. Наши журналы обработки — тоже уже бигдата, нам не хватает серверов. А бизнес твердит про свои эксели. Может быть, мы все делаем не так? Может быть, бигдата — это cv-driven development? Или все наши труды действительно происходят не зря? Порассуждали на тему, почему ИТ-команды и бизнес не слышат друг друга, хотя решают общие задачи.


Запись стрима доступна здесь.

#wbtech #management #southitpark
Как применяется ML в продуктах и процессах Wildberries, и какие решения мы используем в рекомендациях и поиске?

Ответами на эти и другие вопросы поделились спикеры ML Meetup Wildberries. Подробнее в видеозаписях докладов:

◦ Применение ML в продуктах и внутренних процессах Wildberries (YouTube | VK)
Александр Сидоров, Head of DS Wildberries, рассказал о применении DS/ML для улучшения пользовательского опыта и повышения эффективности, повторно используемых моделях, технологиях, организационных функциях и инфраструктуре.

◦ Графовые нейронные сети в рекомендациях (YouTube | VK)
Александр Тришин, Data Scientist RecSys, поделился принципами работы сверточных графовых сетей, разобрал архитектуру модели LightGCN, ее достоинства и способы устранения недостатков.

◦ Мультиязычный текстовый энкодер в похожих товарах (YouTube | VK)
Георгий Соколов, Data Scientist RecSys, рассказал про обучение представления для задачи поиска похожих товаров на основе текстового описания и особенности metric-learning для текстовых энкодеров.

◦ Жаргон и именованные сущности в спеллчеке в Поиске (YouTube | VK)
Анна Текучева, Data Scientist HML, показала на примере связь между спеллчеком, жаргоном и именованными сущностями, а также поделилась выводами после внедрения алгоритма в работу.

Плейлисты выступлений доступны на YouTube и в VK.

#wbtech #wbds #wbspeakers #wbmeetup