WBTECH
11.7K subscribers
230 photos
10 videos
145 links
Разработчики Wildberries делятся опытом: полезные статьи и анонсы мероприятий

Ютуб: https://www.youtube.com/@wb_tech

Регистрация в Роскомнадзоре:
№ 4963508866
Download Telegram
Media is too big
VIEW IN TELEGRAM
В кадре третьего эпизода #wbpeople Саша и Никита: руководитель отдела ранжирования и вчерашний выпускник Бауманки (но уже тимлид!).

Саша Самойлов пришел в IT лет 10 назад из ядерной физики, для Никиты Бульчука это первая работа после универа. Несмотря на разницу в опыте, оба признают, что им есть чему поучиться друг у друга.

Чем помогло фундаментальное образование и почему пришлось оставить ядерную физику, какую музыку предпочитают разработчики и любимый кофе у собаки, советы начинающим физикам-ядерщикам и что больше всего впечатляет в работе — ответы на эти и другие вопросы смотрите в новом выпуске.

PS. Еще у Саши Самойлова в этом ролике классные тапки, и он говорит «айтишка» :-)

#wbtech
Можно ли заменить QA-команду unit-тестами? Спросили об этом Chat GPT и получили настолько развернутый отрицательный ответ, что стало даже немножко страшно.

Ничего не планируйте на это лето — у нас для вас новый курс WB Техношколы: «Ручное тестирование».

Поможем стать уверенным QA-джуном и научим тестировать мобильные и веб-приложения, вести тестовую документацию и применять полученные знания в крупнейшей IT-компании.

Условия просты:
— хочешь тестить и полон драйва, внимателен к деталям и можешь посвящать обучению не менее 12 часов в неделю
— плюсик, если есть опыт в айтишке и тестировании.


6 месяцев знаний и опыта под руководством сеньоров своего дела:
— Мария Солдатова, QA Lead HR Tech, Wildberries
— Виктория Крестенкова, Senior QA Engineer HR Tech, Wildberries
— Наталья Малей, QA Lead, WB Drive
— Алена Свердлова, QA Lead, WB Partners

Стартуем 9 июля, но с заявкой надо поспешить.

#вбтехношкола
Краеугольные камни ClickHouse

Можно годами делать инсерты и апдейты в БД, не зная чем отличаются LSM-деревья от B-деревьев, но частые вставки с миллионами строк рано или поздно потребуют погружения в то, как это работает.

Большая хабростатья от Артемия Кравцова об особенностях в архитектуре ClickHouse и о том, как он хранит данные.

#wbtech #wbdatabases #wbdatabases_habr #clickhouse
Графовые сети в рекомендательных системах

Как работают свертки над графом, что такое Light Convolution, и как удалось победить popularity bias?

Большой гайд на Хабре от Александра Тришина о практическом применении сверточных графовых сетей на примере модели LightGCN.

#wbtech #wbds #wbds_habr
Строим свой PAM на основе Teleport

PAM — это Privileged Access Management система. Например, для обеспечения доступа к виртуальным машинам, серверам, кластерам Kubernetes и другим корпоративным ресурсам. Существует большое количество проприетарных PAM‑решений, однако большинство из них заточено под классическую Windows-инфраструктуру и не учитывают некоторые возможности Linux.

Большая статья на Хабре от Антона Жаболенко и Павла Пархомца о критериях идеального PAM и результатах внедрения PAM на основе Teleport в Wildberries.

#wbtech #wbsecurity #wbsecurity_habr
Увеличиваем выплаты по программе Bug Bounty

Привет, багхантеры!

У нас масштабные обновления — мы релизнули нашу новую политику. Что вас ждет?

Повышенные выплаты
🔵Теперь за Critical уязвимости можно получить в 2 раза больше — до 500 000 ₽, а за High уязвимости аж в 3 раза — до 200 000 ₽
🔵Легендарные баги за косарь остаются в прошлом — минимальная выплата увеличена в пять раз

Новые правила
🔵Мы разделили наши сервисы на 3 тира — и теперь вам доступен новый тир с повышенными выплатами
🔵У нас увеличился скоуп доменов второго уровня — встречайте *.wbwh.ru, *.wbwh.tech, *.wbheld.ru
🔵В программе появилось несколько новых исключений

Подробнее — в нашей политике.

PS. А ещё мы запустили официальный канал для багхантеров — там все подробности, подписывайтесь, чтобы не пропустить следующие обновления.

#wbtech #wbsecurity #bugbounty
Please open Telegram to view this post
VIEW IN TELEGRAM
Администрирование и разработка на PostgreSQL

Один из лучших форматов выступлений — тот, где спикер не ограничен по времени и участники никуда не спешат.

Ринат Сафаров, администратор баз данных в Wildberries, продержался у микрофона почти три часа и ответил на полторы сотни вопросов о Постгресе в Южном ИТ_парке.

Запись стрима доступна здесь.

#wbtech #dba #postgresql #southitpark
🎤 Приглашаем всех интересующихся DS/ML и применением современных решений в работе маркетплейса на первый ML Meetup Wildberries!

Когда? 11 сентября, в 18:00
Где? Москва, офис Wildberries в БЦ «Белые Сады». Адрес: ул. Лесная, 9, здание Б, 7 этаж, метро Белорусская

В программе митапа:
🟣«Применение ML в продуктах и внутренних процессах Wildberries», Александр Сидоров, Head of DS Wildberries
🟣«Графовые нейронные сети в рекомендациях», Александр Тришин, Data Scientist RecSys
🟣«Текстовый эмбеддер в похожих товарах», Георгий Соколов, Data Scientist RecSys
🟣«Жаргон и именованные сущности в спеллчеке», Анна Текучева, Data Scientist HML

Помимо докладов участников ждет ML Quiz и другие активности, за прохождение которых можно получить мерч Wildberries. А также нетворкинг, новые знакомства и вкусные угощения!

Регистрация уже открыта, а количество мест ограничено!

Подробности о мероприятии будут появляться в Telegram-канале WB Space — следите за новостями.

#wbtech #wbmeetups #wbspeakers #wbml
Please open Telegram to view this post
VIEW IN TELEGRAM
Пишем свой генератор ID для мобильных приложений

Задумывались ли вы о том, как использование UUID в UI влияет на производительность в мобильных приложениях?

Анализ и сравнение производительности популярных методов генерации уникальных идентификаторов, разработка собственного метода, пути оптимизации и дальнейшие исследования.

Обо всем этом в новой хабр-статье Андрея Богомолова, Android-разработчика в команде Performance приложения Wildberries.

#wbtech #kotlin #android #wbtech_habr
Всем привет!

21 октября в Техношколе Wildberries стартует курс «Data Science».

Ежедневная пользовательская активность на Wildberries измеряется десятками миллиардов событий, каждый день мы работаем с 15 миллионами заказов, испытывая в пике нагрузки в сотни тысяч RPS.


Что будет на курсе?

Бизнес-задачи для продуктов маркетплейса по направлениям: рекомендательные системы, research, репутация пользователей и языковые модели. Погружение в работу с большими данными с применением самых современных технологий машинного обучения.

Ждем начинающих специалистов и студентов со знанием базовых алгоритмов ML/DL, структур данных и Python.

Прием заявок открыт до 18 октября!

PS. Отличников и хорошистов позовем в команду Wildberries.
Привет, ребята!

28 октября в Техношколе Wildberries стартует курс «Hard аналитика».

Что будет на курсе?

Много теории и решение практического кейса на реальных данных маркетплейса, сценарии работы с данными и A/B-тесты, тонкости дизайна исследований и стек инструментов для хранения и сбора данных.

Ждем начинающих специалистов и студентов с хорошей математической подготовкой и знанием Python и SQL.

Прием заявок открыт до 25 октября!

PS. Лучших студентов пригласим на собеседование в команду Wildberries ;-)
Автотрекинг производительности Room Database

Основное назначение Room — упростить работу с БД SQLite в приложениях Android, предоставляя более высокоуровневый, удобный интерфейс для взаимодействия с данными. Но что, если из-за самой БД скорость старта приложения уменьшается?

Ответ на этот вопрос в новой хабростатье Александра Цыбина, Android-разработчика из команды мониторинга надежности и производительности (SRE) приложения Wildberries.

#wbtech #kotlin #android #wbtech_habr
Процесс рефакторинга в крупном проекте мобильной разработки | Анвар Губайдуллин, Android-разработчик, Wildberries

Растет маркетплейс, растет и количество фич в мобильном приложении — вместе с этим меняется и структура команды: нам приходится делиться на более мелкие продуктовые группы, каждая из которых стремится к тому, чтобы ее код был изолированным и максимально стабильным.

Не секрет также, что при разработке мобильного приложения Wildberries мы исповедуем подход «Offline first» — для нас важна работоспособность приложения в населенных пунктах с плохим Интернетом и даже в режиме полета. И, конечно же, нам приходится следить за синхронизацией и актуальностью данных, поддерживая большой пласт бизнес-логики на клиенте.

В сентябре в своем докладе на DevFest Анвар Губайдуллин рассказал о процессах подготовки к рефакторингу крупных модулей приложения, условиях для его реализации и правилах разработки, выявленных в ходе работы.

Запись доклада с конференции доступна на YouTube.

#wbtech #android #wbspeakers #devfest #android
В сентябре очередь осваивать формат «весь вечер на арене» выпала Андрею Жукову — руководителю отдела индексирования товаров Wildberries.

◦ Темные боги корпоративной архитектуры. Истории из недр Варпа

Как так оказывается, что совершенно разные подходы к организации корпоративной архитектуры порождают одинаково отвратительных демонов реализации. Почему рожденные в идеальном порядке или в искренней любви дизайн-документы все равно приводят нас в пучины отчаяния. Как приключение на один спринт заканчивается падением в черную дыру техдолга. Поговорили о том, что мешает развитию и реализации продукта через призму вселенной Warhammer 40,000.

◦ Дзен и искусство ухода за экселем. Почему ваша бигдата должна перестать ею быть

Мы живем в эпоху больших данных. Строим даталейки, датаплатформы, рассказываем об успехах в обработке больших данных. Наши журналы обработки — тоже уже бигдата, нам не хватает серверов. А бизнес твердит про свои эксели. Может быть, мы все делаем не так? Может быть, бигдата — это cv-driven development? Или все наши труды действительно происходят не зря? Порассуждали на тему, почему ИТ-команды и бизнес не слышат друг друга, хотя решают общие задачи.


Запись стрима доступна здесь.

#wbtech #management #southitpark
Как применяется ML в продуктах и процессах Wildberries, и какие решения мы используем в рекомендациях и поиске?

Ответами на эти и другие вопросы поделились спикеры ML Meetup Wildberries. Подробнее в видеозаписях докладов:

◦ Применение ML в продуктах и внутренних процессах Wildberries (YouTube | VK)
Александр Сидоров, Head of DS Wildberries, рассказал о применении DS/ML для улучшения пользовательского опыта и повышения эффективности, повторно используемых моделях, технологиях, организационных функциях и инфраструктуре.

◦ Графовые нейронные сети в рекомендациях (YouTube | VK)
Александр Тришин, Data Scientist RecSys, поделился принципами работы сверточных графовых сетей, разобрал архитектуру модели LightGCN, ее достоинства и способы устранения недостатков.

◦ Мультиязычный текстовый энкодер в похожих товарах (YouTube | VK)
Георгий Соколов, Data Scientist RecSys, рассказал про обучение представления для задачи поиска похожих товаров на основе текстового описания и особенности metric-learning для текстовых энкодеров.

◦ Жаргон и именованные сущности в спеллчеке в Поиске (YouTube | VK)
Анна Текучева, Data Scientist HML, показала на примере связь между спеллчеком, жаргоном и именованными сущностями, а также поделилась выводами после внедрения алгоритма в работу.

Плейлисты выступлений доступны на YouTube и в VK.

#wbtech #wbds #wbspeakers #wbmeetup
Какой же менеджер без боли?!

27 и 28 ноября в Сколково пройдет TeamLead Conf — конференция, заряженная энергией тысячи менеджеров и тимлидов!

Не пропустите выступления наших коллег:

воркшоп по управлению изменениями «6 механизмов влияния, которые работают»

Ганджина Дедюрина проведет воркшоп по эффективной трансформации процессов в вашей команде, используя научный подход Джозефа Гренни.

28 ноября, 16:20, «Зал 5. Мумбаи (2 этаж)


«Второй мозг для руководителя: как превратить беспорядочный набор заметок в удобный фреймворк для управления большой командой»

Азат Разетдинов расскажет о приёмах работы с личными заметками с помощью Obsidian, не уходя при этом в дебри хардкорного заметковедения.

28 ноября, 17:30, «Зал 2. Пекин+Шанхай»


Ищите нас в расписании, до встречи!

#wbtech #wbspeakers #teamleadconf #management
Осенний бигдатник — теплая ламповая мини-конфа для SQL/DWH/BI-разработчиков и дата-инженеров

Шесть отборных тем для тех, кто интересуется бигдатой и ищет ответы на вопросы, которые даже не гуглятся.

От нас доклады про Apache Iceberg и ksqlDB:

◦ «Расчёт эффективности сотрудников: эволюция витрин от батча к стримингу»
Петр Островский, Wildberries

◦ «Опыт эксплуатации Apache Iceberg на петабайтных таблицах. Проблемы и решения»
Валерий Могильницкий, Wildberries


Начало: 30 ноября, 10:20
Место проведения: ул. Таганская ул., 9 (вход через магазин Vivasan)

Ищите нас в расписании, отменяйте субботние дела.

#wbtech #wbspeakers #databases
HighLoad++Wildberries;

Главное событие этой недели — конференция для разработчиков высоконагруженных систем HighLoad++ (2-3 декабря в Сколково), и мы, конечно же, там ;)

Собрали для вас анонсы выступлений наших ребят:

«Современные подходы к мэтчингу товаров с использованием LLM. GPT-4, Llama 3, InternVL2, Qwen2.5, Qwen2-VL»

Виталий Кулиев делится практическим кейсом использования llama для мэтчинга товаров. Команда не стала заливать проблему деньгами и пришла к довольно эффективному решению, которое вы, если нужно, сможете повторить у себя.

2 декабря, 13:30, Зал «05. Мумбаи (2 этаж)»


«Data Quality против всех»

В докладе Богдана Володарского подробно разобраны понятие качества данных и подходы к его обеспечению. Экспертное заключение о том, что надо учитывать, когда разработчик, архитектор и менеджер имеют дело с разработкой системы, оперирующей важными данными.

2 декабря, 17:00, Зал «11. Белу-Оризонти (2 этаж)»


«Собственная облачная платформа на 20000 виртуальных машин – опыт Wildberries»

Алексей Чуркин приглашает в мир собственных приватных облаков и рассказывает о том, какие необычные уроки мы вынесли на пути роста до более чем 20 000 виртуальных машин в обслуживании.

3 декабря, 14:40, Зал «08. Сингапур / Devops»


«Грейды Go-разработчика, или Что отличает сеньора-гофера от остальных»

Виталий Левченко помогает выстроить осознанный план профессионального развития и карьерного роста.

3 декабря, 15:50, Зал «07. Москва (2 этаж) / Golang»

Ищите нас в расписании, до встречи в кулуарах!

#wbtech #wbspeakers #highload_wbtech