Документо-ориентированное управление
Какое-то время назад, я обещал поделиться, как в современных успешных компаниях работает культура документов. Я являюсь большим поклонником управления через документы и в итоге написал короткую статью. Думаю, что многим, особенно кто не работает в Авито, будет интересно сравнить описанное со своим опытом.
Для публикации на этот раз я выбрал vas3k club. Это закрытое интернет сообщество, годовое членство в котором я получил от своего замечательного Тайного санты ❤️. Не буду сейчас описывать в чем особенность vas3k клуба, в будущем планирую написать о нем пост (напишите, если вам было бы интересно). Если кратко, там сидит довольно много айтишников, а темы в основном нерабочие или околорабочие.
Несмотря на закрытое членство, посты на этой площадке можно делать публичные. Вот ссылка на статью
https://vas3k.club/post/23562/
#productivity #management
Какое-то время назад, я обещал поделиться, как в современных успешных компаниях работает культура документов. Я являюсь большим поклонником управления через документы и в итоге написал короткую статью. Думаю, что многим, особенно кто не работает в Авито, будет интересно сравнить описанное со своим опытом.
Для публикации на этот раз я выбрал vas3k club. Это закрытое интернет сообщество, годовое членство в котором я получил от своего замечательного Тайного санты ❤️. Не буду сейчас описывать в чем особенность vas3k клуба, в будущем планирую написать о нем пост (напишите, если вам было бы интересно). Если кратко, там сидит довольно много айтишников, а темы в основном нерабочие или околорабочие.
Несмотря на закрытое членство, посты на этой площадке можно делать публичные. Вот ссылка на статью
https://vas3k.club/post/23562/
#productivity #management
Вастрик.Клуб
Document-driven management. Почему писать документы - это круто — Вастрик.Клуб
Написание и согласование документов ассоциируется с огромной медленной корпорацией, до ужаса неэффективной и беспощадной к тем, кто не умеет следоват…
👍15❤2
В эти выходные из-за печальных событий принял решение ничего не писать. Но теперь пора возвращаться в ведению канала
Также хочу поприветствовать новых участников канала с Вастрика. Добро пожаловать!👋
Также хочу поприветствовать новых участников канала с Вастрика. Добро пожаловать!
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝1
Архетипы ведения заметок
Полгода назад я писал про то, как перешел на Logseq для ведения заметок. Мой эксперимент оказался удачным: Logseq все это время является моим основным инструментом для структурирования мыслей и ведения заметок. Я периодически рассказываю, почему это классный инструмент, в чем суть графового метода ведения заметок, суть журнала LogSeq и так далее. Но чтобы понять, какая система заметок нужна вам, нужно определить свой архетип ведения заметок (note-taking archetype). Мне очень понравилась эта концепция и я хочу рассказать о ней вам.
💎 Выделяют 3 основных архетипа ведения заметок.
* Архитектор (Architect)
* Садовник (Gardener)
* Библиотекарь (Librarian)
Архитектор создает из заметок систему. Он определяет правила, категоризирует, создает папочки и теги и подготавливает красивые шаблоны. Будет неудивительно, если архитектор использует сложную систему тайм менеджмента вроде GTD. Для таких людей идеальным инструментом является что-то вроде Notion, где можно делать из заметок доски, создавать базы данных и многое другое.
Садовник (это я 🙂) растит свою базу знаний как сад, где есть определенные области, которые растут по мере фокуса человека в ту или иную сторону. Иногда какие-то части базы нужно привести в порядок. А какие-то можно долго не трогать. Я не могу сказать, что у садовников совсем нет правил, но вместо жесткой категоризации заметок по папкам им больше подходят связи. Связи наилучшим образом реализованы в таких системах, как LogSeq и Obsibidan.
Библиотекарь собирает знания. Увидел интересную статью - сохранил. Увидел интересное фото - сохранил. Пригодится. Таким людям подойдут системы вроде Evernote или Onenote с веб клиппером, который создает заметки из страниц браузера.
Еще можно посмотреть
Видео 1
Видео 2
#productivity
Полгода назад я писал про то, как перешел на Logseq для ведения заметок. Мой эксперимент оказался удачным: Logseq все это время является моим основным инструментом для структурирования мыслей и ведения заметок. Я периодически рассказываю, почему это классный инструмент, в чем суть графового метода ведения заметок, суть журнала LogSeq и так далее. Но чтобы понять, какая система заметок нужна вам, нужно определить свой архетип ведения заметок (note-taking archetype). Мне очень понравилась эта концепция и я хочу рассказать о ней вам.
* Архитектор (Architect)
* Садовник (Gardener)
* Библиотекарь (Librarian)
Архитектор создает из заметок систему. Он определяет правила, категоризирует, создает папочки и теги и подготавливает красивые шаблоны. Будет неудивительно, если архитектор использует сложную систему тайм менеджмента вроде GTD. Для таких людей идеальным инструментом является что-то вроде Notion, где можно делать из заметок доски, создавать базы данных и многое другое.
Садовник (это я 🙂) растит свою базу знаний как сад, где есть определенные области, которые растут по мере фокуса человека в ту или иную сторону. Иногда какие-то части базы нужно привести в порядок. А какие-то можно долго не трогать. Я не могу сказать, что у садовников совсем нет правил, но вместо жесткой категоризации заметок по папкам им больше подходят связи. Связи наилучшим образом реализованы в таких системах, как LogSeq и Obsibidan.
Библиотекарь собирает знания. Увидел интересную статью - сохранил. Увидел интересное фото - сохранил. Пригодится. Таким людям подойдут системы вроде Evernote или Onenote с веб клиппером, который создает заметки из страниц браузера.
Еще можно посмотреть
Видео 1
Видео 2
#productivity
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Big Ledovsky
Приложение для заметок, которое вас удивит
Я тут подсел на новый инструмент для ведения заметок - logseq
Заметки я веду очень давно, с 2010 года. Первой моей программой был Evernote. Со временем я использовал самые разные инструменты и последние несколько…
Я тут подсел на новый инструмент для ведения заметок - logseq
Заметки я веду очень давно, с 2010 года. Первой моей программой был Evernote. Со временем я использовал самые разные инструменты и последние несколько…
🔥12❤2🍓1
Big Ledovsky | AI изнутри pinned «Архетипы ведения заметок Полгода назад я писал про то, как перешел на Logseq для ведения заметок. Мой эксперимент оказался удачным: Logseq все это время является моим основным инструментом для структурирования мыслей и ведения заметок. Я периодически рассказываю…»
😱3
Lex Fridman vs Dana White
Ох, ну что за подкаст в этот раз такой! Буду в этом посте популяризировать сразу две вещи, которые мне нравятся: канал Лекса Фридмена и UFC!
А то с другим моим кумиром, Энрю Хьюберманом, случился конфуз, но об этом можем в каментах поговорить 🤹
Я знаю, что среди читателей канала не так много людей смотрит UFC (хотя я также знаю, что их становится все больше 🙂). В России вайб единоборств не считается премиальным. Но мировые тренды совсем другие. Фанатами единоборств, например, являются Марк Цукерберг и Илон Макс. А еще фанатами единоборств являются такие влиятельные подкастеры, как Джо Роган и Лекс Фридман. Джо Роган вообще много лет является комментатором UFC. Кажется, что среди интересов просвещенного сообщества единобоства идут куда-то в сторону триатлона 🚴
Дана, президент UFC, конечно пришел в преддверии юбилейного UFC 300. Раньше говорили, что на UFC 300 все 5 боев будут титульными, затем что будет просто легендарный кард, но на самом деле пока UFC 300🥱
C Алексом Перейрой vs Джамахал Хилл и китайсим женским комейном Вейли Чжан vs (а с кем вообще) он выглядит хуже, чем UFC 299 с Шоном О'Мэлли vs Вера и Бенуа Сендени vs Дастин Порье
Но самого Дану послушать огромное удовольствие. Он американский бизнесмен до мозга костей, сохраняющий относительный нейтралитет, хоть и дружит с Трампом. К слову, вы знаете еще международные организации, где выступают спортсмены из России под флагом страны?
Во второй половине интервью Дана как будто снял свой стандартный барьер при общении с журналистами и прямо разошелся. Про то, что он кайфует от жизни, от борьбы, конкуренции, азартных игр 🎰, и что люди вообще любят смотреть, как дерутся другие.
https://www.youtube.com/watch?v=k7aQEqDbuf8
#lifestyle
Ох, ну что за подкаст в этот раз такой! Буду в этом посте популяризировать сразу две вещи, которые мне нравятся: канал Лекса Фридмена и UFC!
Я знаю, что среди читателей канала не так много людей смотрит UFC (хотя я также знаю, что их становится все больше 🙂). В России вайб единоборств не считается премиальным. Но мировые тренды совсем другие. Фанатами единоборств, например, являются Марк Цукерберг и Илон Макс. А еще фанатами единоборств являются такие влиятельные подкастеры, как Джо Роган и Лекс Фридман. Джо Роган вообще много лет является комментатором UFC. Кажется, что среди интересов просвещенного сообщества единобоства идут куда-то в сторону триатлона 🚴
Дана, президент UFC, конечно пришел в преддверии юбилейного UFC 300. Раньше говорили, что на UFC 300 все 5 боев будут титульными, затем что будет просто легендарный кард, но на самом деле пока UFC 300
C Алексом Перейрой vs Джамахал Хилл и китайсим женским комейном Вейли Чжан vs (а с кем вообще) он выглядит хуже, чем UFC 299 с Шоном О'Мэлли vs Вера и Бенуа Сендени vs Дастин Порье
Но самого Дану послушать огромное удовольствие. Он американский бизнесмен до мозга костей, сохраняющий относительный нейтралитет, хоть и дружит с Трампом. К слову, вы знаете еще международные организации, где выступают спортсмены из России под флагом страны?
Во второй половине интервью Дана как будто снял свой стандартный барьер при общении с журналистами и прямо разошелся. Про то, что он кайфует от жизни, от борьбы, конкуренции, азартных игр 🎰, и что люди вообще любят смотреть, как дерутся другие.
https://www.youtube.com/watch?v=k7aQEqDbuf8
#lifestyle
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Dana White: UFC, Fighting, Khabib, Conor, Tyson, Ali, Rogan, Elon & Zuck | Lex Fridman Podcast #421
Dana White is the CEO and president of the UFC. Please support this podcast by checking out our sponsors:
- LMNT: https://drinkLMNT.com/lex to get free sample pack
- Notion: https://notion.com/lex
- AG1: https://drinkag1.com/lex to get 1 month supply of fish…
- LMNT: https://drinkLMNT.com/lex to get free sample pack
- Notion: https://notion.com/lex
- AG1: https://drinkag1.com/lex to get 1 month supply of fish…
🔥5❤3👍1
Как я начал играть в настольный теннис
Сегодня играл в настольный теннис за Авито🔥 . Я не основной игрок и играл всего два матча, но все равно мне было очень приятно! и крутую футболку Gri дали, я помню что Андрей В ну ооочень хотел ее получить, так что 🤫😅 Я уже упоминал, что около года увлекаюсь теннисом. Пришло время поделиться историей, как так получилось.
Все началось, кажется, в апреле 2023, когда нам в офис наняли Клима, тренера, который приходил два раза в неделю и с которым можно было бесплатно заниматься. Тренировки часовые, в паре с еще одним учеником. На самом деле до этого я мало держал ракетку в руках и особого интереса к настольному теннису у меня не было. Выбор в пользу тенниса был сделан мной крайне прагматично: для тренировки нужно было всего лишь подняться на несколько этажей на лифте, предварительно записавшись в файлик. Это все и решило.
Теннис на самом деле стал быстро популярен, через какое-то время записываться стало сложно. Женя Ч, главный аналитик поиска и рекомендаций, чтобы решить тотальный коллапс записи, в какой-то момент придумал специальную систему на гугл таблицах, которая позволяет записываться не более, чем на 1 слот в день. А потом нам даже добавили один день тренировок и докупили стол.
Но я к тому времени начал брать дополнительные тренировки и ходить на турниры RTTF (любительская федерация тенниса). Отыграл 150+ игр, дошел до рейтинга 147, сейчас пытаюсь пробить турниры уровня 200 (мой профиль). Теннис, конечно, эмоциональный вид спорта. Оо, как я привык за это время проигрывать и бомбить!😡 Как же это ужасно, когда ты вроде бы отлично тренируешься на тренировке, отрабатываешь правильные удары, а потом против тебя выходит человек с дворовой техникой и побеждает. Но это компенсируется невероятными ощущениями от забитого топ спИна (такой удар)!
Вот так я и начал играть в теннис.
PS. Еще замечу, что на основе теннисной тусы в компании неплохо заработал нетворкинг. Тут с одним юнит лидом поиграешь, там с другим.
PPS. Если тоже играете, ставьте 🐳
#lifestyle
Сегодня играл в настольный теннис за Авито
Все началось, кажется, в апреле 2023, когда нам в офис наняли Клима, тренера, который приходил два раза в неделю и с которым можно было бесплатно заниматься. Тренировки часовые, в паре с еще одним учеником. На самом деле до этого я мало держал ракетку в руках и особого интереса к настольному теннису у меня не было. Выбор в пользу тенниса был сделан мной крайне прагматично: для тренировки нужно было всего лишь подняться на несколько этажей на лифте, предварительно записавшись в файлик. Это все и решило.
Теннис на самом деле стал быстро популярен, через какое-то время записываться стало сложно. Женя Ч, главный аналитик поиска и рекомендаций, чтобы решить тотальный коллапс записи, в какой-то момент придумал специальную систему на гугл таблицах, которая позволяет записываться не более, чем на 1 слот в день. А потом нам даже добавили один день тренировок и докупили стол.
Но я к тому времени начал брать дополнительные тренировки и ходить на турниры RTTF (любительская федерация тенниса). Отыграл 150+ игр, дошел до рейтинга 147, сейчас пытаюсь пробить турниры уровня 200 (мой профиль). Теннис, конечно, эмоциональный вид спорта. Оо, как я привык за это время проигрывать и бомбить!
Вот так я и начал играть в теннис.
PS. Еще замечу, что на основе теннисной тусы в компании неплохо заработал нетворкинг. Тут с одним юнит лидом поиграешь, там с другим.
PPS. Если тоже играете, ставьте 🐳
#lifestyle
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22🐳11👍5❤3
Артефакт из Kaggle 2015-го
История из рабочих будней
💎 Введение
Сидели мы недавно на нашем внутреннем семинаре и обсуждали статьи про рекламные CTR модели (предсказывают вероятность клика).
В статьях часто описывают новую модель, тестируют ее на открытом датасете и приводят сравнение с другими моделями. В поиске и рекомендациях не всегда это так. Особенно крупные компании обычно ничего не выкладывают и все результаты только с их слов. Но университеты стараются, а некоторые конференции обязательно требуют воспроизводимость. А найти открытый качественный датасет по поисковому ранжированию честно говоря непросто.
💎 Находка
И тут оказалось, что в одной статье использовали данные Авито. Мы конечно прифигели. Выяснилось, что данные взяли с соревнования Авито на Kaggle аж 2015 года! Вот это соревнование. В то время я еще даже не был дата сайнтистом и работал в консалтинге в EY. Дата сайнс вообще был еще не модный, а кагл только набирал обороты. А Авито в то время уже проводило соревнование🥶
Мы начали смеяться, что спустя 9 лет мы решаем все те же проблемы. На самом деле уровень инфры и задач сейчас сильно другой, но получить такой артефакт из прошлого было забавно.
Интересный факт: кроме того, что это было 9 лет назад, соревнование проводил сам Иван Гуз. Иван на тот момент руководил отделом аналитики, а сейчас он один из двух руководителей компании (роль CEO в Авито выполняют два человека).
💎 Выводы
Этот случай напомнил о ложности ощущения, когда кажется, что на проект нужно выделить немного времени, и он будет готов. На самом деле, если проект успешный, то впереди годы.
#worklife
История из рабочих будней
Сидели мы недавно на нашем внутреннем семинаре и обсуждали статьи про рекламные CTR модели (предсказывают вероятность клика).
В статьях часто описывают новую модель, тестируют ее на открытом датасете и приводят сравнение с другими моделями. В поиске и рекомендациях не всегда это так. Особенно крупные компании обычно ничего не выкладывают и все результаты только с их слов. Но университеты стараются, а некоторые конференции обязательно требуют воспроизводимость. А найти открытый качественный датасет по поисковому ранжированию честно говоря непросто.
И тут оказалось, что в одной статье использовали данные Авито. Мы конечно прифигели. Выяснилось, что данные взяли с соревнования Авито на Kaggle аж 2015 года! Вот это соревнование. В то время я еще даже не был дата сайнтистом и работал в консалтинге в EY. Дата сайнс вообще был еще не модный, а кагл только набирал обороты. А Авито в то время уже проводило соревнование
Мы начали смеяться, что спустя 9 лет мы решаем все те же проблемы. На самом деле уровень инфры и задач сейчас сильно другой, но получить такой артефакт из прошлого было забавно.
Интересный факт: кроме того, что это было 9 лет назад, соревнование проводил сам Иван Гуз. Иван на тот момент руководил отделом аналитики, а сейчас он один из двух руководителей компании (роль CEO в Авито выполняют два человека).
Этот случай напомнил о ложности ощущения, когда кажется, что на проект нужно выделить немного времени, и он будет готов. На самом деле, если проект успешный, то впереди годы.
#worklife
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥4❤3🤔2
Еще не успел посмотреть интервью, но судя по этому кадру Павел Валерьевич знает толк в искусстве 😄
На правом стуле пики
#memes
#memes
🤣13🔥3👍1
Верите ли вы Дурову?
После интервью с Дуровым самой обсуждаемой темой сталокроме стульев а правда ли что телеграм делают всего 30 инженеров, а сам Дуров - единственный продакт в компании?! Я в это верю и повторю свою мысль, которую часто говорю
💎 В технологических компаниях отдача от джуна к мидлу, от мидла к синьору и так далее растет экспоненциально
Причем лишь в небольшом количестве компаний есть специалисты самого высокого уровня и позиции для них. Часто эти позиции называют staff и principal. В Авито и ряде других компаний их обозначают цифрами, например DS6/DS7. Еще используют термин "верхняя перцентиль" специалистов💪
💎 Еще один факт заключается в том, что опыт работы является необходимым, но не достаточным условием попадание в верхнюю перцентиль
Нужно много знать, быстро придумывать решения, быстро и эффективно писать код, понятно объяснять свои мысли и многое другое. И конечно нужны объективные достижения. Все это приобретается потом и кровью, путем приложения экстра усилий, как в спорте.
Верю, что Дуров смог набрать небольшую ультра топ команду 🥷 и что они тащат сервис таким небольшим составом. Для больших компаний найм только синьоров к сожалению не подходит, их просто в таком количестве нет на рынке. Поэтому приходится делать свои школы и растить людей с нуля.
#management
После интервью с Дуровым самой обсуждаемой темой стало
Причем лишь в небольшом количестве компаний есть специалисты самого высокого уровня и позиции для них. Часто эти позиции называют staff и principal. В Авито и ряде других компаний их обозначают цифрами, например DS6/DS7. Еще используют термин "верхняя перцентиль" специалистов
Нужно много знать, быстро придумывать решения, быстро и эффективно писать код, понятно объяснять свои мысли и многое другое. И конечно нужны объективные достижения. Все это приобретается потом и кровью, путем приложения экстра усилий, как в спорте.
Верю, что Дуров смог набрать небольшую ультра топ команду 🥷 и что они тащат сервис таким небольшим составом. Для больших компаний найм только синьоров к сожалению не подходит, их просто в таком количестве нет на рынке. Поэтому приходится делать свои школы и растить людей с нуля.
#management
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👌3💯2
Вакансия ко мне в команду
Всем, привет! Я сегодня с замечательной новостью. Мы набираем мидл и синьор DS инженеров в наш юнит Эффективности Монетизации Авито.
У вас будет возможность поработать над формированием выдачи поиска и рекомендаций Авито и алгоритмами продвижения, которые лежат у нас под капотом. Я считаю, что мы занимаемся безумно вдохновляющей областью. Тут вам и огромная вариативность задач, и нагрузка, и возможность видеть результат своей работы. Скучать не придется.
Ожидаем, что у вас в резюме есть объективное подтверждение ваших навыков, хотя бы одно из списка
- Опыт работы с поиском, рекомендациями или рекламой
- Опыт в сильной технологической компании
- Топ образование
- Достижения в соревнованиях или хакатонах
Вилки писать не буду. Авито дает реально хорошие условия по рынку. Если очень хочется, можно зайти в сингулярис и посмотреть.
Резюме присылайте мне @aledovsky. Буду благодарен за репосты!
https://career.avito.com/vacancies/razrabotka/10357/
Всем, привет! Я сегодня с замечательной новостью. Мы набираем мидл и синьор DS инженеров в наш юнит Эффективности Монетизации Авито.
У вас будет возможность поработать над формированием выдачи поиска и рекомендаций Авито и алгоритмами продвижения, которые лежат у нас под капотом. Я считаю, что мы занимаемся безумно вдохновляющей областью. Тут вам и огромная вариативность задач, и нагрузка, и возможность видеть результат своей работы. Скучать не придется.
Ожидаем, что у вас в резюме есть объективное подтверждение ваших навыков, хотя бы одно из списка
- Опыт работы с поиском, рекомендациями или рекламой
- Опыт в сильной технологической компании
- Топ образование
- Достижения в соревнованиях или хакатонах
Вилки писать не буду. Авито дает реально хорошие условия по рынку. Если очень хочется, можно зайти в сингулярис и посмотреть.
Резюме присылайте мне @aledovsky. Буду благодарен за репосты!
https://career.avito.com/vacancies/razrabotka/10357/
Avito
Data Scientist в команду монетизации
Присоединяйся к команде Авито на позицию «Data Scientist в команду монетизации» в городе Москва. Работа в сильной команде, гибкий график, расширенный ДМС, высокие зарплаты, карьерный рост и реальный вклад в продукт. Мы создаём технологии для миллионов пользователей!
👍21🔥5❤1
Жизненный цикл аналитики
Уровень 0. Аналитики не нужны. Бизнес и так работает
Уровень 1. Мы data-driven. Все должно быть покрыто метриками. Пачками нанимаем аналитиков и дата инженеров. Больше графиков. Правда бизнес как работал, так и работает.
Уровень 2. Научились находить инсайты. Количество метрик и графиков уменьшилось в 10 раз по сравнению с уровнем 1. Однако, оказалось, что находить инсайты недостаточно, т.к. ресурсов ими заниматься все равно нет.
Уровень 3. Благодаря аналитике перестали брать почти все новые фичи в работу (больше не можем доказать их потенциал). Появилось время на работу с инсайтами.
Upd
Уровень 4. Перестали брать новые фичи - перестали расти. Разогнали пол команды —> вернулись на шаг 0
Уровень 4, вариант 2. Аналитика стала очень зрелой. Директор по аналитике стал CEO
#memes
Уровень 0. Аналитики не нужны. Бизнес и так работает
Уровень 1. Мы data-driven. Все должно быть покрыто метриками. Пачками нанимаем аналитиков и дата инженеров. Больше графиков. Правда бизнес как работал, так и работает.
Уровень 2. Научились находить инсайты. Количество метрик и графиков уменьшилось в 10 раз по сравнению с уровнем 1. Однако, оказалось, что находить инсайты недостаточно, т.к. ресурсов ими заниматься все равно нет.
Уровень 3. Благодаря аналитике перестали брать почти все новые фичи в работу (больше не можем доказать их потенциал). Появилось время на работу с инсайтами.
Upd
Уровень 4. Перестали брать новые фичи - перестали расти. Разогнали пол команды —> вернулись на шаг 0
Уровень 4, вариант 2. Аналитика стала очень зрелой. Директор по аналитике стал CEO
#memes
🤣15👏5🔥1
Узнаете себя на каком-то уровне?
Anonymous Poll
54%
Да
14%
Нет
33%
О чем это? (посмотреть результат)
Ревью Intro to LLM от Андрея Карпати
Решил наконец посмотреть (пересмотреть) видео Андрея Карпати (Andrej Karpathy) на ютубе.
Могу порекомендовать каждому часовое видео, которое называется Intro to LLM**. Оно одновременно очень доступное, но при этом подошло бы в качестве вводного занятия серьезного курса лекций. Вот концепции, которые кажутся мне очень важными
- LLM стоит воспринимать как быстрое мышление. Книга "думай медленно, решай быстро" популяризировала идею о наличии быстрого (интуитивного) и медленного (логического). Так вот текущий LLM - первое. Текущий челлендж - научить LLM построению цепочек логических связей.
- LLM стоит воспринимать как процессор в операционной системе, а не как самодостаточный искусственный интеллект. Данная концепция называется LLM OS. Сама LLM это процессор, оперативная память это контекст (= последняя ваша переписка), есть возможность воспользоваться внешними программами (запустить код на питоне, сходить в браузер), есть интерфейсы взаимодействия в виде speech2text/text2speech и генерации видео
- Обучение LLM можно воспринимать, как сжатие обучающего датасета, примерно как это делает ZIP архиватор или MP3 кодек. Обучающий датасет для модели весит ~10 Tb и сжимается ~ в 100 раз до 140 Gb в модели Llama v2 с 7 млрд параметрами. В отличии от ZIP архива LLM сжимает данные с потерями. В этом плане она больше похожа на MP3 формат.
* Слово мета часто используют для описания коллективного понимания эффективных подходов, архитектур и алгоритмов
** Если сложно слушать на английском, но на ютубе есть автосгенерированный перевод
#tech
Решил наконец посмотреть (пересмотреть) видео Андрея Карпати (Andrej Karpathy) на ютубе.
Краткая справка. Андрей - один из пионеров глубокого обучения начала 2010-х, когда оно совершило серьезный прорыв. Работал в Open AI, но потом оттуда ушел. Последнее время раз в несколько месяцев выпускает видео, где то рассказывает про нейронные сети, то что-то кодит. Мой интерес с одной стороны связан желанием быть в мете* современного ML с его LLM (Large Language Models, ChatGPT и др). Я писал про мое восприятие технологического прогресса и сложности нахождения в мете в этом посте. Но еще мне просто нравится слушать Андрея, потому что он рассказывает интересно.
Могу порекомендовать каждому часовое видео, которое называется Intro to LLM**. Оно одновременно очень доступное, но при этом подошло бы в качестве вводного занятия серьезного курса лекций. Вот концепции, которые кажутся мне очень важными
- LLM стоит воспринимать как быстрое мышление. Книга "думай медленно, решай быстро" популяризировала идею о наличии быстрого (интуитивного) и медленного (логического). Так вот текущий LLM - первое. Текущий челлендж - научить LLM построению цепочек логических связей.
- LLM стоит воспринимать как процессор в операционной системе, а не как самодостаточный искусственный интеллект. Данная концепция называется LLM OS. Сама LLM это процессор, оперативная память это контекст (= последняя ваша переписка), есть возможность воспользоваться внешними программами (запустить код на питоне, сходить в браузер), есть интерфейсы взаимодействия в виде speech2text/text2speech и генерации видео
- Обучение LLM можно воспринимать, как сжатие обучающего датасета, примерно как это делает ZIP архиватор или MP3 кодек. Обучающий датасет для модели весит ~10 Tb и сжимается ~ в 100 раз до 140 Gb в модели Llama v2 с 7 млрд параметрами. В отличии от ZIP архива LLM сжимает данные с потерями. В этом плане она больше похожа на MP3 формат.
* Слово мета часто используют для описания коллективного понимания эффективных подходов, архитектур и алгоритмов
** Если сложно слушать на английском, но на ютубе есть автосгенерированный перевод
#tech
YouTube
[1hr Talk] Intro to Large Language Models
This is a 1 hour general-audience introduction to Large Language Models: the core technical component behind systems like ChatGPT, Claude, and Bard. What they are, where they are headed, comparisons and analogies to present-day operating systems, and some…
👍7🔥2❤1
Мнение об интервью с Эмели Драль
Валера Бабушкин недавно делал стрим с Эмели. Меня зацепило и я решил посмотреть
Курсы Эмили я не проходил, и стрим зацепил меня немного по другой причине. Дело в том, что Yandex Data Factory в свое время неожиданно громко вырос, а потом также неожиданно закрылся. А я в 2017-18 годах сам работал в DS консалтинге в IBM, и конечно за YDF мы следили. Было интересно, получится ли у них добиться успеха с крутой технической командой, но без консалтингового бекграунда самой корпорации. На тот момент казалось, что да, и их закрытие стало сюрпризом (хотя конечно приятным для нас - все-таки минус конкурент)
Честно говоря, Эмили не рассказала много про причины. Вроде бы бизнес был прибыльный, но он слишком не сочетался с другими подразделениями Яндекса. Валера возразил, что есть то же Я.Облако, которое отлично синергирует. На что был ответ, что Облака тогда то ли не было, то ли оно не было на тех позициях, что сейчас.
А так, интересное вообще интервью!
https://t.me/cryptovalerii/604
#worklife
Валера Бабушкин недавно делал стрим с Эмели. Меня зацепило и я решил посмотреть
Краткая справка. Эмели Драль известна как автор курсов по ML на курсере. В ~2016-18 работала в Yandex Data Factory - консалтинговом подразделении Яндекса, которое просуществовало некоторое время. После этого ушла делать стартапы. Сейчас кофаундер Evidently AI
Курсы Эмили я не проходил, и стрим зацепил меня немного по другой причине. Дело в том, что Yandex Data Factory в свое время неожиданно громко вырос, а потом также неожиданно закрылся. А я в 2017-18 годах сам работал в DS консалтинге в IBM, и конечно за YDF мы следили. Было интересно, получится ли у них добиться успеха с крутой технической командой, но без консалтингового бекграунда самой корпорации. На тот момент казалось, что да, и их закрытие стало сюрпризом (хотя конечно приятным для нас - все-таки минус конкурент)
Честно говоря, Эмили не рассказала много про причины. Вроде бы бизнес был прибыльный, но он слишком не сочетался с другими подразделениями Яндекса. Валера возразил, что есть то же Я.Облако, которое отлично синергирует. На что был ответ, что Облака тогда то ли не было, то ли оно не было на тех позициях, что сейчас.
А так, интересное вообще интервью!
https://t.me/cryptovalerii/604
#worklife
Telegram
Время Валеры
Запись стрима с Эмели
👍4❤1
Написал новую статью в свой англоязычный сабстек!
https://ledovsky.substack.com/p/lirank-uncovered-the-innovations
#tech
https://ledovsky.substack.com/p/lirank-uncovered-the-innovations
#tech
Alexander Ledovsky’s Substack
LiRank Uncovered: The Innovations Behind LinkedIn's Cutting-Edge CTR and Ranking Models
In this article, I provide a summary and share my thoughts on the latest paper from LinkedIn, which delves into their cutting-edge deep learning architectures for ranking and Click-Through Rate (CTR)
👍12🔥8❤🔥1🦄1
Начал второе майские с шоппинга. Результаты похода в Спорт-Марафон 🙂
Скальники La Sportiva. Уже месяц как занимаюсь на скалодроме. Пришло время обзавестись своей обувью для лазания. В магазине круто помогли с подбором. Сперва померили ногу, дали несколько моделей и сказали полазать на небольшой стене.
Беговые кроссовки Asics GT-2000 12. Пришло время заменить мои старенькие тесные Asics. Тут что-то все вокруг меня бегают. Тоже хочу приобщиться!
Походные брюки North Face. В замену старым ходовым Columbia. У этих отстегиваются коленки и они превращаются в шорты. На самом деле оч крутая фича. Еще в отличии от предыдущих у этих выше плотность и я надеюсь, что они будут более устойчивыми к колючкам и ветру.
💎 Если вы бегун, ставьте молнию, если скалолаз - камень, если походник - единорога!
#lifestyle
Скальники La Sportiva. Уже месяц как занимаюсь на скалодроме. Пришло время обзавестись своей обувью для лазания. В магазине круто помогли с подбором. Сперва померили ногу, дали несколько моделей и сказали полазать на небольшой стене.
Беговые кроссовки Asics GT-2000 12. Пришло время заменить мои старенькие тесные Asics. Тут что-то все вокруг меня бегают. Тоже хочу приобщиться!
Походные брюки North Face. В замену старым ходовым Columbia. У этих отстегиваются коленки и они превращаются в шорты. На самом деле оч крутая фича. Еще в отличии от предыдущих у этих выше плотность и я надеюсь, что они будут более устойчивыми к колючкам и ветру.
#lifestyle
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡18🦄18🗿17🌭13🐳5
Я на ACM Web Conference в Сингапуре. Не такая крупная как NeurIPS, но тоже очень хорошая конфа, особенно подходящая для тех, кто занимается рекламными технологиями (так как на нее традиционно привозят статьи про рекламные аукционы и Ads CTR prediction)
В субботу напишу, что интересного узнал и какие тренды увидел, а пока записал стори с первыми впечатлениями
(да, теперь мой канал умеет сториз! 😅 не зря же вы давали мне обратную связь по каналу)
#worklife
В субботу напишу, что интересного узнал и какие тренды увидел, а пока записал стори с первыми впечатлениями
(да, теперь мой канал умеет сториз! 😅 не зря же вы давали мне обратную связь по каналу)
#worklife
🔥27👍4👏1
Впечатления с ACM Web Conf 2024 - тренд LLM
Я понял, что впечатления о конфе не влезут в один пост, поэтому их будет несколько. Этот пост будет про захвативший всех тренд на LLM модели (ChatGPT и аналоги). И вправду во всех треках конференции наблюдались попытки применить LLM везде, где только можно.
Были достаточно очевидные идеи. Давайте выделять с помощью LLM признаки из текстов, задавая о них вопросы. Признаки будем использовать для улучшения рекомендаций.
Упоминались на первый взгляд нереалистичные идеи. Давайте скормим LLM описания товаров, которые человек посмотрел, а она нам сгенерирует товар, который нужно порекомендовать без доступа к акуальной базе данных товаров (спойлер, так пока не работает)
💎 Было очень крутое применение из области рекламы, которые выиграло приз лучшей статьи конференции. Статья от Google Research называется Mechanism Design for Large Language Models, что можно перевести как "Рекламные аукционы в LLM моделях".
Рассмотрим упрощенный пример, что вы спрашиваете ChatGPT: "Где можно съесть вкусный гамбургер?". LLM может сгенерировать ответ
- "Вы можете съесть вкусный гамбургер во Вкусно и точка" или
- "Вы можете съесть вкусный гамбургер в Бургер Кинге"
Суть статьи в том, как встроить аукцион за то, какая компания попадает в ответ.. В подходе есть проблема, что необходимо иметь отдельные LLM модели, каждая из которых обучена под конкретную компанию-рекламодателя. Дообучение LLM гораздо дешевле, чем обучение с нуля. Но все равно, дообучить LLM под условный Бургер Кинг кажется нетривиальным.
💎 Итого, ситуация с LLM похожа на компьютерную игру-квест, когда ты нашел новый предмет и пытаешься по очереди применить его на все другие предметы в игре, которые тебе доступны. Мой прогноз: будет много бреда, но через какое-то время точно появятся новые успешные применения LLM для существующих задач.
#tech
Я понял, что впечатления о конфе не влезут в один пост, поэтому их будет несколько. Этот пост будет про захвативший всех тренд на LLM модели (ChatGPT и аналоги). И вправду во всех треках конференции наблюдались попытки применить LLM везде, где только можно.
Были достаточно очевидные идеи. Давайте выделять с помощью LLM признаки из текстов, задавая о них вопросы. Признаки будем использовать для улучшения рекомендаций.
Упоминались на первый взгляд нереалистичные идеи. Давайте скормим LLM описания товаров, которые человек посмотрел, а она нам сгенерирует товар, который нужно порекомендовать без доступа к акуальной базе данных товаров (спойлер, так пока не работает)
Рассмотрим упрощенный пример, что вы спрашиваете ChatGPT: "Где можно съесть вкусный гамбургер?". LLM может сгенерировать ответ
- "Вы можете съесть вкусный гамбургер во Вкусно и точка" или
- "Вы можете съесть вкусный гамбургер в Бургер Кинге"
Суть статьи в том, как встроить аукцион за то, какая компания попадает в ответ.. В подходе есть проблема, что необходимо иметь отдельные LLM модели, каждая из которых обучена под конкретную компанию-рекламодателя. Дообучение LLM гораздо дешевле, чем обучение с нуля. Но все равно, дообучить LLM под условный Бургер Кинг кажется нетривиальным.
#tech
Please open Telegram to view this post
VIEW IN TELEGRAM
ACM Conferences
Mechanism Design for Large Language Models | Proceedings of the ACM Web Conference 2024
👍11🔥9👨💻1