#programming #testing
Недавно узнал про сенсор-тесты.
Разница с "обычным" тестом — в том, что ты проверяешь:
Обычный тест: "функция складывает два числа → я проверяю что 2+2=4"
Sensor: "в продакшене 2026-04-19 случилось X. Фикс прошёл. Если через полгода кто-то отрефакторит этот код и баг вернётся — этот тест обязан упасть"
Недавно узнал про сенсор-тесты.
Разница с "обычным" тестом — в том, что ты проверяешь:
Обычный тест: "функция складывает два числа → я проверяю что 2+2=4"
Sensor: "в продакшене 2026-04-19 случилось X. Фикс прошёл. Если через полгода кто-то отрефакторит этот код и баг вернётся — этот тест обязан упасть"
Forwarded from adapt compete evolve or die
https://arxiv.org/abs/2412.04529
Саша с Антоном опубликовали классную статью про CAFA5! А я в соавторах. Много умных слов и понятных картинок. Год назад мы участвовали в соревновании на kaggle, в котором надо было определить функции белка по его аминокислотному составу и таксономии. Соревнование отличалось высоким порогом входа, поскольку таргеты, коих было десятки тысяч, были организованы иерархически и метрика расчитывалась пропагацией по этому дереву. Отдельно стоит отметить разметку, где 1 означала наличие функции у белка, но 0 не означал, что функции нет, она просто еще не была обнаружена, возможно.
Мы заняли 2 место 🎉, уступив профессионалам в области, которые в том числе парсили выходящие во время соревнования статьи про новые экспериментально обнаруженные функции белков. Последующее тестирование решений на еще более свежих данных подтвердило, что распределение мест не было случайностью. Организаторы соревнования настоящие ученые, измерили множество метрик и провели полноценное исследование полученных решений.
В статье показываем подход ProtBoost, в основе которого Py-Boost, линейки и mlp, а так же графовые нейросетки в качестве умного ансамбля (помните про иерархические таргеты?). В качестве признаков эмбединги последовательностей и мета-информация о происхождении белка. Обнаружили, что не все эмбединги одинаково полезно и хайпово не значит лучше.
Соревнования шло 3 месяца, а статья выходит спустя год. Это вам не бустинги стекать 🙈
Из каггл-выводов:
* pyboost хорош, особо хорош, когда таргетов много и бустинги в принципе можно успешно применять на эмбедингах.
* GCN стекер можно применять не только здесь.
* иногда ошибки приводят к интересным открытиям, перепутав айдишники моделей, получили интересную аугментацию.
* если соревнование про науку, то где-то в интернете хранятся разные полезные датасеты и код, но коду организаторов слепо верить не стоить
Саша с Антоном опубликовали классную статью про CAFA5! А я в соавторах. Много умных слов и понятных картинок. Год назад мы участвовали в соревновании на kaggle, в котором надо было определить функции белка по его аминокислотному составу и таксономии. Соревнование отличалось высоким порогом входа, поскольку таргеты, коих было десятки тысяч, были организованы иерархически и метрика расчитывалась пропагацией по этому дереву. Отдельно стоит отметить разметку, где 1 означала наличие функции у белка, но 0 не означал, что функции нет, она просто еще не была обнаружена, возможно.
Мы заняли 2 место 🎉, уступив профессионалам в области, которые в том числе парсили выходящие во время соревнования статьи про новые экспериментально обнаруженные функции белков. Последующее тестирование решений на еще более свежих данных подтвердило, что распределение мест не было случайностью. Организаторы соревнования настоящие ученые, измерили множество метрик и провели полноценное исследование полученных решений.
В статье показываем подход ProtBoost, в основе которого Py-Boost, линейки и mlp, а так же графовые нейросетки в качестве умного ансамбля (помните про иерархические таргеты?). В качестве признаков эмбединги последовательностей и мета-информация о происхождении белка. Обнаружили, что не все эмбединги одинаково полезно и хайпово не значит лучше.
Соревнования шло 3 месяца, а статья выходит спустя год. Это вам не бустинги стекать 🙈
Из каггл-выводов:
* pyboost хорош, особо хорош, когда таргетов много и бустинги в принципе можно успешно применять на эмбедингах.
* GCN стекер можно применять не только здесь.
* иногда ошибки приводят к интересным открытиям, перепутав айдишники моделей, получили интересную аугментацию.
* если соревнование про науку, то где-то в интернете хранятся разные полезные датасеты и код, но коду организаторов слепо верить не стоить
arXiv.org
ProtBoost: protein function prediction with Py-Boost and Graph...
Predicting protein properties, functions and localizations are important tasks in bioinformatics. Recent progress in machine learning offers an opportunities for improving existing methods. We...
❤1
Forwarded from Дата аналитикс
Media is too big
VIEW IN TELEGRAM
Подкаст с BI-тимлидом из Авито!
В гостях Маша Аничкова - тимлид BI-аналитиков в📱 , ex-аналитик в Ozon💳
И если вы до сих пор думаете, что BI - это просто “собрать дэш и не мешать взрослым людям делать продукт”, то у нас для вас интересный разговор))
• почему в Авито в какой-то момент развели продуктовых и BI-аналитиков, и в чем вообще реальная зона ответственности биайщиков.
• как собрать дашборд, который реально смотрят топы, а не просто складировать 200 метрик в одну красивую братскую могилу.
• почему иногда лучший дашборд - это отсутствие дашборда)
• как правильно отвечать на кейс “сделай крутой дашборд” на собесе
• почему если после недели работы заказчику вдруг нужна “одна большая красная циферка”, то где-то, скорее всего, недожали этап сбора требований)
• как устроена матрица компетенций в Авито и как там понимают, кто джун, кто миддл, а кто уже сеньорный сеньор.
• сколько по времени реально занимают витрины данных и почему работа с разработчиками - это всегда отдельный квест со звездочкой.
• как проходить собесы на BI-роли, если хочется не просто “попробоваться”, а дойти до оффера.
• почему у Маши конверсия в оффер 100% [ да, здесь можно немного словить тильт ]
• правда ли, что математика больнее, чем базы данных.
• почему в огромном количестве запросов от заказчиков проблема не в данных, не в витринах и не в аналитике, а просто в том, что человек не выспался))
По времени:
Ссылка на ВК видео🌐
Ссылка на YouTube🌐
Ссылка на Rutube
про BI без душноты, про карьеру без успешного успеха,
и про аналитику так, как она выглядит в реальности, а не в вакансиях.Еще и ипотеку обсудили...
Делитесь мнениями, комментами и подписывайтесь на канал Маши! Маша - класс!
Жмем заинтригованного жаба📃 если хотите еще гостей из 📱
прогрессивного жаба📈 за следующий сильный выпуск про аналитику и карьеру
Ставим лайк ❤️, чтобы поддержать или если вы уже знакомы с Машей
В гостях Маша Аничкова - тимлид BI-аналитиков в
И если вы до сих пор думаете, что BI - это просто “собрать дэш и не мешать взрослым людям делать продукт”, то у нас для вас интересный разговор))
Обсудили:
• почему в Авито в какой-то момент развели продуктовых и BI-аналитиков, и в чем вообще реальная зона ответственности биайщиков.
• как собрать дашборд, который реально смотрят топы, а не просто складировать 200 метрик в одну красивую братскую могилу.
• почему иногда лучший дашборд - это отсутствие дашборда)
• как правильно отвечать на кейс “сделай крутой дашборд” на собесе
• почему если после недели работы заказчику вдруг нужна “одна большая красная циферка”, то где-то, скорее всего, недожали этап сбора требований)
• как устроена матрица компетенций в Авито и как там понимают, кто джун, кто миддл, а кто уже сеньорный сеньор.
• сколько по времени реально занимают витрины данных и почему работа с разработчиками - это всегда отдельный квест со звездочкой.
• как проходить собесы на BI-роли, если хочется не просто “попробоваться”, а дойти до оффера.
• почему у Маши конверсия в оффер 100% [ да, здесь можно немного словить тильт ]
• правда ли, что математика больнее, чем базы данных.
• почему в огромном количестве запросов от заказчиков проблема не в данных, не в витринах и не в аналитике, а просто в том, что человек не выспался))
По времени:
45 минСсылка на ВК видео
Ссылка на YouTube
Ссылка на Rutube
Получился очень живой выпуск:
про BI без душноты, про карьеру без успешного успеха,
и про аналитику так, как она выглядит в реальности, а не в вакансиях.
Делитесь мнениями, комментами и подписывайтесь на канал Маши! Маша - класс!
Жмем заинтригованного жаба
прогрессивного жаба
Ставим лайк ❤️, чтобы поддержать или если вы уже знакомы с Машей
Please open Telegram to view this post
VIEW IN TELEGRAM
#kan #anns
Кто пробовал эти сети Колмогорова-Арнольда в реальных задачах? Я нашел 3 опенсорс реализации и несколько статей на медиуме, но ни одного сравнения на, пусть даже игрушечном, датасете.
Вообще, идея обучать сами функции активации в нейронах сети очень красивая.
https://habr.com/ru/articles/860738
Кто пробовал эти сети Колмогорова-Арнольда в реальных задачах? Я нашел 3 опенсорс реализации и несколько статей на медиуме, но ни одного сравнения на, пусть даже игрушечном, датасете.
Вообще, идея обучать сами функции активации в нейронах сети очень красивая.
https://habr.com/ru/articles/860738
Хабр
KAN 2.0: Kolmogorov-Arnold Networks Meet Science
Предлагаю полный перевод второй статьи на тему нейронных сетей на основе алгоритма Колмогорова-Арнольда (KAN), опубликованной в августе 2024 года. В этой работе исследователи продолжают развивать тему...
Forwarded from Wazowski Recommends
Регрессия и распределение шума
В задачах регрессии обычно предполагают, что есть какая-то неизвестная нам «настоящая» зависимость таргета от входа, а наблюдаемые таргеты получаются из «настоящих» добавлением нормального шума с нулевым матожиданием и постоянной дисперсией. Это предположение ведет к квадратичной функции потерь (L2).
Но часто это предположение ломается: дисперсия шума может быть непостоянной, а само распределение — не нормальным. Например, так распределены деньги, которые пользователи приносят сервису за какой-то период.
Если у вас есть задача регрессии, вы можете построить гистограмму ошибок и проверить, похожа ли она на нормальное распределение.
Интуитивно хочется к таким криво распределенным таргетам сначала применить какое-то преобразование (скажем, логарифм), после которого они станут относительно нормальными, решить задачу регрессии в преобразованной шкале, а потом уже предсказания перевести в исходную шкалу.
Когда-то в Яндексе Миша Парахин всем советовал в таких ситуациях чуть более принципиальный подход: в качестве этого преобразования использовать CDF (функцию распределения) исходного распределения таргетов (оцененную по датасету) и затем обратную CDF нормального распределения. Тогда преобразованные таргеты как раз будут нормально распределены (правда, тут некоторая подмена понятия — вообще говоря, нам нужно нормальное распределение шума/ошибок, а не самих таргетов).
Но у этих подходов есть проблема — они не mean-proper. Mean-proper функции ошибок — это у которых минимум достигается, когда предсказание равно матожиданию таргета. Например, L2 (MSE) или Binary Cross-Entropy (в случае бинарных таргетов) — mean-proper. А вот L1 (MAE), MAPE, MSE логарифмов — нет. Попросту говоря, при использовании таких лоссов предсказания будут смещенными. Я когда-то уже писал про это для логарифмов.
Это свойство (mean-proper) часто довольно важно. Например, хотелось бы, чтобы сумма наших предсказаний доходов по какому-то сегменту пользователей примерно попадала в настоящие суммарные доходы.
Поэтому я к этим трюкам с преобразованием таргета всегда относился скептически — не хочется терять калиброванность из-за того, что шум как-то не так распределен. И вообще, казалось бы, как бы ни был распределен шум, практика нас обычно учит: что вы хотите улучшить на test set — то и оптимизируйте на train set. Хотите MSE — используйте MSE. Просто разные лоссы ведут к разным компромиссам, когда не получается точно описать данные. Так ведь?
Оказалось — нет. За последние несколько дней я провёл небольшой эксперимент на искусственных данных. Пусть у нас одномерный случай, x распределен равномерно на [0, 1], «настоящая» зависимость выглядит как z = exp(a*x + b), а наблюдаемые таргеты сэмплируются не из нормального, а из экспоненциального распределения с матожиданием z(x). Обучаем модель y_pred = exp(a*x + b), т.е. просто подбираем параметры a и b по датасету, используя либо обычный L2 loss, либо специальный экспоненциальный лосс log(y_pred) + y / y_pred — это negative log-likelihood экспоненциального распределения (он тоже mean-proper!).
И оказалось, что экспоненциальный лосс даёт лучшее качество, чем L2, даже по MSE! Особенно, когда обучающих данных немного (когда много — L2 догоняет по качеству).
Конечно, в реальных случаях у нас данных сильно больше, чем тут. Но и зависимости у нас сложнее, и фичей сильно больше, и особенно для спарс-фичей — разреженность данных может быть ещё сильнее.
Эксперимент показал, что лосс, адаптированный к настоящему распределению шума, ведёт именно к лучшей генерализации — а не просто к другому компромиссу.
Иллюстрация (cherry-pick) — ниже. Типичная чувствительность L2 к выбросам.
P.S. Эксперимент выглядит очень простым. Но пока я его делал, я напоролся на несколько удивительных подводных камней. Оказалось, что использование
1) линейной зависимости z = a*x + b (без exp)
2) оптимизаторов Adam и (S)GD
3) mean(x) ± 2 * std(x) / sqrt(N) в качестве доверительного интервала среднего
— всё это делает эксперимент очень нестабильным. Угадайте, почему 😉
В задачах регрессии обычно предполагают, что есть какая-то неизвестная нам «настоящая» зависимость таргета от входа, а наблюдаемые таргеты получаются из «настоящих» добавлением нормального шума с нулевым матожиданием и постоянной дисперсией. Это предположение ведет к квадратичной функции потерь (L2).
Но часто это предположение ломается: дисперсия шума может быть непостоянной, а само распределение — не нормальным. Например, так распределены деньги, которые пользователи приносят сервису за какой-то период.
Если у вас есть задача регрессии, вы можете построить гистограмму ошибок и проверить, похожа ли она на нормальное распределение.
Интуитивно хочется к таким криво распределенным таргетам сначала применить какое-то преобразование (скажем, логарифм), после которого они станут относительно нормальными, решить задачу регрессии в преобразованной шкале, а потом уже предсказания перевести в исходную шкалу.
Когда-то в Яндексе Миша Парахин всем советовал в таких ситуациях чуть более принципиальный подход: в качестве этого преобразования использовать CDF (функцию распределения) исходного распределения таргетов (оцененную по датасету) и затем обратную CDF нормального распределения. Тогда преобразованные таргеты как раз будут нормально распределены (правда, тут некоторая подмена понятия — вообще говоря, нам нужно нормальное распределение шума/ошибок, а не самих таргетов).
Но у этих подходов есть проблема — они не mean-proper. Mean-proper функции ошибок — это у которых минимум достигается, когда предсказание равно матожиданию таргета. Например, L2 (MSE) или Binary Cross-Entropy (в случае бинарных таргетов) — mean-proper. А вот L1 (MAE), MAPE, MSE логарифмов — нет. Попросту говоря, при использовании таких лоссов предсказания будут смещенными. Я когда-то уже писал про это для логарифмов.
Это свойство (mean-proper) часто довольно важно. Например, хотелось бы, чтобы сумма наших предсказаний доходов по какому-то сегменту пользователей примерно попадала в настоящие суммарные доходы.
Поэтому я к этим трюкам с преобразованием таргета всегда относился скептически — не хочется терять калиброванность из-за того, что шум как-то не так распределен. И вообще, казалось бы, как бы ни был распределен шум, практика нас обычно учит: что вы хотите улучшить на test set — то и оптимизируйте на train set. Хотите MSE — используйте MSE. Просто разные лоссы ведут к разным компромиссам, когда не получается точно описать данные. Так ведь?
Оказалось — нет. За последние несколько дней я провёл небольшой эксперимент на искусственных данных. Пусть у нас одномерный случай, x распределен равномерно на [0, 1], «настоящая» зависимость выглядит как z = exp(a*x + b), а наблюдаемые таргеты сэмплируются не из нормального, а из экспоненциального распределения с матожиданием z(x). Обучаем модель y_pred = exp(a*x + b), т.е. просто подбираем параметры a и b по датасету, используя либо обычный L2 loss, либо специальный экспоненциальный лосс log(y_pred) + y / y_pred — это negative log-likelihood экспоненциального распределения (он тоже mean-proper!).
И оказалось, что экспоненциальный лосс даёт лучшее качество, чем L2, даже по MSE! Особенно, когда обучающих данных немного (когда много — L2 догоняет по качеству).
Конечно, в реальных случаях у нас данных сильно больше, чем тут. Но и зависимости у нас сложнее, и фичей сильно больше, и особенно для спарс-фичей — разреженность данных может быть ещё сильнее.
Эксперимент показал, что лосс, адаптированный к настоящему распределению шума, ведёт именно к лучшей генерализации — а не просто к другому компромиссу.
Иллюстрация (cherry-pick) — ниже. Типичная чувствительность L2 к выбросам.
P.S. Эксперимент выглядит очень простым. Но пока я его делал, я напоролся на несколько удивительных подводных камней. Оказалось, что использование
1) линейной зависимости z = a*x + b (без exp)
2) оптимизаторов Adam и (S)GD
3) mean(x) ± 2 * std(x) / sqrt(N) в качестве доверительного интервала среднего
— всё это делает эксперимент очень нестабильным. Угадайте, почему 😉
Forwarded from Wazowski Recommends
Давно не писал — много работы, не хватало ни сил, ни вдохновения. Но сейчас лечу на неделю в командировку в Сан-Франциско, и в самолёте наконец-то появилось время.
С одной стороны, все вокруг пишут про AI. Этого так много, что не хочется за ними повторять и не хочется быть ещё одним AI-каналом. С другой стороны, AI-инструменты на мою работу так сильно повлияли (особенно с января этого года), что и совсем промолчать тоже странно.
Я начал очень активно использовать Claude Code и стал его большим фанатом. Я больше не пишу код руками, 100% за меня пишет Claude. В большинстве случаев это не вайб-кодинг, а вполне себе вдумчивая разработка. Но бывают места (и на работе, и в домашних проектах), где и вайб-кодить уместно.
Второй инструмент, который я начал активно использовать (хотя изначально был настроен скептически) — это Superwhisper. Он распознаёт голос и делает это хорошо. Он ещё запускает LLM поверх распознанного текста (можно выбрать, какую). Я теперь даже частенько в опен-спейсе, когда народу вокруг немного, немножко бубню себе под нос. А если нужно наговорить более серьёзно — просто ухожу в переговорку. Для задач, где текста нужно немало, это настолько удобнее и реально облегчает работу, что уже сложно перестать пользоваться. Черновик к этому посту я тоже надиктовал в самолёте и распознал через Superwhisper.
Расскажу ещё про пару экспериментальных техник, которые я пока исследую. Обе — от Андрея Карпаты. Кстати, если вы за ним не следите — очень рекомендую.
Первая — это autoresearch. Почитайте про неё. Это про то, как улучшать качество вашей системы или модели автоматически — при условии, что вы можете сделать такую среду, где можно быстро и относительно надежно измерять качество.
Он использовал это в своём проекте nanochat, в котором пытается на скорость обучить LLM до уровня GPT-2. И он собрал бенчмарк, в котором обучает модель 5 минут и смотрит на метрики. Оказалось, что этого достаточно, чтобы агент автоматически предлагал разумные улучшения. Качество улучшилось не только в игрушечном сетапе пятиминутного обучения, но и в полноценном обучении.
Я с этой техникой активно экспериментирую. Один раз я её уже успешно применил во временном проекте (расскажу про него в следующий раз), где у меня изначально качество было около-нулевое. Claude примерно за полчаса-час поднял его до приемлемого. Сам разобрался, где основные проблемы и как их поправить.
Сейчас я пробую применять это для своего основного проекта — и параллельно хочу как-то улучшить эту технику. В частности, я пытаюсь скрестить её с другим известным подходом в мире Claude Code — Ralph loop (Ralph Wiggum, Ralphex). Он про то, чтобы не одной большой сессией агента решать большую задачу, а решать её итеративно. На каждой итерации запускается агент с небольшим начальным контекстом и пытается совершить небольшой прогресс. И вот так в цикле, итерация за итерацией, решает задачу.
Ещё одна техника от Карпаты — это LLM Wiki. Она про то, как агенты могут вести, поддерживать и обновлять базу знаний. Я использовал это в своём основном проекте, собирая знания и про проект, и вокруг него. Также я стал прогонять через это все статьи, которые читаю (хотя сейчас это не очень много, но стало больше, благодаря llm wiki). Каждую новую статью, которую я хочу изучить, агент суммаризирует, пытается разбить на разные концепты, связывает её с другими статьями — и собирает такой граф знаний. Получается интересно, но я только начал.
Я ещё хочу попробовать LLM Wiki применить и для домашних задач, где нужно что-то изучить. Попробую, например, в личных финансах.
В общем, продуктивность у меня реально возросла, наверное, раз в десять. Да и фана от работы стало сильно больше. Кстати, спасибо работодателю за то, что позволяет всем этим пользоваться безлимитно и на максималках. Хотя и AI-стратегия компании иногда вызывает вопросы — но вот в этом аспекте не придерешься.
С одной стороны, все вокруг пишут про AI. Этого так много, что не хочется за ними повторять и не хочется быть ещё одним AI-каналом. С другой стороны, AI-инструменты на мою работу так сильно повлияли (особенно с января этого года), что и совсем промолчать тоже странно.
Я начал очень активно использовать Claude Code и стал его большим фанатом. Я больше не пишу код руками, 100% за меня пишет Claude. В большинстве случаев это не вайб-кодинг, а вполне себе вдумчивая разработка. Но бывают места (и на работе, и в домашних проектах), где и вайб-кодить уместно.
Второй инструмент, который я начал активно использовать (хотя изначально был настроен скептически) — это Superwhisper. Он распознаёт голос и делает это хорошо. Он ещё запускает LLM поверх распознанного текста (можно выбрать, какую). Я теперь даже частенько в опен-спейсе, когда народу вокруг немного, немножко бубню себе под нос. А если нужно наговорить более серьёзно — просто ухожу в переговорку. Для задач, где текста нужно немало, это настолько удобнее и реально облегчает работу, что уже сложно перестать пользоваться. Черновик к этому посту я тоже надиктовал в самолёте и распознал через Superwhisper.
Расскажу ещё про пару экспериментальных техник, которые я пока исследую. Обе — от Андрея Карпаты. Кстати, если вы за ним не следите — очень рекомендую.
Первая — это autoresearch. Почитайте про неё. Это про то, как улучшать качество вашей системы или модели автоматически — при условии, что вы можете сделать такую среду, где можно быстро и относительно надежно измерять качество.
Он использовал это в своём проекте nanochat, в котором пытается на скорость обучить LLM до уровня GPT-2. И он собрал бенчмарк, в котором обучает модель 5 минут и смотрит на метрики. Оказалось, что этого достаточно, чтобы агент автоматически предлагал разумные улучшения. Качество улучшилось не только в игрушечном сетапе пятиминутного обучения, но и в полноценном обучении.
Я с этой техникой активно экспериментирую. Один раз я её уже успешно применил во временном проекте (расскажу про него в следующий раз), где у меня изначально качество было около-нулевое. Claude примерно за полчаса-час поднял его до приемлемого. Сам разобрался, где основные проблемы и как их поправить.
Сейчас я пробую применять это для своего основного проекта — и параллельно хочу как-то улучшить эту технику. В частности, я пытаюсь скрестить её с другим известным подходом в мире Claude Code — Ralph loop (Ralph Wiggum, Ralphex). Он про то, чтобы не одной большой сессией агента решать большую задачу, а решать её итеративно. На каждой итерации запускается агент с небольшим начальным контекстом и пытается совершить небольшой прогресс. И вот так в цикле, итерация за итерацией, решает задачу.
Ещё одна техника от Карпаты — это LLM Wiki. Она про то, как агенты могут вести, поддерживать и обновлять базу знаний. Я использовал это в своём основном проекте, собирая знания и про проект, и вокруг него. Также я стал прогонять через это все статьи, которые читаю (хотя сейчас это не очень много, но стало больше, благодаря llm wiki). Каждую новую статью, которую я хочу изучить, агент суммаризирует, пытается разбить на разные концепты, связывает её с другими статьями — и собирает такой граф знаний. Получается интересно, но я только начал.
Я ещё хочу попробовать LLM Wiki применить и для домашних задач, где нужно что-то изучить. Попробую, например, в личных финансах.
В общем, продуктивность у меня реально возросла, наверное, раз в десять. Да и фана от работы стало сильно больше. Кстати, спасибо работодателю за то, что позволяет всем этим пользоваться безлимитно и на максималках. Хотя и AI-стратегия компании иногда вызывает вопросы — но вот в этом аспекте не придерешься.
X (formerly Twitter)
Andrej Karpathy (@karpathy) on X
I like training large deep neural nets.
#saas #programming #ai
Странно, даже такую хрень люди покупают, когда можно просто сделать это через Чат, Грок и т.д. ?
https://www.youtube.com/watch?v=E0KML1B1ssg
Странно, даже такую хрень люди покупают, когда можно просто сделать это через Чат, Грок и т.д. ?
https://www.youtube.com/watch?v=E0KML1B1ssg
YouTube
Я навайбкодил AI стартап за 3 недели. Он принес мне 700к+ рублей
Агрегатор нейросетей Syntx AI: https://syntx.ai/
Используйте промокод OLEG, чтобы получить скидку 15% для новых пользователей
🔗 Клуб по AI. Цифры, графики и данные из видео тут: https://club.stefanov.tech/?utm_source=youtube&utm_medium=video&utm_campaig…
Используйте промокод OLEG, чтобы получить скидку 15% для новых пользователей
🔗 Клуб по AI. Цифры, графики и данные из видео тут: https://club.stefanov.tech/?utm_source=youtube&utm_medium=video&utm_campaig…
#randomness
"Другие исследовательские группы и стартапы изучают иные способы воплощения ТДВ: на основе мемристоров, магнитных туннельных переходов и даже сверхпроводящих схем. в Национальной лаборатории им. Лоуренса в Беркли (Lawrence Berkeley National Laboratory) предложили концепцию нелинейных «термодинамических нейронов», не нуждающихся в возврате к состоянию термодинамического равновесия перед началом нового цикла вычислений. Идея Стивена Уайтлама (Stephen Whitelam) и его коллеги Корнела Касерта (Corneel Casert), соавторов опубликованной в Nature Communications статьи на эту тему, заключается в том, чтобы научиться управлять эволюцией термодинамических состояний базовых элементов вычислительной схемы, заставляя их «развиваться» в нужном экспериментаторам направлении: «Если взять физическое устройство с энергетическим масштабом, сравнимым с масштабом тепловой энергии, и оставить его в покое, оно будет изменять своё состояние со временем под действием тепловых флуктуаций. Цель состоит в том, чтобы запрограммировать его таким образом, чтобы на этот раз эволюция принесла пользу. Классические и квантовые вычисления борются с шумом — но именно он заставляет термодинамические вычисления работать». Используя цифровое моделирование, Уайтлам и Касерт показали, что нелинейные вычисления — подобные тем, которые выполняются нейронными сетями, — действительно возможны с помощью ТДВ, не начинающих работу непременно из состояния равновесия. Это существенно расширяет спектр исполнимых на таком «железе» алгоритмов — позволяя, в частности, термодинамическому контуру вести себя подобно нейрону в биологической нейронной сети.
Термодинамические вычислители находятся — даже если сравнивать их с квантовыми — в самом начале пути: разнородных аппаратных платформ слишком много, эффективных алгоритмов маловато, подтверждённой эффективности гибридных применений в связке с фоннеймановскими системами откровенно недостаёт. И всё же по мере дальнейшего нарастания спроса на энергию для ИИ-вычислений в какой-то момент наверняка выяснится, что проинвестировать в ускорение развития ТДВ — лучше сразу по нескольким конкурирующим направлениям — выгоднее и эффективней, чем возводить где-нибудь за Полярным кругом очередной ИИ-ЦОД в комплекте с ядерным мини-реактором. Экономика, сколь обидно бы это ни звучало для визионеров и евангелистов «чистого» технического прогресса, — лучший и мощнейший двигатель науки!"
https://3dnews.ru/1140731/termodinamicheskie-vichisliteli
"Другие исследовательские группы и стартапы изучают иные способы воплощения ТДВ: на основе мемристоров, магнитных туннельных переходов и даже сверхпроводящих схем. в Национальной лаборатории им. Лоуренса в Беркли (Lawrence Berkeley National Laboratory) предложили концепцию нелинейных «термодинамических нейронов», не нуждающихся в возврате к состоянию термодинамического равновесия перед началом нового цикла вычислений. Идея Стивена Уайтлама (Stephen Whitelam) и его коллеги Корнела Касерта (Corneel Casert), соавторов опубликованной в Nature Communications статьи на эту тему, заключается в том, чтобы научиться управлять эволюцией термодинамических состояний базовых элементов вычислительной схемы, заставляя их «развиваться» в нужном экспериментаторам направлении: «Если взять физическое устройство с энергетическим масштабом, сравнимым с масштабом тепловой энергии, и оставить его в покое, оно будет изменять своё состояние со временем под действием тепловых флуктуаций. Цель состоит в том, чтобы запрограммировать его таким образом, чтобы на этот раз эволюция принесла пользу. Классические и квантовые вычисления борются с шумом — но именно он заставляет термодинамические вычисления работать». Используя цифровое моделирование, Уайтлам и Касерт показали, что нелинейные вычисления — подобные тем, которые выполняются нейронными сетями, — действительно возможны с помощью ТДВ, не начинающих работу непременно из состояния равновесия. Это существенно расширяет спектр исполнимых на таком «железе» алгоритмов — позволяя, в частности, термодинамическому контуру вести себя подобно нейрону в биологической нейронной сети.
Термодинамические вычислители находятся — даже если сравнивать их с квантовыми — в самом начале пути: разнородных аппаратных платформ слишком много, эффективных алгоритмов маловато, подтверждённой эффективности гибридных применений в связке с фоннеймановскими системами откровенно недостаёт. И всё же по мере дальнейшего нарастания спроса на энергию для ИИ-вычислений в какой-то момент наверняка выяснится, что проинвестировать в ускорение развития ТДВ — лучше сразу по нескольким конкурирующим направлениям — выгоднее и эффективней, чем возводить где-нибудь за Полярным кругом очередной ИИ-ЦОД в комплекте с ядерным мини-реактором. Экономика, сколь обидно бы это ни звучало для визионеров и евангелистов «чистого» технического прогресса, — лучший и мощнейший двигатель науки!"
https://3dnews.ru/1140731/termodinamicheskie-vichisliteli
#trading
Дело говорит (частично, по кр. мере). Правда, нахрена им учить кого-то еще?
https://www.youtube.com/watch?v=Wa4Xxxjl6YI
Дело говорит (частично, по кр. мере). Правда, нахрена им учить кого-то еще?
https://www.youtube.com/watch?v=Wa4Xxxjl6YI
YouTube
#ЦМФ #HFT Александр Бойко, Head of HFT Trading: ML в HFT: Market prediction in HFT: from 0 to HERO
Дополнительная возможность поступить на программу по продвинутой количественной аналитике и на проекты по алгоритмической торговле (опционы и HFT) до 2 мая:
https://www.linkedin.com/posts/options-pricing-and-trading-1-share-7453490009317240832--dlY
https://www.linkedin.com/posts/options-pricing-and-trading-1-share-7453490009317240832--dlY
#jobs #law
"Письменный опрос 272 сокращённых, организованный бывшими сотрудниками совместно с центром защиты прав работников What We Will, показал, что 62 % респондентов старше 40 лет, а 22 % проработали в компании более 15 лет. Многие респонденты полагают, что Oracle целенаправленно сокращала более возрастных и высокооплачиваемых работников, у которых накопилось больше акций с ограниченным обращением (RSU) — формы вознаграждения, при которой компания обещает передать сотруднику акции по графику, и при увольнении до срока «созревания» (вестинга) акции просто аннулируются. 27 % опрошенных сообщили, что до ближайшего вестинга им оставалось менее 90 дней. Старший менеджер по разработке рассказал изданию TIME, что 70 % его компенсации составляли RSU и что до вестинга опционов на акции стоимостью $1 млн ему оставалось четыре месяца.
Часть уволенных находились в США по рабочим визам H-1B и теперь у них есть лишь 60 дней, чтобы найти нового работодателя или покинуть страну. В отрасли, где наём обычно растягивается на месяцы, это крайне узкое окно. «Поскольку я нахожусь в стране по визе H-1B, это не просто потеря работы, а конец моей жизни в США, — написал один из респондентов. — Всё, что я строил почти десять лет, рухнет за несколько недель».
Бывшие сотрудники добиваются увеличения выходного пособия, тем более что предложение Oracle существенно ниже отраслевых стандартов. Компания предлагает четыре недели базового оклада плюс одну неделю за каждый год стажа, тогда как Google и Meta дают вчетверо больше стартовую сумму и вдвое больше за год.
17 апреля 600 работников Oracle подписали письмо с требованием улучшить выходное пособие, обеспечить поддержку обладателям виз H-1B, ускорить вестинг акций и продлить медицинскую страховку, прежде всего для онкобольных, беременных женщин и ветеранов. Участники группы не объединены в профсоюз и уже уволены, поэтому их рычаги давления на компанию ограничены. Oracle ответила на письмо, что не намерена вести переговоры с ними как с группой лиц."
https://3dnews.ru/1141105/oracle-uvolila-do-30-000-sotrudnikov-radi-ii-i-data-tsentrov-a-uvolennye-obedinilis-dlya-borby-za-kompensatsii
"Письменный опрос 272 сокращённых, организованный бывшими сотрудниками совместно с центром защиты прав работников What We Will, показал, что 62 % респондентов старше 40 лет, а 22 % проработали в компании более 15 лет. Многие респонденты полагают, что Oracle целенаправленно сокращала более возрастных и высокооплачиваемых работников, у которых накопилось больше акций с ограниченным обращением (RSU) — формы вознаграждения, при которой компания обещает передать сотруднику акции по графику, и при увольнении до срока «созревания» (вестинга) акции просто аннулируются. 27 % опрошенных сообщили, что до ближайшего вестинга им оставалось менее 90 дней. Старший менеджер по разработке рассказал изданию TIME, что 70 % его компенсации составляли RSU и что до вестинга опционов на акции стоимостью $1 млн ему оставалось четыре месяца.
Часть уволенных находились в США по рабочим визам H-1B и теперь у них есть лишь 60 дней, чтобы найти нового работодателя или покинуть страну. В отрасли, где наём обычно растягивается на месяцы, это крайне узкое окно. «Поскольку я нахожусь в стране по визе H-1B, это не просто потеря работы, а конец моей жизни в США, — написал один из респондентов. — Всё, что я строил почти десять лет, рухнет за несколько недель».
Бывшие сотрудники добиваются увеличения выходного пособия, тем более что предложение Oracle существенно ниже отраслевых стандартов. Компания предлагает четыре недели базового оклада плюс одну неделю за каждый год стажа, тогда как Google и Meta дают вчетверо больше стартовую сумму и вдвое больше за год.
17 апреля 600 работников Oracle подписали письмо с требованием улучшить выходное пособие, обеспечить поддержку обладателям виз H-1B, ускорить вестинг акций и продлить медицинскую страховку, прежде всего для онкобольных, беременных женщин и ветеранов. Участники группы не объединены в профсоюз и уже уволены, поэтому их рычаги давления на компанию ограничены. Oracle ответила на письмо, что не намерена вести переговоры с ними как с группой лиц."
https://3dnews.ru/1141105/oracle-uvolila-do-30-000-sotrudnikov-radi-ii-i-data-tsentrov-a-uvolennye-obedinilis-dlya-borby-za-kompensatsii
#kaggle #competitions
Приятненькая сорева началась. Влез для разнообразия.
"Roughly 10,000 horizontal wells are drilled worldwide every year, yet much of the drilling process still relies on manual interpretation by experts. These operations require immense technical precision, where even small deviations from the target zone can lead to significant resource waste. If the well drifts into less favorable geology, it results in inefficient energy recovery and may require additional corrective measures that increase the overall environmental footprint of the site.
Interpreting the subsurface is challenging because direct measurements are inherently limited. Data from wells, seismic surveys, and logging tools only show part of the picture. Rock layers start out stacked like a layer cake, but can bend or break along faults, making it hard to know exactly where the drill bit sits within the formation. Geologists and engineers analyze incoming data to steer the well, but current analytical tools often struggle to match the nuance of expert interpretation.
In this competition, you’ll develop machine learning models that predict the geology encountered along a horizontal wellbore. Your models should identify favorable layers from drilling data and help guide well placement more accurately during operations.
Your solution could help reduce resource waste by minimizing redundant drilling, improve operational safety by better predicting geological hazards, and move the industry toward automated systems that make faster, more consistent, and data-driven decisions.
A clearer map beneath the surface could make every meter count."
🧠 Общая идея
Соревнование Rogii Wellbore Geology Prediction — это задача из нефтегаза про геонавигацию (geosteering).
👉 Если очень просто:
бурят горизонтальную скважину и хотят держать её внутри “полезного слоя” (например, нефтеносного).
Но проблема в том, что:
геология под землёй неизвестна точно
данные приходят по мере бурения (streaming / sequential)
решения нужно принимать в реальном времени
🎯 Что нужно предсказать
Ты получаешь данные измерений из скважины (well logs) и должен:
👉 предсказать геологию вокруг ствола скважины
Конкретно:
где находятся слои пород
где границы (top/bottom)
где “target zone” (полезный слой)
https://www.kaggle.com/competitions/rogii-wellbore-geology-prediction/overview
Приятненькая сорева началась. Влез для разнообразия.
"Roughly 10,000 horizontal wells are drilled worldwide every year, yet much of the drilling process still relies on manual interpretation by experts. These operations require immense technical precision, where even small deviations from the target zone can lead to significant resource waste. If the well drifts into less favorable geology, it results in inefficient energy recovery and may require additional corrective measures that increase the overall environmental footprint of the site.
Interpreting the subsurface is challenging because direct measurements are inherently limited. Data from wells, seismic surveys, and logging tools only show part of the picture. Rock layers start out stacked like a layer cake, but can bend or break along faults, making it hard to know exactly where the drill bit sits within the formation. Geologists and engineers analyze incoming data to steer the well, but current analytical tools often struggle to match the nuance of expert interpretation.
In this competition, you’ll develop machine learning models that predict the geology encountered along a horizontal wellbore. Your models should identify favorable layers from drilling data and help guide well placement more accurately during operations.
Your solution could help reduce resource waste by minimizing redundant drilling, improve operational safety by better predicting geological hazards, and move the industry toward automated systems that make faster, more consistent, and data-driven decisions.
A clearer map beneath the surface could make every meter count."
🧠 Общая идея
Соревнование Rogii Wellbore Geology Prediction — это задача из нефтегаза про геонавигацию (geosteering).
👉 Если очень просто:
бурят горизонтальную скважину и хотят держать её внутри “полезного слоя” (например, нефтеносного).
Но проблема в том, что:
геология под землёй неизвестна точно
данные приходят по мере бурения (streaming / sequential)
решения нужно принимать в реальном времени
🎯 Что нужно предсказать
Ты получаешь данные измерений из скважины (well logs) и должен:
👉 предсказать геологию вокруг ствола скважины
Конкретно:
где находятся слои пород
где границы (top/bottom)
где “target zone” (полезный слой)
https://www.kaggle.com/competitions/rogii-wellbore-geology-prediction/overview