Aspiring Data Science

#learningtorank #ml #metric

лучшая иллюстрация работы метрик ранжирования

https://amitness.com/2020/08/information-retrieval-evaluation/

Amit Chaudhary

Evaluation Metrics For Information Retrieval

Learn about common metrics used to evaluate performance of information retrieval systems

74 views09:19

Aspiring Data Science

"Хотя многие компании уже прибегли к обходным путям для включения чат-ботов в свои программы и применяют API общедоступных моделей GPT, появление официального API ChatGPT, похоже, совершит революцию на рынке ПО. Над собственными ИИ-моделями работают многие компании, однако ChatGPT остаётся самым популярным и развитым вариантом."

https://3dnews.ru/1082768/openai-anonsirovala-reliz-api-dlya-integratsii-chatgpt-i-drugih-instrumentov-v-prilogeniya-storonnih-razrabotchikov

3DNews - Daily Digital Digest

OpenAI представила API для интеграции ChatGPT в приложения сторонних разработчиков

Компания OpenAI сообщила о доступности для профессиональной аудитории API ChatGPT, позволяющего разработчикам интегрировать ИИ-бота в свои программные решения и создавать умные сервисы с использованием технологий машинного обучения и систем искусственного…

39 viewsedited 13:28

Aspiring Data Science

"Microsoft представила мультимодальную ИИ-модель Kosmos-1, способную анализировать содержание изображений, решать графические головоломки, распознавать текст, проходить визуальные тесты на IQ и понимать команды на естественном языке. Учёные считают, что создание мультимодального ИИ, способного работать в текстовом, аудио- и графическом режимах (включая видео), — ключевой шаг на пути формирования «общего искусственного интеллекта» (AGI), готового справляться с многопрофильными задачами не хуже людей."

https://3dnews.ru/1082777/publikatsiya-1082777

34 viewsedited 13:28

Aspiring Data Science

#robots #sex

https://3dnews.ru/1082775/tesla-prodemonstrirovala-novie-vozmognosti-chelovekopodobnih-robotov-optimus

3DNews - Daily Digital Digest

Tesla показала, как размножаются человекоподобные роботы Optimus: двое делают третьего

Человекоподобные роботы Optimus прошлой осенью предстали перед публикой в виде двух прототипов.

34 viewsedited 13:32

Aspiring Data Science

#chess

Гата Камский бы не поверил )

https://www.youtube.com/watch?v=VQfgclxxQyY&ab_channel=LevitovChess

YouTube

Рекорд Ананда: 35 ходов по первой линии против Каспарова! Рассказывает Владимир Крамник

По мнению 14-го чемпиона мира, рубрика «Мои любимые партии» постепенно переросла в курс современной истории шахмат. В одну из самых интересных, но сравнительно мало исследованную эпоху 1990-х годов. Только-только отшумели битвы Карпова с Каспарова, а на мировую…

38 viewsedited 15:04

Aspiring Data Science

#timeseriesforecasting #competition #electricityprice

Угадайте, чья модель из 4 дата-сайентистов пока что лучше предсказывает цену на электричество в Техасе на сл 24 часа? )

41 viewsedited 15:25

Aspiring Data Science

Forwarded from partially unsupervised

Самая неинтутивная вещь про работу программиста: на каком-то уровне сеньорности чем больше времени ты пишешь код, тем хуже. И дело не в том, что надо уметь писать быстрее, а в том, что написание кода становится прокрастинацией, а максимальную пользу для компании человек мог бы наносить другими, более "менеджерскими" способами: планирование, дизайн, уточнение требований, поиск корнер кейсов, ревью, фидбеки, приоритизация, обучение менее опытных коллег etc. Но такая работа часто сложнее и менее комфортна, и потому эскапизм в родную IDE - как глоток свежего воздуха.

Кстати, про IDE - утащу из одного чатика инсайд от сотрудника Jetbrains:
> В JB было сделано внутреннее исследование, сколько кодят разработчики - и выяснилось, что почти по всем языкам это порядка 10 строк кода в день в среднем; потом это исследование решили не публиковать.

(Не знаю, насколько этому исследованию можно доверять, но сойдет как иллюстрация того, что не кодом единым).

Когда именно с этим парадоксом сталкивается конкретный IC, зависит от окружения. Эвристика простая: чем более ты сеньорный относительно прочих в своей команде/организации, тем меньше кода нужно писать. И потому на каком-то этапе карьеры надо либо осознанно перековываться в человеки-которые-[почти]-не-пишут-код, либо целенаправленно идти в такой орг, где личная максимальная полезность оказывается именно в написании кода, обычно это какие-то сложные специфические системы, и такого в индустрии маловато.

Еще, конечно, всегда можно вырулить в соседнюю область, которая дисконтирует предыдущую сеньорность, но это только временное решение.

35 views16:33

Aspiring Data Science

Forwarded from NOdata Миша

Data science в футболе

Наткнулся на интересный подкаст про использованию ds в футболе

https://www.youtube.com/watch?v=MsuLggu3hu4

#ссылки

YouTube

Как работает Data Science в футбольной аналитике: плюсы/минусы и как внедрять в клубы

Запись выступления по теме «Выстраивание Data-стратегии в футбольном клубе»:
https://www.youtube.com/watch?v=WoWQCsbwsdg

Наши контакты
Сайт школы: https://buildup-school.ru
Александр Моисеев (основатель): 8 (926) 663-89-10
Почта школы: buildup.school.f…

42 views16:34

Aspiring Data Science

#books #fantasy #zhelazny #donnerjack #tanatos

"Он обитал в Непостижимых Полях, но присутствие его простиралось и за их пределы, проникая в самые дальние уголки Вирту. И являлся он, в некотором смысле. Властелином Всего Сущего, хотя у других также имелись основания претендовать на сей титул. Впрочем, его права были ничуть не менее прочными и обоснованными, чем у остальных, поскольку никто не мог отрицать факта существования его владений.

Он двигался среди обломков разбитых фигур - в прошлом обитателей Вирту. Те приходили сюда, подчиняясь его призыву или по собственной воле, когда конец их существования становился неопровержимым фактом. Порой он использовал определенные части для своих целей, но многие оставались лежать, пока не сровняются с землей; впрочем, некоторые их компоненты сохранялись достаточно долго. И когда он шагал мимо, обломки поднимались - в человеческом обличье или каком-нибудь ином, - чтобы пройти несколько шагов,произнести какие-то слова, сделать характерный жест, а затем вновь превратиться в мусор и пыль. Порой - как сейчас - он шевелил груды хлама посохом и смотрел, что будет. Если ему удавалось натолкнуться на какой-нибудь фокус или обрывочную информацию, ключ или код, имеющие некий интерес, он забирал их в свою обитель-лабиринт. Он мог превратиться в мужчину или женщину, отправиться в любое место, но неизменно предпочитал черный плащ с капюшоном, скрывающий поразительно хрупкую фигуру - мельтешение белого в мрачных тенях.

Обычно в Непостижимых Полях царило величественное молчание. Иногда возникали диковинные, невнятные звуки, исходившие словно из самых глубин огромных куч мусора - стоны энтропии; а когда они затихали, тишина становилась еще глубже. Чаще всего он покидал свои владения, чтобы услышать что-нибудь осмысленное - музыку, например. Вселенная не знала подобного существа. Ему давали тысячи имен и прозвищ, однако самым распространенным стало Танатос."

http://lib.ru/ZELQZNY/donnerdzhek.txt

44 viewsedited 16:52

Aspiring Data Science

#ml #interpretability #shap #facet

Новая интересная идея над SHAP. Как известно, каждая фича в рамках SHAP по каждому примеру получает некоторое значение, сдвигающее прогноз от среднего. А почему бы не рассмотреть фичу как вещественный вектор этих значений по всем примерам? Тогда у нас появляется возможность делать матоперации над векторами/фичами: считать углы, к примеру, тем самым выявляя фичи синергичные, ортогональные, и избыточны. Это красиво реализовано в библе Facet (pip install gamma-facet). Мне только кажется, они упустили, что переобучение модельки даст уже другие SHAP VALUES (особенно при мультиколлинеарности), и нельзя закладываться на единственный fit.

Показан реальный пример из строительной индустрии с CV и HPT. Очень интересны и красивы их симуляционные графики.

https://www.youtube.com/watch?v=fTQhfxZxavQ&ab_channel=PyData

YouTube

Jan Ittner & Mateusz Sokół - Exploring Feature Redundancy and Synergy with FACET 2.0

www.pydata.org

Understanding dependencies between features is crucial in the process of developing and interpreting black-box ML models. Mistreating or neglecting this aspect can lead to incorrect conclusions and, consequentially, sub-optimal or wrong decisions…

45 viewsedited 04:58

Aspiring Data Science

https://3dnews.ru/1082821/mozgovie-implanti-ilona-maska-neuralink-zapretili-testirovat-na-lyudyah

#neuralink

"Объясняя своё решение, FDA обозначило десятки проблем, которые компания должна решить перед тестированием на людях, что является важной вехой на пути к созданию конечного продукта. Одна из важнейших претензий FDA — возможность того, что крошечные электроды могут мигрировать в другие области мозга. Такие провода могут вызывать воспаление, нарушать функцию в критических областях мозга и разрывать кровеносные сосуды, что может привести даже к смерти.

Также не лишены оснований опасения FDA по поводу системы дистанционной зарядки литиевых батарей импланта — при перегреве и выходе батареи из строя может быть повреждён мозг. Само устройство в процессе работы тоже может перегреться, что приведёт к поражению тканей мозга. FDA также подняло вопрос о том, будет ли возможность удалить устройство, не повредив мозг.

Neuralink занялась исправлением проблем, обозначенных FDA. Однако имеются серьёзные сомнения, что компания сможет быстро их решить, и осуществить обещание Маска начать испытания на людях весной. По статистике FDA, агентство одобряет в среднем только 66 % заявок испытаний на людях с первой попытки, после повторной заявки количество одобрений достигает 85 %. Компании, получившие разрешение на тестирование на людях, обычно предварительно проводят не менее двух раундов испытаний, прежде чем подавать заявку на одобрение FDA. Но такая неторопливость не устраивает Маска.

«Я мог бы имплантировать устройство Neuralink прямо сейчас, и вы бы даже не узнали», — уверен Илон. Недавно он заявил, что настолько уверен в безопасности устройств, что готов имплантировать их своим детям. Он также обещал, что Neuralink восстановит полную подвижность парализованным пациентам."

3DNews - Daily Digital Digest

Мозговые импланты Neuralink Илона Маска не разрешили тестировать на людях

Илон Маск (Elon Musk) уверен, что его компания Neuralink, разрабатывающая мозговые импланты, заставит парализованных ходить, слепых видеть и в конечном итоге позволит подключать людей к компьютерам.

38 views05:27

Aspiring Data Science

Forwarded from Small Data Science for Russian Adventurers

#забавно
Есть такая старая картинка с колодой карт, на которой изображены математики. Интересно, что есть и другие подобные колоды в интернете, довольно качественно оформленные.

30 views13:50

Aspiring Data Science

#series #yourhonor #weekendmovie

Вы - строгий и беспристрастный судья, что вершит правосудие и всегда следует букве и духу закона. Но однажды ваш сын сбивает насмерть пешехода...

https://www.youtube.com/watch?v=oYqjcyRkqD4&ab_channel=Amediateka

YouTube

Ваша честь | Your Honor | Трейлер (2020)

Кто там скучал по Брайану Крэнстону?

Showtime выпустил трейлер нового юридического сериала «Ваша честь» (Your Honor), в котором актер исполнил роль судь, скрывающего преступление собственного сына.

Премьеру в Амедиатеке смотрите уже в декабре этого года.…

52 viewsedited 15:50

Aspiring Data Science

#series #yourhonor #weekendmovie Вы - строгий и беспристрастный судья, что вершит правосудие и всегда следует букве и духу закона. Но однажды ваш сын сбивает насмерть пешехода... https://www.youtube.com/watch?v=oYqjcyRkqD4&ab_channel=Amediateka

#ml #python #antipatterns

Я впервые вижу технически валидный, но НАСТОЛЬКО бездарный ML-код. Писавший не понимает совершенно, что делается, зачем, почему так, что такое fp64 vs fp32, feature engineering, early stopping, pipeline, cv, baseline, timeseries, transformed target. Не понимает даже языковых конструкций.

При этом, что удивительно, его код компилируется и набирает лайки. И типа проблема решается. Датасайентист, чо уж там. Вроде модельку зафиттил, графички нарисовал, выводы хорошие сделал, а в башке - пустота. Это, безусловно, жемчужина. Рекомендуется к изучению и разбору, как не надо делать. Меня удивляет, где они подобное копипастят, везде же говорится, что это антипаттерны и так делать не надо. Они как-то сами до этого доходят, избирательно читая доку?

P.S. Стало немного понятнее. Это оказалось "копипастой копипасты". Но всё равно, как мог оригинальный автор так накривить?

https://www.kaggle.com/code/rodsaldanha/stock-prediction-pytorch/notebook

Kaggle

stock-prediction-pytorch

Explore and run machine learning code with Kaggle Notebooks | Using data from DJIA 30 Stock Time Series

43 viewsedited 08:36

Aspiring Data Science

Я думал, что повидал уже многое. Но этот шедевр говнокодинга "превосходит ожидания".

43 views10:08

Aspiring Data Science

#vr

https://3dnews.ru/1082887/meta-znachitelno-snizit-tseni-na-vrgarnituri-quest-pro-i-versiyu-quest-2-s-256-gbayt-pamyati

3DNews - Daily Digital Digest

Профессиональная VR-гарнитура Quest Pro подешевеет на $500, а одна из версий игровой Quest 2 сбросит $70

Компания Meta значительно снизит цену профессиональной гарнитуры виртуальной и дополненной реальности Meta Quest Pro, а также уменьшит стоимость игровой VR-гарнитуры Quest 2, сообщает издание The Verge, ссылающееся на заявление главы компании Марка Цукерберга…

43 views13:50

Aspiring Data Science

#games #saturnalia

"События Saturnalia развернутся в вымышленной итальянской деревне Гравой, после проведения древнего ритуала оставшейся почти без жителей. Игрокам предстоит выяснить тайну случившегося, решая головоломки и избегая монстров.

Обещают четырёх героев с разными умениями, изменение структуры деревни после гибели, нелинейный сюжет, а также рисовку и анимацию на основе покадровой съёмки и технологии ротоскопирования."

https://youtu.be/v1qGfWjlv8s

YouTube

Saturnalia – Consoles and Launch Date Announcement Trailer

Psychedelic Survival Horror Saturnalia is a Halloween Fever Dream, available October 27th on the Epic Games Store for PC and on PlayStation©4 and PlayStation©5, Xbox One and Series S | X, and Nintendo Switch consoles.

39 views16:01

Aspiring Data Science

Робопсы Boston Dynamics приняли участие в модном показе Coperni в Париже

#robotics #BostonDynamics

"Когда в зале погас свет, в полумраке начали мигать зелёные глаза робопсов. Затем появились модели, которые демонстрировали новую коллекцию одежды, но, вероятно, внимание зрителей было приковано именно к роботам. Во время показа один из робопсов, оснащённый механическим манипулятором, взял из рук модели сумочку и помог ей донести её. Другой робот некоторое время как бы рассматривал модель, после чего помог ей снять пиджак.

По словам дизайнеров Coperni, концепция показа стала своеобразным переосмыслением произведения французского баснописца Жана де Лафонтена «Волк и ягнёнок», которое превратилось в представление об отношениях человека и робота. «Наш позитивный посыл заключается в том, что люди и технологии могут жить вместе в гармонии», — сказал представитель Coperni, отметив, что при первой встрече с роботом Spot ему было не по себе."

https://youtu.be/X67IwvYXHLU

YouTube

Models and robots at Coperni fashion show #shorts

Models and robots share the runway at Coperni fashion show
Coperni is a French womenswear brand based in Paris created by Sébastien Meyer and Arnaud Vaillant.
Coperni partnered with Boston Dynamics for the first fashion show in which robots, rather than models…

41 viewsedited 16:05

Aspiring Data Science

Насколько часто Вы пользуетесь HPT (Hyper Parameters Tuning) в реальных проектах?

Anonymous Poll

33%

К меня ещё (почти) не было реальных ML проектов

Никогда не пользуюсь - не вижу смысла. Дефолтные параметры обычно хороши.

11%

Иногда пользуюсь, без особого успеха к метрике проекта

11%

Если остаётся время до сдачи, всегда стараюсь использовать, обычно улучшает метрику

44%

Всегда выкраиваю время для HPT, добиваюсь существенного улучшения метрики

9 voters39 views05:45

Aspiring Data Science

Forwarded from DevFM

Введение в logging на Python

Мы описывали концептуальные варианты поиска проблемы в коде, давали небольшой пример логирования и писали о разухабистом логировании.

Пора немного углубиться в детали логирования. Разберём модуль logging из стандартной библиотеки питона. В статье автор даёт пример лога своего проекта, подробно описывает сущность logger, после чего
– описывает уровни логирования debug-info-warning-error-critical, не забывает о методе exception, который работает как error плюс выводит информацию об исключении

– объясняет, что такое handler и разбирает некоторые варианты использования. К logger можно привязать несколько обработчиков, чтобы одновременно писать в несколько локаций. На наш взгляд, сейчас эта настройка потеряла актуальность – писать надо в стандартные потоки упакованного в докер приложения, а дальше собирать логи снаружи

– с помощью Formatter расширяет запись в логе дополнительной информацией. Вот это ключевая фича, которая отличает логирование от отладочных принтов. Для лога мы можем настройкой изменить все сообщения, добавив туда время, уровень предупреждения, строчку и файл возникновения сообщения и многое другое

– применяет Filter, чтобы перестать писать часть сообщений, или, наоборот, писать только определённые сообщения в лог. Бывает удобно, но на текущий момент чаще это решается снаружи путём поиска по логам

– применяет LoggerAdapter для внедрения дополнительной информации в лог-сообщение

– применяет extra для логирования сущностей или их частей, например, включения в лог текста запроса веб-сервера

– конфигурирует логер приложения, при этом не забывает, что следует выносить настройки логера в отдельный модуль

– напоминает о наследовании логера, что позволяет упростить настройку логирования в модулях, указывая только индивидуальные настройки – общая часть будет взята из класса-родителя

В конце автор на примере бота для телеграм разбирает вариант конфигурирования логера. По каждому вопросу есть ссылка на офф документацию питона.

#python

Khashtamov

Введение в logging на Python

В стандартной библиотеке Python есть замечательный пакет для логирования — logging. В сети бытует мнение, что он сложный и настраивать его сплошная боль. В этой статье я попробую убедить вас в о…

38 views09:06

About

Blog

Apps

Platform