Aspiring Data Science
371 subscribers
425 photos
11 videos
11 files
1.88K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#jobs

"Возвращение личного формата собеседований стало неожиданным поворотом на рынке труда, где между работодателями и соискателями ужесточалась «гонка вооружений» ИИ: работодатели из-за большого числа заявок стали сортировать соискателей при помощи ИИ, а те в ответ — жульничать с ответами на вопросы и тестовыми заданиями.

Дошло до того, что северокорейские киберпреступники при помощи технологий дипфейка стали выдавать себя за американцев и устраиваться на удалённую работу в американские компании, и ФБР опубликовало предупреждение об этой схеме мошенничества."

https://3dnews.ru/1127554/google-i-prochie-stali-vozvrashchatsya-k-ochnim-sobesedovaniyam-izza-gulikov-s-ii
#featureimportances

Отправил клиенту несколько обученных ML моделек. Он говорит - запилю-ка я метамодельку поверх. И присылает данные по важностям метапризнаков, которые он навайбкодил за пару дней. У меня аж челюсть хлопнула. Говорю, мол, и кто из нас после этого дата-сайентист? )
1😁1
#trading

Такой раритет! Нашёл свои старые попытки применить нейросети в трейдинге.

Это скрины программы, которую я написал в Visual Basic 6 19 лет назад, в 2006м году.

Она так и не пошла толком в работу, и реальных сделок я по ней делал совсем немного - увлекла работа в банке, будь она неладна. Надо было тот банк сразу нахер слать.

Да-да, я обучал нейронки методом обратного распространения ошибки, который я закодил по глючным формулам из книжки Осовского, кажется. Помню, сидел часами над ними, пытаясь понять, куда какой градиент идёт )

Тогда уже был Matlab, но хотелось же своё.
🆒7
#trading

Удивительный пример доклада, имеющего 0 практической ценности. Мне кажется, даже в лужу пёрднуть и то результативнее. Кто понял, что что хотел сказать докладчик, напишите плз.

Какие бустинги, какой регрет, как это вообще в кучу можно намешать было...


https://youtu.be/49PHeGZzttM?si=QlewHfx0kgnjdB1T
#astronomy

"Опубликованные в 2018 и 2020 годах работы о Церере свидетельствуют о присутствии на этой планете в прошлом органических веществ и воды. Собственно, следы воды на Церере и «вкусной» для микробов химии обнаружила станция «Рассвет». Оставался вопрос: было ли там когда-нибудь достаточно тепло, чтобы могла развиться хотя бы одноклеточная жизнь?

Новая работа добавляет недостающую часть головоломки. Предложенные учёными NASA модели геологической эволюции Цереры и органической химии в её недрах показывают, что на этой карликовой планете в прошлом был достаточно длительный период, когда она была пригодна для органической жизни.

Модели показали, что источником тепла на Церере был радиоактивный распад в её недрах — явление вполне обычное для планет в Солнечной системе. Это тепло не пропало впустую. Под поверхностью Цереры существовал глобальный океан или крупные резервуары с жидкой водой, выходы которой на поверхность планеты зафиксировала станция Dawn. Геотермальные воды из глубин Цереры смешивались с богатым питательными веществами солёным океаном и согревали его, одновременно насыщая минералами. Так продолжалось примерно 1,5 млрд лет — от 4 до 2,5 млрд лет назад. В тех условиях под поверхностью Цереры могла существовать та жизнь, которую мы знаем по Земле."


https://3dnews.ru/1127992/milliardi-let-nazad-tserera-bila-prigodna-dlya-gizni-zayavili-v-nasa
2
#hardware #ssd

"Для накопителя заявлена скорость последовательного чтения до 14 800 Мбайт/с и последовательной записи до 13 400 Мбайт/с. Производительность в операциях случайного чтения и записи составляет 2,2 млн IOPS и 2,6 млн IOPS соответственно. Модель на 8 Тбайт получила 8192 Мбайт кеш-памяти LPDDR4X, то есть вдвое больше, чем модель на 4 Тбайт."

https://3dnews.ru/1128031/flagmanskiy-ssd-samsung-9100-pro-vishel-v-versii-na-8-tbayt-za-999
#ai #llms #gpt

"Развитие передовых ИИ-моделей демонстрирует признаки замедления. После ажиотажа вокруг искусственного интеллекта, возникшего при запуске алгоритма OpenAI ChatGPT в конце 2022 года, и регулярного появления впечатляющих ИИ-моделей становится всё более очевидным, что темпы прогресса больших языковых моделей снижаются.

В этом нет ничего удивительного. Интернет в конечном счёте изменил образ жизни людей и бизнес-практики, но в 1990-х на это ушло больше времени, чем предполагали первые энтузиасты. По данным Pew Research Center, потребовалось десятилетие, чтобы уровень проникновения домашнего широкополосного интернета в США вырос с почти нулевого в 2000 году до более чем 60 % взрослого населения.

Бум искусственного интеллекта во многом отличается, но развитие может пойти по схожей траектории: всплеск энтузиазма, за которым следует спад по мере распространения технологий в обществе и бизнесе. Истинный масштаб преимуществ от внедрения ИИ станет понятен лишь спустя годы."

https://3dnews.ru/1128177/ii-zamedlisya-v-razvitii-no-biznes-ne-dolgen-ob-etom-bespokoitsya
1
#musk #fun

"Глава компаний Tesla, SpaceX, соцсети X и разработчика искусственного интеллекта xAI Илон Маск (Elon Musk) зарегистрировал Macrohard — компанию, которая будет выступать прямым конкурентом Microsoft. Бизнесмен утверждает, что всё, что делает Microsoft, способен делать и ИИ."

Троллинг норм )

https://3dnews.ru/1128142/ilon-mask-osnoval-kompaniyu-macrohard-antipoda-microsoft-v-kotorom-razrabotkoy-po-zaymyotsya-ii
😁1
#hardware #nvidia #jetson

"Jetson T5000 представляет собой вычислительный модуль, включающий центральный процессор с 14 ядрами Arm Neoverse-V3AE с частотой до 2,6 ГГц, а также графический процессор на архитектуре Blackwell с 2560 ядрами CUDA и 96 тензорными ядрами пятого поколения, работающими на частоте до 1,57 ГГц. Чип дополняют 128 Гбайт оперативной памяти LPDDR5X с пропускной способностью 273 Гбайт/с."

https://3dnews.ru/1128216/nvidia-vipustila-mozgi-dlya-robotov-kotorie-rabotayut-v-realnom-mire-platformi-jetson-thor-za-25003500
ML Training HSE TS.pdf
6.2 MB
В комментах к последним постам про логарифмирование таргета (а в комментах был материал про другие модификации и их свойства) задавались вопросы по прогнозированию временных рядов.

Ок, лучшее, что я могу посоветовать - презентация с наших совместных с ВШЭ ML-тренировок by Дмитрий Симаков, Kaggle competitions master, тимлид Sber AI Lab

Прежде чем покупать и листать большие книги -- а по рядам их написано много -- макроэкномисты и биржевые спекулянты продолжают искать философский камень -- я бы начал с этой презентации -- максимум практики и опыта в одном месте.