Aspiring Data Science
387 subscribers
483 photos
16 videos
12 files
2.33K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#hardware #dvd

"Единственным диском, пережившим более 1000 циклов тестирования (или 2000 циклов, если считать запись и стирание данных отдельно), оказался TDK 2x DVD-RW (TDK502sakuM3). Он значительно опередил конкурентов, а вот диски от Verbatim и Memorex показали себя хуже. Стоит ещё раз упомянуть, что результаты проведённого эксперимента актуальны лишь для конкретного привода и тестируемого диска."

https://3dnews.ru/1138314/entuziast-polgoda-testiroval-dvdrw-perezapisyu-samimi-nadyognimi-okazalis-diski-kotorie-uge-ne-vipuskayutsya
#music #rammstein #gothic #poetry

A little child has died, they say,
Yet only seemed to pass away.
The tiny heart lay still for hours,
So death was written in its powers.

They laid him in the dampened sand,
A music box within his hand.
The first white snow fell soft and deep
And gently woke the child from sleep.

Upon a bitter winter night
The little heart returned to life.
When frost had crept into the child
He wound the music box and smiled.

A melody rides through the wind,
And from the earth there sings the child.

Hoppe, hoppe, rider ride,
No angel comes from the heaven’s side.
My heart will beat for me no more,
Only rain weeps at the graveyard floor.

The frozen moon in silver light
Hears all the screaming in the night.
And no bright angel ventures near,
Only rain weeps by the bier.

Between the hard oak coffin boards
He plays the music box once more.
A melody rides through the wind,
And from the earth there sings the child.

On Sunday of the Dead they heard
From God’s own field that haunting chord.
They dug him up from out the bed
And saved the little heart instead.


https://www.youtube.com/watch?v=bWtYzU40N-M
1
#games #gpu


"DLSS 5 берёт данные о цвете и векторах движения из каждого игрового кадра, а затем применяет модель искусственного интеллекта, которая улучшает освещение и отклик материалов, оставаясь при этом привязанной к исходной 3D-сцене. Компания заявляет, что система работает в реальном времени с разрешением до 4K и разработана для обеспечения детерминированного и согласованного вывода от кадра к кадру, что является ключевым требованием для игр.

DLSS 5 позиционируется как обновление визуального конвейера, а не как ещё один этап генерации кадров. Nvidia заявляет, что модель обучена понимать элементы сцены, такие как кожа, волосы, ткань и условия освещения, а затем использовать эту информацию для улучшения эффектов, таких как подповерхностное рассеивание, блеск ткани и взаимодействие света с волосами. Разработчики также получат элементы управления интенсивностью, цветокоррекцией и маскированием, а интеграция будет продолжаться через существующую структуру Nvidia Streamline, используемую для DLSS и Reflex."

https://3dnews.ru/1138385/nvidia-anonsirovala-dlss-5-s-neyronnim-renderingom-ii-dobavit-fotorealizm-v-kagduyu-igru-uge-osenyu

https://www.youtube.com/watch?v=dJACkKbN-Eo
#law #ai

"«Британская энциклопедия» утверждает, что OpenAI неоднократно копировала их контент без разрешения. «GPT-4 сама “запомнила” большую часть защищенного авторским правом контента энциклопедии и будет выдавать почти дословные копии значительных фрагментов по запросу. Запомненные примеры являются несанкционированными копиями, которые [OpenAI] использовала для обучения своих моделей, включая GPT-4», — утверждается в иске.

В иске также приводятся примеры ответов моделей OpenAI рядом с текстом «Британской энциклопедии», в которых целые отрывки совпадают слово в слово. «Британника» также утверждает, что OpenAI «перетягивает» на себя её веб-трафик, генерируя ответы, которые «заменяют или напрямую конкурируют» с контентом энциклопедии, вместо того чтобы направлять пользователей на свой веб-сайт, как это делала бы традиционная поисковая система.

Как пишет The Verge, это последний из растущей череды исков о нарушении авторских прав от издателей, направленных против компаний, занимающихся искусственным интеллектом, за последние несколько лет. Ранее газета The New York Times выдвигала аналогичные обвинения в своём продолжающемся судебном процессе против OpenAI, в том числе обвиняя компанию в массовом копировании её защищённого авторским правом контента. В сентябре компания Anthropic урегулировала коллективный иск об использовании защищённых авторским правом книг для обучения своих моделей ИИ, выплатив авторам книг $1,5 млрд."

https://3dnews.ru/1138381/britanskaya-entsiklopediya-podala-v-sud-na-openai-chatgpt-pochti-doslovnovosproizvodit-eyo-stati
#space #hardware

"Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) анонсировал на конференции GTC 2026 космический модуль Nvidia Space-1 Vera Rubin Module. По словам Хуанга, модуль обеспечивает до 25 раз большую вычислительную мощность для задач искусственного интеллекта, чем сервер с ускорителями H100.

В октябре прошлого года основатель Amazon и Blue Origin Джефф Безос (Jeff Bezos) предсказал, что орбитальные центры обработки данных гигаваттного уровня появятся через 10–20 лет. В качестве основных преимуществ таких платформ он назвал непрерывное солнечное электроснабжение и упрощённую систему охлаждения в космосе. Starcloud, один из шести партнёров Nvidia, уже строит, как он сам описывает, специально разработанные орбитальные центры обработки данных, предназначенные для выполнения задач обучения моделей ИИ и вывода данных на орбите.

«Космические вычисления, последний рубеж, уже здесь», — сказал Дженсен Хуанг, добавив, что «обработка данных с помощью ИИ в космических и наземных системах обеспечивает сбор данных в реальном времени, принятие решений и автономность, превращая орбитальные центры обработки данных в инструменты исследований, а космические аппараты — в системы с автономным управлением».

Глава Nvidia не сказал, когда космический модуль Vera Rubin станет доступен для развёртывания. Компания уже предлагает в качестве космических платформ IGX Thor, Jetson Orin и RTX Pro 6000 Blackwell Server Edition."
https://3dnews.ru/1138390/kosmicheskie-vichisleniya-uge-zdes-nvidia-predstavila-modul-space1-vera-rubin-dlya-orbitalnih-iiserverov
🔥1
#hardware #cpu

"Процессор Vera получил 88 вычислительных ядер и 176 потоков, тогда как у первого поколения Grace было 72 ядра. Компания Nvidia заявляет о росте количества исполняемых инструкций за такт (IPC) сразу на 50 %, что является необычно крупным скачком для современной процессорной архитектуры, где прирост от поколения к поколению обычно ограничивается однозначными или небольшими двузначными процентами.

Всё дело в том, что если в Grace применялись стандартные ядра Arm Neoverse, то в Vera используются новые ядра Olympus, которые описываются как разработанные Nvidia, что указывает на серьёзные модификации базового дизайна Arm. За основу взята современная архитектура Arm v9.2-A.

Одной из ключевых особенностей стала технология пространственной многопоточности (Spatial Multi-Threading). В отличие от традиционного SMT, где потоки поочерёдно используют ресурсы ядра, здесь ключевые элементы конвейера — исполнительные блоки, кеши и регистровые файлы — физически изолированы между потоками. Благодаря этому оба потока могут фактически выполняться одновременно, что повышает параллелизм инструкций, увеличивает пропускную способность и делает производительность более предсказуемой, поскольку простаивающие исполнительные блоки могут немедленно задействовать инструкции из другого потока. Подобная схема особенно полезна в средах с большим количеством независимых пользователей и виртуальных окружений.


Все 88 ядер объединены в единый вычислительный домен без NUMA-разделения, характерного для современных многоядерных x86-процессоров. Это должно уменьшить задержки доступа к памяти, повысить предсказуемость работы системы и упростить программирование. Для организации взаимодействия между ядрами используется новое поколение фирменной шины Nvidia Scalable Coherency Fabric с сеточной или ячеистой топологией (mesh). Оно основано на когерентной сетевой архитектуре Arm CMN-700, применявшейся в Grace, однако, вероятно, использует более современную реализацию CMN S3 или её модификацию.

Сеточная структура обеспечивает высокую суммарную пропускную способность памяти и позволяет эффективно распределять ресурсы между ядрами. В процессорах Grace общая пропускная способность памяти составляла 546 Гбайт/с, что соответствовало примерно 7,6 Гбайт/с на ядро. В Vera этот показатель вырос более чем вдвое — до 1,2 Тбайт/с, которые обеспечиваются 1,5 Тбайт памяти LPDDR5 в модулях SOCAMM. Ёмкость памяти увеличилась втрое, а средняя пропускная способность на ядро при полной загрузке достигает 13,6 Гбайт/с. При неравномерной нагрузке отдельное ядро может получать до 80 Гбайт/с, что особенно важно для потоков с интенсивным доступом к памяти.

Архитектура также включает десятиканальный блок декодирования инструкций, нейросетевой предсказатель ветвлений, специализированный механизм предварительной выборки для анализа графовых баз данных и буфер инструкций, оптимизированный под PyTorch. Процессор поддерживает технологию Confidential Computing, что позволяет создавать полностью защищённые вычислительные домены CPU и GPU.

Для связи между кристаллами используется интерфейс NVLink-C2C с пропускной способностью до 1,8 Тбайт/с — вдвое больше, чем у Grace, и примерно в семь раз быстрее, чем у PCI Express 6.0. Процессоры также поддерживают двухсокетные конфигурации и современные стандарты для дата-центров, включая PCIe 6.0 и CXL 3.1.

Помимо самих процессоров Nvidia представила стоечную систему Vera CPU Rack.

https://3dnews.ru/1138392/nvidia-udarila-po-intel-i-amd-predstavleni-servernie-88yadernie-cpu-vera-kotorie-sgodyatsya-ne-tolko-dlya-ii
#jobs

"Ажиотаж вокруг ИИ продолжает стремительно обогащать основателей технологических компаний. В ежегодном рейтинге миллиардеров Forbes за 2026 год зафиксирован резкий прирост представителей ИИ-индустрии, общее число которых достигло 86 человек. Их суммарное состояние оценивается в колоссальные $2,9 трлн. Примечательно, что почти половина из них, а именно 45 человек, приобрела статус миллиардера только в течение последнего года.

Фундаментом для такого обогащения послужили рекордные раунды финансирования и сделки по слиянию и поглощению компаний, сообщает Forbes.ru. В январе SpaceX, принадлежащая Илону Маску (Elon Musk), приобрела ИИ-компанию xAI при оценке бизнеса в $250 млрд. В феврале Anthropic привлекла инвестиции при оценке в $380 млрд, а OpenAI объявила о привлечении $110 млрд, после чего её стоимость взлетела до $840 млрд. На этом фоне даже стартапы с небольшой выручкой (например, робототехническая Figure AI, Z.ai или Safe Superintelligence, у которой пока нет полностью готового продукта) оцениваются рынком в десятки миллиардов долларов.

Лидером среди новых миллиардеров стал Эдвин Чен (Edwin Chen) из компании Surge AI, занимающейся разметкой данных для ИИ. Его состояние оценивается в $18 млрд. Столь высокая оценка обусловлена уникальной структурой владения. В частности, Чен сохранил за собой более 75 % компании, отказавшись от классических венчурных инвестиций. Ранее он также заявлял Forbes USA, что работа его компании необходима для создания общего искусственного интеллекта (AGI) и без неё этот технологический прорыв просто не произойдёт.

Вторым стал Лю Дэбин (Liu Debing), соучредитель китайской компании Z.ai (специализируется на open-source ИИ-моделях), с состоянием $9,1 млрд. Он разбогател после IPO в Гонконге. Третье место у Дэниела Надлера (Daniel Nadler) — основателя OpenEvidence, создавшего поисковик на базе ИИ для врачей. Его капитал составляет $7,6 млрд.

Новые миллиардеры представляют разнообразные сегменты рынка. Десять человек попали в список благодаря развитию направления вайб-кодинга и созданию прикладного ПО. Среди них — основатели платформ Cursor, Lovable, Sierra, Harness и Cognition. Другая группа обогатилась на создании базовой инфраструктуры, включая владельцев дата-центров и производителей компонентов, таких как Питер Саланки (Peter Salanki) из CoreWeave, Майкл Синг (Michael Sing) из Monolithic Power Systems и Тоби Нойгебауэр (Tobi Neugebauer) из Fermi America. Также в список вошли создатели ПО для автономного транспорта."

https://3dnews.ru/1138389/iibum-naplodil-milliarderov-reyting-forbes-popolnili-srazu-45-novoispechyonnih-bogachey
#astronomy #biology

"Свежий анализ образцов, доставленных с астероида Рюгу японской миссией Hayabusa2, ещё сильнее укрепил мнение о космическом происхождении жизни на Земле. В материале астероида учёные нашли все пять базовых азотистых оснований — аденин, гуанин, цитозин, тимин и урацил, которые являются фундаментальными строительными блоками нуклеиновых кислот ДНК и РНК, без которых жизнь в нынешнем виде на Земле была бы невозможна.

Ранее в образцах Рюгу был обнаружен только урацил, однако новое исследование подтвердило наличие полного набора, выявленного в двух независимых образцах. Это открытие делает Рюгу вторым углеродистым астероидом (после Бенну) с полным комплектом нуклеотидов, что указывает на их широкое распространение в Солнечной системе. Если одинаковые комплекты найдены на двух далеко отстоящих астероидах, значит, они есть практически повсеместно в нашей системе.

Азотистые основания делятся на две группы: пурины (аденин и гуанин) и пиримидины (цитозин, тимин и урацил). В образцах Рюгу они обнаружены примерно в равных пропорциях, в отличие от Мурчисонского метеорита (который богаче пуринами) или астероида Бенну и метеорита Оргей (они богаче пиримидинами). Такие различия, вероятно, связаны с химической средой родительских астероидов, в частности с содержанием аммиака.

Особое значение имеет обнаружение в образцах с Рюгу тимина — молекулы, необходимой для создания ДНК. Существует гипотеза, что космическая среда преимущественно синтезирует урацил для РНК. После изучения образцов с Рюгу эта гипотеза становится сомнительной, поскольку основания для ДНК и РНК найдены в равных пропорциях.

В целом открытие всех пяти азотистых оснований в материале Рюгу подтверждает гипотезу о том, что углеродистые астероиды могли доставлять пребиотические органические молекулы на раннюю Землю во время интенсивной бомбардировки около 4 млрд лет назад. Образцы с астероидов были взяты и сохранены в стерильных условиях, что исключает их загрязнение земными молекулами. Это является важным доказательством того, что базовая органика могла возникнуть в космосе в ходе фотохимических преобразований и позже попасть в благоприятные для развития жизни условия на нашей планете."

https://3dnews.ru/1138493/nashlos-vsyo-v-obraztsah-s-asteroida-ryugu-obnarugeni-vse-azotistie-osnovaniya-dlya-zarogdeniya-gizni
#astronomy #biology #mars #lifeorigin

"Работа продолжалась с сентября 2023 года по февраль 2024 года, но только после её завершения учёные поняли, с чем столкнулись.

Это оказалась более древняя дельта реки, залегающая глубоко под поверхностью Марса. С учётом перепада высот при продвижении марсохода оценочная толщина осадочных пород древней дельты достигает 90 метров. На радиолокационной карте чётко видны структуры, характерные для тех, которые формируются текущей водой, — от отложений до вкраплений валунов, перенесённых мощным потоком.

То, что было обнаружено с орбиты и что отправился изучать на Марсе Perseverance, оказалось следами более поздних потоков воды. Новые, более глубокие структуры свидетельствуют о длительном периоде существования дельты реки в этом месте планеты, что означает более высокие шансы на зарождение микробной жизни на Марсе — вода там присутствовала дольше и в большем объёме, чем считали учёные ранее. Более того, глубинные слои хорошо защищены от радиации и могут сохранить древнюю биологическую историю Красной планеты, если она там была."

https://3dnews.ru/1138591/rover-perseverance-viyavil-skrituyu-pod-poverhnostyu-marsa-drevnyuyu-rechnuyu-deltu
#trading #backtesting #walkforward

Иронично - похоже, проведя мета-оптимизацию walkforward бэктеста, автор совершил ту же ошибку, которую и должен предотвращать walkforward, только на мета-уровне.Иными словами, в конце статьи он снова получил переподгонку.

https://medium.datadriveninvestor.com/what-is-walk-forward-backtesting-implementation-in-python-ae09baaa5802
#programming #ai

tokenmaxxing )))

"Объём взаимодействия одного из инженеров OpenAI с ИИ-ботами за неделю составил 210 млрд токенов. Этого объёма текста хватило бы, чтобы заполнить «Википедию» 33 раза. На данный момент это достижение является рекордным среди всех сотрудников компании. В Anthropic один из пользователей ИИ-помощника в написании программного кода Claude Code за месяц накопил счёт более чем на $150 тыс. В некоторых технологических компаниях, таких как Meta и Shopify, руководители стали учитывать, насколько активно сотрудники используют ИИ, при оценке эффективности их работы. Руководство поощряет тех, кто активно применяет ИИ-инструменты, и делает замечания тем, кто работает иначе.

Это новая реальность для программистов, которые в числе первых ощутили на себе влияние ИИ по мере распространения новых технологий в экономике. Предполагалось, что нейросети помогут технологическим компаниям повысить производительность и сократить расходы. Однако ИИ также породил дорогостоящую игру за статус, которая получила название «tokenmaxxing», среди ИИ-разработчиков, отчаянно стремящихся доказать свою продуктивность.

Щедрые бюджеты на использование ИИ-алгоритмов становятся для программистов такими же корпоративными бонусами, как медицинская страховка или бесплатное питание. При этом некоторые программисты тратят тысячи долларов в месяц, пытаясь автоматизировать как можно больше своей работы. «Наверно, я трачу на Claude больше, чем моя зарплата», — прокомментировал данный вопрос Макс Линдер (Max Linder), разработчик программного обеспечения из Стокгольма, расходы которого на ИИ оплачивает работодатель.

Ситуацию изменило появление ИИ-агентов для генерации программного кода. Такие системы могут функционировать без контроля со стороны человека часами, просматривая и редактируя большие базы кода и создавая целые программные продукты на основе запросов пользователя. Каждый ИИ-агент способен создавать дополнительные инструменты для обработки отдельных задач, генерируя тысячи токенов на каждом этапе. Некоторые ИИ-системы, такие как популярный фреймворк с открытым исходным кодом OpenClaw, предназначены для работы 24/7 и перерабатывают информацию безостановочно, что ещё больше увеличивает объём потребляемых токенов.

«Если у вас есть несколько постоянно работающих агентов, один полноценный агент будет потреблять 700 млн токенов в неделю. На самом деле это не так уж много», — считает Эге Эрдил (Ege Erdil) соучредитель ИИ-стартапа Mechanize. Он также оценил собственное потребление токенов в диапазоне от 1 до 10 млрд в неделю.

Всё это позволяет ИИ-компаниям, которые продают токены, существенно нарастить доходы. Так, Anthropic более чем вдвое повысила прогноз по выручке за два месяца в этом году, во много благодаря стремительному росту своих ИИ-агентов для генерации программного кода. OpenAI недавно заявила, что ИИ-помощник в написании кода Codex утроил количество еженедельно активных пользователей с начала года, а общее использование Codex, измеряемое в токенах, увеличилось в пять раз. В прошлом году Google заявляла, что ИИ-модели компании обрабатывали более 1,3 квадриллиона токенов в месяц."

https://3dnews.ru/1138712/programmisti-vsyo-bolshe-polzuyutsya-ii-a-v-nekotorih-kompaniyah-eto-dage-prevratilos-v-sorevnovanie
#war #ai

"Maven является ИИ-системой для боевого применения, которая позволяет обнаруживать цели на поле боя путём анализа поступающей разведывательной информации сразу по нескольким каналам. Только за время текущей операции США в Иране данная система позволила выбрать цели и нанести тысячи ударов по ним. Утверждение Maven в качестве главной системы такого типа позволит американским военным стандартизировать её применение во всех подразделениях и обеспечит Palantir долгосрочными оборонными контрактами. До сих пор эти контракты курировало Национальное агентство геопространственной разведки США, но в результате принятых решений они перейдут под контроль верховного командования американской армии.

Только один контракт Palantir с американскими военными прошлым летом принёс компании $10 млрд, а в целом их было заключено несколько штук. Капитализация этого оборонного подрядчика оценивается в $360 млрд. Система Maven обучена в автоматическом режиме обнаруживать цели на поле боя, идентифицировать возможные укрытия и склады боеприпасов и горючего. На решение соответствующих задач привычными методами ранее уходили часы. Palantir подчёркивает, что конечное решение о применении оружия делает человек, а система Maven только определяет цели. Разработка системы ведётся с 2017 года, первый контракт с Пентагоном был заключён компанией Palantir в 2024 году, принеся ей $480 млн. В мае прошлого года потолок финансирования был увеличен до $1,3 млрд. Примечательно, что сама Palantir использует для работы своих систем ИИ-решения Anthropic, от которых теперь придётся избавляться, если соответствующий запрет не будет снят."

https://3dnews.ru/1138679/pentagon-prinyal-boevuyu-iisistemu-palantir-maven-v-kachestve-osnovnoy-dlya-armii-ssha