Aspiring Data Science

#anthropic

"When you feel that their values are not they say they are, when you feel that they are not honest, it makes it very hard to continue to work with the company."

Понимаю это чувство.

https://www.youtube.com/watch?v=v1wZwxY3CMg

YouTube

Inside Anthropic, the $965 Billion AI Juggernaut | The Circuit

Emily Chang meets Anthropic co-founders Dario and Daniela Amodei for a rare, in-depth discussion of the startup's origin story, its battles with the Pentagon and how the company says it intends to put safety first in the high-stakes AI race.

Watch more of…

78 viewsedited 10:17

Aspiring Data Science

#ai #llms

https://habr.com/ru/articles/1023316/

Хабр

Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Оркестрационный цикл, инструменты, память, управление контекстом — и всё остальное, что превращает stateless...

80 views00:57

Aspiring Data Science

#ai #3d

https://www.youtube.com/watch?v=SCQt6B96DSs

YouTube

AI Just Broke 3D Modeling — The State of AI 3D in 2026 (Full Talk)

AI is changing 3D faster than many are willing to admit.
In this workshop, we discuss the inevitable shift AI is bringing to the 3D industry. From the earliest image-to-3D experiments to changes in game development, production pipelines, animation, 3D printing…

78 views16:49

Aspiring Data Science

#stocks #spacex #musk

"Акции компании SpaceX начали торговаться на нью-йоркской фондовой бирже Nasdaq под тикером SPCX. Компания разместила 555 555 555 ценных бумаг по цене $135 за штуку. В рамках первичного размещения компания рассчитывает привлечь около $75 млрд, что делает IPO крупнейшим в истории фондового рынка.

Ранее в этом году SpaceX была оценена примерно в $1,25 трлн после объединения с компанией xAI, также принадлежащей Илону Маску. Однако в итоге компания вышла на биржу с оценкой в $1,77 трлн, сразу ворвавшись в восьмёрку самых дорогих публичных компаний мира.

Что интересно, несмотря на выход на биржу, Илон Маск (Elon Musk) сохранит практически полный контроль над SpaceX — предприниматель получил 85 % голосующих акций. Вместе с тем выход SpaceX на биржу сделал Маска первым в истории человеком с капиталом более триллиона долларов. Принадлежащий ему пакет оценивается в $648 млрд (плюс $44,3 млрд в виде опционов), что в сочетании с остальными активами обеспечивает состояние в $1,1 трлн."

https://3dnews.ru/1143468/spacex-provela-krupneyshee-ipo-v-istorii-privlekla-75-mlrd-i-sdelala-maska-pervim-trillionerom

3DNews - Daily Digital Digest

SpaceX провела крупнейшее IPO в истории, привлекла $75 млрд и сделала Маска первым триллионером

Акции компании SpaceX начали торговаться на нью-йоркской фондовой бирже Nasdaq под тикером SPCX. Компания разместила 555 555 555 ценных бумаг по цене $135 за штуку. В рамках первичного размещения компания рассчитывает привлечь около $75 млрд, что делает IPO…

85 views18:09

Aspiring Data Science

#tabular

Эти идеи с синтетикой были понятны уже лет пять тому, просто не было лишних рук чтобы реализовать. Но работаю над этом сейчас в рамках проекта интеллектуального HP-тюнера. Рад, что ML сообщество наконец-то преодолело лень и занялось этим направлением, немцы из университета Фрайбурга - красавчики.

https://www.youtube.com/watch?v=MvEkj7TOmj8

YouTube

TabICLv2: A better, faster, scalable, and open tabular foundation model

Title: TabICLv2: A better, faster, scalable, and open tabular foundation model

Speaker: David Holzmüller (https://dholzmueller.github.io/)

Abstract:

Tabular foundation models, such as TabPFNv2 and TabICL, have recently dethroned gradient-boosted trees…

75 views11:01

Aspiring Data Science

Forwarded from partially unsupervised

История с закрытием доступа к Fable - повод тянуться за шампанским в офисах провайдеров открытых моделей. Каждый executive, который участвовал во внедрении AI в своей организации (т.е. просто каждый executive), резко задумался: "А что и кому они внезапно отключат в следующий раз?". Все страхи про вендорлок материализовались мгновенно, даже если конкретно в этой компании Fable и не начали использовать, да и не планировали.

И поэтому все мультивендорные альтернативы резко заиграли новыми красками. Во-первых, бигтехи, перепродающие много моделей под своей крышей (AWS Bedrock, Databricks Unity AI Gateway, Cursor в случае кодинг агентов). Но это полумера, все еще сильная зависимость от топовых лаб. Потому есть и во-вторых: выбрать что-то с open weights, как раз ключевые игроки в этой нише недавно выкатили свежие релизы (Minimax 3, Kimi 2.7, GLM 5.2). Сменить провайдера в таком сетапе совершенно не проблема.

Где-то тут еще витают страхи, что токены в обозримом будущем подорожают, чтобы отбивать венчурные сотни миллиардов, кодинг агенты по подписке снизят лимиты / перестанут быть доступны для корпораций. В общем, беспокойное время для менеджеров, хорошее время делать vendor-agnostic платформы.

Openrouter идеально подгадал по времени и выкатил fusion ендпоинт, из которого неспециалист достанет только один тейк - "микс из моделей попроще работает не хуже топовой модели". Воспитанные кагглом люди помнят, что ансамбли слабо скоррелированных моделей - универсальный молоток. Дьявол все еще в деталях, универсального способа блендить LLM пока не видно, хотя для частных случаев что-то придумать можно.

—
Именно для этих экспериментов я в свое время и сделал nitpicker - чтобы вайбчекать варианты бленда моделей, пытаясь получить близкое к tier-1 качество, используя tier-2 модели (впрочем, никто не мешает жечь и токены опуса/gpt).

Для тех, кому лень ставить незнакомый софт, сделал бесплатную веб-версию. Ограничения: одно ревью на всех в момент времени, работает только с публичными PR на гитхабе, те самые tier-2 модели, аптайм не гарантирован (хостится у меня под теликом).

57 views11:23

Aspiring Data Science

#data

Alyosha, pastiche ))

https://www.youtube.com/watch?v=vk6lgHjjGp8

YouTube

Surface Data vs. Deep Data

Alyosha Efros (UC Berkeley)
https://simons.berkeley.edu/talks/alyosha-efros-uc-berkeley-2026-06-11
Topics in Intelligence: World Models and Social Reasoning

65 viewsedited 09:40

Aspiring Data Science

#cloud

Казалось бы, кому эта Пинтерест нафиг нужна?

"Фотохостинг Pinterest объявил о значительном расширении сотрудничества с AWS, начавшемся в 2010 году. Согласно новому соглашению, Pinterest выплатит AWS в период до 2031 года $4 млрд за использование её сервисов, что является крупнейшим инфраструктурным проектом в истории Pinterest.

В рамках расширенного соглашения Pinterest планирует диверсифицировать использование инфраструктуры AWS для поддержки растущих потребностей в ИИ, одновременно улучшая соотношение цены и производительности. В частности, компания планирует использовать ускорители AWS Trainium для размещения и запуска больших языковых моделей и моделей визуального и языкового анализа, которые обеспечивают персонализированный визуальный поиск и поиск с помощью ИИ. Также Pinterest намерена расширить использование Arm-процессоров Graviton, которые уже обеспечивают работу примерно трети её вычислительной инфраструктуры, для запуска большего количества систем, поддерживающих поиск контента для пользователей фотохостинга, ежемесячная аудитория которого превышает 600 млн."

https://servernews.ru/1143542

62 views09:56

Aspiring Data Science

#ml

Общая постановка задачи машинного обучения с метками, как это выглядело 20 лет назад. Есть интересные идеи, незаслуженно забытые сейчас.

Попробовал закодить 4 идеи (тесторы, MoE на tabular, алгебраический стэкинг, коррекция ансамблей слабых моделей), ни одна не взлетела на синтетике - лучше чем ничего, но хуже существующих альтернатив. Либо надо работать над этими идеями дольше и более вдумчиво.

https://www.youtube.com/watch?v=R3CMqrrIWOk&

YouTube

Ю.И. Журавлев. Математические методы прогнозирования

27.12.2007 16:00 Общеинститутский семинар «Математика и ее приложения» Математического института им. В.А. Стеклова РАН:
Ю.И. Журавлев, Математические методы прогнозирования и распознавания на базе неполной, частично противоречивой, разнородной информации.…

67 viewsedited 10:41

Aspiring Data Science

#fun #literature

https://www.youtube.com/shorts/oOzioPdZ9Bo

YouTube

0:49

ПОЧЕМУ ДЕТИ МАЛО ЧИТАЮТ?

Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.

48 views15:52

Aspiring Data Science

#people

https://www.youtube.com/watch?v=q-wxaOLyLw0

YouTube

Такого ТИНЬКОВА вы, возможно, еще не видели: "Я лежал в соседней комнате и плакал". Честное интервью

Предприниматель Олег ТИНЬКОВ в Грэме. Большое интервью.

Фильм Андрея Лошака "Plata за риск":

https://www.youtube.com/watch?v=pWwQmikOoqg&t=62s

Ютуб канал @platapeople

=======================================================

Skip VPN - обход блокировок…

😁1

60 views02:45

Aspiring Data Science

#seldon #foundational #tabular

https://www.youtube.com/watch?v=Xym8FGDcl34

YouTube

Nicolas Makaroff - AI Scientist - Hands-On with Tabular Foundation Models | Pydata London 26

This hands-on tutorial takes participants from zero to confident use of tabular foundation models. Using real datasets, we will run TabICL-style models, benchmark them rigorously against XGBoost and Random Forest, diagnose their behavior, and build intuition…

57 views21:50

Aspiring Data Science

#testing #trading

"Whether you’re validating software or validating trading strategies, the discipline is the same: test cheap and fast first, invest in expensive and thorough only when the cheap tests pass, and never skip a level of the pyramid just because you’re excited about the idea."

"Financial theory provides the same kind of invariants. The difference is that most quants don’t think of them as test specifications. They think of them as textbook formulas. But the formulas encode relationships that must hold by the structure of markets:

Non-negative bid-ask spread: the ask price is at least as high as the bid. Always. A violation in your data means stale quotes, a crossed market that should have been filtered, or corrupt data.
OHLC consistency: the high is the highest price in the bar, the low is the lowest. The open and close fall between them. This is definitional, not statistical.
Monotonic timestamps: each observation comes after the previous one. Out-of-order data means your pipeline has a sorting bug or your source delivered duplicates.
Adjusted price continuity through splits: a 2:1 split shouldn’t create a 50% gap in the adjusted price series. If it does, the adjustment factor is wrong or missing."

https://martinfowler.com/articles/practical-test-pyramid.html

https://www.susanpotter.net/quant/testing-pyramid-sideways/

https://www.susanpotter.net/quant/metamorphic-relations-backtests/

https://www.susanpotter.net/quant/property-based-testing-statistical-validation/

Susan Potter

The Testing Pyramid, Sideways: Software Testing Practices … – quant developer, quantitative researcher, options trader, software…

The quant research funnel maps almost directly onto the software testing pyramid. Exploration is customer discovery. Backtesting is unit testing. Statistical …

50 viewsedited 04:38

Aspiring Data Science

#trading

So true.

"The Cost of Not Shipping
In quantitative finance, the cost of perfectionism is measured in:

Opportunity cost: Alpha decays. A strategy that worked six months ago may not work today. Ship now or lose the edge.
Learning velocity: Live trading teaches lessons backtests cannot. Every month spent perfecting a backtest is a month not learning from real market feedback.
Capital efficiency: Money sitting idle waiting for the “perfect” strategy earns zero return.
TL;DR
The backtest will never be perfect. The infrastructure will never handle every edge case. The model will never capture every market regime.

Ship the minimum viable strategy to paper trading or with micro-positions. Iterate based on live market feedback. The quant who runs ten strategies through paper trading and learns from each deployment discovers more than the quant who perfects one strategy in simulation indefinitely."

https://www.susanpotter.net/quant/perfection-paradox-quant-development/

Susan Potter

The Perfection Paradox in Quantitative Development :: quant … – quant developer, quantitative researcher, options trader, software…

Why chasing the perfect backtest, optimal parameters, or flawless infrastructure can stall your trading research. Strategies for balancing rigor with progress.

❤1

59 views04:46

Aspiring Data Science

#trading #backtesting

"Knowledge lookahead is hard to detect algorithmically because it lives in the researcher’s head, not in the code. The best defense is a strict event-time framework and a willingness to question every filtering step: “Would I have been able to apply this filter in real time?”"

"Preventing Lookahead
The structural fix is an event-time framework where every data point carries two timestamps: the effective date (when the event occurred) and the availability date (when you could have known about it). Signals are computed strictly from data whose availability date precedes the signal computation time. This is the same “parse at the boundary” principle from software engineering: validate and tag your data at the point of ingestion, and enforce the temporal constraint everywhere downstream."

"Detecting Regime Dependence
Sub-period analysis is the first tool. Split the backtest into non-overlapping windows of equal length and compute performance separately in each. If the Sharpe ratio varies wildly across sub-periods, the strategy is regime-dependent, and your full-period result is averaging over very different performance characteristics.

Rolling metrics make this visual. Plot the rolling one-year Sharpe ratio over the backtest period. A robust strategy shows a relatively stable line. A regime-dependent strategy shows extended periods of strong performance interspersed with extended periods of negative Sharpe."

"The Capacity Question
Every strategy has a capacity limit beyond which market impact overwhelms the alpha. If your backtest assumes you can trade $50M per day in a stock that averages $10M in daily volume, you are assuming away the dominant cost. The backtest shows profits at a scale that is physically impossible to execute.

I think about capacity before I think about performance. A strategy with a Sharpe of 2.0 and a capacity of $500K is an intellectual exercise, not a trading strategy. A strategy with a Sharpe of 0.8 and a capacity of $50M is a business."

"Measuring Your Cost Sensitivity
The break-even cost analysis is the most informative diagnostic: compute the per-trade cost at which the strategy’s Sharpe drops to zero. If the break-even cost is close to realistic transaction costs, the edge is thin and fragile."

"Data Frequency Bias
Using daily data for a strategy that would execute on intraday signals hides intraday drawdowns that would trigger risk limits in production. A daily bar that closes up 0.5% may have had an intraday drawdown of 3% that would have stopped you out. Your backtest shows a calm upward ride; the live experience would have been a drawdown followed by a recovery you never captured because your stop triggered.

If your strategy operates at intraday frequency, backtest on intraday data. Daily data can give you a rough first pass, but you must re-validate on appropriate-frequency data before committing capital."

https://www.susanpotter.net/quant/backtest-bias-taxonomy/

Susan Potter

A Taxonomy of Backtest Lies: Survival Bias, Lookahead Bias, … – quant developer, quantitative researcher, options trader, software…

Every backtest is biased. The question is how badly and in which direction. This article catalogs the biases that corrupt backtesting results, from survivorship …

66 viewsedited 06:20

Aspiring Data Science

When trees still beat tabular foundation models
https://open.substack.com/pub/mindfulmodeler/p/when-trees-still-beat-tabular-foundation

Substack

When trees still beat tabular foundation models

As you might have noticed, I’m rather optimistic about tabular foundation models.

47 views15:35

Aspiring Data Science

Forwarded from kyrillic

Про AI пузырь, ч.4: что не так с OpenAI. Это компания - главный "consumer-локомотив" всей AI индустрии, ключевой продукт которой - не сама технология genAI, а ChatGPT. Это видно по доле API в выручке, по разным данным ее 15-20%, что непростительно мало для революционной технологии.

1️⃣ Про неоправданные расходы OpenAI не сказал только ленивый, они в принципе не могут окупиться, даже теоретически. Наверняка планы будут пересматриваться.

Например я писал, что сделка с Nvidia на $100 млрд - это не сделка, а letter of intent (то есть просто интерес, без обязательств). И эта "сделка" уже по сути отменена, но свои охваты и внимание медиа компании уже получили.

2️⃣ Недавний раунд OpenAI на $110 млрд, самый большой в истории венчурной индустрии, - не совсем раунд. Это больше похоже на пыль в глаза обывателю из медиа. Лучше меня про это написал Денис Ефремов, цитата:

❗️Итого, что мы имеем по самому крупному раунду в истории венчурного рынка:
❌ Чистых денег <30% раунда, остальное, вероятно, – circular financing.
❌ ~31% – финансирование отложенное, при выполнении условий.
❌ Главные инвесторы – публичные компании, которые уже признали или скоро признают выручку и получат 10-20х на вложенные инвестиции в виде роста СВОЕЙ капитализации.
❌ NVIDIA инвестирует в 3 раза меньше, чем могла.
❌ Венчурных фондов в инвесторах нет.
❌ Саудитов нет.

Еще раз: венчурные инвесторы не захотели участвовать в этом раунде! Выводы о вере в будущее genAI можете сделать сами.

3️⃣ Самый вероятный исход для OpenAI - это поглощение Майкрософтом, которому и так уже принадлежит 20%.

Может быть и IPO, но это раскроет финансы, включая ужасные цифры главного в мире genAI продукта (пост об этом). Это ударит по всем AI-стартапам, чего конечно не хотелось бы.

4️⃣ OpenAI часто сравнивают с известными компаниями, сжигавшими миллиарды, но это совсем неверное сравнение.

Убер субсидировал поездки, чтобы захватить рынок и убить конкурентов: в городах где побеждал, он поднимал цены и выходил на операционную прибыль. У OpenAI нет возможности захватить локальный рынок. И нет сетевого эффекта между пользователями.

У Амазона каждый потраченный доллар создавал актив на балансе. OpenAI тратит миллиарды на компьют, который арендует у Майкрософта, и на исследования, которые устаревают.

AWS почти сразу показывал положительную юнит-экономику, которой у OpenAI нет спустя 3+ года, и кажется не может быть даже в теории.

И самое худшее мы уже обсуждали: у OpenAI, Anthropic и всех AI стартапов нет эффекта масштаба SaaS-модели: когда с ростом выручки резко уменьшается доля издержек. То есть OpenAI в принципе не может показывать красивую экономику SaaS'ов.

5️⃣ Считаю, что если/когда AI-пузырь лопнет (не без проблем у OpenAI), то нам, обычным пользователям, одни плюсы:

• Чем раньше это произойдет, тем меньше негативного эффекта будет на мировых рынках (пост).

• Громадный капекс в $1 трлн, который планируется потратить на AI-инфраструктуру, сделает AI-ресурсы доступнее, лицензии дешевле, опенсорс в AI популярнее, модели станут коммодити (еще больше, чем сейчас) и др.

Вполне возможен сценарий, когда останутся лишь дефолты по облигациям и списанные опционы, без системного коллапса. Что наверное лучший вариант для нас.

@kyrillic

31 views02:31

Aspiring Data Science

Forwarded from kyrillic

Как перепроверять за бухгалтерами, промпт! И пример хорошего genAI кейса.

В продолжение поста про налоговые риски, хочу поделиться мастер-промптом (raw) Сергея, одного из участников нашего закрытого чата владельцев американских LLC, который написал:

Я работал с разными бухгалтерами в США. все CPA и все косячили. со всеми влетали на претензии от IRS по разным причинам. Но успешно отбивались и в итоге, штрафы ни разу не платили.

Пришел к системе - CPA + LLM, где я проверяю в ChatGPT полноту отчетов/ форм / приложений, которые CPA подает

С промптом LLM интервьюирует о бизнесе (структура, операции, и тд) и отвечает что и когда сдавать. Он делался для международной группы компаний, чтобы закрыть риски операций внутри группы и их отражения в США. Он немного избыточен для single member LLC, но не оставит дыр в репортинге трансграничных операций.

Могу только подписаться под этими словами - тоже пришел к выводу, что нужно перепроверять даже за сертифицированными консультантами. В США риски высоки: штрафы за неподачу каких-то форм могут быть $10-25k.

Сам Сергей написал про пользу промпта так:

После его использования у меня получился непростой разговор с CPA. оказалось, что она много что упустила. и на мой вопрос - "ну как же так?" она сказала - чтобы такой уровень accounting поддержки иметь "out of the box" вам нужно было идти в Big4 (и платить $20-50k в год, а не мне предъявлять за $500)

Сергей в теме, с опытом CFO, и много итерировал промпт. Он кстати консультирует стартапы как CFO, полезно, и есть бесплатная консультация: https://www.clearviewgrowthadvisory.com/ Можете смело писать @skalachev по релевантным вопросам.

Сам промпт наверное можно взять за основу для других тем, и сделать такой по своей. Но в ней нужно разбираться.

PS Если вы открыли LLC для себя, то приглашаю в наш чат, тут ссылка на форму. Если только собираетесь - рекомендую Doola, недорого, адекватно, YC компания и по статистике многие из вас открывали через них.

@kyrillic

Gist

us_senior_cpa.md

GitHub Gist: instantly share code, notes, and snippets.

28 views02:42

About

Blog

Apps

Platform