Aspiring Data Science
389 subscribers
483 photos
16 videos
12 files
2.33K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
Aspiring Data Science
#news #automl #plans ML/DS-планы на 2024-й. Как-то незаметно прошло уже почти полгода! Поймал себя на том, что двигаюсь к своей мини-automl системе. Скажете, почему не возьмёшь готовую? Ответ обычный, хочешь чтоб было сделано хорошо - сделай сам (если у…
2 года назад вот какие планы я строил на ближайшие полгода. И только сейчас, с появлением ИИ который может писать код с приемлемым уровнем качества, они стали реальностью для "команды" из 1 человека.

На 70% функциональность этой automl системы мной (с помощью ИИ) уже реализована, скоро, надеюсь, смогу выкладывать результаты бенчмарков. What a great time to be alive!
🔥3
#stocks #spacex #musk

"Акции компании SpaceX начали торговаться на нью-йоркской фондовой бирже Nasdaq под тикером SPCX. Компания разместила 555 555 555 ценных бумаг по цене $135 за штуку. В рамках первичного размещения компания рассчитывает привлечь около $75 млрд, что делает IPO крупнейшим в истории фондового рынка.

Ранее в этом году SpaceX была оценена примерно в $1,25 трлн после объединения с компанией xAI, также принадлежащей Илону Маску. Однако в итоге компания вышла на биржу с оценкой в $1,77 трлн, сразу ворвавшись в восьмёрку самых дорогих публичных компаний мира.

Что интересно, несмотря на выход на биржу, Илон Маск (Elon Musk) сохранит практически полный контроль над SpaceX — предприниматель получил 85 % голосующих акций. Вместе с тем выход SpaceX на биржу сделал Маска первым в истории человеком с капиталом более триллиона долларов. Принадлежащий ему пакет оценивается в $648 млрд (плюс $44,3 млрд в виде опционов), что в сочетании с остальными активами обеспечивает состояние в $1,1 трлн."


https://3dnews.ru/1143468/spacex-provela-krupneyshee-ipo-v-istorii-privlekla-75-mlrd-i-sdelala-maska-pervim-trillionerom
#tabular

Эти идеи с синтетикой были понятны уже лет пять тому, просто не было лишних рук чтобы реализовать. Но работаю над этом сейчас в рамках проекта интеллектуального HP-тюнера. Рад, что ML сообщество наконец-то преодолело лень и занялось этим направлением, немцы из университета Фрайбурга - красавчики.


https://www.youtube.com/watch?v=MvEkj7TOmj8
Forwarded from partially unsupervised
История с закрытием доступа к Fable - повод тянуться за шампанским в офисах провайдеров открытых моделей. Каждый executive, который участвовал во внедрении AI в своей организации (т.е. просто каждый executive), резко задумался: "А что и кому они внезапно отключат в следующий раз?". Все страхи про вендорлок материализовались мгновенно, даже если конкретно в этой компании Fable и не начали использовать, да и не планировали.

И поэтому все мультивендорные альтернативы резко заиграли новыми красками. Во-первых, бигтехи, перепродающие много моделей под своей крышей (AWS Bedrock, Databricks Unity AI Gateway, Cursor в случае кодинг агентов). Но это полумера, все еще сильная зависимость от топовых лаб. Потому есть и во-вторых: выбрать что-то с open weights, как раз ключевые игроки в этой нише недавно выкатили свежие релизы (Minimax 3, Kimi 2.7, GLM 5.2). Сменить провайдера в таком сетапе совершенно не проблема.

Где-то тут еще витают страхи, что токены в обозримом будущем подорожают, чтобы отбивать венчурные сотни миллиардов, кодинг агенты по подписке снизят лимиты / перестанут быть доступны для корпораций. В общем, беспокойное время для менеджеров, хорошее время делать vendor-agnostic платформы.

Openrouter идеально подгадал по времени и выкатил fusion ендпоинт, из которого неспециалист достанет только один тейк - "микс из моделей попроще работает не хуже топовой модели". Воспитанные кагглом люди помнят, что ансамбли слабо скоррелированных моделей - универсальный молоток. Дьявол все еще в деталях, универсального способа блендить LLM пока не видно, хотя для частных случаев что-то придумать можно.


Именно для этих экспериментов я в свое время и сделал nitpicker - чтобы вайбчекать варианты бленда моделей, пытаясь получить близкое к tier-1 качество, используя tier-2 модели (впрочем, никто не мешает жечь и токены опуса/gpt).

Для тех, кому лень ставить незнакомый софт, сделал бесплатную веб-версию. Ограничения: одно ревью на всех в момент времени, работает только с публичными PR на гитхабе, те самые tier-2 модели, аптайм не гарантирован (хостится у меня под теликом).
#cloud

Казалось бы, кому эта Пинтерест нафиг нужна?

"Фотохостинг Pinterest объявил о значительном расширении сотрудничества с AWS, начавшемся в 2010 году. Согласно новому соглашению, Pinterest выплатит AWS в период до 2031 года $4 млрд за использование её сервисов, что является крупнейшим инфраструктурным проектом в истории Pinterest.

В рамках расширенного соглашения Pinterest планирует диверсифицировать использование инфраструктуры AWS для поддержки растущих потребностей в ИИ, одновременно улучшая соотношение цены и производительности. В частности, компания планирует использовать ускорители AWS Trainium для размещения и запуска больших языковых моделей и моделей визуального и языкового анализа, которые обеспечивают персонализированный визуальный поиск и поиск с помощью ИИ. Также Pinterest намерена расширить использование Arm-процессоров Graviton, которые уже обеспечивают работу примерно трети её вычислительной инфраструктуры, для запуска большего количества систем, поддерживающих поиск контента для пользователей фотохостинга, ежемесячная аудитория которого превышает 600 млн."

https://servernews.ru/1143542
#ml

Общая постановка задачи машинного обучения с метками, как это выглядело 20 лет назад. Есть интересные идеи, незаслуженно забытые сейчас.

Попробовал закодить 4 идеи (тесторы, MoE на tabular, алгебраический стэкинг, коррекция ансамблей слабых моделей), ни одна не взлетела на синтетике - лучше чем ничего, но хуже существующих альтернатив. Либо надо работать над этими идеями дольше и более вдумчиво.

https://www.youtube.com/watch?v=R3CMqrrIWOk&