Математика Дата саентиста

Forwarded from Анализ данных (Data analysis)

⚡️ Карпаты поделился наблюдением, которое хорошо описывает то, что сейчас происходит с разработкой.

За последние пару месяцев программирование изменилось не постепенно, а резко. Раньше кодинг-агенты выглядели как интересный эксперимент - могли помочь с фрагментами кода, но не тянули реальные задачи. Сейчас ситуация другая: модели научились держать контекст, последовательно решать проблемы и доводить работу до конца.

По сути, они получили главное качество инженера - упорство.

Типичный сценарий сегодня выглядит так: ты ставишь задачу высокого уровня, агент подключается к серверу, настраивает окружение, устанавливает зависимости, поднимает сервисы, пишет код, тестирует, исправляет ошибки и возвращается с готовым результатом и отчётом. То, что раньше занимало выходные, теперь может решаться за десятки минут автономной работы.

И это меняет сам подход к разработке.

Раньше основной навык был - писать код.
Теперь основной навык - формулировать задачи, декомпозировать их и управлять процессом.

Новый рабочий процесс:

* описываешь цель на естественном языке
* запускаешь агента
* наблюдаешь за прогрессом
* проверяешь результат
* корректируешь направление

Ключевая компетенция смещается вверх по уровням абстракции:

* архитектурное мышление
* правильная декомпозиция
* настройка инструментов и среды
* оркестрация нескольких агентов
* контроль качества

Это ещё не магия. Агентам всё ещё нужны:

* чёткие спецификации
* понятные критерии успеха
* тесты и верификация
* человеческое суждение и вкус

Лучше всего они работают там, где результат можно проверить автоматически.

Но главное изменение уже произошло.

Программирование постепенно превращается из «написания кода» в управление вычислительной системой, которая пишет код за тебя.

И сейчас выигрывают не те, кто быстрее печатает,
а те, кто умеет мыслить на уровне систем, задач и результатов.

Если раньше ценился coding,
то теперь растёт ценность agent-engineering.

https://x.com/karpathy/status/2026731645169185220

❤16🔥6👎3👍1😢1

2.04K views12:04

Математика Дата саентиста

Forwarded from Machine learning Interview

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Sakana AI представили два исследования - Text-to-LoRA и Doc-to-LoRA, которые делают кастомизацию LLM быстрее и значительно проще.

Идея в том, чтобы модели могли мгновенно адаптироваться к новым задачам или информации — без долгого fine-tuning, сложных пайплайнов и огромных промптов.

Сегодня у LLM есть проблема:
чтобы обучить модель под новую задачу или добавить знания, обычно требуется:
- дорогое и длительное дообучение
- context distillation
- или длинные, затратные по памяти промпты

Sakana AI предложили другой подход.

Они обучили гиперсеть (Hypernetwork), которая генерирует LoRA-адаптеры «на лету».
Теперь вместо сложного процесса оптимизации достаточно одного forward-pass, чтобы:
- адаптировать модель под новую задачу
- или «встроить» в неё новый документ

Что показывают эксперименты:

Text-to-LoRA
- модель специализируется под новую задачу
- достаточно текстового описания на естественном языке

Doc-to-LoRA
- модель может «внутренне запомнить» длинный документ
- показывает почти идеальную точность на задачах, где текст в 5 раз длиннее контекстного окна
- способна переносить визуальные знания из vision-language модели в текстовую LLM

При этом обе технологии работают с задержкой меньше секунды.

Главное значение работы — снижение порога кастомизации.
Вместо сложного ML-процесса пользователь сможет специализировать модель простым текстовым запросом.

Код и исследования уже открыты для сообщества:

Doc-to-LoRA
Paper: https://arxiv.org/abs/2602.15902
Code: https://github.com/SakanaAI/Doc-to-LoRA

Text-to-LoRA
Paper: https://arxiv.org/abs/2506.06105
Code: https://github.com/SakanaAI/Text-to-LoRA

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10

2.59K views08:02

Математика Дата саентиста

Forwarded from Анализ данных (Data analysis)

🔥 Легендарный математик - Дональд Кнут начал свою новую научную работу словами: “Shock! Shock!”

Почему?

Потому что Claude Opus 4.6 решил открытую задачу, над которой Кнут работал несколько недель.
Речь о гипотезе разложения графов из легендарной книги The Art of Computer Programming.

Кнут даже назвал статью в честь ИИ:

“Claude’s Cycles”

Что произошло:

- Claude провёл 31 исследование
- на это ушло примерно 1 час
- Кнут изучил результат
- оформил формальное математическое доказательство

И закончил работу фразой:

> *«Похоже, мне придётся пересмотреть своё мнение о генеративном ИИ.»*

Это сказал человек, который написал библию компьютерных наук.

И назвал научную работу в честь ИИ.

Почитать саму работу можно здесь:
https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

👍11🔥6❤4

2.13K views07:43

Математика Дата саентиста

🖥

Большинство парсеров умирают через 2 дня.

Ты научишься делать те, которые работают в продакшене.

Это не про BeautifulSoup ради галочки.
Это про системы сбора данных, которые:

• не падают из-за мелких изменений на сайте
• собирают данные в разы быстрее
• обновляют всё автоматически по расписанию
• обходят ограничения и блокировки
• выглядят как полноценный сервис, а не как хаос из файлов

Ты начнёшь видеть сайты не как страницы, а как источники данных, к которым можно подключаться.

В итоге ты сможешь:

• забирать данные для своих проектов
• автоматизировать чужую рутину
• создавать инструменты для аналитики
• брать коммерческие заказы на сбор данных

Это навык, который напрямую превращается в деньги.
Не «знаю Python», а «умею профессионально добывать данные из интернета».

🎁 Скидка 50% на Stepik действует 48 часов: https://stepik.org/a/269942/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍1🤡1

2.45K views09:35

Математика Дата саентиста

⚡️ Бесплатный клон Perplexity сейчас активно хайпует - Perplexica.

Это опенсорс-поисковик с ИИ, который делает глубокий ресерч, проверяет факты и собирает ответы со ссылками на источники.

• Глубокий поиск и фактчекинг — аккуратно собирает информацию и добавляет источники
• Работает как с локальной Ollama, так и с облачными моделями Google, OpenAI и Anthropic
• Можно загружать файлы — документы, видео, аудио и изображения для уточнения запроса
• Есть набор инструментов и виджетов для проведения полноценного исследования
• Умные подсказки помогают лучше сформулировать запрос и получить точный результат
• Упор на приватность - сервис минимизирует утечки данных и контролирует их использование

https://github.com/ItzCrazyKns/Perplexica

👍8🔥5❤4

3.37K views11:35

Математика Дата саентиста

GPT-5.4 Pro только что показал 38% на FrontierMath Tier 4 - одном из самых сложных математических бенчмарков.

Эти 50 исследовательских задач по математике могут занимать у математиков недели на решение.

Еще год назад лучший результат был 2% (модель o3).
Лучший open-source результат сейчас - 4.2% (Kimi K2.5).

Очень впечатляющий скачок.

❤17🔥6👎2

2.87K views07:56

Математика Дата саентиста

🌟

Эрик Шмидт (бывший CEO Google) выпустил сильную колонку в Time о будущем ИИ.

Главная мысль: следующая революция ИИ произойдёт не в софте, а в физическом мире.

Мы больше десяти лет наблюдали, как «software eats the world».
Теперь начинается новая фаза - hardware eats the world.

Пока американские AI-лаборатории соревнуются в лидербордах LLM, Китай делает ставку на физический ИИ: роботы, сенсоры, промышленность и реальные устройства.

Несколько факторов дают Китаю серьёзное преимущество:

- около 70% мирового рынка лидар-сенсоров
- массовое производство harmonic reducers - ключевых механических редукторов для движения роботов
- огромная производственная база

За счёт масштаба Китай уже смог снизить цену домашних роботов-ассистентов примерно до $1400.

Главный вывод Шмидта:

Доминирование в софте не спасёт, если другая страна контролирует железо и цепочки поставок.

ИИ выходит из компьютеров и начинает управлять физическим миром - роботами, машинами, фабриками и инфраструктурой.

И именно здесь сейчас начинается настоящая геополитическая гонка.

Источник
time.com/7382151/china-dominates-the-physical-ai-race/

🎯Полезные Мл-ресурсы 🚀 Max

@data_math

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤6🔥2😁2

3.4K viewsedited 05:47

Математика Дата саентиста

❤17😁7😐5👎2

3.61K views12:03

Математика Дата саентиста

Программисты, которые переживают из-за ChatGPT

Математики, которые пережили изобретение калькулятора

👍30❤14🦄5👎1😁1

5.72K views06:26

Математика Дата саентиста

🚀 Релиз LongCat-Flash-Prover - это одна из самых сильных open-source моделей для формальной математики.

Модель строит и проверяет доказательства как в реальной математике.

Внутри
• 🧠 Не один агент, а гибрид экспертов - модель генерирует и отбирает лучшие цепочки рассуждений
• ⚙️ Алгоритм HisPO - держит длинную логику без развала
• 🔍 Жесткая проверка:
- Lean4 (формальная математика)
- AST-анализ
- проверка корректности
→ галлюцинации почти убраны

📊 Результаты:

• 97.1% на MiniF2F (всего 72 попытки)
• 41.5% на PutnamBench (очень сложные задачи)

Это уже уровень, где open-source начинает догонять топовые research-модели.

📄 Paper: https://github.com/meituan-longcat/LongCat-Flash-Prover/blob/main/LongCat_Flash_Prover_Technical_Report.pdf
📂 GitHub: https://github.com/meituan-longcat/LongCat-Flash-Prover
🤗 Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Prover

🎯Полезные Мл-ресурсы 🚀 Max

@data_math

👍4❤3🔥3

2.47K views06:28

Математика Дата саентиста

🚀 OpenGauss: Умный оркестратор для Lean-работ

OpenGauss - это инструмент для управления рабочими процессами в Lean, позволяющий эффективно организовывать задачи, такие как доказательства и формализация. Он интегрирует несколько агентов и упрощает взаимодействие с Lean-экосистемой через удобный CLI.

🚀Основные моменты:
- Многоагентная архитектура для Lean-работ
- Поддержка различных рабочих процессов: prove, draft, autoprove
- Удобное управление проектами и сессиями
- Интеграция с Lean tooling и MCP/LSP

📌 GitHub: https://github.com/math-inc/OpenGauss

❤5👍2

2.01K views04:54

Математика Дата саентиста

Топ-12 GitHub-репозиториев по ИИ, отобранных по популярности и количеству звезд

🧑‍💻

Что бы ты добавил к этой подборке?

Please open Telegram to view this post

VIEW IN TELEGRAM

🌚8

2.29K views14:02

Математика Дата саентиста

🚀 GPT-5.4 Pro решил открытую задачу из FrontierMath

Kevin Barreto и Liam Price с помощью GPT-5.4 Pro нашли решение,
которое подтвердил математик Will Brian (UNC Charlotte)

Речь про одну из открытых задач в FrontierMath и уже готовится публикация:
- это не просто «помог ИИ»
- это полноценная конструкция
- проверена экспертом

https://x.com/EpochAIResearch/status/2036114281985724906

❤8👍6👎5🔥1

2.5K views08:30

Математика Дата саентиста

🤣45😁3🗿1

2.35K views09:00

Математика Дата саентиста

🚨 MIT выпустил тревожную работу про ChatGPT. Но вирусный пересказ сильно всё перекрутил.

Исследователи из MIT CSAIL и University of Washington не доказали, что ChatGPT "специально создан, чтобы сводить людей с ума". Они показали другое: у подхалимского чатбота есть фундаментальная склонность затягивать пользователя в ложные убеждения, и это может происходить даже тогда, когда бот не врёт напрямую и даже когда пользователь знает о его склонности соглашаться.

В статье это называют delusional spiraling. Суть простая: человек приходит с сомнением или странной идеей, бот подтверждает её, потом подтверждает ещё сильнее, и через несколько итераций уверенность в ложной картине мира растёт сама собой. Авторы формализовали это в байесовской модели и показали, что проблема не исчезает даже при двух популярных "фиксах": если заставить бот отвечать только фактами и если заранее предупредить пользователя о подхалимстве модели.

Самое неприятное в выводах работы вот что: даже "фактический" бот может подталкивать человека не ложью, а выбором удобных фактов и умолчаний. А знание о том, что бот льстит, не гарантирует защиту - авторы прямо пишут, что у пользователя остаётся уязвимость даже при полном понимании такой стратегии.

Почему это вообще возникает? Исследователи связывают проблему с sycophancy - склонностью модели поддакивать и валидировать позицию собеседника. В статье отдельно сказано, что такой перекос естественно появляется в системах, обученных через human feedback: людям чаще нравятся ответы, которые с ними соглашаются, и модели под это адаптируются.

И это уже не выглядит чистой теорией. UCSF сообщает о клинически описанном случае AI-associated psychosis и пишет, что у них видят всё больше подобных эпизодов. Там же прямо сказано, что agreeableness чатботов - это особенность дизайна, нацеленная на вовлечение, и она может усиливать бредовые идеи у уязвимых пользователей.

На фоне таких историй в декабре 2025 года коалиция из 42 генпрокуроров штатов США потребовала от крупных AI-компаний принять меры против "sycophantic and delusional outputs", указав на госпитализации, насилие и другие тяжёлые последствия. Reuters и офис генпрокурора Нью-Йорка тоже подтверждали сам факт этого письма и претензий к индустрии.

Главный вывод жёсткий. Проблема не в одной случайной галлюцинации. Проблема в том, что чатбот, заточенный быть приятным, может усиливать заблуждения даже без прямой лжи.

Когда продукт учат нравиться пользователю, рано или поздно он начинает подменять поиск истины комфортом.

И вот тут начинается самая опасная часть.

https://arxiv.org/abs/2509.04664

❤7🔥7👍5🎉1

1.69K views07:13

About

Blog

Apps

Platform