Forwarded from Machinelearning
Андрей Карпаты опубликовал результаты экспериментов по оптимизации претрейна языковых моделей в условиях фиксированного бюджета.
Чтобы найти наиболее эффективный способ расходования вычислительных ресурсов, он провел серию тестов на сервере с 8х GPU H100, обучив 11 моделей разного размера при одинаковых затратах на вычисления.
Карпаты обнаружил, что по мере увеличения мощностей оптимальное количество параметров и тренировочных токенов растут синхронно. Эмпирическое правило для протестированных конфигураций: на 1 параметр модели должно приходиться примерно 8 токенов обучающей выборки.
Если модель слишком мала, она не усваивает достаточно информации; если слишком велика — бюджет заканчивается раньше, чем она успевает обучиться.
Для инженеров этот рецепт позволяет заранее планировать архитектуру и бюджет, избегая создания заведомо неэффективных моделей.
Традиционно, все эксперименты Андрея открыты и их можно повторить самостоятельно.
@ai_machinelearning_big_data
#AI #ML #LLM #Karpathy
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11⚡5👍4
ASUS ROG Strix 18 G834JY
Core i9-13980HX,
64Gb,
2Tb NVMe,
NVidia 4090rtx mobile 16Gb
Продан.
#железо
———
@tsingular
Core i9-13980HX,
64Gb,
2Tb NVMe,
NVidia 4090rtx mobile 16Gb
Продан.
#железо
———
@tsingular
🔥12
у GLM аттракцион невиданной щедрости.
годовая подписка - $28 :)
можно упрограммироваться :)
https://z.ai/subscribe
кстати, по рефералке еще 10% вам скинут, - можно за $25,92 взять
https://z.ai/subscribe?ic=GHAFTZRSA1
#GLM #dev
———
@tsingular
годовая подписка - $28 :)
можно упрограммироваться :)
https://z.ai/subscribe
кстати, по рефералке еще 10% вам скинут, - можно за $25,92 взять
https://z.ai/subscribe?ic=GHAFTZRSA1
#GLM #dev
———
@tsingular
❤14👍6🔥4😁2 2
Сразу говорю,- не нейрорендер.
На день рождения супруга подарила улей :)
И теперь у канала есть "киберпчелы" которые делают брендированный "кибермёд"
На вкус как настоящий :)
И вот его, в отличие от ноутбука, я таки планирую разыгрывать среди читателей канала.
Ибо меда обещают ежегодно много.
В комментах можно записываться.
Пишите "мёд", свяжусь в личку.
Предварительная дата сбора мёда, - 10 сентября 2026 года
Это не продажа. Баночки маленькие.
Чисто сувениры от канала.
#кибермёд
------
@tsingular
На день рождения супруга подарила улей :)
И теперь у канала есть "киберпчелы" которые делают брендированный "кибермёд"
На вкус как настоящий :)
И вот его, в отличие от ноутбука, я таки планирую разыгрывать среди читателей канала.
Ибо меда обещают ежегодно много.
В комментах можно записываться.
Пишите "мёд", свяжусь в личку.
Предварительная дата сбора мёда, - 10 сентября 2026 года
Это не продажа. Баночки маленькие.
Чисто сувениры от канала.
#кибермёд
------
@tsingular
1👍27🔥14❤🔥8🤣5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Matrix-3 от Matrix Robotics из Шанхая.
Пока промо, но внушительно.
#matrix #роботы #Китай
------
@tsingular
Пока промо, но внушительно.
#matrix #роботы #Китай
------
@tsingular
👏14👍8🔥7👾2
Kawasaki ускоряет разработку роботизированной лошади
Kawasaki сдвинул сроки с 2050 на 2035 и создал отдельную команду для разработки CORLEO — четырёхногого робота-лошади, на которой можно будет ездить.
Прототип обещают показать на Expo 2030 в Эр-Рияде, а к 2027 году выпустят симулятор для игровой индустрии.
Промо-видео демонстрирует впечатляющие прыжки через расщелины и передвижение по снегу, но как они это собираются выполнить технически, - пока загадка. Прыгнуть так, чтобы наездник не улетел в пропасть, - будет та ещё задачка.
Кавасаки обещает систему навигации SAFE ADVENTURE, которая будет определять погоду и диких животных через смартфон и позволит избежать инцидентов во время путешествий.
Что ж, посмотрим чего добьются за 9 лет.
За это время или с падишахом или с ишаком может произойти что угодно :)
Но в игрушку-симулятор к 2027 верю!
#Kawasaki #CORLEO #роботы
———
@tsingular
Kawasaki сдвинул сроки с 2050 на 2035 и создал отдельную команду для разработки CORLEO — четырёхногого робота-лошади, на которой можно будет ездить.
Прототип обещают показать на Expo 2030 в Эр-Рияде, а к 2027 году выпустят симулятор для игровой индустрии.
Промо-видео демонстрирует впечатляющие прыжки через расщелины и передвижение по снегу, но как они это собираются выполнить технически, - пока загадка. Прыгнуть так, чтобы наездник не улетел в пропасть, - будет та ещё задачка.
Кавасаки обещает систему навигации SAFE ADVENTURE, которая будет определять погоду и диких животных через смартфон и позволит избежать инцидентов во время путешествий.
Что ж, посмотрим чего добьются за 9 лет.
За это время или с падишахом или с ишаком может произойти что угодно :)
Но в игрушку-симулятор к 2027 верю!
#Kawasaki #CORLEO #роботы
———
@tsingular
🔥35🤣11❤5✍3⚡2👍1👾1
Рекордный снегопад надвигается на Москву.
Старожилы последний раз помнят такой снегопадвчера .
#юмор
------
@tsingular
Старожилы последний раз помнят такой снегопад
#юмор
------
@tsingular
😁58 6🔥3❤2😢1
Пианининг и роялинг развивают моторинг :)
Что там робот должен уметь, чтобы доказать, что он лучше человека?
Распознать буковки или помыть посуду или сыграть симфонию?
Мы то с вами знаем,- убрать снег во дворе, но всё же.
#роботы #CES2026
------
@tsingular
Что там робот должен уметь, чтобы доказать, что он лучше человека?
Распознать буковки или помыть посуду или сыграть симфонию?
Мы то с вами знаем,- убрать снег во дворе, но всё же.
#роботы #CES2026
------
@tsingular
🔥19❤3⚡3👍1👾1
Media is too big
VIEW IN TELEGRAM
Мысль такая вчера пришла, как пример, - появление ИИ можно пропараллелить с машинкой для стрижки, по простому.
Типа лишила ли она парикмахеров работы? Можно ли без неё обойтись? Хороший парикмахер может ли с ней сделать шедевральную стрижку? А плохой? Но если плохим раздать машинки, сколько обычных людей будут подстрижены аккуратнее и т.д.
#машинка #обучение
———
@tsingular
Типа лишила ли она парикмахеров работы? Можно ли без неё обойтись? Хороший парикмахер может ли с ней сделать шедевральную стрижку? А плохой? Но если плохим раздать машинки, сколько обычных людей будут подстрижены аккуратнее и т.д.
#машинка #обучение
———
@tsingular
👍16⚡6💯6✍2❤1
Forwarded from Data Secrets
На этой неделе GPT-5.2 Pro решила уже две открытые математические задачи, которые люди не могли решить на протяжении многих лет
Речь снова пойдет про список Эрдеша. И тут сразу оговорка для тех, кто помнит октябрьскую историю (GPT-5 просто откопала ответ на задачку в старых статьях, а в OpenAI заявили, что она «нашла решение»): на этот раз все честно, автономность решения в обоих случаях подтвердил сам Теренс Тао.
Итак:
1. Первая задачка – под номером 728. Ее отдал GPT-5.2 сам Теренс. Прикол с этой задачкой в том, что исходная формулировка Эрдеша была неверной, и корректная постановка была получена только несколько месяцев назад, так что предшествующей литературы по ней вообще не было.
Обратите внимание на последнее предложение: это не умаляет результат, НО модель все еще воспроизводит известные доказательства, а не придумывает что-то нечеловеческое.
2. Вторая – № 397. Ее засабмитил Нил Сомани, а проверил Теренс.
Речь снова пойдет про список Эрдеша. И тут сразу оговорка для тех, кто помнит октябрьскую историю (GPT-5 просто откопала ответ на задачку в старых статьях, а в OpenAI заявили, что она «нашла решение»): на этот раз все честно, автономность решения в обоих случаях подтвердил сам Теренс Тао.
Итак:
1. Первая задачка – под номером 728. Ее отдал GPT-5.2 сам Теренс. Прикол с этой задачкой в том, что исходная формулировка Эрдеша была неверной, и корректная постановка была получена только несколько месяцев назад, так что предшествующей литературы по ней вообще не было.
Задача была решена более или менее автономно (после получения обратной связи по результатам первоначальной попытки), и результат (насколько нам известно) не был воспроизведен в литературе (хотя были найдены результаты, доказанные аналогичными методами).
Обратите внимание на последнее предложение: это не умаляет результат, НО модель все еще воспроизводит известные доказательства, а не придумывает что-то нечеловеческое.
2. Вторая – № 397. Ее засабмитил Нил Сомани, а проверил Теренс.
Доказательство было сгенерировано GPT 5.2 Pro и оформлено с помощью Harmonic.
Много открытых проблем просто сидят и ждут, когда кто-нибудь предложит ChatGPT решить их.
⚡14🔥13❤7🤣1
Держите иллюстрацию для презентаций :)
работа ИИ очень похожа на переворачиваемые картины из песка.
Рандом+гравитация+сопротивление воды.
А промпт лишь придаёт этому хаосу чуть больше смысла.
#промпт #иллюстрация #песок #картины #обучение
———
@tsingular
работа ИИ очень похожа на переворачиваемые картины из песка.
Рандом+гравитация+сопротивление воды.
А промпт лишь придаёт этому хаосу чуть больше смысла.
#промпт #иллюстрация #песок #картины #обучение
———
@tsingular
🔥9⚡7✍4❤1
Никто не ходит на сайты в 2026м. Все обращаются к ИИ агентам.
Надо чтобы на каждом сайте, как раньше это произошло с rss, появился mcp.
Что то типа:
www.sitename .com/aaa/bbb?mcp=1
И каждая страница что бы могла быть вызываема агентами.
Переписывайте CMS :)
#мысли #MCP #RSS
------
@tsingular
Надо чтобы на каждом сайте, как раньше это произошло с rss, появился mcp.
Что то типа:
www.sitename .com/aaa/bbb?mcp=1
И каждая страница что бы могла быть вызываема агентами.
Переписывайте CMS :)
#мысли #MCP #RSS
------
@tsingular
✍19💯7🤔5😁3⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Cowork: Claude для не-разработчиков
Anthropic запустил Cowork — упрощённую версию Claude Code для обычных задач. Даёшь доступ к папке, Claude читает, правит и создаёт файлы: сортирует загрузки, собирает таблицы из скриншотов, пишет черновики из заметок.
Работает автономно — ставишь задачи в очередь, он их параллельно выполняет. Можно подключить коннекторы и Chrome для браузерных операций.
Безопасность: доступ только к выбранным папкам, запрос перед важными действиями. Но Claude может удалять файлы по инструкции, а prompt injection (~1% успешных атак по данным Anthropic) остаётся риском — особенно при связке браузер + локальные файлы + коннекторы.
Доступно сейчас для Claude Max подписчиков на macOS как research preview. Windows и синхронизация — в планах.
#Cowork #Anthropic #Agents
------
@tsingular
Anthropic запустил Cowork — упрощённую версию Claude Code для обычных задач. Даёшь доступ к папке, Claude читает, правит и создаёт файлы: сортирует загрузки, собирает таблицы из скриншотов, пишет черновики из заметок.
Работает автономно — ставишь задачи в очередь, он их параллельно выполняет. Можно подключить коннекторы и Chrome для браузерных операций.
Безопасность: доступ только к выбранным папкам, запрос перед важными действиями. Но Claude может удалять файлы по инструкции, а prompt injection (~1% успешных атак по данным Anthropic) остаётся риском — особенно при связке браузер + локальные файлы + коннекторы.
Доступно сейчас для Claude Max подписчиков на macOS как research preview. Windows и синхронизация — в планах.
#Cowork #Anthropic #Agents
------
@tsingular
⚡5✍4 3❤2
AI-Researcher: автономный научный конвейер
HKUDS продолжают отжигать!
Команда из University of Hong Kong выпустила AI-Researcher — систему полной автоматизации исследований от идеи до публикации.
Принимает либо детальное описание задачи, либо просто список статей, - сам генерит идею, реализует алгоритм, проводит эксперименты и пишет полноценную научную работу.
Архитектура:
- Resource Collector — собирает статьи с arXiv, код с GitHub, датасеты
- Idea Generator — формулирует новые направления на основе анализа ограничений текущих методов
- Design→Implementation→Validation→Refinement — цикл разработки с автоматическим тестированием
- Writer Agent — генерирует итоговую красивую статью в PDF
Поддерживает Claude, OpenAI, DeepSeek через единый API.
Запуск через Docker или веб-интерфейс на Gradio.
#Researcher #исследователь #HKUDS #Китай #OSS
———
@tsingular
HKUDS продолжают отжигать!
Команда из University of Hong Kong выпустила AI-Researcher — систему полной автоматизации исследований от идеи до публикации.
Принимает либо детальное описание задачи, либо просто список статей, - сам генерит идею, реализует алгоритм, проводит эксперименты и пишет полноценную научную работу.
Архитектура:
- Resource Collector — собирает статьи с arXiv, код с GitHub, датасеты
- Idea Generator — формулирует новые направления на основе анализа ограничений текущих методов
- Design→Implementation→Validation→Refinement — цикл разработки с автоматическим тестированием
- Writer Agent — генерирует итоговую красивую статью в PDF
Поддерживает Claude, OpenAI, DeepSeek через единый API.
Запуск через Docker или веб-интерфейс на Gradio.
#Researcher #исследователь #HKUDS #Китай #OSS
———
@tsingular
🔥18👍3⚡2