⚡️ GPT-4.5 ТУТ — OpenAI только что анонсировали новую модель.
Она в РАЗЫ лучше конкурентов по понимаю промтов, почти не выдумывает инфу и самое главное — куда креативнее. Суперского буста в программировании ждать не стоит — o1 и o3 пока делают это лучше.
Начинают раскатывать уже сегодня, пока для подписчиков и по API.
Она в РАЗЫ лучше конкурентов по понимаю промтов, почти не выдумывает инфу и самое главное — куда креативнее. Суперского буста в программировании ждать не стоит — o1 и o3 пока делают это лучше.
Начинают раскатывать уже сегодня, пока для подписчиков и по API.
Openai
Introducing GPT-4.5
We’re releasing a research preview of GPT‑4.5—our largest and best model for chat yet. GPT‑4.5 is a step forward in scaling up pre-training and post-training.
🥱1
ИИ открыл новый способ считать. Но вы всё равно продолжите пользоваться калькулятором
ИИ должен упростить нашу жизнь, да? Ну так вот, вместо того, чтобы просто запомнить, что 2+2=4, GPT-J делает что-то похожее на тригонометрический ритуал. Он кодирует числа на многомерной спирали, раскладывает в базис косинусов, а сложение выполняет через преобразования, которые нормальный человек даже на экзамене по линалу не вспомнит.
Исследователи попытались разобраться, как LLM складывают числа, и обнаружили, что модели вроде GPT-J-6B кодируют и обнаружили метод, который назвали Clock algorithm, потому что сложение выполняется как сложение углов: через cos(a), cos(b) → cos(a+b) и напоминает сложение углов на циферблате.
Векторные представления чисел исследовали через остаточный поток модели, прогоняя GPT-J-6B на всех числах из диапазона [0,360]. Спектральный анализ показал, что представление разрежено в пространстве Фурье, а главная компонента PCA оказалась линейной. А что у нас такое периодическое и линейное? Спираль!🌀
x = r cos t
y = r sin t
y = c t
Проверили это гипотезу, подбирая параметры спирали для представления каждого числа. Оказалось, что токены, представляющие суммы (a+b), хорошо описываются этой же основой, что говорит о реальном использовании модели такого механизма.
🛠 Как проверить, что модель действительно так считает?
✔️ Intervention patching: заменили активации слоёв модели на вычисленные вручную спиральные представления и обнаружили, что это почти так же хорошо, как полная подмена слоя! Значит, модель действительно использует эту структуру.
✔️ Разделение ролей между слоями: слои MLP 14-18 формируют спиральное представление (a+b), а слои 19-27 считывают его и поднимают соответствующий токен в логитах.
✔️ Разбор нейронов: используя атрибуционные техники, исследователи выяснили, что активации нейронов MLP тоже следуют периодическим паттернам, что дополнительно подтверждает гипотезу о геликоидальном (спиральном) сложении.
Почему это важно?
Оказывается, вместо того, чтобы просто запоминать суммы, модель самостоятельно выучивает сложную, но универсальную алгоритмическую структуру! Этот же метод ранее встречался в исследованиях модульного сложения в трансформерах, который раньше описывал Neel Nanda. LLM не просто таблицы с вероятностями, а какие-то самоорганизующиеся вычислительные системы.
В любом случае, может, машинное обучение и не всегда дает интуитивно понятные решения, но точно умеет находить красивые и неожиданные пути.
🔗 Источники:
📜 arxiv
📝 Блог
💻 Код
#articles #models
ИИ должен упростить нашу жизнь, да? Ну так вот, вместо того, чтобы просто запомнить, что 2+2=4, GPT-J делает что-то похожее на тригонометрический ритуал. Он кодирует числа на многомерной спирали, раскладывает в базис косинусов, а сложение выполняет через преобразования, которые нормальный человек даже на экзамене по линалу не вспомнит.
Исследователи попытались разобраться, как LLM складывают числа, и обнаружили, что модели вроде GPT-J-6B кодируют и обнаружили метод, который назвали Clock algorithm, потому что сложение выполняется как сложение углов: через cos(a), cos(b) → cos(a+b) и напоминает сложение углов на циферблате.
Векторные представления чисел исследовали через остаточный поток модели, прогоняя GPT-J-6B на всех числах из диапазона [0,360]. Спектральный анализ показал, что представление разрежено в пространстве Фурье, а главная компонента PCA оказалась линейной. А что у нас такое периодическое и линейное? Спираль!🌀
x = r cos t
y = r sin t
y = c t
Проверили это гипотезу, подбирая параметры спирали для представления каждого числа. Оказалось, что токены, представляющие суммы (a+b), хорошо описываются этой же основой, что говорит о реальном использовании модели такого механизма.
🛠 Как проверить, что модель действительно так считает?
✔️ Intervention patching: заменили активации слоёв модели на вычисленные вручную спиральные представления и обнаружили, что это почти так же хорошо, как полная подмена слоя! Значит, модель действительно использует эту структуру.
✔️ Разделение ролей между слоями: слои MLP 14-18 формируют спиральное представление (a+b), а слои 19-27 считывают его и поднимают соответствующий токен в логитах.
✔️ Разбор нейронов: используя атрибуционные техники, исследователи выяснили, что активации нейронов MLP тоже следуют периодическим паттернам, что дополнительно подтверждает гипотезу о геликоидальном (спиральном) сложении.
Почему это важно?
Оказывается, вместо того, чтобы просто запоминать суммы, модель самостоятельно выучивает сложную, но универсальную алгоритмическую структуру! Этот же метод ранее встречался в исследованиях модульного сложения в трансформерах, который раньше описывал Neel Nanda. LLM не просто таблицы с вероятностями, а какие-то самоорганизующиеся вычислительные системы.
В любом случае, может, машинное обучение и не всегда дает интуитивно понятные решения, но точно умеет находить красивые и неожиданные пути.
🔗 Источники:
📜 arxiv
📝 Блог
💻 Код
#articles #models
arXiv.org
Language Models Use Trigonometry to Do Addition
Mathematical reasoning is an increasingly important indicator of large language model (LLM) capabilities, yet we lack understanding of how LLMs process even simple mathematical tasks. To address...
🔥1
https://github.com/DenoiseLAB/HSE_Assistant_Hack - запушил наше решение по HSE Assistant Hack. Очень долго мы там тюнили все, прям реально долго подбирали гиперпараметы и по итогу взяли первые места на лидерборде как на привате так и на паблике.
GitHub
GitHub - DenoiseLAB/HSE_Assistant_Hack: Решение по HSE assistantHack
Решение по HSE assistantHack. Contribute to DenoiseLAB/HSE_Assistant_Hack development by creating an account on GitHub.
https://github.com/DenoiseLAB?tab=repositories - периодически сюда пушу, неплохие решения которые были за практику.
#coding
#coding
GitHub
DenoiseLAB - Repositories
DenoiseLAB has 14 repositories available. Follow their code on GitHub.
DenoiseLAB pinned «https://github.com/DenoiseLAB?tab=repositories - периодически сюда пушу, неплохие решения которые были за практику. #coding»
This media is not supported in your browser
VIEW IN TELEGRAM
«Бегущий по лезвию 2049»: китайская компания BYD совместно с DJI начала продавать систему запуска дронов с крыши для всех своих авто
По задумке, коптер будет снимать пейзажи и красивые пролеты рядом с тачкой, а также помогать ориентироваться на бездорожье.
Он взлетает по нажатию одной кнопки и автоматически возвращается на место.
#technology
По задумке, коптер будет снимать пейзажи и красивые пролеты рядом с тачкой, а также помогать ориентироваться на бездорожье.
Он взлетает по нажатию одной кнопки и автоматически возвращается на место.
#technology
https://github.com/natasha/slovnet - если вы вдруг ищите NLP на русском, всякие тулзы и корпуса слов, мимо этого вы не пройдете.
GitHub
GitHub - natasha/slovnet: Deep Learning based NLP modeling for Russian language
Deep Learning based NLP modeling for Russian language - natasha/slovnet
Режиссёр-самоучка сделал в бесплатной программе мульт, который нагнул Disney, забрал «Оскар» и превратил чёрного кота в национального героя — рассказываем историю оглушительного успеха «Потока».
Гинтс Зильбалодис с детства мечтал сделать крутой мульт — родители привили любовь к рисованию, оставалось только заставить картинки двигаться. В Латвии нет вышки для аниматоров, поэтому Гинтс вооружился гайдами на Ютубе и засел изучать Blender.
Анимация диалогов получалась у парня хуже всего, поэтому он твёрдо решил — хорошая история обойдётся и без них. На сценарий без единой реплики у Гинтса и его друга ушло больше 3 лет.
Сюжет получился прост: в постапокалиптическом будущем котик выживает в мире, в котором нет людей. Он нашел убежище на лодке вместе с другими животными, однако ужиться с ними оказывается ещё сложнее, чем преодолеть свой страх воды.
Одна из главных фишек мульта — реалистичные движения персонажей. Зильбалодис и его команда просмотрели тысячи мемных видео с котиками и другими животными, параллельно посещая зоопарк. Там нашли и «актёров» — для мульта записывали звуки реальных животных.
Всё испортила капибара: её уговаривали, кормили, щекотали, а в ответ услышали лишь писк, который бил по ушам. В итоге капибару «озвучил» верблюд.
На амбициозного режиссёра с бюджетом в два дошика обратило внимания правительство — фонды Латвии, Франции и Бельгии выделили в сумме 3,5 миллиона евро. Для сравнения масштабов — у «Головоломки 2» от Disney бюджет свыше 200 млн долларов.
Инвестиции отбились — картина стала настоящим хитом, собрала 20 миллионов долларов, забрала «Оскар» за лучший мульт, а сам Гинтс радостно делится в Твиттере историями разработки.
Чёрный кот же стал героем в Латвии — хвостатому поставили статую в Риге, уличные художники рисуют арты с ним, а дата получения «Оскара» стала национальным праздником.
@exploitex
Гинтс Зильбалодис с детства мечтал сделать крутой мульт — родители привили любовь к рисованию, оставалось только заставить картинки двигаться. В Латвии нет вышки для аниматоров, поэтому Гинтс вооружился гайдами на Ютубе и засел изучать Blender.
Анимация диалогов получалась у парня хуже всего, поэтому он твёрдо решил — хорошая история обойдётся и без них. На сценарий без единой реплики у Гинтса и его друга ушло больше 3 лет.
Сюжет получился прост: в постапокалиптическом будущем котик выживает в мире, в котором нет людей. Он нашел убежище на лодке вместе с другими животными, однако ужиться с ними оказывается ещё сложнее, чем преодолеть свой страх воды.
Одна из главных фишек мульта — реалистичные движения персонажей. Зильбалодис и его команда просмотрели тысячи мемных видео с котиками и другими животными, параллельно посещая зоопарк. Там нашли и «актёров» — для мульта записывали звуки реальных животных.
Всё испортила капибара: её уговаривали, кормили, щекотали, а в ответ услышали лишь писк, который бил по ушам. В итоге капибару «озвучил» верблюд.
На амбициозного режиссёра с бюджетом в два дошика обратило внимания правительство — фонды Латвии, Франции и Бельгии выделили в сумме 3,5 миллиона евро. Для сравнения масштабов — у «Головоломки 2» от Disney бюджет свыше 200 млн долларов.
Инвестиции отбились — картина стала настоящим хитом, собрала 20 миллионов долларов, забрала «Оскар» за лучший мульт, а сам Гинтс радостно делится в Твиттере историями разработки.
Чёрный кот же стал героем в Латвии — хвостатому поставили статую в Риге, уличные художники рисуют арты с ним, а дата получения «Оскара» стала национальным праздником.
@exploitex
Настоящее Время
Латвия получила первый в своей истории "Оскар" за мультфильм "Поток"
Мультфильм "Поток" (в оригинале – Straume, в международном прокате – Flow) латвийского режиссера Гинтса Зилбалодиса получил премию "Оскар" в номинации "Лучший анимационный фильм". Впервые в истории работа латвийского производства удостоилась самой престижной…
Китайцы снова нагнули OpenAI — стартап Manus выпустили ИИ-агента общего назначения. Это значит, что он может ВСЁ.
OpenAI Operator + Deep Research = Manus, но ЛУЧШЕ. Нейросеть может и компьютером пользоваться, и собрать инфу для научного исследования.
— Нейронка смогла сделать глубокий анализ акций Tesla и дать прогноз (!) на будущее.
— На первом видео Manus регистрирует и начинает активно вести 50 (!!) аккаунтов в Твиттере одновременно.
— Manus смог просчитать оптимальную орбиту для космического аппарата, летящего на Марс, с поправкой на текущее (!!!) положение планет.
Попробовать крышесносный ИИ можно самостоятельно — оставляем заявку здесь.
OpenAI Operator + Deep Research = Manus, но ЛУЧШЕ. Нейросеть может и компьютером пользоваться, и собрать инфу для научного исследования.
— Нейронка смогла сделать глубокий анализ акций Tesla и дать прогноз (!) на будущее.
— На первом видео Manus регистрирует и начинает активно вести 50 (!!) аккаунтов в Твиттере одновременно.
— Manus смог просчитать оптимальную орбиту для космического аппарата, летящего на Марс, с поправкой на текущее (!!!) положение планет.
Попробовать крышесносный ИИ можно самостоятельно — оставляем заявку здесь.
manus.im
Manus: Hands On AI
Manus is the action engine that goes beyond answers to execute tasks, automate workflows, and extend your human reach.
🇺🇸 В США началась тотальная слежка за гражданами с помощью ИИ
Правозащитники в США бьют тревогу: системы на основе искусственного интеллекта (ИИ) активно используются полицией и частными корпорациями для слежки за гражданами. Они собирают гигабайты данных о передвижении людей, что вызывает опасения о нарушении прав на конфиденциальность.
Один из примеров использования таких систем - случай с американцем Дэвидом Зайасом. Искусственный интеллект, анализируя базу данных из более чем полутора миллиарда записей номерных знаков, определил, что автомобиль Зайаса совершал поездку, типичную для наркоторговца. В результате, после остановки и обыска автомобиля, у Зайаса были обнаружены наркотики, оружие и большая сумма наличных.
Система слежения за номерными знаками, которую использовала полиция, была создана частной компанией Rekor, специализирующейся на искусственном интеллекте. Эта технология уже продана по меньшей мере 23 полицейским управлениям и местным органам власти по всей Америке.
Правозащитники выражают опасения, что подобные технологии нарушают базовые права американцев, грубо нарушая их конфиденциальность.
🗣 Масштабы такого рода слежки просто невероятно велики, - отмечает Бретт Макс Кауфман, старший юрист американского союза защиты гражданских свобод.
В то же время, подобные системы начинают использоваться и в коммерческой сфере. Например, сети ресторанов быстрого питания, такие как McDonald's и White Castle, уже начали использовать технологии, подобные ALPR, для оптимизации доставок и выявления возвращающихся клиентов.
🌐 Источник: www.securitylab.ru
Правозащитники в США бьют тревогу: системы на основе искусственного интеллекта (ИИ) активно используются полицией и частными корпорациями для слежки за гражданами. Они собирают гигабайты данных о передвижении людей, что вызывает опасения о нарушении прав на конфиденциальность.
Один из примеров использования таких систем - случай с американцем Дэвидом Зайасом. Искусственный интеллект, анализируя базу данных из более чем полутора миллиарда записей номерных знаков, определил, что автомобиль Зайаса совершал поездку, типичную для наркоторговца. В результате, после остановки и обыска автомобиля, у Зайаса были обнаружены наркотики, оружие и большая сумма наличных.
Система слежения за номерными знаками, которую использовала полиция, была создана частной компанией Rekor, специализирующейся на искусственном интеллекте. Эта технология уже продана по меньшей мере 23 полицейским управлениям и местным органам власти по всей Америке.
Правозащитники выражают опасения, что подобные технологии нарушают базовые права американцев, грубо нарушая их конфиденциальность.
В то же время, подобные системы начинают использоваться и в коммерческой сфере. Например, сети ресторанов быстрого питания, такие как McDonald's и White Castle, уже начали использовать технологии, подобные ALPR, для оптимизации доставок и выявления возвращающихся клиентов.
Please open Telegram to view this post
VIEW IN TELEGRAM
SecurityLab.ru
Правозащитники бьют тревогу: американские граждане страдают от тотальной слежки с применением ИИ
Полиция и даже частные корпорации не стесняются собирать гигабайты данных о передвижении людей, к чему это нас приведёт?
🔥2