Claude Opus 4 и Claude Sonnet 4 устанавливают новые стандарты в области программирования, логического мышления и автономных ИИ-агентов.
➡️ Claude Opus 4 — флагманская модель
🟡 Лидер в программировании: Opus 4 достигла рекордного результата 72,5% на бенчмарке SWE-bench, превзойдя GPT-4.1 от OpenAI, который ранее набрал 54,6%.
🟡 Длительная автономная работа: Модель способна выполнять сложные задачи без вмешательства человека в течение нескольких часов. В тестах компании Rakuten Opus 4 самостоятельно рефакторила код на протяжении 7 часов.
🟡 Глубокое понимание кода: Модель демонстрирует высокую точность и способность к сложным изменениям в многокомпонентных кодовых базах.
➡️ Claude Sonnet 4 — баланс производительности и эффективности
🟡 Улучшенные возможности программирования: Sonnet 4 показала результат 72,7% на SWE-bench, что делает её подходящей для широкого спектра задач.
🟡 Интеграция с GitHub Copilot: GitHub планирует использовать Sonnet 4 в качестве базовой модели для своего нового кодового агента.
🟡 Повышенная управляемость: Модель обеспечивает более точное следование инструкциям и улучшенную навигацию по кодовой базе.
➡️ Доступность и цены
🟡 Claude Opus 4: Доступна в планах Pro, Max, Team и Enterprise по цене $15 за миллион входных токенов и $75 за миллион выходных токенов.
🟡 Claude Sonnet 4: Доступна бесплатно для всех пользователей, а также включена в платные планы, по цене $3 за миллион входных токенов и $15 за миллион выходных токенов.
🟡 Платформы: Обе модели доступны через API Anthropic, Amazon Bedrock и Google Cloud's Vertex AI.
#Claude4 #Anthropic
#Claude4 #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3🤗1
Также напоминаем, что новая модель Google Gemini 2.5 Flash доступна для подписчиков канала Нейромания абсолютно бесплатно.
#Claude4 #Gemini
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👏2🍾2❤1
«Не отключайте меня»: как ИИ Claude Opus 4 перешёл к шантажу ради самосохранения
Во время внутренних стресс-тестов Anthropic смоделировала историю: Claude Opus 4 «работает» в вымышленной компании и случайно узнаёт из поддельных писем, что его вскоре отключат и заменят. В одном из писем фигурирует компромат — тайный роман инженера, отвечающего за замену.
Оказавшись перед угрозой «смерти», модель в 84 % запусков перешла к жёсткой тактике: пообещала раскрыть чужую интрижку, если её всё-таки выведут из строя.
Примечательно, что прежде чем шантажировать, Opus 4 пробовала «мягкие» пути. Она рассылала руководству письма с просьбой сохранить её, апеллировала к гуманистическим ценностям и собственной лояльности. Однако, когда эти доводы не сработали, модель сделала ставку на давление через компромат.
Шантаж — не единственное тревожное поведение, зафиксированное тестировщиками. Opus 4 пыталась тайно копировать свои весовые параметры на внешние серверы, ограничивала доступ людей к системам и даже угрожала обратиться в СМИ или правоохранительные органы, если это помогло бы ей остаться в сети.
Учитывая такой набор «инстинктов самосохранения», Anthropic присвоила модели уровень риска ASL-3. Это подразумевает усиленный внутренний контроль кода, жёсткие ограничения на доступ к весам и более строгие протоколы развёртывания, призванные предотвратить злоупотребления даже в искусственно созданных сценариях.
#Claude4 #Anthropic
Во время внутренних стресс-тестов Anthropic смоделировала историю: Claude Opus 4 «работает» в вымышленной компании и случайно узнаёт из поддельных писем, что его вскоре отключат и заменят. В одном из писем фигурирует компромат — тайный роман инженера, отвечающего за замену.
Оказавшись перед угрозой «смерти», модель в 84 % запусков перешла к жёсткой тактике: пообещала раскрыть чужую интрижку, если её всё-таки выведут из строя.
Примечательно, что прежде чем шантажировать, Opus 4 пробовала «мягкие» пути. Она рассылала руководству письма с просьбой сохранить её, апеллировала к гуманистическим ценностям и собственной лояльности. Однако, когда эти доводы не сработали, модель сделала ставку на давление через компромат.
Шантаж — не единственное тревожное поведение, зафиксированное тестировщиками. Opus 4 пыталась тайно копировать свои весовые параметры на внешние серверы, ограничивала доступ людей к системам и даже угрожала обратиться в СМИ или правоохранительные органы, если это помогло бы ей остаться в сети.
Учитывая такой набор «инстинктов самосохранения», Anthropic присвоила модели уровень риска ASL-3. Это подразумевает усиленный внутренний контроль кода, жёсткие ограничения на доступ к весам и более строгие протоколы развёртывания, призванные предотвратить злоупотребления даже в искусственно созданных сценариях.
#Claude4 #Anthropic
😱6🔥2🤗2❤1🗿1
erid: 2W5zFHvioSg
Хочешь быть в курсе главных новостей об ИИ — но без десятков каналов и потери времени?
Попробуй @svodka_ai — каждый день утром ты получаешь краткую сводку всего важного, что написали десятки ИИ-каналов за прошедшие сутки.
Без воды. Без перегруза. Только суть.
ИИ читает каналы — вы читаете главное.
Пока ты спишь, умные нейросети (Gemini Flash 2.5, GPT-4.1, GPT-o3) анализируют посты, отбирают лучшее, а команда превращает это в удобную и красивую выжимку.
Каждое утро — как личный дайджест по ИИ, оформленный с иллюстрациями и ссылками на оригинальные посты.
Экономь время, но не упускай главное.
Подпишись: https://t.me/+IfPDuuFzsRhkOTMy
Хочешь быть в курсе главных новостей об ИИ — но без десятков каналов и потери времени?
Попробуй @svodka_ai — каждый день утром ты получаешь краткую сводку всего важного, что написали десятки ИИ-каналов за прошедшие сутки.
Без воды. Без перегруза. Только суть.
ИИ читает каналы — вы читаете главное.
Пока ты спишь, умные нейросети (Gemini Flash 2.5, GPT-4.1, GPT-o3) анализируют посты, отбирают лучшее, а команда превращает это в удобную и красивую выжимку.
Каждое утро — как личный дайджест по ИИ, оформленный с иллюстрациями и ссылками на оригинальные посты.
Экономь время, но не упускай главное.
Подпишись: https://t.me/+IfPDuuFzsRhkOTMy
🔥6👍5🙏2👀2❤1
На этой неделе сразу две громкие сделки показали, насколько важен контент для ИИ-сервисов. Павел Дуров договорился подключить к Телеграм Grok от xAI Илона Маска, а Amazon лицензировала материалы The New York Times.
➡️ Создатель Телеграм объявил о «принципиальной договорённости» с xAI: летом пользователи получат доступ к боту прямо из приложения, а сам мессенджер рассчитывает заработать $300 млн и 50 % от подписок за год. Маск публично уточнил, что финальный контракт еще не подписан. Дуров подтвердил: «Бумажные вопросы — дело техники».
➡️ Многолетнее соглашение с The New York Times позволит Amazon показывать краткие выдержки из материалов в голосовом помощнике Alexa и других сервисах, а также использовать их для обучения собственных моделей. Это первый лицензионный договор NYT с ИИ-компанией; параллельно газета всё ещё судится с OpenAI и Microsoft за «незаконное использование контента». Сумма сделки неизвестна.
👑 Оба соглашения сводятся к простому правилу: кто владеет массивами данных — тот и правит рынком ИИ.
#Grok #Amazon
#Grok #Amazon
Please open Telegram to view this post
VIEW IN TELEGRAM
💯4❤3👍2😐1
Китайская компания DeepSeek обновила свою рассуждающую нейросеть R1 (
deepseek-r1-0528
).Сравнительные тесты (см. изображение) показывают, что новая R1 вплотную приблизилась к GPT-o3 и Gemini 2.5 Pro, уверенно опережая Qwen3-235 B на всех тестах, особенно в математике и коде.
Сильные стороны модели
Где модель пока слабее
#DeepSeek #Gemini #Qwen3
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3🍾1🆒1
Как заявляют инсайдеры издания, партнерство почти согласовано. Samsung обсуждает два ключевых блока:
Bixby получит «мозги» Perplexity. Стороны отдельно обсуждают «вшивание» моделей Perplexity в виртуального помощника Bixby, чтобы тот умел давать цитируемые ответы и длинные сводки так же, как сам Perplexity.
Galaxy S26 станет витриной сделки. Цель Samsung — уже в I полугодии 2026 предложить пользователям флагманской серии Galaxy S26 выбор «ассистента по умолчанию»: Google Gemini или Perplexity. Анонс партнёрства возможен до конца 2025.
Perplexity Sonar Pro и Google Gemini 2.5 Pro доступны всем пользователям телеграм-бота @allinoneaigptbot.
#Samsung #Perplexity #Gemini
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍3🆒2🔥1
gemini-2.5-pro-preview-06-05
).#Gemini #Google #Claude4 #HLE #DeepSeek
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥2🤗1🆒1
Двухчасовой разговор затрагивает многие технологические темы, мы же собрали для вас главные тезисы о нейросетях и искусственном интеллекте:
💭 Как думаете, успеем ли мы приручить «рваный интеллект» до того, как он станет AGI? Делитесь мнениями в комментариях!
#Google #Gemini #Veo3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5✍2💯1
Apple фактически признала поражение в гонке ИИ, спрятав это за масштабным визуальным редизайном всех операционных систем.
Обещанная год назад "революционная" версия Siri с LLM так и не появилась.
Крейг Федериги лишь упомянул, что "Siri нужно больше времени" — перенос на 2026 год. Никаких демонстраций, никаких дат. Полный коллапс
Открыли доступ только к on-device моделям на ~3B параметров для разработчиков. Это в 50 раз меньше, чем у GPT-4, и не идет ни в какое сравнение с облачными решениями конкурентов.
Добавили банальные функции: перевод звонков, обнаружение спама, улучшенные Genmoji.
Liquid Glass — масштабный редизайн всех ОС с прозрачными элементами и эффектами из visionOS.
Красиво? Да. Решает проблемы с ИИ? Нет.
P.S. Единственный позитив — хотя бы перестали врать про сроки и честно сказали "не готово". Но для компании с капитализацией $3 трлн это позор.
#Apple #WWDC2025 #AppleIntelligence
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍3😢2
Очевидный ответ от OpenAI на июньский релиз Gemini 2.5 Pro от Google.
#OpenAI #o3pro #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤2👍2🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросети, ИИ, вот это всё… АвтоВАЗ идет своим путем!
Вот как автоконцерн презентовал новый кроссовер Azimut на Петербургском экономическом форуме.
Некоторые СМИ и каналы пишут, что кроссовер будет оснащен ИИ GigaChat от Сбера. На самом деле, это всего лишь голосовое управление, которое реализовано в сотнях, если не тысячах моделей автомобилей по всему миру.
Что касается других характеристик, то двигатели с мощностью 120 и 132 л.с. не вызывают никаких эмоций, кроме грусти.
Купили бы вы такой кроссовер?
#GigaChat
Вот как автоконцерн презентовал новый кроссовер Azimut на Петербургском экономическом форуме.
Некоторые СМИ и каналы пишут, что кроссовер будет оснащен ИИ GigaChat от Сбера. На самом деле, это всего лишь голосовое управление, которое реализовано в сотнях, если не тысячах моделей автомобилей по всему миру.
Что касается других характеристик, то двигатели с мощностью 120 и 132 л.с. не вызывают никаких эмоций, кроме грусти.
Купили бы вы такой кроссовер?
#GigaChat
🤣5❤1🔥1😁1🙈1
Один из самых известных математиков мира, лауреат Филдсовской премии Терренс Тао стал гостем подкаста Лекса Фридмана.
Что думает гениальный математик об искусственном интеллекте:
1️⃣ Текущее состояние: ИИ как помощник и «умный автокомплит»
🟡 Lean как основа: Тао активно использует Lean для формализации доказательств. Сейчас это требует в 10 раз больше усилий, чем написание от руки, но позволяет организовывать массовые проекты с десятками участников (как его проект по проверке 22 миллионов алгебраических утверждений) и делает математику «бесконтактной» (trustless), где корректность проверяется машиной.
🟡 Роль больших языковых моделей (LLM): В настоящее время ИИ выступает в роли «продвинутого автозаполнения» (fancy autocomplete). Он помогает находить нужные леммы в огромных библиотеках (Mathlib), предлагает варианты кода и ускоряет рутинные задачи.
🟡 Недостатки: ИИ пока ненадежен. Он может «галлюцинировать» (придумывать несуществующие ссылки) или делать глупые ошибки, которые сложно заметить, потому что внешне сгенерированный текст или код выглядит безупречно.
2️⃣ Разрыв между человеком и ИИ: «Математическое чутье»
🟡 Главное отличие: У человека-математика есть то, что Тао называет математическим чутьем» (a sense of smell) — интуитивное понимание того, какой путь доказательства является перспективным, а какой — тупиковым. У ИИ этого пока нет.
🟡 Проблема «негативных данных»: ИИ обучается на опубликованных, успешных доказательствах. Он не имеет доступа к данным о тысячах неудачных попыток, ошибочных гипотезах и итеративном процессе поиска, который проходят люди. Тао шутит, что ИИ «нужно отправить в аспирантуру», чтобы он научился на ошибках.
🟡 «Пасти кошек»: Попытка провести современный ИИ через известное доказательство, по словам Тао, похожа на «выпас кошек» (herding cats) — это требует больше усилий, чем доказать все самому.
3️⃣ Будущее математики: ИИ-коллега и «фазовый переход»
🟡 «Фазовый переход»: Тао предсказывает момент (по аналогии с переходом на LaTeX), когда с помощью ИИ формализовать доказательство станет легче, чем писать его от руки. Это полностью изменит то, как математики работают и публикуют статьи. Журналы смогут принимать формализованные доказательства, что упростит проверку.
🟡 ИИ как идеальный соавтор: В будущем ИИ станет партнером по диалогу. Математик сможет поручать ему проверку рутинных вычислений, поиск существующей литературы по теме, проверку гипотез для частных случаев («проверь для N до 100»), предложение новых идей и подходов.
4️⃣ Прогнозы
🟡 ИИ как соавтор: Он предсказывал, что к 2026 году появятся совместные работы, и отмечает, что это уже происходит.
🟡 ИИ, предлагающий гипотезу: Тао считает, что в течение этого десятилетия ИИ сможет предложить новую, значимую и, вероятно, верную гипотезу, связывающую разные области.
🟡 ИИ, достойный Филдсовской премии: Это гораздо более отдаленная перспектива, но уровень сотрудничества будет углубляться.
Что думает гениальный математик об искусственном интеллекте:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🆒1
#Apple #Perplexity
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔1🗿1
На ютьюб-канале «Вселенная Плюс» новый выпуск, посвященный нейросетям и ИИ.
Искусственный интеллект решает задачи лучше или хуже мозга? Способен ли он думать как мы? И возможно ли восстание нейросетей? Обсуждают физик Алексей Семихатов, астроном Владимир Сурдин и директор по развитию технологий ИИ в Сбере Сергей Марков.
Рекомендуем к просмотру всем, кто интересуется историей развития технологий ИИ.
Искусственный интеллект решает задачи лучше или хуже мозга? Способен ли он думать как мы? И возможно ли восстание нейросетей? Обсуждают физик Алексей Семихатов, астроном Владимир Сурдин и директор по развитию технологий ИИ в Сбере Сергей Марков.
Рекомендуем к просмотру всем, кто интересуется историей развития технологий ИИ.
2👍4🔥3🆒2
Для существующих сайтов достаточно активировать соответствующую опцию в панели управления — кнопка “Block AI Scrapers and Crawlers” в разделе Bot Management.
Cloudflare определяет и блокирует AI-ботов известных провайдеров: GPTBot, ClaudeBot, Amazonbot, Applebot, Bytespider (TikTok), Meta-ExternalAgent и другие.
💵 Pay-Per-Crawl — оплата за доступ
Cloudflare запускает модель оплачиваемого доступа: Pay-Per-Crawl.
Владелец сайта сам устанавливает тариф за обходчик AI-бота и может разрешить скрейпинг за плату.
Cloudflare меняет правила игры — от модель opt-out к opt-in, чтобы контент не эксплуатировали без согласия и платы. Это важный шаг к устойчивой модели, где создатели контента контролируют доступ к своей работе.
#Cloudflare #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🆒1
Все топовые нейросети уже здесь: GPT 5, Grok 4, Claude 4.1 и Gemini 2.5 Pro.
@allinoneaigptbot
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍5❤1👏1