Forwarded from Эксплойт
OpenAI платят домохозяйкам в Индии за мытьё посуды и чистку картошки — за час домашней работы можно получить аж 250 рупий (~190 рублей).
Но есть важное условие: хозяйством нужно заниматься, записывая весь процесс на камеру. Индия стала главным хабом для обучения роботов — сотни тысяч работяг выполняют свои обычные дела под запись, фактически тренируя роботов, которые в будущем оставят их без работы.
ИИкономика будущего.
@exploitex
Но есть важное условие: хозяйством нужно заниматься, записывая весь процесс на камеру. Индия стала главным хабом для обучения роботов — сотни тысяч работяг выполняют свои обычные дела под запись, фактически тренируя роботов, которые в будущем оставят их без работы.
ИИкономика будущего.
@exploitex
Т.е. такая вот будет драка да? :D
Все платёжные шлюзы банков перейдут на конкретный серт, и нужно будет клиентам устанавливать у себя на устройстве отдельный серт чтобы эти платежи проходили через платёжные шлюзы банков, а твой сайт здесь немного в стороне, даже посередине между клиентом и банком, но серт нужен клиенту и банку, а не твоему сайту который посередине.
Все платёжные шлюзы банков перейдут на конкретный серт, и нужно будет клиентам устанавливать у себя на устройстве отдельный серт чтобы эти платежи проходили через платёжные шлюзы банков, а твой сайт здесь немного в стороне, даже посередине между клиентом и банком, но серт нужен клиенту и банку, а не твоему сайту который посередине.
Наткнулся на аббревиатуру RSI
RSI в AI-контексте — это Recursive Self-Improvement, рекурсивное самоулучшение.
Когда ИИ начинает улучшать сам процесс создания следующего ИИ.
Главная разница:
AGI — это уровень способностей:
OpenAI описывает AGI как систему, способную решать задачи человеческого уровня / быть в целом умнее людей.
RSI — это механизм ускорения:
То есть AGI — это «у нас появился очень умный работник».
RSI — это «этот работник начал улучшать фабрику, которая производит ещё более умных работников».
RSI в AI-контексте — это Recursive Self-Improvement, рекурсивное самоулучшение.
Когда ИИ начинает улучшать сам процесс создания следующего ИИ.
Главная разница:
AGI — это уровень способностей:
ИИ может решать широкий класс задач на уровне человека или выше.
OpenAI описывает AGI как систему, способную решать задачи человеческого уровня / быть в целом умнее людей.
RSI — это механизм ускорения:
ИИ помогает проектировать, писать, тестировать, обучать и улучшать следующие версии ИИ.
То есть AGI — это «у нас появился очень умный работник».
RSI — это «этот работник начал улучшать фабрику, которая производит ещё более умных работников».
Даже интересно как у GPT пройдёт релиз модели очередной с учётом новых мер контроля, тогда будет с кем сравнивать, много интересного возможно узнаем :)
Forwarded from Сиолошная
Мониторим ситуацию: что стало известно про запрет на экспорт Fable / Mythos от Anthropic. Ссылки: 1, 2, 3, 4, 5, 6.
— перед релизом Fable Anthropic работали с USG (US government, правительство) над мерами безопасности. Обе стороны описывают сотрудничество как «продуктивное». Вполне вероятно, хотя прямого подтверждения ни с одной из сторон нет, что та самая мера по бесшумному ухудшению модели в определённых ситуациях (в купе со всеми другими методами защиты) — это результат совместной работы, который позволил выпустить Fable.
— Anthropic не получили прямого запрета на запуск модели и, собственно, сделали её доступной всем во вторник, 9-го июня (и немногим погодя откатили часть методов защиты, хоть концептуально ничего не поменялось: в случае определённых запросов полный Mythos не будет отвечать, вместо него или пустой ответ, или от Opus 4.8). В одном из источников написано, что они наоборот даже получили одобрение на запуск модели.
— после релиза исследователи из Amazon использовали серию промптов, чтобы заставить модель выдать информацию, которая могла бы помочь в организации кибератак и должна была быть заблокирована. Об этом CEO Amazon Andy Jassy сообщил чиновникам в четверг, мол, так и так, мы обеспокоены, есть вот такой джейлбрейк для Fable. Деталей джейлбрейка пока не было опубликовано, хотя существует некоторый отчёт, который был доступ ограниченному кругу лиц.
— со слов USG, с их стороны уязвимость якобы подтвердили в АНБ и сочли, что у них есть доказательство уязвимости Anthropic.
— в пятницу в полдень представители администрации хотели связаться с CEO Anthropic, однако тот был... на «оздоровительном отдыхе». Представители Anthropic опровергают эту информацию, но соглашаются, что Dario Amodei вышел на связь с USG только через ~75 минут. Я не думаю, что Dario в ту же неделю, что выпустил клёвую модель, сидел отдыхал — вероятно, он с юристами и своей командой думал, что делать и что говорить.
— далее было 3 звонка с более чем 7 представителями USG, которые объясняли, что их «доверенный партнёр» (Amazon) и АНБ нашли джейлбрейк, и просили отключить доступ к Fable + улучшить меры безопасности. Dario пытался объяснить, что это минорная проблема, сам джейлбрейк не очень общий (то есть не позволяет выпытать любую информацию из Mythos), и отказывался отключать модель.
— в ходе звонков Dario просил дать ему больше времени и конкретики, что именно не так, чтобы проработать вопрос, но не пообещал отключить модель.
— по результатам переговоров USG дали Anthropic 90 минут на добровольное отключение модели. Anthropic не стали ничего делать — с их слов, они не считали проблему большой, плюс они не видели каких-то формальных доказательств серьёзности проблемы, «правительство предоставило нам лишь устные доказательства потенциального узкого, не общего джейлбрейка». И также упомянули, что тот же подход работает и с GPT-5.5 (я так понимаю, что работает не только обход систем защиты, но и то, что модель выдаёт конкретную часть информации в ответ на запрос).
— вечером пятницы Anthropic получили письмо счастья на экспортный контроль и отключили модель.
И немного про будущее:
— согласно письму Министерства торговли, для предоставления доустпа к модели внутри страны потребуется лицензия. Кроме того, Anthropic придется подавать дополнительную заявку на получение индивидуально утверждаемых лицензий👨🦳 (но я не понял контекст этого заявления — это в случае, если ограничения останутся? или вообще?)
— представители Белого дома заявляют, что скорее всего не станут распространять экспортные ограничения на другие ИИ-компании
— Администрация президента «откровенно сбита с толку» тем, что Anthropic не захотела выполнять требования по безопасности, которые сама же ранее называла своим главным приоритетом.
— перед релизом Fable Anthropic работали с USG (US government, правительство) над мерами безопасности. Обе стороны описывают сотрудничество как «продуктивное». Вполне вероятно, хотя прямого подтверждения ни с одной из сторон нет, что та самая мера по бесшумному ухудшению модели в определённых ситуациях (в купе со всеми другими методами защиты) — это результат совместной работы, который позволил выпустить Fable.
— Anthropic не получили прямого запрета на запуск модели и, собственно, сделали её доступной всем во вторник, 9-го июня (и немногим погодя откатили часть методов защиты, хоть концептуально ничего не поменялось: в случае определённых запросов полный Mythos не будет отвечать, вместо него или пустой ответ, или от Opus 4.8). В одном из источников написано, что они наоборот даже получили одобрение на запуск модели.
— после релиза исследователи из Amazon использовали серию промптов, чтобы заставить модель выдать информацию, которая могла бы помочь в организации кибератак и должна была быть заблокирована. Об этом CEO Amazon Andy Jassy сообщил чиновникам в четверг, мол, так и так, мы обеспокоены, есть вот такой джейлбрейк для Fable. Деталей джейлбрейка пока не было опубликовано, хотя существует некоторый отчёт, который был доступ ограниченному кругу лиц.
— со слов USG, с их стороны уязвимость якобы подтвердили в АНБ и сочли, что у них есть доказательство уязвимости Anthropic.
— в пятницу в полдень представители администрации хотели связаться с CEO Anthropic, однако тот был... на «оздоровительном отдыхе». Представители Anthropic опровергают эту информацию, но соглашаются, что Dario Amodei вышел на связь с USG только через ~75 минут. Я не думаю, что Dario в ту же неделю, что выпустил клёвую модель, сидел отдыхал — вероятно, он с юристами и своей командой думал, что делать и что говорить.
— далее было 3 звонка с более чем 7 представителями USG, которые объясняли, что их «доверенный партнёр» (Amazon) и АНБ нашли джейлбрейк, и просили отключить доступ к Fable + улучшить меры безопасности. Dario пытался объяснить, что это минорная проблема, сам джейлбрейк не очень общий (то есть не позволяет выпытать любую информацию из Mythos), и отказывался отключать модель.
— в ходе звонков Dario просил дать ему больше времени и конкретики, что именно не так, чтобы проработать вопрос, но не пообещал отключить модель.
— по результатам переговоров USG дали Anthropic 90 минут на добровольное отключение модели. Anthropic не стали ничего делать — с их слов, они не считали проблему большой, плюс они не видели каких-то формальных доказательств серьёзности проблемы, «правительство предоставило нам лишь устные доказательства потенциального узкого, не общего джейлбрейка». И также упомянули, что тот же подход работает и с GPT-5.5 (я так понимаю, что работает не только обход систем защиты, но и то, что модель выдаёт конкретную часть информации в ответ на запрос).
— вечером пятницы Anthropic получили письмо счастья на экспортный контроль и отключили модель.
И немного про будущее:
— согласно письму Министерства торговли, для предоставления доустпа к модели внутри страны потребуется лицензия. Кроме того, Anthropic придется подавать дополнительную заявку на получение индивидуально утверждаемых лицензий
— представители Белого дома заявляют, что скорее всего не станут распространять экспортные ограничения на другие ИИ-компании
— Администрация президента «откровенно сбита с толку» тем, что Anthropic не захотела выполнять требования по безопасности, которые сама же ранее называла своим главным приоритетом.
Please open Telegram to view this post
VIEW IN TELEGRAM
- Konami отключила доступ к своим играм для пользователей из России и Беларуси.
Как будто в последнее время к ним и так через зелёные магазины заходили, сейчас только через него видимо пойдут.
Как будто в последнее время к ним и так через зелёные магазины заходили, сейчас только через него видимо пойдут.
Интересный видос про Plata и Олега Тинькова, клёвый вайб у него остался ещё, даже больше, он этот вайб там сам переизобрёл ))
https://www.youtube.com/watch?v=pWwQmikOoqg
https://www.youtube.com/watch?v=pWwQmikOoqg
YouTube
Плата за риск — Олег Тиньков и команда построили всё заново
«Plata за риск» — документальный фильм о том, как бывшие топ-менеджеры Тинькофф Банка построили новый банк в Мексике с нуля.
Олег Тиньков, менеджеры, разработчики и продакты из России — люди, которые могли остаться в России и жить спокойно. Вместо этого…
Олег Тиньков, менеджеры, разработчики и продакты из России — люди, которые могли остаться в России и жить спокойно. Вместо этого…
Отличный видос с Валерием Бабушкиным про AI-powered :D
https://www.youtube.com/watch?v=Sv5ZZB-M59Q
https://www.youtube.com/watch?v=Sv5ZZB-M59Q
YouTube
Валерий Бабушкин открывает 6-ой сезон подкаста «Деньги любят техно».
В AI-powered мире живут AI-powered люди. Кто они? Разбираемся в новом эпизоде вместе с одним из ведущих специалистов в области Data Science, машинного обучения и искусственного интеллекта Валерием Бабушкиным.
Валерий — Kaggle Competition Grandmaster, автор…
Валерий — Kaggle Competition Grandmaster, автор…
Представляю как они салатик кушают втроём, под столом Трамп с Маском записывают )
😁1
Так это всем предстоит моделям\поставщикам выкатывать теперь перед релизом ?)
https://www.anthropic.com/constitution
Главные приоритеты Claude там такие:
- Broadly safe — не подрывать человеческий контроль и надзор над ИИ.
- Broadly ethical — быть честным, избегать опасного и вредного поведения.
- Compliant with Anthropic’s guidelines — следовать более конкретным правилам Anthropic, например по медицине, кибербезопасности, jailbreak’ам, инструментам.
- Genuinely helpful — реально помогать пользователям и операторам, а не просто “отказываться на всякий случай”.
Если эти цели конфликтуют, Claude должен обычно ставить их именно в таком порядке.
https://www.anthropic.com/constitution
Главные приоритеты Claude там такие:
- Broadly safe — не подрывать человеческий контроль и надзор над ИИ.
- Broadly ethical — быть честным, избегать опасного и вредного поведения.
- Compliant with Anthropic’s guidelines — следовать более конкретным правилам Anthropic, например по медицине, кибербезопасности, jailbreak’ам, инструментам.
- Genuinely helpful — реально помогать пользователям и операторам, а не просто “отказываться на всякий случай”.
Если эти цели конфликтуют, Claude должен обычно ставить их именно в таком порядке.
Anthropic
Claude’s Constitution
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
Forwarded from Alexander Shmorgunov
This media is not supported in your browser
VIEW IN TELEGRAM
Орнул. Клодеры, признавайтесь, у вас так?
😁1