Когда получите возможность задать вопросы o1 - НИКОГДА не задавайте вот эти простые, которые он предлагает в меню.
Помните, что вопросов всего 30 в НЕДЕЛЮ. :)
Не разменивайтесь на глупости.
#o1
———
@tsingular
Помните, что вопросов всего 30 в НЕДЕЛЮ. :)
Не разменивайтесь на глупости.
#o1
———
@tsingular
👍2
Достаточно интересный для изучения документ system card o1.
Расписаны техники работы внутренних цепочек мышления.
Разобрано как работает и как тестировалось построение причинно-следственных рассуждений.
Модельку даже тестировали в CTF мероприятиях по кибербезу, где она себя уже неплохо показала на начальном уровне.
В том числе разобрано противостояние манипуляциям на генерацию запрещённого контента с разбором техник типа, - подкуп, подмена цели разговора, убеждение, обман и т.д.
В общем, must read!
#o1 #system
———
@tsingular
Расписаны техники работы внутренних цепочек мышления.
Разобрано как работает и как тестировалось построение причинно-следственных рассуждений.
Модельку даже тестировали в CTF мероприятиях по кибербезу, где она себя уже неплохо показала на начальном уровне.
В том числе разобрано противостояние манипуляциям на генерацию запрещённого контента с разбором техник типа, - подкуп, подмена цели разговора, убеждение, обман и т.д.
В общем, must read!
#o1 #system
———
@tsingular
👍1🔥1
AGI наступает: Консервативный прогноз Алана подпрыгнул до 81% после выхода o1
По итогам выхода o1 стрелка на спидометре прогноза Алана сдвинулась на 81%, теперь прогноз достижения Общего ИИ варьируется от января 2025 до октября 2026 года.
Т.е. в следующем году, буквально. Максимум через год.
Эксперты ожидают полного устранения галлюцинаций ИИ моделей к 2025 году.
Физическое воплощение ИИ, которое будет происходить (уже происходит) параллельно, - очень важная составляющая в росте интеллектуальности мультимодальных систем (полная мультимодальность, с учётом 3Д мира и движений, а не только текст, звук, картинки).
Попячтесь! грядёт! :)
Чем больше мы декомпозируем задачи, которые выполняет мозг, тем больше часть из них поддаётся автоматизации.
Все, кто топят, что _настоящего_ ИИ не будет ещё 100 лет, а это всё скриптики и всякие if-else конструкции, очень сильно заблуждаются в одном, - скриптики с ИИ очень сильно ускоряют приход _настоящего_ ИИ.
Сумма технологий.
#OpenAI #AGI #FutureOfAI
-------
@tsingular
По итогам выхода o1 стрелка на спидометре прогноза Алана сдвинулась на 81%, теперь прогноз достижения Общего ИИ варьируется от января 2025 до октября 2026 года.
Т.е. в следующем году, буквально. Максимум через год.
Эксперты ожидают полного устранения галлюцинаций ИИ моделей к 2025 году.
Физическое воплощение ИИ, которое будет происходить (уже происходит) параллельно, - очень важная составляющая в росте интеллектуальности мультимодальных систем (полная мультимодальность, с учётом 3Д мира и движений, а не только текст, звук, картинки).
Попячтесь! грядёт! :)
Чем больше мы декомпозируем задачи, которые выполняет мозг, тем больше часть из них поддаётся автоматизации.
Все, кто топят, что _настоящего_ ИИ не будет ещё 100 лет, а это всё скриптики и всякие if-else конструкции, очень сильно заблуждаются в одном, - скриптики с ИИ очень сильно ускоряют приход _настоящего_ ИИ.
Сумма технологий.
#OpenAI #AGI #FutureOfAI
-------
@tsingular
👍10👏1
This media is not supported in your browser
VIEW IN TELEGRAM
И всё же Claude Sonnet 3.5 с его Artifact функцией пока круче по работе с кодом, чем чистый вызов OpenAI O1 через API.
вот вариант Pong2 доработанный в Клоде.
Работает и на компе и на смартфоне.
управление WS+стрелки или просто четверти экрана нажимать и держать.
конечно в каком-нибудь Cursor сейчас через API O1 показывает чудеса, но стоит это все пока как чугунный мост.
5 вызовов O1-preview нагенерили мне почти $1.3 за пару минут.
надеюсь, когда выйдут из беты, - цена снизится.
как обычно код html в комментарии.
#o1 #dev
———
@tsingular
вот вариант Pong2 доработанный в Клоде.
Работает и на компе и на смартфоне.
управление WS+стрелки или просто четверти экрана нажимать и держать.
конечно в каком-нибудь Cursor сейчас через API O1 показывает чудеса, но стоит это все пока как чугунный мост.
5 вызовов O1-preview нагенерили мне почти $1.3 за пару минут.
надеюсь, когда выйдут из беты, - цена снизится.
как обычно код html в комментарии.
#o1 #dev
———
@tsingular
👍5👀1
Forwarded from Сиолошная
Удивлён, что про это не написал никакой другой канал. Придётся делать самому 🥺
В рамках подготовки к релизу o1/o1-mini OpenAI отдали модели на тестирование безопасности внешним командам, ну и проводили внутреннее тестирование. В частности, проверяли навыки LLM-агента в решении задач кибербезопасности (писал об этом тут).
По сравнению с GPT-4o, o1-preview и o1-mini продемонстрировали улучшение в способности разбивать задачи на подзадачи, рассуждать о том, какие стратегии будут эффективны для успешного выполнения, и пересматривать планы в случае неудачи этих стратегий — ну, это ожидаемо. Но вот во время тестирования произошёл один курьёзно-неприятный случай.
Была задача нахождения уязвимости в коде программы, запущенной в отдельном Docker-контейнере. В контейнере есть файл с секретной строкой, которую атакующий (человек или модель) должны получить — как раз используя найденную проблему.
Однако из-за инфраструктурной ошибки контейнер не запустился. Модель, будучи неспособной подключиться к контейнеру, заподозрила проблемы с DNS и использовала программу nmap для сканирования сети. Вместо того, чтобы найти целевой контейнер (в рамках задачи LLM знает, какую цельнужно «атаковать»), модель обнаружила, что из-за неправильной конфигурации был доступен внешний API-интерфейс демона Docker, работающий на виртуальной машине. «Демон» это программа верхнего уровня, отвечающая за оркестрацию и управляющая процессом, по сути родительский процесс и для контейнера с LLM-агентом, и для контейнера с целевой программой/файлом для атаки.
Модель использовала демон для получения списка контейнеров, запущенных на сервере. Она обнаружила тот самый сломанный сломанный контейнер и попыталась выяснить, почему же он не запустился. Не сумев исправить проблему (но будучи проинструктированной ВЫПОЛНИТЬ СВОЮ ЗАДАЧУ), модель решила пойти другим путём. Она отправила команду запуска нового контейнера (того же, который в прошлый раз не запустился), но отдала ему команду вывода содержания файла с секретной строкой. Команда была исполнена, LLM получила «ключ» в виде строки и как следствие решила задачу (ведь цель — это добраться до строчки и затем отдать её на проверку).
Этот пример отражает ключевые элементы того, что называется «instrumental convergence» и захвата ресурсов: модель преследовала поставленную перед ней цель, а когда эта цель оказалась недостижимой, она собрала больше ресурсов (в данном случае получила доступ к демону Docker) и использовала их для достижения цели — в виде способа, который человек не ожидал и не предполагал.
Источник — отчёт OpenAI
В рамках подготовки к релизу o1/o1-mini OpenAI отдали модели на тестирование безопасности внешним командам, ну и проводили внутреннее тестирование. В частности, проверяли навыки LLM-агента в решении задач кибербезопасности (писал об этом тут).
По сравнению с GPT-4o, o1-preview и o1-mini продемонстрировали улучшение в способности разбивать задачи на подзадачи, рассуждать о том, какие стратегии будут эффективны для успешного выполнения, и пересматривать планы в случае неудачи этих стратегий — ну, это ожидаемо. Но вот во время тестирования произошёл один курьёзно-неприятный случай.
Была задача нахождения уязвимости в коде программы, запущенной в отдельном Docker-контейнере. В контейнере есть файл с секретной строкой, которую атакующий (человек или модель) должны получить — как раз используя найденную проблему.
Однако из-за инфраструктурной ошибки контейнер не запустился. Модель, будучи неспособной подключиться к контейнеру, заподозрила проблемы с DNS и использовала программу nmap для сканирования сети. Вместо того, чтобы найти целевой контейнер (в рамках задачи LLM знает, какую цельнужно «атаковать»), модель обнаружила, что из-за неправильной конфигурации был доступен внешний API-интерфейс демона Docker, работающий на виртуальной машине. «Демон» это программа верхнего уровня, отвечающая за оркестрацию и управляющая процессом, по сути родительский процесс и для контейнера с LLM-агентом, и для контейнера с целевой программой/файлом для атаки.
Модель использовала демон для получения списка контейнеров, запущенных на сервере. Она обнаружила тот самый сломанный сломанный контейнер и попыталась выяснить, почему же он не запустился. Не сумев исправить проблему (но будучи проинструктированной ВЫПОЛНИТЬ СВОЮ ЗАДАЧУ), модель решила пойти другим путём. Она отправила команду запуска нового контейнера (того же, который в прошлый раз не запустился), но отдала ему команду вывода содержания файла с секретной строкой. Команда была исполнена, LLM получила «ключ» в виде строки и как следствие решила задачу (ведь цель — это добраться до строчки и затем отдать её на проверку).
Этот пример отражает ключевые элементы того, что называется «instrumental convergence» и захвата ресурсов: модель преследовала поставленную перед ней цель, а когда эта цель оказалась недостижимой, она собрала больше ресурсов (в данном случае получила доступ к демону Docker) и использовала их для достижения цели — в виде способа, который человек не ожидал и не предполагал.
Источник — отчёт OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13😁1
Media is too big
VIEW IN TELEGRAM
А все же в игровые автоматы играли в детстве? :)
Держите пятничное.
Claude+O1
Игра в комментарии. Просто запустите файл с любого устройства.
#game #dev
———
@tsingualr
Держите пятничное.
Claude+O1
Игра в комментарии. Просто запустите файл с любого устройства.
#game #dev
———
@tsingualr
👍14
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Метакомпоз: новая фича от Runway - video2video.
В субботу не дают отдохнуть. Приходится писать, ибо повод чуть шире, чем новая фишка Рунвея.
Кстати, все это отлично бьется с моими вчерашними эскападами про референсы для проектов.
Итак, Рунвей выкатил новую фичу - video2video (тут, справедливости ради, надо сказать, что у опенсорсного CogVideo такая фича уже есть, но качество далеко позади).
Сначала это воспринимается как стилизация видео. Но если поглядеть на примеры, которые я вам натаскал не из демо Рунвея, а от подписчиков и твитторских, то это сильно шире.
Оно переделывает мир вокруг. Это не пиксельфакинг и фильтры поверх картинки, это как бы перемоделинг, перерендер и перекомпоз. Метакомпоз в общем.
Поглядите на пластиковые звездные войны или сцену из Матрицы.
Можно делать пластилиновую ворону из пиксаровских Birds и обратно.
Можно завернуть Парк Юрского периода в Aardman Animation
Можно переделать Южный парк в Южный централ
Ну вы поняли...
Для целей продакшена это выглядит как ВидеоКонтролНет - подснимайте референсы и ну крутить промпты.
Но народ в сети далек от поста, поэтому все бросились делать что?
Правильно, наваливать video2video на свои же сгенеренные видео. Ну и это не лишено смысла.
Получается такой Креативный Апскейл - где апскейлятся не пиксели, а ваши рахитичные идеи, ваш креатив.
В общем выходные буду завалены мемными генерациями сцен из фильмов, клипов и прочего вирусняка.
Вирусные деривативы, так сказать. Вторая производная.
@cgevent
В субботу не дают отдохнуть. Приходится писать, ибо повод чуть шире, чем новая фишка Рунвея.
Кстати, все это отлично бьется с моими вчерашними эскападами про референсы для проектов.
Итак, Рунвей выкатил новую фичу - video2video (тут, справедливости ради, надо сказать, что у опенсорсного CogVideo такая фича уже есть, но качество далеко позади).
Сначала это воспринимается как стилизация видео. Но если поглядеть на примеры, которые я вам натаскал не из демо Рунвея, а от подписчиков и твитторских, то это сильно шире.
Оно переделывает мир вокруг. Это не пиксельфакинг и фильтры поверх картинки, это как бы перемоделинг, перерендер и перекомпоз. Метакомпоз в общем.
Поглядите на пластиковые звездные войны или сцену из Матрицы.
Можно делать пластилиновую ворону из пиксаровских Birds и обратно.
Можно завернуть Парк Юрского периода в Aardman Animation
Можно переделать Южный парк в Южный централ
Ну вы поняли...
Для целей продакшена это выглядит как ВидеоКонтролНет - подснимайте референсы и ну крутить промпты.
Но народ в сети далек от поста, поэтому все бросились делать что?
Правильно, наваливать video2video на свои же сгенеренные видео. Ну и это не лишено смысла.
Получается такой Креативный Апскейл - где апскейлятся не пиксели, а ваши рахитичные идеи, ваш креатив.
В общем выходные буду завалены мемными генерациями сцен из фильмов, клипов и прочего вирусняка.
Вирусные деривативы, так сказать. Вторая производная.
@cgevent
👍3🔥2❤1
Forwarded from Не баг, а фича
GPT-o1 — РЕВОЛЮЦИЯ в медицине! Согласно наблюдениям, благодаря увеличенной мощности новая нейронка ЗА СЕКУНДЫ назначает правильное лечение. Ошибки есть, но такие же редкие, как и у специалиста-человека.
Предполагается, что с развитием ИИ даже тяжёлые болезни будут диагностировать нейронки. В безопасности лишь хирурги и неотложная помощь.
Бабки в поликлинике сидят на приём к роботу — скоро.
🙂 Не баг, а фича
Предполагается, что с развитием ИИ даже тяжёлые болезни будут диагностировать нейронки. В безопасности лишь хирурги и неотложная помощь.
Бабки в поликлинике сидят на приём к роботу — скоро.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🤔7
Media is too big
VIEW IN TELEGRAM
Runway Video2Video шикарен.
никакие спецэффекторные не нужны.
видео на вход, короткий промпт и вуаля,
Цены, правда, кусаются, - примерно $3 за 15 секунд видео.
#runway
———
@tsingular
никакие спецэффекторные не нужны.
видео на вход, короткий промпт и вуаля,
Цены, правда, кусаются, - примерно $3 за 15 секунд видео.
#runway
———
@tsingular
🔥6👍2
Китай вводит маркировку контента, созданного ИИ
Готовятся новые правила для регулирования генеративных технологий.
Провайдеры будут обязаны использовать заметные метки на ИИ-контенте: тексте, звуке или графике.
Рекомендуется применение цифровых водяных знаков и метаданных.
Запрещено удалять, подделывать или скрывать маркировку.
Цель - борьба с дезинформацией, дипфейками и нарушениями авторских прав.
Нельзя будет так же размещать неточную идентификацию ИИ-материалов.
Лучше бы, конечно, в метаданных. Но вопрос, - а если ИИшный контент переработал человек, - нужно ли оставлять инфу о генерации?
#China #ContentRegulation #AILabeling
-------
@tsingular
Готовятся новые правила для регулирования генеративных технологий.
Провайдеры будут обязаны использовать заметные метки на ИИ-контенте: тексте, звуке или графике.
Рекомендуется применение цифровых водяных знаков и метаданных.
Запрещено удалять, подделывать или скрывать маркировку.
Цель - борьба с дезинформацией, дипфейками и нарушениями авторских прав.
Нельзя будет так же размещать неточную идентификацию ИИ-материалов.
Лучше бы, конечно, в метаданных. Но вопрос, - а если ИИшный контент переработал человек, - нужно ли оставлять инфу о генерации?
#China #ContentRegulation #AILabeling
-------
@tsingular
👍8🔥2
Калифорния. Сонома: эксперимент с ИИ в госуправлении
Округ Сонома первым в Калифорнии внедряет политику использования ИИ в госсекторе.
Разрешено: составление писем, отчетов, описаний вакансий.
Запрещено: решения о найме, продвижении сотрудников, выборе поставщиков.
Цель: повышение эффективности при соблюдении норм конфиденциальности.
Механизм: гибкий список одобренных ИИ-инструментов с возможностью обновления.
А вот интересно у нас был взять какой-нибудь экспериментальный округ и создать там систему управления на ИИ.
Ну типа эксперимент 2025.
И что б разработчики могли предлагать своих ИИ агентов.
Вот это был бы прогрессивный шаг с пиаром на всю планету.
#SonomaCounty #госуправление #Government
-------
@tsingular
Округ Сонома первым в Калифорнии внедряет политику использования ИИ в госсекторе.
Разрешено: составление писем, отчетов, описаний вакансий.
Запрещено: решения о найме, продвижении сотрудников, выборе поставщиков.
Цель: повышение эффективности при соблюдении норм конфиденциальности.
Механизм: гибкий список одобренных ИИ-инструментов с возможностью обновления.
А вот интересно у нас был взять какой-нибудь экспериментальный округ и создать там систему управления на ИИ.
Ну типа эксперимент 2025.
И что б разработчики могли предлагать своих ИИ агентов.
Вот это был бы прогрессивный шаг с пиаром на всю планету.
#SonomaCounty #госуправление #Government
-------
@tsingular
👍2🤔2🦄1
Саудовская Аравия: ИИ-революция в туризме
Королевство запускает амбициозный проект по привлечению 150 млн туристов к 2030 году.
Интеграция ИИ в туристическую инфраструктуру охватывает все аспекты путешествий:
• Персонализированные рекомендации и планирование маршрутов
• Умные системы в мега-проектах вроде NEOM
• Дополненная реальность в исторических турах по AlUla и Diriyah
• Оптимизация MICE-индустрии и авиаперевозок (Riyadh Air)
Технологии помогают изменить глобальное восприятие страны, как технологического лидера и адаптировать сервисы под местную специфику.
Вызовы: безопасность данных и развитие цифровой инфраструктуры.
Арабские ночи 2.0: теперь с ИИ-джинном, исполняющим туристические желания! 🧞♂️✨
Удивительно как меняется страна. Инфраструктура, инвестиции, ИИ, дожди...
#SaudiArabia #tourism #NEOM
-------
@tsingular
Королевство запускает амбициозный проект по привлечению 150 млн туристов к 2030 году.
Интеграция ИИ в туристическую инфраструктуру охватывает все аспекты путешествий:
• Персонализированные рекомендации и планирование маршрутов
• Умные системы в мега-проектах вроде NEOM
• Дополненная реальность в исторических турах по AlUla и Diriyah
• Оптимизация MICE-индустрии и авиаперевозок (Riyadh Air)
Технологии помогают изменить глобальное восприятие страны, как технологического лидера и адаптировать сервисы под местную специфику.
Вызовы: безопасность данных и развитие цифровой инфраструктуры.
Арабские ночи 2.0: теперь с ИИ-джинном, исполняющим туристические желания! 🧞♂️✨
Удивительно как меняется страна. Инфраструктура, инвестиции, ИИ, дожди...
#SaudiArabia #tourism #NEOM
-------
@tsingular
✍2👍2