Forwarded from Сиолошная
Пара новостей от OpenAI (чтобы замять исход команды лидеров, кек):
1) теперь есть не просто JSON-режим, когда модель отвечает вам в машино-читаемом формате, а структурированная генерация. Первый (представленный в прошлом году) просто повышает надежность модели для создания синтаксически валидных JSON, а второй гарантирует, что ответ модели будет соответствовать определенной схеме. Вот если вы пишете "мне нужно, чтобы были такие-то и такие-то поля, и никаких больше" - теперь в 100% случаев будет исполняться. Можно указывать сложные вложенные структуры (см. картинку).
2) вышла новая gpt-4o, gpt-4o-2024-08-06, но об улучшениях в метриках и качестве работы ничего не говорят
3) зато она дешевле в 2 раза! не знаю, что там делают внутри компании - роняют маржинальность или дистиллируют более качественно (или на самом деле новая модель хуже..), но вот, теперь новая цена $2.50/$10 за миллион токенов на входе и на выходе (против $5/$15).
Напомню, что у OpenAI ещё есть BatchAPI (это когда нужно ждать ответа до 24 часов - подходит для разных несрочных задач), который делит цену на два. Совсем копеешно получается!
1) теперь есть не просто JSON-режим, когда модель отвечает вам в машино-читаемом формате, а структурированная генерация. Первый (представленный в прошлом году) просто повышает надежность модели для создания синтаксически валидных JSON, а второй гарантирует, что ответ модели будет соответствовать определенной схеме. Вот если вы пишете "мне нужно, чтобы были такие-то и такие-то поля, и никаких больше" - теперь в 100% случаев будет исполняться. Можно указывать сложные вложенные структуры (см. картинку).
2) вышла новая gpt-4o, gpt-4o-2024-08-06, но об улучшениях в метриках и качестве работы ничего не говорят
3) зато она дешевле в 2 раза! не знаю, что там делают внутри компании - роняют маржинальность или дистиллируют более качественно (или на самом деле новая модель хуже..), но вот, теперь новая цена $2.50/$10 за миллион токенов на входе и на выходе (против $5/$15).
Напомню, что у OpenAI ещё есть BatchAPI (это когда нужно ждать ответа до 24 часов - подходит для разных несрочных задач), который делит цену на два. Совсем копеешно получается!
XBOW: ИИ-пентестер на уровне лучших профи
XBOW продемонстрировал впечатляющие результаты в сравнении с человеческими пентестерами.
В серии из 104 тестов, охватывающих OWASP Top 10, ИИ-система показала 85% успеха, сравнявшись по эффективности с ведущим экспертом.
При этом, скорость XBOW оказалась в 85 раз выше: 28 минут против 40 часов работы людей.
ИИ превзошёл специалистов на лёгких и средних задачах, но пока, предсказуемо, уступил топ-эксперту в сложных сценариях.
Непрерывная работа XBOW позволяет выявлять уязвимости на ранних этапах разработки ПО.
Технология не заменит профессию, но трансформирует подход к кибербезопасности, делая её более интегрированной в процесс создания софта.
Автоматизация пентеста с обеих сторон перейдёт на новый уровень. х10 0day в месяц.
Оно пока в закрытой бете, но как выйдет, - интересно будет посмотреть.
#XBOW #pentesting #cybersecurity
-------
@tsingular
XBOW продемонстрировал впечатляющие результаты в сравнении с человеческими пентестерами.
В серии из 104 тестов, охватывающих OWASP Top 10, ИИ-система показала 85% успеха, сравнявшись по эффективности с ведущим экспертом.
При этом, скорость XBOW оказалась в 85 раз выше: 28 минут против 40 часов работы людей.
ИИ превзошёл специалистов на лёгких и средних задачах, но пока, предсказуемо, уступил топ-эксперту в сложных сценариях.
Непрерывная работа XBOW позволяет выявлять уязвимости на ранних этапах разработки ПО.
Технология не заменит профессию, но трансформирует подход к кибербезопасности, делая её более интегрированной в процесс создания софта.
Автоматизация пентеста с обеих сторон перейдёт на новый уровень. х10 0day в месяц.
Оно пока в закрытой бете, но как выйдет, - интересно будет посмотреть.
#XBOW #pentesting #cybersecurity
-------
@tsingular
🔥1
Cloud Security Alliance: ИИ в наступательной кибербезопасности
Cloud Security Alliance опубликовала отчет об использовании ИИ в сфере наступательной кибербезопасности.
Документ анализирует потенциал и ограничения языковых моделей в контексте пяти фаз: разведка, сканирование, анализ уязвимостей, эксплуатация и отчетность.
Эксперты подчеркивают, что ИИ не панацея, а инструмент дополнения работы специалистов.
Ключевые вызовы: обработка массивных данных, точное выявление уязвимостей, ограничения токенов в моделях.
При этом рекомендуется сохранять человеческий контроль и внедрять надежные системы управления при автоматизации задач.
Отчёт в комментариях.
#CloudSecurityAlliance #OffensiveSecurity #LLM
-------
@tsingular
Cloud Security Alliance опубликовала отчет об использовании ИИ в сфере наступательной кибербезопасности.
Документ анализирует потенциал и ограничения языковых моделей в контексте пяти фаз: разведка, сканирование, анализ уязвимостей, эксплуатация и отчетность.
Эксперты подчеркивают, что ИИ не панацея, а инструмент дополнения работы специалистов.
Ключевые вызовы: обработка массивных данных, точное выявление уязвимостей, ограничения токенов в моделях.
При этом рекомендуется сохранять человеческий контроль и внедрять надежные системы управления при автоматизации задач.
Отчёт в комментариях.
#CloudSecurityAlliance #OffensiveSecurity #LLM
-------
@tsingular
Forwarded from эйай ньюз
Дешёвые, как грязь, LLM
API-провайдеры невероятно быстро снижают стоимость использования своих LLM. При отсутствии ярко выраженного лидера по качеству моделей, главным аргументом становится цена.
➖ Google с 12 августа дропает цены на Gemini Flash на 80%. Вот и реакция на GPT-4o mini, спустя две недели после релиза. Вот бы то же самое сделали с Pro 1.5.
➖ Новая версия GPT-4o упала в цене до $2.5 input/$10 output за миллион токенов, прошлые версии стоили $5 input/$15 output за миллион токенов. Последний месяц Claude 3.5 Sonnet и Llama 3.1 405B сильно поджимали OpenAI по цене, пришлось отвечать.
➖Deepseek релизит обещанный месяц назад Context Caching. Цены поражают: стоимость токенов при попадании в кэш падает не в 2x, как у гугла, а в 10x, при этом с бесплатным хранением. DeepSeek V2 и так произвёл эффект разорвавшейся бомбы на китайском рынке три месяца назад: модель была в разы дешевле конкурентов, при лучшем качестве. А сейчас нанесли добивающий удар.
С такими темпами цена за миллион токенов станет меньше цента менее чем через год. И будем мы мерять цены в долларах за миллиард токенов.
А помните, цены на GPT-4 доходили до $60 input/$120 output?
@ai_newz
API-провайдеры невероятно быстро снижают стоимость использования своих LLM. При отсутствии ярко выраженного лидера по качеству моделей, главным аргументом становится цена.
➖ Google с 12 августа дропает цены на Gemini Flash на 80%. Вот и реакция на GPT-4o mini, спустя две недели после релиза. Вот бы то же самое сделали с Pro 1.5.
➖ Новая версия GPT-4o упала в цене до $2.5 input/$10 output за миллион токенов, прошлые версии стоили $5 input/$15 output за миллион токенов. Последний месяц Claude 3.5 Sonnet и Llama 3.1 405B сильно поджимали OpenAI по цене, пришлось отвечать.
➖Deepseek релизит обещанный месяц назад Context Caching. Цены поражают: стоимость токенов при попадании в кэш падает не в 2x, как у гугла, а в 10x, при этом с бесплатным хранением. DeepSeek V2 и так произвёл эффект разорвавшейся бомбы на китайском рынке три месяца назад: модель была в разы дешевле конкурентов, при лучшем качестве. А сейчас нанесли добивающий удар.
С такими темпами цена за миллион токенов станет меньше цента менее чем через год. И будем мы мерять цены в долларах за миллиард токенов.
А помните, цены на GPT-4 доходили до $60 input/$120 output?
@ai_newz
❤🔥1
Forwarded from Machinelearning
⚡️Qwen выпустили Qwen2-Math, размером 1.5B, 7B и 72B, превосходящие GPT4o, Claude 3.5 на AIME 24/ AMC 23. 🔥
> 84 (72B), 75 (7B), 69,4 (1,5B) баллов на MATH
> > 72B SoTA на MMLU STEM
> Лицензия Apache 2.0 для версии 1.5B и 7B, 72B выпущена под лицензией Qianwen
> Основана на той же архитектуре, что и Qwen 2
> Интеграция с Transformers! 🤗
▪Hf
▪Github
▪Tech report
▪Scope
@ai_machinelearning_big_data
#opensource #Qwen #math
> 84 (72B), 75 (7B), 69,4 (1,5B) баллов на MATH
> > 72B SoTA на MMLU STEM
> Лицензия Apache 2.0 для версии 1.5B и 7B, 72B выпущена под лицензией Qianwen
> Основана на той же архитектуре, что и Qwen 2
> Интеграция с Transformers! 🤗
▪Hf
▪Github
▪Tech report
▪Scope
@ai_machinelearning_big_data
#opensource #Qwen #math
Anthropic запускает BugBounty для ИИ
Фокус на выявлении универсальных атак для обхода защитных механизмов.
Особое внимание уделяется критическим областям: химия, биология, радиология, ядерное и кибербезопасность.
Запускают в закрытом формате совместно с HackerOne.
Цель - протестировать новое поколение систем безопасности ИИ до их публичного запуска.
К участию приглашаются опытные исследователи и эксперты по обходу ограничений LLM.
Срок подачи заявок - 16 августа, отбор кандидатов пройдет осенью.
Здравая инициатива. Сбер когда?
#Anthropic #BugBounty #AISecuriy
-------
@tsingular
Фокус на выявлении универсальных атак для обхода защитных механизмов.
Особое внимание уделяется критическим областям: химия, биология, радиология, ядерное и кибербезопасность.
Запускают в закрытом формате совместно с HackerOne.
Цель - протестировать новое поколение систем безопасности ИИ до их публичного запуска.
К участию приглашаются опытные исследователи и эксперты по обходу ограничений LLM.
Срок подачи заявок - 16 августа, отбор кандидатов пройдет осенью.
Здравая инициатива. Сбер когда?
#Anthropic #BugBounty #AISecuriy
-------
@tsingular
POE.com добавили генератор картинок Flux.
- FLUX.1[pro]: самая мощная
- FLUX.1[dev]: баланс качества и скорости
- FLUX.1[schnell]: скоростная
#poe #flux
———
@tsingular
- FLUX.1[pro]: самая мощная
- FLUX.1[dev]: баланс качества и скорости
- FLUX.1[schnell]: скоростная
#poe #flux
———
@tsingular
❤1
Forwarded from Не баг, а фича
This media is not supported in your browser
VIEW IN TELEGRAM
Сайт запустит ChatGPT в браузере и покажет работу нейросети в разрезе! Это самая наглядная визуализация трансформеров для чайников.
В Transformer Explainer можно влиять на нейросеть ИЗНУТРИ — менять входы, параметры и температуру генерации. Так вы быстро преисполнитесь в понимании ИИ.
Прокачаться на выходных — тут.
🙂 Не баг, а фича
В Transformer Explainer можно влиять на нейросеть ИЗНУТРИ — менять входы, параметры и температуру генерации. Так вы быстро преисполнитесь в понимании ИИ.
Прокачаться на выходных — тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Smart Connections - ИИ помощник для Obsidian
Smart Connections - новый плагин для Obsidian, использующий ИИ-эмбеддинги для анализа и связывания заметок.
Функционал включает Smart View (отображение связанных заметок) и Smart Chat (общение с базой знаний).
Поддерживает локальные модели и 100+ API, включая Claude, Gemini, ChatGPT и Llama 3.
Плагин использует технологию HyDE для поиска, позволяет исключать файлы из обработки и визуализировать связи.
Разработчики сделали упор на минимизацию зависимостей и эффективность.
Прикольный плагин для Obsidian
https://github.com/brianpetro/obsidian-smart-connections
Спасибо @alyxst за рекомендацию!
#Obsidian #SmartConnections #NoteOrganization
-------
@tsingular
Smart Connections - новый плагин для Obsidian, использующий ИИ-эмбеддинги для анализа и связывания заметок.
Функционал включает Smart View (отображение связанных заметок) и Smart Chat (общение с базой знаний).
Поддерживает локальные модели и 100+ API, включая Claude, Gemini, ChatGPT и Llama 3.
Плагин использует технологию HyDE для поиска, позволяет исключать файлы из обработки и визуализировать связи.
Разработчики сделали упор на минимизацию зависимостей и эффективность.
Прикольный плагин для Obsidian
https://github.com/brianpetro/obsidian-smart-connections
Спасибо @alyxst за рекомендацию!
#Obsidian #SmartConnections #NoteOrganization
-------
@tsingular
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Первоначально это было неподвижное изображение AI, которое стало вирусным из-за того, насколько реалистично оно выглядит, созданное с помощью Flux1.0, который обещает стать лучшим бесплатным и открытым инструментом для создания изображений.
Затем @iamneubert на x.com сказал: "Подержите мое пиво!" и оживил его с помощью модели «Image-to-Video» Runwayml GEN-3 Alpha.
Источник: iamneubert на x.com
https://lnkd.in/g_Wep9Fp
Prompt: static camera, fast natural movement, dynamic motion, fashion portrait, she smiles while she talks, blinking eyes.
#Video #Runway #Gen3
———
@tsingular
Затем @iamneubert на x.com сказал: "Подержите мое пиво!" и оживил его с помощью модели «Image-to-Video» Runwayml GEN-3 Alpha.
Источник: iamneubert на x.com
https://lnkd.in/g_Wep9Fp
Prompt: static camera, fast natural movement, dynamic motion, fashion portrait, she smiles while she talks, blinking eyes.
#Video #Runway #Gen3
———
@tsingular
🔥7
ух ты, какая красота.
количество патентов в GenAI по странам.
WIPO pdf
#china #genai #patents
———
@tsingular
количество патентов в GenAI по странам.
WIPO pdf
#china #genai #patents
———
@tsingular
❤🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Machine-Learning-Tokyo: интерактивные инструменты для ML и математики
Репозиторий Machine-Learning-Tokyo представляет обширную коллекцию интерактивных инструментов для визуализации и понимания ML, DL и математики.
Включает средства для изучения трансформеров (Transformer Explainer, exBERT, BertViz), CNN, GAN, эмбеддингов и других ключевых концепций.
Предоставляет платформы для анализа NLP моделей (LIT), исследования поведения ML систем (What-If Tool) и изучения метрик разнообразия в поиске.
Содержит визуализации для математики, вероятностей и байесовского вывода.
Теперь даже школьник сможет понять, как работает нейросеть!
#MachineLearningTokyo #InteractiveTools #DataVisualization
-------
@tsingular
Репозиторий Machine-Learning-Tokyo представляет обширную коллекцию интерактивных инструментов для визуализации и понимания ML, DL и математики.
Включает средства для изучения трансформеров (Transformer Explainer, exBERT, BertViz), CNN, GAN, эмбеддингов и других ключевых концепций.
Предоставляет платформы для анализа NLP моделей (LIT), исследования поведения ML систем (What-If Tool) и изучения метрик разнообразия в поиске.
Содержит визуализации для математики, вероятностей и байесовского вывода.
Теперь даже школьник сможет понять, как работает нейросеть!
#MachineLearningTokyo #InteractiveTools #DataVisualization
-------
@tsingular
❤2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Форж для Флекса.
В переводе с клингонского, обновился клиент Stable Diffusion от создателя Фокуса и теперь он поддерживает Flux.
Причем не просто поддерживает, в еще и оптимизирует память. Господин Жанг умял Флекс в новый формат NP.4, которые быстрее и точнее FP8!
Короче, это теперь можно запускать на ваших чахлых машинах.
Более того, автор перебрал Форжа по косточкам, и теперь он снова синхронизирован с А1111 1.10 и снова работает быстрее.
Багов много, например, сейчас надо запускать Фордж с выключенными диффьюзерс. Но там комиты идкт каждые полчаса.
Но наконец-то!
https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/981
@cgevent
В переводе с клингонского, обновился клиент Stable Diffusion от создателя Фокуса и теперь он поддерживает Flux.
Причем не просто поддерживает, в еще и оптимизирует память. Господин Жанг умял Флекс в новый формат NP.4, которые быстрее и точнее FP8!
Короче, это теперь можно запускать на ваших чахлых машинах.
Более того, автор перебрал Форжа по косточкам, и теперь он снова синхронизирован с А1111 1.10 и снова работает быстрее.
Багов много, например, сейчас надо запускать Фордж с выключенными диффьюзерс. Но там комиты идкт каждые полчаса.
Но наконец-то!
https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/981
@cgevent
Forwarded from Social Engineering
• C 3 по 8 августа в Лас-Вегасе проходила одна из крупнейших #ИБ конференций в мире — Black Hat USA 2024. Было представлено большое количество интересных докладов и уникальной информации. • Официальный YT-канал ещё не опубликовал видео с выступлений, но зато пару дней назад были опубликованы первые презентации в одном из репозиториев:
• А ещё обязательно посмотрите выступления с предыдущих ивентов, где можно подчеркнуть для себя много нового и полезного:
- Видео Black Hat Europe 2023;
- Видео Black Hat USA 2023;
- Видео Black Hat Asia 2023.
- Видео Black Hat Europe 2022;
- Видео Black Hat USA 2022;
- Видео Black Hat Asia 2022.
- Презентации Black Hat Asia 2024.
- Презентации Black Hat Europe 2023;
- Презентации Black Hat USA 2023;
- Презентации Black Hat Asia 2023.
- Презентации Black Hat Europe 2022;
- Презентации Black Hat USA 2022;
- Презентации Black Hat Asia 2022.
S.E. ▪️ infosec.work ▪️ VT
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Forwarded from PWN AI (Artyom Semenov)
Что посмотреть по AI Security и AI in Security на DEFCON 32🔊
➡️ Incubated Machine Learning Exploits: Backdooring ML Pipelines Using Input-Handling Bugs (Suha Sabi Hussain)
➡️ ATTACKS ON GEN AI DATA AND USING VECTOR ENCRYPTION TO STOP THEM
➡️ Hackers vs AI: Perspectives from an ex-spy
➡️ VIDEO-DEMO Adnan Khan John Stawinski - Grand Theft Actions Abusing Self-Hosted GitHub Runners at Scale-pytorch
➡️ GRT_NOTEBOOK (показывают как запускать инструмент Inspect (от AI Safety Institute))
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Neo4j - GraphRAG для генеративного ИИ
Neo4j представила инструментарий GraphRAG для разработки приложений генеративного ИИ.
Ключевые компоненты:
• LLM Knowledge Graph Builder: формирует структурированный граф из неструктурированных данных.
• NeoConverse: генерирует и выполняет Cypher-запросы на основе пользовательских вопросов.
• Интеграции с LangChain, LlamaIndex, Haystack и облачными сервисами Google, AWS, Azure.
Экосистема позволяет улучшить качество ответов и прозрачность в GenAI-приложениях.
Доступны обучающие ресурсы, включая курс по графам знаний от Deeplearning AI.
Интересный готовый инструмент по построению графовых баз знаний для LLM.
Под капотом векторный кросс-поиск по связям и автогенерация cypher запросов (аналог SQL для графов)
#Neo4j #GraphRAG #KnowledgeGraphs
-------
@tsingular
Neo4j представила инструментарий GraphRAG для разработки приложений генеративного ИИ.
Ключевые компоненты:
• LLM Knowledge Graph Builder: формирует структурированный граф из неструктурированных данных.
• NeoConverse: генерирует и выполняет Cypher-запросы на основе пользовательских вопросов.
• Интеграции с LangChain, LlamaIndex, Haystack и облачными сервисами Google, AWS, Azure.
Экосистема позволяет улучшить качество ответов и прозрачность в GenAI-приложениях.
Доступны обучающие ресурсы, включая курс по графам знаний от Deeplearning AI.
Интересный готовый инструмент по построению графовых баз знаний для LLM.
Под капотом векторный кросс-поиск по связям и автогенерация cypher запросов (аналог SQL для графов)
#Neo4j #GraphRAG #KnowledgeGraphs
-------
@tsingular
⚡2