Технозаметки Малышева

YouTube внедряет ИИ-инструменты для создателей контента

Google DeepMind интегрирует передовые модели генеративного ИИ в YouTube.
Функция Dream Screen позволит генерировать фоны для Shorts, используя технологии Veo и Imagen 3.
Вкладка 'Вдохновение' в YouTube Studio предложит идеи видео, заголовки и наброски сценариев.
В 2025 году планируется возможность создания 6-секундных видеоклипов.
Контент, созданный с помощью ИИ, будет помечен водяными знаками SynthID и спец метками.
Умнее станет так же функция автоматического дубляжа на разные языки.
В разделе Сообщества так же появятся новые инструменты ИИ появятся для работы с аудиторией.

Нужен отдельный видеохостинг для контента без ИИ.
Может в этом и будет цель Рутуба в итоге ? :)

#YouTube #DeepMind #DreamScreen
-------
@tsingular

951 viewsedited 06:54

7:43

Media is too big

VIEW IN TELEGRAM

Nvidia’s CEO Jensen Huang и Salesforce CEO Marc Benioff обсуждают ИИ агентов на Dreamforce 2024.

- Это будет индустрия навыков - агенты, использующие инструменты. У нас будут агенты, которые понимают тонкости того, что мы просим их сделать и они смогут использовать инструменты, рассуждать и сотрудничать друг с другом.

- Прорыв для меня наступил в момент, когда мы поняли, что обучение без учителя стало возможным. Когда оно позволило нам использовать языковые модели для создания языковых моделей, кодифицирующих предварительные знания человека, с этого момента масштаб стал экспоненциальным.

- Мы находимся на стадии, когда мы движемся гораздо быстрее закона Мура. Возможно, в квадратичной степени закона Мура.

- Сейчас только раскручивается маховик обратной связи и я думаю, что прогресс, который у нас будет с агентами в течение следующего года или двух, будет впечатляющим и удивительным.

- ИИ теперь рассуждает о том, достаточно ли безопасен и правилен ответ, который он генерирует.

- Создание агента не должно быть каким-то проектом для хакатона по информатике. Это должно быть чем-то, что мы можем легко сделать, потому что это будет больше похоже на адаптацию сотрудников, чем на написание программного обеспечения.

- Мы собираемся привнести уровень автоматизации, которого мир никогда не видел.

Следующий год, - официально год агентов.
Ещё Хуанг в другом интервью заявил, что для вот этих самостоятельных рассуждений нужно примерно 50х больше инференс мощности, чем для обычных LLM, потому что там очень много промежуточных промптов и рассуждений. И их будет еще больше и нужно чтоб они проходили не за минуты как сейчас, а мгновенно, фоном незаметно для пользователя.
Так что следующие Blackwell чипы будут гораздо мощнее. Как видно из этого интевью, - в сотни раз, благодаря как раз ИИ разработчикам.

Добро пожаловать в Технологическую Сингулярность!

#NVIDIA #SalesForce #агенты
———
@tsingular

🔥7👍5👾1

1.07K viewsedited 09:00

Технозаметки Малышева

0:21

Media is too big

VIEW IN TELEGRAM

Tripo3D обновилась до v2.
И теперь можно бесплатно из любой фотки запилить 3Д фигуру за пару секунд.
Хочешь потом печатай её, хочешь в игру вставляй.

Работает и в вебе и по API

https://www.tripo3d.ai/app

#tripo3d #3d
———
@tsingular

🔥7✍3

984 views11:00

Технозаметки Малышева

Amazon представляет Project Amelia - ИИ-помощники для продавцов

Амазон запустил бета-версию AI-ассистентов для продавцов в США.
Project Amelia, созданный на базе Amazon Bedrock, упрощает управление бизнесом.

Агенты помогают в анализе продаж, трафика и предоставляют сводки ключевых метрик.

В перспективе ассистент сможет самостоятельно решать проблемы и выполнять задачи от имени продавца.

Через пару лет:
Я - Уинстон Вульф, решаю проблемы... 🛒💰

#Amazon #ProjectAmelia #eCommerce
-------
@tsingular

905 viewsedited 06:50

Технозаметки Малышева

Forwarded from Machinelearning

⚡️ Qwen2.5 Family: Релиз Qwen2.5, Qwen2.5-Coder и Qwen2.5-Math.

Команда разработки Qwen (Alibaba Group) опубликовала большой релиз нового поколения моделей - Qwen2.5, специализированные модели: Qwen2.5-Coder, Qwen2.5-Math, их инструктивные и квантованные версии, анонсированы закрытые Qwen-Plus и Qwen-Turbo.

Вместе с релизом нового поколения 2.5 в отрытый доступ опубликована Qwen2-VL-72B-Instruct предыдущего поколения.

▶️

Qwen2.5

В дополнение к традиционным вариантам с 0,5-1,5-7-72 млрд параметров, Qwen2.5 предлагает две новые модели среднего размера 14 млрд и 32 млрд параметров и компактную модель 3 млрд параметров.

Qwen2.5 обучались на увеличенном и улучшенном наборе данных размером в 18 трлн токенов.

Значительно расширены знания моделей: возможности в области программирования,
усовершенствованы математические способности Qwen2.5, повышено соответствие ответов модели предпочтениям человека: следование инструкциям, генерация длинных текстов (до 8 тыс. токенов), понимание структурированных данных и генерация структурированных выводов (в частности, JSON).

Список моделей:

🟢

Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B;

🟢

Qwen2.5-Instruct: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B;

🟢Qwen2.5-Instruct: все варианты в форматах GPTQ, AWQ, GGUF.

В дополнение к этим моделям открыт доступ по API для флагманских моделей: Qwen-Plus и Qwen-Turbo через Model Studio.

▶️

Qwen2.5 Coder

Qwen2.5-Coder доступна в трех размерах: 1,5 млрд, 7 млрд и 32 млрд параметров (последняя появится в ближайшее время). Обновление состоит из двух основных улучшений: больше объем обучающих данных и расширение возможностей программирования в общих задачах и в математике.

Модели обучались на массиве данных объемом 5,5 триллиона токенов, включающем исходный код, данные для сопоставления текста и кода и синтетические данные.

Qwen2.5-Coder поддерживает до 128 тысяч токенов контекста, знает 92 языка программирования и выполняет операции по генерации кода, автодополнению и исправлению кода.

Qwen2.5-Coder-Instruct имеет способность к обобщению, знает более 40 языков программирования, справляется с задачами, связанными с логическим мышлением в коде, и показывает высокие результаты в задачах, связанных с математическим мышлением.

Список моделей:

🟠

Qwen2.5-Coder: 1.5B, 7B;

🟠

Qwen2.5-Coder-Instruct: 1.5B, 7B;

🟠Qwen2.5-Coder-Instruct в формате GGUF: 1.5B, 7B.

▶️

Qwen2.5 Math

Qwen2.5-Math обучались на корпусе математических данных Qwen Math Corpus v2, который содержит более 1 трлн. токенов.

Помимо базовых моделей, серия Qwen2.5-Math включает в себя инструктивные модели: Qwen2.5-Math-Instruct и модель математического вознаграждения, Qwen2.5-Math-RM-72B.

Qwen2.5-Math-Instruct обучалась с использованием данных CoT и TIR на китайском и английском языках, а также данных SFT, созданных с использованием Qwen2.5-Math-RM-72B.

Список моделей:

🟠

Qwen2.5-Math: 1.5B, 7B, 72B, RM-72B;

🟠

Qwen2.5-Math-Instruct: 1.5B, 7B, 72B.

▶️ Вместе с релизом Qwen2.5, опубликована Qwen2-VL-72B-Instruct и ее квантованные Int8 и Int4 версии в форматах GPTQ, AWQ.

📌Лицензирование:

🟢Apache 2.0 для всех base и instruct моделей, кроме 3B и 72B.
🟠Qwen2.5-3B - Qwen Research License.
🟠Qwen2.5-72B и Qwen2.5-Math-72B - Qwen License.

🟡

Страница проекта

🟡

Коллекция моделей на HF

🟡

Demo Qwen2.5-Instruct-72B

🟡

Demo Qwen2.5-Coder-Instruct-7B

🟡

Demo Qwen2.5-Math

🟡

Сообщество в Discord

🖥

Github

@ai_machinelearning_big_data

#AI #ML #LLM #Qwen

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍1

1.04K views08:59

Технозаметки Малышева

Forwarded from Data Secrets

No Context Russia

😁11🎃2

1.28K views09:09

Технозаметки Малышева

🔥9😁5

833 views09:14

Технозаметки Малышева

ИИ в ИБ - на примере защиты веб сайта

Провёл тут небольшое упражнение:

Берём простой сайт, буквально лэндинг с чат-ботом (это чтобы API security тоже проработать), запускаем и смотрим логи.

В логах сразу видим разных ботов и прочие хакер-сканеры. Буквально через пару минут они к вам придут, если не быстрее.

Но у нас же ИБ паранойя, - начинаем думать что бы прикрыть в первую очередь своими силами.

Security Hardening, - есть такой базовый термин - настроить то, что уже есть под рукой или взять open source.

Берём какой-нибудь более менее бесплатный внешний сканер (или платный в режиме промо), смотрим что же у нас не так.

Получаем на почту отчет, - в моём примере он что-то в размере 5 средних и 4 не страшных уязвимостей нашел и еще рекомендации дал WAF поднять и еще по мелочи.

Берём этот отчёт и кормим Sonnet 3.5 вместе с конфигом nginx! тут важно, чтобы он не нагалюцинировал что-то, что порушит ваш текущий конфиг!

И получаем на выходе новый исправленный конфиг и еще описание шагов по установке WAF и настройке ufw и т.д.

Получается можно очень быстро поднять уровень безопасности своей веб инфраструктуры без привлечения вообще никого за несколько десятков тысяч токенов, - т.е. даром.

Мастер-класс нужен кому ? :)

#securityhardening #security #manual
———
@tsingular

1🔥18👍9✍4

1.34K viewsedited 10:35

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

2:14

Media is too big

VIEW IN TELEGRAM

Это видео я хотел прикрепить к посту про то, что Lionsgate заключила сделку с Runway.

Но забыл.

Исправляюсь. Это картинки из Флюкса+Лоры, присунутые в Runway. В большом количестве.

На реддите отчаянно ищут блох - зубы кривые, башка большая, тело маленькое..

Стадия гнев. Скоро депрессия и принятие.

Обратите внимание, ничего (почти) не кипит, это вам не AnimDiff, это video генерация

Заберите девочку и скормите ея в video2video. Она и так хороша, но можно будет снимать сериалы и накидывать на них скины: аниме, пластилин, киберпанк..

И тут мне пришла в голову идея выпить за модный эмоциональный интеллект.

Берем актеров и студентов актерских вузов, курсов, тусовок. Размечаем датасет. Тут радость, тут грусть, тут нереальное сопререживание, тут чудовищная эмпатия.
Дальше пишем промпты. Точнее пишем, что надо выдавить из кожаного зрителя, а chatGPT или Жан Клод напишет оптимальный промпт для генерации.

Ну, за эмоциональный интеллект, которые плавно приватизирован искусственным интеллектом.

@cgevent

👍12

1.17K views11:02

Технозаметки Малышева

Forwarded from Mashkka про Data Science

🫥

Paper Watch: Методы для обнаружения утечек данных в LLM

В новом выпуске #paperwatch разбираем самые последние статьи по детекции утечек данных в LLM:

1️⃣

DETECTING PRETRAINING DATA FROM LARGE LANGUAGE MODELS

2️⃣

Min-K%++: Improved Baseline for Detecting Pre-Training Data from Large Language Models

3️⃣

Generalization or Memorization: Data Contamination and TrustworthyEvaluation for Large Language Models

👀Запись
💭Слайды

#nlp #llm

Please open Telegram to view this post

VIEW IN TELEGRAM

895 views12:15

Технозаметки Малышева

Forwarded from Machinelearning

🌟 Агенты GenAI: Репозиторий Github c обширной базой знаний и примерами.

GenAI-агенты - это системы ИИ, способные взаимодействовать с окружающим миром и выполнять разнообразные задачи, подобно человеку. В отличие от традиционных систем ИИ, GenAI-агенты обладают большей гибкостью, адаптивностью и способностью к обучению.

Репозиторий - кладезь теоретических и практических знаний: примеры, начиная от простых разговорных ботов до сложных многоагентных систем, обучающие материалы для всех уровней — от начинающих до опытных пользователей, заинтересованных в изучении и применении современных технологий GenAI.

Простые агенты:

🟢простые диалоговые агентов и агенты для ответов на вопросы;
🟢агенты для анализа данных;

Агенты для конкретных задач:

🟠клиентская поддержка;
🟠оценка эссе и сочинений;
🟠планировщик путешествий;

Творческие агенты:

🟢агент генерации GIF-анимации;
🟢агент для генерации речи на основе текста;
🟢агент для генерации музыкальных композиций;

Сложные системы агентов:

🟠разговорный агент с расширенной памятью;
🟠многоагентные системы;
🟠самосовершенствующиеся агенты;
🟠агенты, ориентированные на выполнение задач;
🟠агенты для поиска и обобщения информации в Интернете;
🟠 исследовательские группы агентов на базе Autogen;

Специальные сложные агенты:

🟢агент для комплексных задач с использованием RAG.

▶️Практическое изучение и создание агентов GenAI::

# Клонируйте репозиторий
git clone https://github.com/NirDiamant/GenAI_Agents.git

#Перейдите к интересующей вас технике
cd all_agents_tutorials/technique-name

#Следуйте подробному руководству по применению в каталоге каждой техники.

📌 Лицензирование : Apache 2.0 License.

🟡

Сообщество в Discord

🖥

Github

@ai_machinelearning_big_data

#AI #ML #Agents #AwesomeGenAI #Github

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8

990 views17:03

Технозаметки Малышева

Перезапуск Three Mile Island: АЭС оживят для ИИ-проектов Microsoft

Компания Constellation Energy перезапустит реактор на Three Mile Island в связи с дефицитом мощностей под ИИ-проекты Microsoft.
20-летний контракт обеспечит 835 МВт мощности и создаст 3400 рабочих мест.
Проект принесёт экономике Пенсильвании $16 млрд. и продлит работу АЭС до 2054 года.
Станцию переименуют в Crane Clean Energy Center, запуск намечен на 2028 год.
Это отражает тренд роста потребления генерации на фоне бума ИИ проектов в мире.
К 2030 году потребление энергии дата-центрами вырастет на 160%.
Потенциал необходимого объёма в будущем на порядок превышает текущие мощности.

1 B200 - 1кВт, грубо. + 50%, допустим, на обвязку.
1 электростанция на ~500тыс видеокарт, что не мало, конечно, но в целом впритык.

Покупаем акции Росатома, получается :)

#ThreeMileIsland #Microsoft #ConstellationEnergy
-------
@tsingular

✍8👏1😁1

1.11K viewsedited 05:23

Технозаметки Малышева

Автоматизация защиты от дефейса на примере AWS и CloudWatch Synthetics

А вот еще простая, но интересная техника наблюдения за сайтом, - не взломали ли его и не подменили ли страницу.

Система использует скрипты, регулярно делающие скриншоты сайта и сравнивающие их с эталонными.

При превышении порога расхождения запускается автоматическое реагирование через EventBridge и SNS.

Для минимизации ложных срабатываний предусмотрено исключение динамического контента и настройка порогов.

В случае подтверждения атаки AWS WAF может оперативно развернуть страницу обслуживания.

Ну т.е. теперь можно ИИ заставить посмотреть на скриншот (каждую минуту, его глазки-то не жалко) и определить есть ли изменения за пределами нормы, - если есть, решаем скриптами или зовём человеков.
И причём эта система может же быть удалённой, мониторить ИИ-глазками сайты.
Вот вам и стартап. :)

#AWS #CloudWatch #cybersecurity
-------
@tsingular

🔥11❤1👍1

1.68K viewsedited 07:01

Технозаметки Малышева

Salesforce открывает бесплатные курсы по ИИ для всех

Крупнейший CRM-провайдер запускает масштабную образовательную инициативу в сфере искусственного интеллекта.
Онлайн-платформа Trailhead предоставит доступ к курсам до конца 2025 года.
В штаб-квартире компании в Сан-Франциско откроются пространства для очного обучения.
Для 72 000 сотрудников Salesforce вводятся ежеквартальные дни обучения ИИ с практикой на инструментах Agentforce.
Программа включает основы ИИ, этичное использование и промптинг.
40% из 2,6 млн значков по ИИ на Trailhead уже получены работниками компании.

Salesforce очень сильно рванул вперёд в ИИ гонке именно в плане применения в бизнесе.
Т.е. они не разрабатывают ИИ модели, но тюнят готовые от лидеров и создают экосистемы вокруг.
В том числе, как видим, - теперь и курсы.
Ежеквартальное обучение сотрудников новинкам ИИ, - это вообще что-то за гранью! 🤖💼
Одобряю.

#Salesforce #Trailhead #AIEducation
-------
@tsingular

👍2✍1

2.48K views07:12

Технозаметки Малышева

Forwarded from Data Secrets

Microsoft оценили рост популярности ИИ

И самое интересное, что сделали они это очень крутой метрикой: не объемами рынка, не числом новых стартапов, не суммой инвестиций и вот этим всем, а с помощью простого человеческого количества ИИ-контрибьютов на GitHub в минуту.

Получился вот такой симпатичный график. Как всегда, видна четкая граница до/после релиза ChatGPT. Всего с этого момента рост метрики произошел на 230% (!!!), и это действительно показательно (потому что где, как не на гитхабе, сейчас наблюдать тренды экономики?)

Красивое, в общем 😍

Please open Telegram to view this post

VIEW IN TELEGRAM

✍6👍2🍓2

2.69K views08:46

About

Blog

Apps

Platform