Технозаметки Малышева
8.57K subscribers
3.82K photos
1.43K videos
40 files
4K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from e/acc
Вчера мы говорили много о роли и позиции разных стран в ИИ-гонке: обсудили вчерашний документ Белого Дома, в котором они заявляют что ИИ — это ключевой элемент геополитического лидерства и безопасности; поговорили о зависимости и экспортируемости ИИ, а так же о том как разные страны и системы подходят к проблеме.

Хочу дополнить эту беседу довольно показательным графиком о количестве установленных серверов в стране. Примерно такая же картина с производством чипов (+Тайвань) и, естественно, тренировкой моделей.
Disney запускает масштабную ИИ-трансформацию

Disney анонсирует глобальное внедрение искусственного интеллекта во все сферы бизнеса.
Сотни специалистов будут задействованы в модернизации производства контента и управлении парками развлечений.
Технология затронет пост-продакшн, визуальные эффекты и оптимизацию операционных процессов.
CEO Боб Айгер подчеркивает: ИИ станет инструментом улучшения, а не замены человеческого труда.
Проект позволит быстрее создавать контент и делать общение в парках развлечений более персонализированными.
Другие киностудии тоже не отстают. Например, Lionsgate запартнёрилась с Runway.

Больше персонализированных развлечений богу развлечений!
Аниматроники в Диснейленде теперь смогут обратиться к вам лично по имени.
Норм идея и для нашего Острова Мечты или Кидзании, например.
Союзмультфильм, опять же :) 🐭

#Disney #Entertainment #ContentProduction
-------
@tsingular
👍6
Китай: на одного AI-специалиста претендуют 10 компаний

Технологический сектор КНР столкнулся с критической нехваткой AI-экспертов.
На 5 вакансий приходится лишь 2 квалифицированных соискателя.
Базовые зарплаты начинаются от $63,000 в год.
ByteDance, Baidu и Alibaba активно переманивают специалистов друг у друга.
90% местных IT-талантов остаются в стране, снизив отток с 11% до 3%.
Власти внедряют искусственный интеллект в школьную программу и развивают партнёрства вузов с бизнесом.

Похоже, скоро китайские специалисты будут стоить дороже американских 🤑

#ByteDance #Alibaba #Baidu #Китай
-------
@tsingular
Человечество впервые поговорило с китом: прорыв SETI с применением ИИ

Ученые проекта Whale-SETI успешно провели 20-минутный диалог с горбатым китом Твейн.
В эксперименте задействованы подводные динамики, гидрофоны и AI-алгоритмы для анализа звуковых сигналов.
Кит демонстрировал три фазы поведения: вовлеченность, возбуждение и отключение, соблюдая паузы между ответами.
Исследование открывает путь к пониманию нечеловеческого интеллекта и потенциальному контакту с внеземными цивилизациями.
Проект объединил достижения морской биологии, лингвистики и информационной теории.

Вспоминается "В поисках Немо" :)

#SETI #WhaleDialogue #InterspeciesCommunication
-------
@tsingular
🔥14🐳4
NotebookLlama: PDF в подкаст с помощью нейросетей

Представлен интересный инструментарий для трансформации PDF-документов в аудиоподкасты с использованием различных языковых моделей.
Процесс включает очистку текста, генерацию сценария и создание аудио с применением TTS-моделей parler-tts и bark/suno.
Система поддерживает разные версии Llama (70B, 8B, 1B) в зависимости от доступных вычислительных ресурсов.
Гибкая архитектура позволяет экспериментировать с системными промптами и настраивать различные голоса для разных спикеров.

Теперь можно слушать научные статьи в машине, как подкасты. Обсуждение в студии от нейросетевых экспертов! 🎧📚

#NotebookLlama #TTS #podcast
-------
@tsingular
👍6
Google готовит Jarvis - ИИ-помощника для автономной работы в браузере

Технологический гигант тестирует новый проект под кодовым названием Jarvis, способный самостоятельно управлять браузером.
Виртуальный ассистент анализирует скриншоты экрана, интерпретирует контент и выполняет действия: клики, ввод данных, навигацию по веб-страницам.
Может помочь с бронированием авиабилетов, поиском выгодных предложений и проведением онлайн-исследований.
Запуск проекта ожидается в декабре параллельно с релизом Gemini 2.0.

Можно будет попросить его помониторить hh, job.ru, CIAN или Авито ночью.
Дэйтинг сайты можно вычёркивать, - там только Jarvisы и будут сидеть теперь.

#Google #Jarvis #Chrome
-------
@tsingular
👍2
Forwarded from e/acc
Советник по безопасности Президента США на протяжении часа рассказывал о стратегической важности ИИ в национальной безопасности.

Быстро мы прошли путь от "ой, милая зверушка не умеет считать буквы r в straberry" до "доминация в ИИ — императив геополитической стабильности и безопасности США".

Несколько тезисов:

— ИИ наиболее критическая технология для национальной безопасности
— Лидерство в ИИ = залог геополитической доминации
— Президент и Белый Дом рук не покладая пишут указы о домашнем производстве чипов, массовому завозу ML рисечеров и дата сатанистов в Штаты, и вообще. Гринкарту при въезде на лоб.
— США должны быстрее других стран внедрить ИИ на всех уровнях системы безопасности и Армии
— China. China. China.
— Больше всего боевой ИИ сегодня тестируется в русско-украинской войне, внимательно изучаем уроки
— В рамках National Security Memorandum происходит внедрение ИИ и одновременно тестирование ИИ прямо на поле боя в Украине — некоторые уроки уже имплеметированы в US Army (дроны, jamming)
— Даже если у нас модели круче, тот, кто быстрее внедрит может победить, поэтому надо ускоряться
— Мы постоянно видим попытки nation state шпионажа против ИИ-лаб, поставим мотоциклечиков-пулеметчиков у входа, будем бдеть!
— Надо построить 10, а лучше 100 гигаватт энергогенерации исключительно для ИИ в следующие "несколько" лет 🤯
🤔9👍2
Первый в мире «жидкий ИИ».
Похож на ChatGPT, но прозрачен, энергоэффективен и почти в 500 раз дешевле.

Вчера самый популярный ИИ-стартап Бостона Liquid AI провел большое публичное мероприятие в MIT, чтобы продемонстрировать свои последние разработки, материализовавшие их «уникальный и революционный подход к ИИ» (видео рассказ о мероприятии).

«Мы создаем самые эффективные и самые мощные системы ИИ, которые вы еще не видели» и «Liquid AI делает возможным то, что до сих пор было невозможным» - объявил соучредитель Liquid AI Рамин Хасини, открывший мероприятие вместе с губернатором Маурой Хили.

Бостон Глоб дала своему репортажу об этом событии название «Маленькие черви, большие мечты: как мозг беспозвоночного вдохновил Бостон на самую большую добавку к ИИ» с подзаголовками «Liquid AI стремится стать ключевым событием, «подобным приезду Beatles в Америку» и «Модель ИИ LiquidAI отличается от модели LLM OpenAI».

Последнее – читая правда. Ибо 3 новых модели LiquidAI – это модели генеративного ИИ принципиально нового класса LFM (Liquid Foundation Models - Жидкие Базовые Модели), демонстрирующие топовую производительность при любом масштабе, и при занимающие ощутимо меньший объем памяти, обеспечивая более эффективные вывод.

Кроме того, LFM:
• снижает зависимость от облачных сервисов (что снижает затраты и потребление энергии), в результате чего модель может работать на смартфоне без Интернета;
• обеспечивает большую объяснимость и прозрачность, чем архитектуры на основе трансформаторов, потому что поведение моделей LFM можно перемотать назад, чтобы увидеть, как они произвели результат;
• разработка 3х моделей потребовала всего лишь $38 млн интвестиций (сравните с $17.9 млрд у OpenAI)

«Вдохновленная структурой мозга червя C. elegans, архитекрута класса LFM не похожа ни на что из того, что предлагают OpenAI, Google и их конкуренты, — однако она может предложить те же самые революционные приложения, используя при этом много меньше электричества» - сказал Рамин Хасини.

Червь C. elegans является одним из немногих существ, чья нервная система была полностью картирована, и он способен к удивительно сложному поведению, несмотря на то, что у него всего 302 нейрона. «Когда-то это был просто научный проект, но эта технология полностью коммерциализирована и полностью готова приносить пользу предприятиям», —объявил Хасани.

Кардинальное отличие в следующем.
• Внутри обычной нейронной сети свойства каждого моделируемого нейрона определяются статическим значением («весом»), который влияет на порог его возбуждения.
• В жидкостной нейронной сети поведение каждого нейрона управляется уравнением, которое предсказывает его поведение с течением времени. Сама же сеть, в ходе своего функционирования, решает каскад связанных уравнений. Конструкция делает сеть более эффективной и гибкой, позволяя ей обучаться даже после обучения, в отличие от обычной нейронной сети.

Все это звучит, как сказка. Но попробуйте сами поиграть с «жидким ИИ-чатботом». Мне очень понравилось.

PS И ведь предупреждал же еще в 2018, что «Человечество движется к разжижению мозга. Это возможный переход на альтернативный вариант интеллекта».
# LFM
🔥13👍411
Forwarded from Не баг, а фича
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла нейронка, которая полностью меняет фон и даже СВЕТ на любой фотке. Да, снимки как в дорогой фотосессии теперь можно сделать за минуту!

ИИ не только заменяет фон, но и корректирует освещение, яркость, контрасты и тени.
• Сохраняет все детали исходника без артефактов.
• Теперь даже в самой темной фотке можно мгновенно выставить КИНОШНЫЙ свет!

Демо пробуем здесь. Код лежит тут.

🙂 Не баг, а фича
Please open Telegram to view this post
VIEW IN TELEGRAM
👍102
This media is not supported in your browser
VIEW IN TELEGRAM
XHAND: Новые руки для роботов от RobotEra

Китайская компания RobotEra представила новую версию рук для роботов с тактильными датчиками на пальцах.
Подушечки каждого пальца собирают не только давление на сам палец, но и векторную карту перемещения объекта по подушечке с достаточно высоким разрешением.

Руки тренируют в виртуальной среде и дальше проверяют на реальных кошках :)

Точность поражает, - пластиковые стаканы с водой не мнутся, кошка жива.
🤖

#XHAND #RobotEra #Beijing #Китай
———
#tsingular
🔥11
IBM запустила Bee Agent Framework

IBM выпустила альфа версию открытого фреймворка 🐝 Bee Agent Framework для создания и управления мультиагентными ИИ системами.

Платформа уже оптимизирована под Granite и Llama 3.x, работает с OpenAI API, так что может подключаться к большинству современных популярных ИИ провайдеров.
Обеспечивает изолированное выполнение кода в контейнерах.
Позволяет управлять памятью, сериализацией состояний, интеграцией с MLFlow и созданием своих агентов.
Разработан на TypeScript, поддерживает Ollama, распространяется через Corepack и имеет удобный чат-интерфейс.

GitHub
Примеры от разработчиков.

Это мы пробуем. Альфа версия пока, но то, что оно все на моём любимом Node - считаю плюс. 🤖

#IBM #BeeAgentFramework #Bee #🐝
-------
@tsingular
Аттракцион невиданной щедрости, господа :)

тут недавно вышел Stability 3.5 и облачную версию я подключал в бота @cloud_gpt_bot, - который платный.

Теперь пришла очередь бесплатного.
Добавил локальную генерацию в
@ai_gptfreebot

Теперь по 1 запросу вы получаете 2 картинки.
Одну версию от Flux schnell, а вторую, следом, - Stability 3.5 large

Команда та же:
/image что хотите нарисовать

Каждый запрос сначала "раскрывается" с помощью модели gemma2:27b.
Например:
in: рождественская ёлка на Марсе
out: A solitary, vibrant Christmas tree stands defiantly against the stark, rusty-red Martian landscape.

это позволяет создавать реально красивые картинки из простых запросов.

На мой взгляд Stability точнее следует промпту, но судите сами, кому что полезнее будет.

P.S. Сервер 1. картинки генерятся по 1-3 минуты каждая. Поэтому если 100 человек обратятся одновременно - будет рисовать до вечера. Так что если не ответил, - попробуйте позже.
Но вижу, что уже у многих получается! :)
На здоровье!

#боты #dev
———
@tsingular
👍12🔥31
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Пришло письмо от Wonder Dynamics

Они выпускают Wonder Animation - и выглядит это невыносимо круто.


И да, это вам не однокнопочный ViggleAI - это профессиональное решение со сложным управление.

Поглядите видео, они преобразуют отснятый материал в 3D-сцены со всеми настройками камеры, анимацией тела и лица персонажа и полностью редактируемыми элементами в одной 3D-сцене. Тут много !.

Может кушать несколько планов с разными углами (широкий, средний, крупный). Затем ИИ реконструирует сцену в 3D и согласует положение и движение каждой камеры с персонажами и окружающей средой (анимация, персонаж, окружение, освещение и трекинг камеры)

Напомню, что пять месяцев назад их пожрал Автодеск. Но пока не убрал под сукно, а даже рекламирует как тул для Maya, Blender or Unreal.
https://adsknews.autodesk.com/en/news/autodesk-launches-wonder-animation-video-to-3d-scene-technology/

Цены профессиональные, особенно в пересчет на секунды.

@cgevent
🔥11👍3
Media is too big
VIEW IN TELEGRAM
OpenAI запускает поиск в ChatGPT

ChatGPT получил возможность поиска актуальной информации в интернете через Bing.
Функционал доступен всем пользователям Plus и Enterprise подписок.
Чатбот теперь может анализировать свежие данные и предоставлять ответы с цитированием источников.

Интеграция позволяет получать актуальные сведения о событиях, происходящих после сентября 2023 года.

С одной стороны поиск это, конечно, хорошо.
Тут и Perplexity может начать волноваться и, собственно, Google.
С другой стороны, - это же Bing.
За 15 лет он так и не смог стать лучшим поисковиком. Почему теперь ИИ с не лучшим поисковиком вдруг должен стать популярным?
Скорее уже Gemini2, который выйдет до конца этого года, всех обойдёт.

#OpenAI #Bing #Search
———
@tsingular
Chrome OS 130: ИИ и продуктивность для Chromebook Plus

Google выпустила масштабное обновление Chrome OS 130 с фокусом на эффективность работы.
Quick Insert обеспечивает молниеносный доступ к эмодзи, GIF и ссылкам через сочетание клавиш.
Модели с Neural Processing Unit получили эксклюзивные возможности: запись с ИИ, улучшенный звук и эффекты камеры.
Focus Mode блокирует уведомления в заданные периоды, а Welcome Recap восстанавливает прошлую сессию.
Samsung Galaxy Chromebook Plus первым обзавелся специальной кнопкой для быстрых действий, остальные модели получат её в 2024.

В будущем все ноутбуки будут с ИИ-ускорителями. Даже школьный хромбук теперь умнее калькулятора! 🎓

#ChromeOS #Samsung #NPU
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini API интегрируется с Google Search для улучшения точности ответов

Google добавил функцию Grounding with Search в AI Studio и Gemini API.
Нововведение позволяет моделям получать актуальные данные из поисковой системы и предоставлять ссылки на источники.
Функционал доступен для всех версий Gemini 1.5 через раздел Tools или параметр 'google_search_retrieval' в API.
Система динамически определяет необходимость поиска, используя пороговое значение 0.3.
Разработчики получили возможность тонкой настройки процесса поиска и извлечения данных.

А вот и то, о чем так долго говорили большевики, свершилось.
Буквально пара строк кода и ответы подкрепляются поиском без необходимости вызова отдельно поиска через апи.
import google.generativeai as genai
import os

genai.configure(api_key=os.environ["API_KEY"])
model = genai.GenerativeModel('models/gemini-1.5-flash-002')

response = model.generate_content(contents="Who won Wimbledon this year?",
tools='google_search_retrieval')
print(response)


#Gemini #GoogleSearch #APITools
-------
@tsingular
SmolLM2: сверхмалая англоязычная модель с эффективностью GPT 3.5

SmolLM2 - семейство компактных языковых моделей с размерами от 135M до 1.7B параметров.

Флагманская версия обучена на 11 триллионах токенов используя FineWeb-Edu, DCLM и The Stack датасеты.

Ключевые улучшения включают расширенную математическую логику, function calling и улучшенное следование инструкциям.

Основные ограничения: работа преимущественно на английском языке и возможная генерация неточной информации.

Вполне подойдет для дронов. 🤖🔢

#SmolLM2 #HuggingFace #LLM
-------
@tsingular
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Клод теперь читает пдфы как человек, с картинками.

До сегодняшнего дня, когда вы запихивалт PDF в Клод, он использовал службу извлечения текста для захвата текста и отправки его себе в текстовом промпте.

Теперь Клод может визуально увидеть PDF-файл вместе с текстом ЦЕЛИКОМ.

С картинками, диаграммами, и что там ещё запихивают в пдф.

Взгляд на страницу целиком.

Это позволяет Клоду более точно понимать сложные документы, например те, которые изобилуют диаграммами или графиками, не поддающимися текстовому представлению.

Например, теперь можно задавать Клоду вопросы о PDF-файле, полном анатомических диаграмм. См. видео

А ещё теперь можно пихать пдф в Клода через API.

Теперь он не читает документы, он их "рассматривает". Все как у людей.
https://docs.anthropic.com/en/docs/build-with-claude/pdf-support

@cgevent
👍532🔥1
О, Сбер теперь и в API обновил модельку!
Полезно.

Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).

- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama-405B.
- GigaChat-Max достигает 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU.
- По результатам SBS, где учитывается красота ответов, мы выигрываем в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro.
- В Arena-Hard мы достигаем 51% скора против GPT-4-0314
- В Vkhr Arena-General-RU мы достигаем 90%, в то время как YaGPT-4 Pro достигает 59%.


https://t.me/mashkka_ds/1824

#Сбербанк
———
@tsingular