Технозаметки Малышева – Telegram

Технозаметки Малышева

8.57K subscribers

3.82K photos

1.43K videos

40 files

4K links

Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb

Download Telegram

About

Blog

Apps

Platform

Технозаметки Малышева

8.57K subscribers

Технозаметки Малышева

Forwarded from e/acc

Вчера мы говорили много о роли и позиции разных стран в ИИ-гонке: обсудили вчерашний документ Белого Дома, в котором они заявляют что ИИ — это ключевой элемент геополитического лидерства и безопасности; поговорили о зависимости и экспортируемости ИИ, а так же о том как разные страны и системы подходят к проблеме.

Хочу дополнить эту беседу довольно показательным графиком о количестве установленных серверов в стране. Примерно такая же картина с производством чипов (+Тайвань) и, естественно, тренировкой моделей.

1.11K views09:12

Технозаметки Малышева

Disney запускает масштабную ИИ-трансформацию

Disney анонсирует глобальное внедрение искусственного интеллекта во все сферы бизнеса.
Сотни специалистов будут задействованы в модернизации производства контента и управлении парками развлечений.
Технология затронет пост-продакшн, визуальные эффекты и оптимизацию операционных процессов.
CEO Боб Айгер подчеркивает: ИИ станет инструментом улучшения, а не замены человеческого труда.
Проект позволит быстрее создавать контент и делать общение в парках развлечений более персонализированными.
Другие киностудии тоже не отстают. Например, Lionsgate запартнёрилась с Runway.

Больше персонализированных развлечений богу развлечений!
Аниматроники в Диснейленде теперь смогут обратиться к вам лично по имени.
Норм идея и для нашего Острова Мечты или Кидзании, например.
Союзмультфильм, опять же :) 🐭✨

#Disney #Entertainment #ContentProduction
-------
@tsingular

👍6

1.16K viewsedited 11:23

Технозаметки Малышева

Китай: на одного AI-специалиста претендуют 10 компаний

Технологический сектор КНР столкнулся с критической нехваткой AI-экспертов.
На 5 вакансий приходится лишь 2 квалифицированных соискателя.
Базовые зарплаты начинаются от $63,000 в год.
ByteDance, Baidu и Alibaba активно переманивают специалистов друг у друга.
90% местных IT-талантов остаются в стране, снизив отток с 11% до 3%.
Власти внедряют искусственный интеллект в школьную программу и развивают партнёрства вузов с бизнесом.

Похоже, скоро китайские специалисты будут стоить дороже американских 🤑

#ByteDance #Alibaba #Baidu #Китай
-------
@tsingular

1.11K viewsedited 11:38

Технозаметки Малышева

Человечество впервые поговорило с китом: прорыв SETI с применением ИИ

Ученые проекта Whale-SETI успешно провели 20-минутный диалог с горбатым китом Твейн.
В эксперименте задействованы подводные динамики, гидрофоны и AI-алгоритмы для анализа звуковых сигналов.
Кит демонстрировал три фазы поведения: вовлеченность, возбуждение и отключение, соблюдая паузы между ответами.
Исследование открывает путь к пониманию нечеловеческого интеллекта и потенциальному контакту с внеземными цивилизациями.
Проект объединил достижения морской биологии, лингвистики и информационной теории.

Вспоминается "В поисках Немо" :)

#SETI #WhaleDialogue #InterspeciesCommunication
-------
@tsingular

🔥14🐳4

1.11K views11:43

Технозаметки Малышева

NotebookLlama: PDF в подкаст с помощью нейросетей

Представлен интересный инструментарий для трансформации PDF-документов в аудиоподкасты с использованием различных языковых моделей.
Процесс включает очистку текста, генерацию сценария и создание аудио с применением TTS-моделей parler-tts и bark/suno.
Система поддерживает разные версии Llama (70B, 8B, 1B) в зависимости от доступных вычислительных ресурсов.
Гибкая архитектура позволяет экспериментировать с системными промптами и настраивать различные голоса для разных спикеров.

Теперь можно слушать научные статьи в машине, как подкасты. Обсуждение в студии от нейросетевых экспертов! 🎧📚

#NotebookLlama #TTS #podcast
-------
@tsingular

👍6

1.22K viewsedited 17:15

Технозаметки Малышева

Google готовит Jarvis - ИИ-помощника для автономной работы в браузере

Технологический гигант тестирует новый проект под кодовым названием Jarvis, способный самостоятельно управлять браузером.
Виртуальный ассистент анализирует скриншоты экрана, интерпретирует контент и выполняет действия: клики, ввод данных, навигацию по веб-страницам.
Может помочь с бронированием авиабилетов, поиском выгодных предложений и проведением онлайн-исследований.
Запуск проекта ожидается в декабре параллельно с релизом Gemini 2.0.

Можно будет попросить его помониторить hh, job.ru, CIAN или Авито ночью.
Дэйтинг сайты можно вычёркивать, - там только Jarvisы и будут сидеть теперь.

#Google #Jarvis #Chrome
-------
@tsingular

👍2

1.09K viewsedited 06:00

Технозаметки Малышева

Forwarded from e/acc

Советник по безопасности Президента США на протяжении часа рассказывал о стратегической важности ИИ в национальной безопасности.

Быстро мы прошли путь от "ой, милая зверушка не умеет считать буквы r в straberry" до "доминация в ИИ — императив геополитической стабильности и безопасности США".

Несколько тезисов:

— ИИ наиболее критическая технология для национальной безопасности
— Лидерство в ИИ = залог геополитической доминации
— Президент и Белый Дом рук не покладая пишут указы о домашнем производстве чипов, массовому завозу ML рисечеров и дата сатанистов в Штаты, и вообще. Гринкарту при въезде на лоб.
— США должны быстрее других стран внедрить ИИ на всех уровнях системы безопасности и Армии
— China. China. China.
— Больше всего боевой ИИ сегодня тестируется в русско-украинской войне, внимательно изучаем уроки
— В рамках National Security Memorandum происходит внедрение ИИ и одновременно тестирование ИИ прямо на поле боя в Украине — некоторые уроки уже имплеметированы в US Army (дроны, jamming)
— Даже если у нас модели круче, тот, кто быстрее внедрит может победить, поэтому надо ускоряться
— Мы постоянно видим попытки nation state шпионажа против ИИ-лаб, поставим мотоциклечиков-пулеметчиков у входа, будем бдеть!
— Надо построить 10, а лучше 100 гигаватт энергогенерации исключительно для ИИ в следующие "несколько" лет 🤯

National Security Advisor Jake Sullivan Holds Fireside Chat About Artificial Intelligence

National Security Advisor Jake Sullivan spoke about artificial intelligence at the National Defense University.

Fuel your success with Forbes. Gain unlimited access to premium journalism, including breaking news, groundbreaking in-depth reported stories…

🤔9👍2

1.08K views10:13

Технозаметки Малышева

Forwarded from Малоизвестное интересное

Первый в мире «жидкий ИИ».
Похож на ChatGPT, но прозрачен, энергоэффективен и почти в 500 раз дешевле.
Вчера самый популярный ИИ-стартап Бостона Liquid AI провел большое публичное мероприятие в MIT, чтобы продемонстрировать свои последние разработки, материализовавшие их «уникальный и революционный подход к ИИ» (видео рассказ о мероприятии).

«Мы создаем самые эффективные и самые мощные системы ИИ, которые вы еще не видели» и «Liquid AI делает возможным то, что до сих пор было невозможным» - объявил соучредитель Liquid AI Рамин Хасини, открывший мероприятие вместе с губернатором Маурой Хили.

Бостон Глоб дала своему репортажу об этом событии название «Маленькие черви, большие мечты: как мозг беспозвоночного вдохновил Бостон на самую большую добавку к ИИ» с подзаголовками «Liquid AI стремится стать ключевым событием, «подобным приезду Beatles в Америку» и «Модель ИИ LiquidAI отличается от модели LLM OpenAI».

Последнее – читая правда. Ибо 3 новых модели LiquidAI – это модели генеративного ИИ принципиально нового класса LFM (Liquid Foundation Models - Жидкие Базовые Модели), демонстрирующие топовую производительность при любом масштабе, и при занимающие ощутимо меньший объем памяти, обеспечивая более эффективные вывод.

Кроме того, LFM:
• снижает зависимость от облачных сервисов (что снижает затраты и потребление энергии), в результате чего модель может работать на смартфоне без Интернета;
• обеспечивает большую объяснимость и прозрачность, чем архитектуры на основе трансформаторов, потому что поведение моделей LFM можно перемотать назад, чтобы увидеть, как они произвели результат;
• разработка 3х моделей потребовала всего лишь $38 млн интвестиций (сравните с $17.9 млрд у OpenAI)

«Вдохновленная структурой мозга червя C. elegans, архитекрута класса LFM не похожа ни на что из того, что предлагают OpenAI, Google и их конкуренты, — однако она может предложить те же самые революционные приложения, используя при этом много меньше электричества» - сказал Рамин Хасини.

Червь C. elegans является одним из немногих существ, чья нервная система была полностью картирована, и он способен к удивительно сложному поведению, несмотря на то, что у него всего 302 нейрона. «Когда-то это был просто научный проект, но эта технология полностью коммерциализирована и полностью готова приносить пользу предприятиям», —объявил Хасани.

Кардинальное отличие в следующем.
• Внутри обычной нейронной сети свойства каждого моделируемого нейрона определяются статическим значением («весом»), который влияет на порог его возбуждения.
• В жидкостной нейронной сети поведение каждого нейрона управляется уравнением, которое предсказывает его поведение с течением времени. Сама же сеть, в ходе своего функционирования, решает каскад связанных уравнений. Конструкция делает сеть более эффективной и гибкой, позволяя ей обучаться даже после обучения, в отличие от обычной нейронной сети.

Все это звучит, как сказка. Но попробуйте сами поиграть с «жидким ИИ-чатботом». Мне очень понравилось.

PS И ведь предупреждал же еще в 2018, что «Человечество движется к разжижению мозга. Это возможный переход на альтернативный вариант интеллекта».
# LFM

🔥13👍4❤1⚡1

982 views14:15

Технозаметки Малышева

Forwarded from Не баг, а фича

This media is not supported in your browser

VIEW IN TELEGRAM

Вышла нейронка, которая полностью меняет фон и даже СВЕТ на любой фотке. Да, снимки как в дорогой фотосессии теперь можно сделать за минуту!

• ИИ не только заменяет фон, но и корректирует освещение, яркость, контрасты и тени.
• Сохраняет все детали исходника без артефактов.
• Теперь даже в самой темной фотке можно мгновенно выставить КИНОШНЫЙ свет!

Демо пробуем здесь. Код лежит тут.

🙂

Не баг, а фича

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10❤2

1.13K views16:28

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

XHAND: Новые руки для роботов от RobotEra

Китайская компания RobotEra представила новую версию рук для роботов с тактильными датчиками на пальцах.
Подушечки каждого пальца собирают не только давление на сам палец, но и векторную карту перемещения объекта по подушечке с достаточно высоким разрешением.

Руки тренируют в виртуальной среде и дальше проверяют на реальных кошках :)

Точность поражает, - пластиковые стаканы с водой не мнутся, кошка жива.
🤖

#XHAND #RobotEra #Beijing #Китай
———
#tsingular

🔥11

1.36K views06:04

Технозаметки Малышева

IBM запустила Bee Agent Framework

IBM выпустила альфа версию открытого фреймворка 🐝 Bee Agent Framework для создания и управления мультиагентными ИИ системами.

Платформа уже оптимизирована под Granite и Llama 3.x, работает с OpenAI API, так что может подключаться к большинству современных популярных ИИ провайдеров.
Обеспечивает изолированное выполнение кода в контейнерах.
Позволяет управлять памятью, сериализацией состояний, интеграцией с MLFlow и созданием своих агентов.
Разработан на TypeScript, поддерживает Ollama, распространяется через Corepack и имеет удобный чат-интерфейс.

GitHub
Примеры от разработчиков.

Это мы пробуем. Альфа версия пока, но то, что оно все на моём любимом Node - считаю плюс. 🤖

#IBM #BeeAgentFramework #Bee #🐝
-------
@tsingular

1.21K viewsedited 05:07

Технозаметки Малышева

Аттракцион невиданной щедрости, господа :)

тут недавно вышел Stability 3.5 и облачную версию я подключал в бота @cloud_gpt_bot, - который платный.

Теперь пришла очередь бесплатного.
Добавил локальную генерацию в
@ai_gptfreebot

Теперь по 1 запросу вы получаете 2 картинки.
Одну версию от Flux schnell, а вторую, следом, - Stability 3.5 large

Команда та же:
/image что хотите нарисовать

Каждый запрос сначала "раскрывается" с помощью модели gemma2:27b.
Например:
in: рождественская ёлка на Марсе
out: A solitary, vibrant Christmas tree stands defiantly against the stark, rusty-red Martian landscape.

это позволяет создавать реально красивые картинки из простых запросов.

На мой взгляд Stability точнее следует промпту, но судите сами, кому что полезнее будет.

P.S. Сервер 1. картинки генерятся по 1-3 минуты каждая. Поэтому если 100 человек обратятся одновременно - будет рисовать до вечера. Так что если не ответил, - попробуйте позже.
Но вижу, что уже у многих получается! :)
На здоровье!

#боты #dev
———
@tsingular

👍12🔥3❤1

1.25K views06:36

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

VIEW IN TELEGRAM

Пришло письмо от Wonder Dynamics

Они выпускают Wonder Animation - и выглядит это невыносимо круто.

И да, это вам не однокнопочный ViggleAI - это профессиональное решение со сложным управление.

Поглядите видео, они преобразуют отснятый материал в 3D-сцены со всеми настройками камеры, анимацией тела и лица персонажа и полностью редактируемыми элементами в одной 3D-сцене. Тут много !.

Может кушать несколько планов с разными углами (широкий, средний, крупный). Затем ИИ реконструирует сцену в 3D и согласует положение и движение каждой камеры с персонажами и окружающей средой (анимация, персонаж, окружение, освещение и трекинг камеры)

Напомню, что пять месяцев назад их пожрал Автодеск. Но пока не убрал под сукно, а даже рекламирует как тул для Maya, Blender or Unreal.
https://adsknews.autodesk.com/en/news/autodesk-launches-wonder-animation-video-to-3d-scene-technology/

Цены профессиональные, особенно в пересчет на секунды.

@cgevent

🔥11👍3

1.05K views10:54

Технозаметки Малышева

Media is too big

VIEW IN TELEGRAM

OpenAI запускает поиск в ChatGPT

ChatGPT получил возможность поиска актуальной информации в интернете через Bing.
Функционал доступен всем пользователям Plus и Enterprise подписок.
Чатбот теперь может анализировать свежие данные и предоставлять ответы с цитированием источников.

Интеграция позволяет получать актуальные сведения о событиях, происходящих после сентября 2023 года.

С одной стороны поиск это, конечно, хорошо.
Тут и Perplexity может начать волноваться и, собственно, Google.
С другой стороны, - это же Bing.
За 15 лет он так и не смог стать лучшим поисковиком. Почему теперь ИИ с не лучшим поисковиком вдруг должен стать популярным?
Скорее уже Gemini2, который выйдет до конца этого года, всех обойдёт.

#OpenAI #Bing #Search
———
@tsingular

908 views04:34

Технозаметки Малышева

Chrome OS 130: ИИ и продуктивность для Chromebook Plus

Google выпустила масштабное обновление Chrome OS 130 с фокусом на эффективность работы.
Quick Insert обеспечивает молниеносный доступ к эмодзи, GIF и ссылкам через сочетание клавиш.
Модели с Neural Processing Unit получили эксклюзивные возможности: запись с ИИ, улучшенный звук и эффекты камеры.
Focus Mode блокирует уведомления в заданные периоды, а Welcome Recap восстанавливает прошлую сессию.
Samsung Galaxy Chromebook Plus первым обзавелся специальной кнопкой для быстрых действий, остальные модели получат её в 2024.

В будущем все ноутбуки будут с ИИ-ускорителями. Даже школьный хромбук теперь умнее калькулятора! 🎓

#ChromeOS #Samsung #NPU
-------
@tsingular

845 views04:36

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini API интегрируется с Google Search для улучшения точности ответов

Google добавил функцию Grounding with Search в AI Studio и Gemini API.
Нововведение позволяет моделям получать актуальные данные из поисковой системы и предоставлять ссылки на источники.
Функционал доступен для всех версий Gemini 1.5 через раздел Tools или параметр 'google_search_retrieval' в API.
Система динамически определяет необходимость поиска, используя пороговое значение 0.3.
Разработчики получили возможность тонкой настройки процесса поиска и извлечения данных.

А вот и то, о чем так долго говорили большевики, свершилось.
Буквально пара строк кода и ответы подкрепляются поиском без необходимости вызова отдельно поиска через апи.

import google.generativeai as genai
import os

genai.configure(api_key=os.environ["API_KEY"])
model = genai.GenerativeModel('models/gemini-1.5-flash-002')

response = model.generate_content(contents="Who won Wimbledon this year?",
tools='google_search_retrieval')
print(response)

#Gemini #GoogleSearch #APITools
-------
@tsingular

875 viewsedited 04:44

Технозаметки Малышева

SmolLM2: сверхмалая англоязычная модель с эффективностью GPT 3.5

SmolLM2 - семейство компактных языковых моделей с размерами от 135M до 1.7B параметров.

Флагманская версия обучена на 11 триллионах токенов используя FineWeb-Edu, DCLM и The Stack датасеты.

Ключевые улучшения включают расширенную математическую логику, function calling и улучшенное следование инструкциям.

Основные ограничения: работа преимущественно на английском языке и возможная генерация неточной информации.

Вполне подойдет для дронов. 🤖🔢

#SmolLM2 #HuggingFace #LLM
-------
@tsingular

951 viewsedited 14:11

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Клод теперь читает пдфы как человек, с картинками.

До сегодняшнего дня, когда вы запихивалт PDF в Клод, он использовал службу извлечения текста для захвата текста и отправки его себе в текстовом промпте.

Теперь Клод может визуально увидеть PDF-файл вместе с текстом ЦЕЛИКОМ.

С картинками, диаграммами, и что там ещё запихивают в пдф.

Взгляд на страницу целиком.

Это позволяет Клоду более точно понимать сложные документы, например те, которые изобилуют диаграммами или графиками, не поддающимися текстовому представлению.

Например, теперь можно задавать Клоду вопросы о PDF-файле, полном анатомических диаграмм. См. видео

А ещё теперь можно пихать пдф в Клода через API.

Теперь он не читает документы, он их "рассматривает". Все как у людей.
https://docs.anthropic.com/en/docs/build-with-claude/pdf-support

@cgevent

👍5❤3✍2🔥1

932 views22:49

Технозаметки Малышева

О, Сбер теперь и в API обновил модельку!
Полезно.

Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).

- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama-405B.
- GigaChat-Max достигает 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU.
- По результатам SBS, где учитывается красота ответов, мы выигрываем в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro.
- В Arena-Hard мы достигаем 51% скора против GPT-4-0314
- В Vkhr Arena-General-RU мы достигаем 90%, в то время как YaGPT-4 Pro достигает 59%.

https://t.me/mashkka_ds/1824

#Сбербанк
———
@tsingular

Mashkka про Data Science

Релиз GigaChat MAX! (ссылка на Хабр)

Салют! Мы открываем доступ к модели GigaChat MAX. Модель доступна в @gigachat_bot, в веб-версии и через публичное API (в режиме раннего доступа).

- GigaChat MAX занимает 3 место в бенчмарке MERA. Сразу за gpt-4o и Llama…

989 viewsedited 10:41