AI Для Всех

Важные личные новости🗞️

Мне дали О1 (Виза талантов) в США 🇺🇸 а это значит, что пора сказать до свидания академии, и окунуться в реальный мир 🌍

Напишу об этом еще много слов, а пока выдыхаем

6.4K viewsArtemii, edited 06:12

AI Для Всех

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

ML на графах в задаче e-commerce

Сегодня у нас пост присланный подписчиком: @marinadkntm (спасибо 🤩)

Допустим, мы решаем задачу поиска одинаковых товаров в онлайн-магазине.

Классический подход:
1. Подбор кандидатов. На этом этапе используется грубый, но быстрый алгоритм для подбора большого количества схожих объектов, потенциальных пар
2. Проверка пар моделью (т. н. матчинг) — более точная проверка того действительно ли в паре одинаковые объекты

У объекта может быть более одного дубликата, и хочется их объединять в одну группу, один кластер.

Просто склеить все найденные пары в один кластер — не лучшая идея, поскольку предсказания модели на 2 этапе имеют не нулевой процент ошибок.

На помощь приходит community detection (поиск сообществ), который представляет собой кластеризацию на графах.

В случае с товарами можно построить из них граф, рёбра между которыми будут соответствовать предсказанию модели, что товары являются дубликатами. На таком графе community detection поможет выделить группы одинаковых товаров.

Некоторые преимущества такого подхода:
1. Не нужно подбирать гиперпараметры. Например, задавать количество кластеров

2. Скорость. При таком подходе нет необходимости считать расстояние каждого объекта с каждым.

3. Масштабируемость. Можно запускать на больших графах параллельно на множестве executors

4. Self-supervised и Semi-supervised подходы. Задачу можно решать как при отсутствии какой-либо информации о кластерах, так и при заданной на части вершин информации о сообществах

Читайте подробнее про алгоритмы кластеризации на графах в:

📕 Статья на Habr

7.2K viewsArtemii, 16:17

AI Для Всех

Антропик анонсировали Claude 3

Один из основных конкурентов OpenAI, про который уже все успели подзабыть на фоне бесконечного потока AI новостей, опубликовал свою новую языковую модель - Claude 3.

Судя по проиллюстрированным бенчамаркам, модель обходит GPT-4. В виду того, что Claude 3 уже доступен в API, думаю что мы скоро увидим в деле, так ли он реально хорош.

Помимо понимания текста, модели доступно зрение (image comprehension).

По деньгам Claude 3 дороже чем OpenAI GPT-4. Видимо есть вероятность, что прирост в интеллекте не маржинальный

🖥️ Почитать подробнее
📟 Попоробовать Claude 3

8.2K viewsArtemii, edited 16:05

AI Для Всех

Илон хайпует на OpenAI and OpenAI хайпует на Илоне в соцсети, которая принадлежит Илону 🐕

И мы поXайпуем

8.1K viewsArtemii, edited 07:09

AI Для Всех

Пока я все еще не могу войти в режим и снова писать посты каждый день, добавляйтесь в мои другие соцсети:

🌟

x.com

Please open Telegram to view this post

VIEW IN TELEGRAM

6.7K viewsArtemii, 16:32

AI Для Всех

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Я попробовал Apple Vision Pro

В Америке AVP можно попробовать в любом Apple Store. Работает это так: на сайте Apple выбираешь доступное время в удобном салоне, и бронируешь демо заранее (в моем случае за один день было норм).

На демо, просят взять с собой очки для зрения (если носите), их прямо на месте сканируют и по результатам выдают специальные оптические вставки для AVP.

Само демо длится ~30 минут и начинается с основ управления. Управлять реально легко - смотришь и делаешь щипок пальцами. Через несколько минут уже чувствуешь себя уверенно.

На демо сначала показывают фотки, видео, панормы и spatial video. Потом учат пользоваться виртуальными средами и наконец дают посмотреть immersive video - и это реально вау 🤩. Ощущение как будто бы ты реально там! Вообще слово вау, я кажется говорил каждые пару минут.

Еще я попросил включить мне демо с динозаврами, и это тоже прям очень круто! 🦖

В целом, прибор мне понравился, но наверное я подожду 2-3юю версию, перед тем как покупать. Не то что бы с этим что-то не так, просто зная Apple, следующие несколько итераций будут самыми значительными.

8.0K viewsArtemii, edited 21:54

AI Для Всех

2:35

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAI показали свое первое демо совместно с Figure

🎧 Смотреть со звуком!

Недавно, OpenAI анонсировали свое партнерство с Figure - компанией производящей роботов. И вот появилась первая демонстрация.

В настоящий момент, GPT взяла на себя функции восприятия и интерфейса - то есть OpenAI воспринимает сенсорную информацию и передает ее роботу, внутренний (спинной?) мозг которого превращает эту информацию в движения (контроль). Так же, OpenAI берет на себя функцию общения с человеком.

Судя по видео - GPT-4V крутится на сервере, а не на самом роботе, но с развитием маленьких языковых и мультимодальных моделей несложно увидеть будущее (пару месяцев), в котором все происходит на самом роботе.

Ждем ответочку от Илона и Оптимуса с Гроком!

X.com

40.9K viewsArtemii, edited 18:12

AI Для Всех

Илон Маск и x.ai опубликовали веса Grok-1

Grok-1 это ИИ для платных подписчиков Твиттера, который по задумке создателя, должен функционировать как ИИ из книги «Автостопом по галактике». Модель из себя представляет огроменный Mixture of Experts на 314 млрд параметров. Мне пока такое проверит не на чем, так что подождём недельку и 100% увидим креатив от OSS сообщества, по сжиманию весов.

🎂 Анонс
💿 Код
🤗 HF

P.S.: не нашел их random seed, но надеюсь он 42

7.1K viewsArtemii, edited 20:28

AI Для Всех

Top-10% статьей, которые скачали в 2022 году (в журнале JGR: Solid Earth).

Сегодня получил неожиданную ачивку (особенно учитывая, что на дворе середина 2024 года).

Оказывается, моя статья про разделение сейсмических сигналов вошла в топ 10% самый скачиваемых статьей в журнале JGR: Solid Earth.

Суть статьи заключается в следующем:

Мы адаптировали метод разделения сигналов Dual-Path Recurrent Neural Network (DPRNN), изначально предложенный для обработки речи, для применения к сейсмическим данным.
Обучив нейросеть на датасете STEAD, мы продемонстрировали возможность: (a) очистки сейсмических записей от шума (denoising) (b) разделения нескольких наложенных друг на друга сейсмических сигналов (source separation)
Такое разделение сигналов на одноканальных записях может найти применение во многих задачах сейсмологии - анализе афтершоков, seismo-acoustics, ambient томографии и др.

Мы показали, что машинное обучение способно успешно разделять сигналы даже в случае их значительного перекрытия по времени и частоте, когда традиционные подходы неэффективны.

📖 Статья

🖥

Код

Please open Telegram to view this post

VIEW IN TELEGRAM

7.1K viewsArtemii, 16:49

AI Для Всех

Чайник из Юты

Сегодня, хочу вам рассказать про любопытнейший артифакт, который я на днях заметил в Музее Истории Компьютеров (Mountain View, CA).

Чайник из Юты, также известный как чайник Ньюэлла, является важной частью компьютерной графики. Созданный в 1975 году Мартином Ньюэллом, аспирантом из Университета Юты, он послужил универсальной тестовой моделью для ранних алгоритмов рендеринга.

Его выбор был обусловлен геометрической сложностью и узнаваемостью. За годы своего существования "Чайник из Юты" стал символическим эталоном, иллюстрирующим прогресс от простых wireframe моделей до современных сложных, фотореалистичных 3D-рендерингов.

Чайник из Юты до сих пор остается культовой эмблемой в сообществе цифровой визуализации, символизируя пересечение технических инноваций и художественного выражения.

Обязательно сходите в этот музей! Там много всего интересного

7.5K viewsArtemii, edited 15:44

AI Для Всех

А вот и Grok на консьюмерском железе: https://x.com/ibab_ml/status/1771340692364943750?s=46&t=LyC3cTf6saYBOGwroEuLcg

X (formerly Twitter)

Igor Babuschkin (@ibab_ml) on X

Grok-1 314B running on M2 Ultra 🚀

7.2K viewsArtemii, 02:26

AI Для Всех

Случайно проходил мимо

В окрестностях Open AI - островок нормальности по средине Mission district.

Вайб тут такой. А в нашей реальности происходит мрак.

📍Карта
🎧 Soundtrack

8.1K viewsArtemii, edited 02:37

AI Для Всех

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

1:05

This media is not supported in your browser

VIEW IN TELEGRAM

YOLO-World: обнаружение объектов в реальном времени без ограничений по категориям (почти)

Уже два месяца, как YOLO-World среди нас, но у меня только сейчас до нее дошли руки.
YOLO знаменитая серия детекторов которым достаточно "взглянуть только один раз", чтобы найти нужный объект. Одно «но» - их надо было обучать и дообучать заранее предопределенным категориям. В Tencent AI Lab объявили, что нашли способ обойти это ограничение.

Секрет в RepVL-PAN - перепараметризуемой сети агрегации зрительно-языковых путей для создания пирамиды признаков. Текстовые эмбеддинги могут быть перепараметризованы в веса сверточных или линейных слоев во время деплоймента.

Звучит классно, ведь больше не нужно собирать свой датасет. Проверила на рабочих картинках и загрустила: YW не может zero-short обнаружить ничего на лабораторных снимках… И на рентгене не нашла даже костей. Поэтому пока оставлю кастомную YOLOv8.

Если вам пригодилось, поделитесь? Может, кто-то, напр, трещины в бетоне детектил

👾Github
📖Paper
🎬Official
🤗Hf

6.7K viewsGinger Spacetail, 08:38

AI Для Всех

OpenAI только что релизнули старую версию GPT-3.5 на Hugging Face

В Америке сейчас Пасха, и у многих сотрудников отпуска и выходные. OpenAI, видимо в преддверии релиза GPT-5, выложили в открытый доступ веса GPT-3.5. Ждём подробностей от сообщества.

🤗 веса

9.2K viewsArtemii, edited 15:54

AI Для Всех

Forwarded from Denis Sexy IT 🤖

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

4.6K viewsArtemii, 04:29

AI Для Всех

Forwarded from Агенты ИИ | AGI_and_RL

На канале 3Blue1Brown вышло видео объясняющее что же такое GPT. Очень приятное.
Я выставил в настройках русские субтитры, и мне стало еще понятнее :)

https://www.youtube.com/watch?v=wjZofJX0v4M

YouTube

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

Breaking down how Large Language Models work
Instead of sponsored ad reads, these lessons are funded directly by viewers: https://3b1b.co/support

---

Here are a few other relevant resources

Build a GPT from scratch, by Andrej Karpathy
https://youtu.be/kCc8FmEb1nY…

5.8K viewsArtemii, 14:50

AI Для Всех

Международный онлайн саммит про разработку в сфере ИИ

Лучшие практики для разработчиков, ресерчеров, дата сайентистов, техлидов и фаундеров – от ведущих мировых экспертов из индустрии ИИ.

Выступят спикеры из:
— Microsoft (команда PromptFlow)
— D-ID
— Aisera
— Spectrm
— Lightricks
— Wrike
и других компаний-лидеров, которые прямо сейчас создают будущее искусственного интеллекта.

На саммите обсудят темы:
— How to build scalable GenAI Apps using prompts
— Data-driven approaches to personalizing AI Agents
— Crafting AI agents with a natural user interface
— Building robust & scalable AI-powered chatbots;
— The reality of being an AI Founder in 2024
— How Later Stage Companies Adopted AI
— Creating your own corporate-secured "ChatGPT" with almost zero specific knowledge
— Fine-tuning strategies for adapting pre-trained AI Agents to specific use cases,
и многое другое!

Конференция пройдет в ОНЛАЙН формате 16➖17 апреля на английском языке 🌎

Участникам будут доступны презентации, материалы воркшопов и записи, а также доступ в нетворкинг-чат.

Скидка 1️⃣0️⃣ % по промо-коду — osHMmof

Регистрация через VPN

#реклама

6.1K viewsArtemii, 09:04

About

Blog

Apps

Platform