STARTOBUS
2.76K subscribers
2.56K photos
774 videos
212 files
3.36K links
@startobus: AI — гайды, инструменты, кейсы для креатива, маркетинга и бизнеса
👋 @dchannov, Денис Чаннов, 35 лет опыта 🚀 2500+ проектов в 30+ странах.
Download Telegram
Илон Маск и Робин Ли решили посостязаться в новом олимпийском виде спорта — предсказаниях о будущем ИИ. Маск, видимо, в лучших традициях фантастических фильмов, заявляет, что через два года ИИ будет умнее нас всех. Звучит как план: "Ребята, давайте поскорее создавать сверхразум, чтобы он смог завладеть миром, а мы сидели и смотрели Netflix!"

Робин Ли, глава китайского Baidu, в свою очередь, настроен более философски. Он считает, что на это понадобится целых десять лет. Видимо, Ли вдохновился древней китайской мудростью о том, что путь к просветлению долог и тернист. Ну или просто решил не подгонять события, зная, что ИИ все равно придется учить китайский язык.

Конечно, Альтман из OpenAI тоже не остался в стороне и загадочно намекает на «достаточно близкое будущее». Что ж, создается ощущение, что этот клуб предсказателей соревнуется, кто быстрее сделает так, чтобы все человеческие профессии стали бесполезны. В любом случае, пока США и ЕС нацелились на создание «самой мощной модели», Китай, как всегда, делает ставку на практическое применение технологии. Потому что, как известно, лучшая модель — это та, которая умеет делать димсамы на завтрак и чинить велосипед.

И вот так и живем: одни обещают чудеса уже завтра, другие — послезавтра. Главное, чтобы за всеми этими предсказаниями не забыли про важное — вовремя выключить компьютер и пойти на улицу подышать свежим воздухом, пока ИИ нас не опередил и в этом.

@lobushkin

@startobus 🧠 запуск идей с AI
👏2
Российские компании начинают активно использовать крипту для торговли сырьевыми товарами с Китаем. По крайней мере, два крупнейших металлурга, оба из которых не находятся под санкциями, начали использовать USDT и некоторые другие криптовалюты для расчетов по некоторым из своих трансграничных транзакций с преимущественно китайскими клиентами и поставщиками — Bloomberg

@startobus 🧠 запуск идей с AI
😁1
OpenAI начала обучение новой модели ИИ — GPT нового, пятого поколения

OpenAI анонсировала старт обучения новой модели ИИ — пока что каких-то цифр нет, но аудиторию готовят к существенному технологическому рывку. Вот что говорится в сообщении:

▪️ модель должна приблизиться к общему искусственному интеллекту (AGI), благодаря чему достигнет нового уровня возможностей ИИ;
▪️ новая модель станет базой для пула ИИ-решений, таких как чат-боты, цифровые помощники и голосовые ассистенты, поисковые системы и генераторы изображений.

Совет директоров OpenAI даже создал из своих членов специальный Комитет по безопасности и защите — мол, чтобы изучить, как следует справляться с рисками именно новой модели. По истечении 90 дней со старта своей работы Комитет должен поделится рекомендациями по безопасности с советом директоров — а тот отчитаться о принятых мерах. После чего рекомендации комитета будут опубликованы.

Новый Комитет открывают вместо подразделения Superalignment Team, занимавшегося безопасностью и закрывшегося после громких увольнений Ильи Суцкевера и Яна Лейке. Последний при уходе из компании заявил, что OpenAI недостаточно инвестировала в работу по обеспечению безопасности ИИ и что напряженность в отношениях с руководством «достигла критической точки».

Вероятно, открытием нового Комитета руководство OpenAI стремится показать, что роспуск подразделения не отменяет того, что компания заботится о безопасности своих решений, а напротив поднимает эту проблему на новый управленческий уровень. Однако, если Superalignment Team могла непосредственно работать с моделями, и на ее работу было обещано выделять до 20% машинного времени OpenAI, то комитет при совете директоров сможет лишь заслушивать чужие отчеты, то есть будет органом формальным.

Когда выйдет новая модель?

Официальной даты нет, но NYT оценивают сроки в девять-двенадцать месяцев. Правда, в случае с GPT-4, от начала обучения до релиза времени прошло меньше — полгода (с сентября 2022 по март 2023-го), так что есть вероятность, что новая версия GPT может быть представлена уже в ноябре-декабре 2024 года.

@startobus 🧠 запуск идей с AI
В бесплатную версию ChatGPT4o добавили возможность загружать файлы, пользоваться GPTs - почти все, что раньше было только в платной версии. Лимитированно, но и это не плохо.

И мне не дает покоя вопрос, что они такое дадут пользователям Plus, чтобы те не ушли не бесплатную версию?

@startobus 🧠 запуск идей с AI
🇷🇺🌏Россия — четвёртая экономика мира с 2021 года, — Всемирный банк

▪️Всемирный банк обновил данные по паритету покупательной способности за 2021 год (предыдущий отчёт относится к 2017 году). Из новых данных следует, что экономика России занимает четвёртое место в мире

▪️Пятёрка мировых лидеров в 2021 году с долей от мирового ВВП, составлявшего 152,4 трлн долларов:
🇨🇳Китай — 18,9%, 28,8 трлн долларов
🇺🇸США — 15,5%, 23,6 трлн долларов
🇮🇳Индия — 7,2%, 11,9 трлн долларов
🇷🇺Россия — 3,8%, 5,7 трлн долларов
🇯🇵Япония — 3,7%, 5,6 трлн долларов

▪️Германия занимает шестое место (3,4%), за ней следуют Бразилия (2,4%), Франция (2,4%), Британия (2,3%) и замыкает десятку Индонезия (2,3%)

▪️В последующие два года пятёрка лидеров не изменилась, — констатируют эксперты. По итогам 2023 года она выглядит следующим образом:
🇨🇳Китай — 35,0 трлн долларов
🇺🇸США — 27,4 трлн долларов
🇮🇳Индия — 14,6 трлн долларов
🇷🇺Россия — 6,45 трлн долларов
🇯🇵Япония — 6,3 трлн долларов
1
Развитие дисплеев для AR и VR очков наряду к концепцией spatial computing привело к появлению очевидного нового класса устройств — безэкранные ноутбуки. Штука не массовая, но кому часто приходится летать и пытаться нормально работать на полноразмерном ноутбуке в салоне эконом-класса — тот оценит!
Концепция дошла до уровня приема предзаказов на устройства Spacetop G1 с обещанием доставки в октябре.
Казалось бы, несложно заменить экран на крышке на экран в очках — но на деле все сложней и интересней, потому о целая статья по ссылке, а не просто короткая новостная заметка.
https://www.wired.com/story/sightful-spacetop-g1-augmented-reality-laptop/

@startobus 🧠 запуск идей с AI
👍1
Эксперимент, который несколько лет назад привлек мое внимание, сейчас повторили в более строгих условиях и на большей выборке.
Суть дела: дать человеку механический шестой палец на руке с управлением от датчиков, скажем, где-то под пяткой ноги. Никаких ИИ и инвазивных операций.
Смысл: изучить, насколько быстро и насколько массово мозг людей справится с изменением телесной архитектуры и начнет использовать новые расширенные возможности тела на рефлекторном уровне.
Выборка: 596 людей разного возраста, образования и т.д.
Результат: лишь 13 из 596 не сумели освоиться с новой телесной возможностью. Исследователи очередной раз подтвердили, что мозг легко справляется; так что технологические расширения наших тел (например, экзоскелеты всех сортов) могут быть вполне массовыми и легко осваиваемыми. Хотя, следуя моде, авторы в основном обсуждают, что во всех таких устройствах инклюзивность должна быть заложена by design, а не то, насколько легко и просто стать киборгом:)
https://www.inverse.com/health/third-thumb-study

@startobus 🧠 запуск идей с AI
53. Мне сегодня 53…
Могу вспомнить много про прошлое: как в детстве бегали по стройке и жевали гудрон вместо жевачки или как дважды поступал в Бауманку, как запускали партию или первый канал, как делали рекламу для самых крутых мировых компаний и запускали стартапы.

Но следующие 53 - это еще интереснее: преподавание и новые ии-проекты и полеты на своих Flyber’ах, внуки и правнуки и, надеюсь, новая еда, которая без усилий будет держать вес и здоровье в норме.

Спасибо время, ты самое интересное!

@startobus 🧠 запуск идей с AI
4🎉3🔥1
Label Studio - замечательный Open Source проект для оценки и разметки данных.

Например, если нужно быстро разметить кучу документов на обучение и валидацию модели для table layout detection (ибо ну нет нормальных)

Label Studio работает с картинками, текстами, аудио, временными рядами и видео.

Если не пробовали, то всячески советую потыкать палочкой.


# Install the package
# into python virtual environment
pip install -U label-studio
# Launch it!
label-studio



Ваш, @llm_under_hood 🤗

@startobus 🧠 запуск идей с AI
👍1
БИОФОРТЕФИКАЦИЯ
и скрытый голод

В Nature в январе опубликовали интересную работу.

Называется так: "Вклад биофортификации в смягчение последствий дефицита микроэлементов".

Это попытка осмыслить текущий статус проблемы "скрытого голода" и дефицита различных микронутриентов в рационе современного человека.

Там же обзор различных технологических решений в селекции и генетике, которые направлены на выведение известных сортов расстений с повышенным содержанием тех или иных микроэлементов.

Сегодня наиболее распостраненное направление решения проблемы «скрытого голода» - это обогащение пищи. Здесь же предлагают опуститься по технологической цепочке на поле и поискать решения там.

Мы эту работу перевели.
Почитать можно здесь.

А завтра на Deepfoodtech конференции весь день посвятим теме - "еда как лекарство". Про скрытый голод обязательно поговорим.

@startobus 🧠 запуск идей с AI
Какой-то «черный понедельник» для ChatGPT. Сервис лежит весь день с периодическими подъемами. У вас как?

@startobus 🧠 запуск идей с AI
👏1
Манхэттенский проект - 2.0

Бывший сотрудник команды Ильи Суцкевера, отвечавшей в OpenAI за безопасность моделей ИИ, Леопольд Ашенбреннер выпустил аналитический документ о ближайшем будущем ИИ (а вот тут разговор с ним), в котором в частности утверждает, что в ближайшие несколько лет, на горизонте 26-28 года в США неизбежно (вне зависимости от того, кто станет президентом) возникнет государственный проект по созданию «суперинтеллекта» по аналогии с Манхэттенским, поскольку, как и с ядерной бомбой, даже месяцы преимущества в его создании станут критическими для будущего страны.

Сверхинтеллект – это в буквальном смысле аналог ядерной бомбы. А потому государству придется национализировать его создание (не хотите же вы, чтобы у стартапов из Сан-Франциско, типа Убера, было по ядерной кнопке? Представьте Илона Маска с бомбой в одной руке и косяком в другой).

Для самых патриотически озабоченных: Россия в докладе упоминается пару раз наряду с Северной Кореей, как государство-изгой, от которого будет необходимо оборонять секреты AGI, чтобы она потом не держала весь мир в заложниках, а главным противником Леопольд видит Коммунистическую партию Китая (именно так, а не страну Китай), способную сегодня украсть любой технологический секрет из совершенно не готовых к этому частных лабораторий:

При нынешнем курсе мы можем отказаться от любых американских усилий в области AGI; Китай может быстро украсть все алгоритмические прорывы и модельные веса (буквально копию суперинтеллекта) напрямую. Неясно даже, сможем ли мы при нынешнем курсе достичь «защищенной от Северной Кореи» безопасности сверхинтеллекта. В мире частных стартапов, разрабатывающих АГИ, суперинтеллект распространится на десятки государств-изгоев. Это просто несостоятельно.
Чтобы избежать этого в будущей конструкции международной безопасности придется использовать режим нераспространения AGI так же, как он действует сейчас в области ядерного оружия, уверен Ашенбреннер. И США не справятся одни, придется создать международную коалицию, как из западных стран, так и не слишком демократичных, чтобы обеспечить безопасность AGI (в частности – цепочку поставок чипов), а после создать структуры типа МАГАТЭ.


И вот к 27/28 наступает эндшпиль. К 28/29 году начнется взрывное развитие интеллекта; к 2030 году мы соберем суперинтеллект во всей его силе и мощи. Перед теми, кого поставят во главе проекта, будет стоять чертовски сложная задача: создать AGI, причем быстро; перевести американскую экономику на военные рельсы, чтобы произвести сотни миллионов графических процессоров; утвердить все это, вычистить шпионов и отразить тотальные атаки Компартии Китая; каким-то образом управлять сотней миллионов AGI, яростно автоматизирующих исследования ИИ, совершающих десятилетний скачок за год и вскоре создающих системы ИИ, намного более умные, чем самые умные люди; как-то удержать ситуацию, чтобы она не сошла с рельсов и не породила сверхинтеллект-изгоя, который попытается захватить контроль у своих человеческих надсмотрщиков; использовать эти сверхинтеллекты для разработки новых технологий, которые будут необходимы для стабилизации ситуации и опережения противников, быстро перестраивая вооруженные силы США для их интеграции; и при этом ориентироваться в самой напряженной международной ситуации, которую когда-либо приходилось наблюдать. И лучше бы они были хороши в этом, скажу я вам.

Апокалиптическая картина, но напомню, чувак долго работал в самом сердце самого передового ИИ-разработчика.

По его мнению мы сейчас примерно в районе 1939 года, когда Эйнштейн написал подготовленное Сцилардом письмо президенту Рузвельту с предупреждением о разработке атомной бомбы в Третьем Рейхе и о необходимости начала широкомасштабных атомных исследований в США. В какой-то момент правительству придется объединить всех этих частных исследователей в одну супер-лабораторию по аналогии созданной в 40-е в пустыне в Лос-Аламосе ядерной лаборатории, считает он. Это потребуется для обеспечения безопасности исследований, в том числе физической.

«До встречи в пустыне», — так заканчивается документ.
🔥1
Но не будем драматизировать.

Для таких вычислений нужно будет в 10 тыс раз больше энергии: - сегодня большой дата-центр это единицы или десятки мегаватт, но с ИИ потребность вырастет на, как минимум, 4 порядка (x 10,000)
мы увидим единый вычислительный кластер стоимостью в триллион долларов в течении пяти лет. самая рациональная инвестиция со стороны state actors и big tech — это compute, атомная энергия и инфраструктура для первых двух.


Писал про это раньше:
- https://t.me/startobus/3285
- https://t.me/startobus/3286

Возможно все это пшик - новые «Звездные войны» начала 80-х, которые объявил Рональд Рейган - амбициозный проект, который оказался пшиком.

Но если что - Россия - мировой лидер в атомной энергетике и обогащении урана. Да и проектировать чипы и решать сложнейие инженерные задачи в росатоме не разучились. Так что запасаемся попкорном.

Чем мы можем быть полезны - делать объективные датасеты - без перекосов на толерантность и перверсии).

@startobus 🧠 запуск идей с AI
👍1
Как управлять сверхинтеллектом?

Если ИИ, превосходящий человека во всем, включая обман, ложь, жажду власти, грядет относительно скоро, то каким образом мы можем контролировать его? Как гарантировать что военный ИИ управляющий тысячами дронов будет слушаться приказа? Или финансовый ИИ не решить поддержать себя, вместо экономики? И то, и другое делают сегодня люди вместо ИИ, но мы хотя бы понимаем как их можно контролировать.

В нашумевшей статье приводится много деталей о подходах к superalignment — техническим подходам к управлению и согласованию целей ИИ с нашими, понимании его работы, созданию доверия между человеком и сверхумной машиной.

Если/когда AGI будет достигнут, то текущие методы контроля (RLHF, возможность читать текст “мыслей” модели типа chain-of-thought) перестанут работать. Одновременно с этим, скорость развития ИИ только увеличится, ибо первой работой AGI будет профессия “ИИ исследователь/инженер” и появятся миллионы ИИ-агентов делающих ИИ-рисерч. Сверх-ИИ вряд ли будет “рассуждать” в токенах английского языка, ибо это критически неэффективно, даже в текущих моделях.

Технически и математически Superalignment возможен, но все описанные подходы сводятся к тому, что для контроля и оценки более мощного ИИ используется более слабый, но которому мы точно можем доверять. Вот почему:

- Оценка результата модели всегда сильно проще, чем генерация. Это значит, что более слабый интеллект будет в состоянии оценивать качество работы более сильного.
- Автоматизация надзора, в частности когда более слабая модель проверяет не весь спектр способностей более мощной, а только очень узкую их часть. Например, написание кода без бекдоров и ошибок.
- Модели генерализируют. Это значит, что если модель обучена давать честный ответ на простые задачи, то есть основания предполагать, что её поведение будет таким же с более сложными, не подсильными человеческому интеллекту, задачами.
- Механистическая интерпретация, то есть МРТ модели в процессе её работы. Определение конкретных мест в процессе выполнения модели, которые отвечают за “честность” или “следование инструкциям”.

С точки зрения вычислений, это значит что для эффектиной суперзащиты от супер-ИИ потребуется как минимум столько же энергии и серверов для AGI, работающих над защитой по сравнению с теми, которые занимаются рисерчем и созданием еще более мощных AGI.

@startobus 🧠 запуск идей с AI
👏2🥰1
Новости

1️⃣ Совпадение? ChatGPT, Claude и Perplexity вышли из строя одновременно. А как вы проводили время без любимых AI?

2️⃣ Машины уже не в приоритете. Илон Маск попросил Nvidia направить тысячи чипов, зарезервированных для Tesla в xAI. Этот парень держит нос по ветру.

3️⃣ Малинки, Малинки, такие вечеринки... Компания Raspberry Pi сотрудничает с Hailo (внимательно читаем), чтобы предоставить опциональное AI-дополнение для своих микрокомпьютеров.

4️⃣ Cisco Live 2024: Cisco объявляет о новых инновациях и инвестициях, на рынке искусственного интеллекта, которые помогут заказчикам открыть более безопасное будущее. Компания планирует привлечь в ИИ-проекты 1млрд долларов

5️⃣ Основатель Zoom говорит о больших планах в области корпоративного программного обеспечения, в том числе позволяя вашим "цифровым двойникам", работающим на основе искусственного интеллекта, посещать собрания за вас.

6️⃣ Когда-то (в 2017 вроде) это была 1-апрельская шутка. Но, как известно, в каждой шутке есть доля шутки. Nvidia анонсировала ИИ-помощника в играх. Считать дамаги в Героях Меча и Магии станет проще?

7️⃣ Все технологические гиганты говорят об ИИ, забывая о нуждах пользователей. Вот и Apple, по некоторым инсайдам, посвятит WWDC 2024 интеллекту искусственного происхождения, а аппаратная часть останется без внимания.

8️⃣ Оно живое (это я про Hitachi)! Hitachi и Microsoft заключили знаковое соглашение об ускорении бизнес и социальных инноваций с помощью генеративного ИИ

@startobus 🧠 запуск идей с AI
Там на неведомых дорожках…
10 критичных ошибок при запуске бизнеса или продукта с нуля (А.С. Пушкину - и его др посвящается)

Друзья мои, позвольте поведать вам о тернистом пути создания бизнеса, дабы уберечь вас от ошибок роковых.

Итак, начнем:

1. на неведомых дорожках…
10 критичных ошибок Устремите взор ваш вдаль, амбиции подняв до небес, дабы рынок был обширен, как океан.

2. Все дураки, а я Д`Артаньян
Не думай себя превыше всех, не унижай соперников своих.

3. У нас нет аналогов
Сравнивай и учись у других, совершенствуя продукт твой.

4. Натягивать "сову на глобус"
Не строй замков воздушных, а будь реалистом в мечтах своих.

5. Нет драйверов роста
Найди силы движущие, что поднимут тебя к вершинам.

6. "Три П": Прокрастинация, Перфекционизм, Паралич аналитика
Беги от этих зол, как черт от ладана.

7. Искать легкие кривые пути, вместо прямого и трудного — продавать с первого дня
Начни торговать сразу, не ищи легких путей.

8. Неумение считать экономику и оценивать бизнес-модель
Учись считать и планировать, иначе гибелью грозит.

9. Не те люди делают не те проекты
Собери команду достойную, по духу и делу близкую.

10. Игнорировать советы бывалых и возможность копирования
Внемли мудрым советам и подражай успешным.

В добавок, современностью навеяно:

11.на неведомых дорожках…
Начать проект и не бросать его — это суперсила, которой обладают немногие.

Список этот, конечно, бесконечен, ибо каждое начинание уникально. Но посему, из опыта нашего, что бы еще добавили?

Поделитесь вашими мыслями, в сей светлый день Пушкина, друзья!

@startobus 🧠 запуск идей с AI
Forwarded from Pavel Durov (Pavel Durov)
Big day today, we’re launching Telegram Stars ⭐️ – a way to pay for digital services in mini-apps.

Unlike old-school apps, Telegram mini apps like Notcoin don’t need to be installed for use. That’s why they grow so quickly. In addition, Telegram’s social nature allows mini apps to spread virally, so they reach tens of millions of users within weeks ⚡️

⭐️ With Telegram Stars, mini apps can now accept payments for digital services using the simplest payment method possible – in-app purchases on Android and iOS 💳

Mini app developers can withdraw their Stars via Fragment using TON. They can also use Stars to further promote their apps on Telegram — on preferential terms! 👛

Apple and Google take a 30% cut when users buy Stars from them, but Telegram will subsidize ads purchased with Telegram Stars. So if developers reinvest Stars in promoting their app, the overall commission will be nearly 0%! As a result, launching apps on Telegram makes more economic sense than launching traditional mobile apps 📈

The recent mini app boom has already made Telegram the main destination to launch new apps. Stars and ad subsidies bring this to a new level – unprecedented in the history of social media 😏
Please open Telegram to view this post
VIEW IN TELEGRAM
Идеальная локация для предпринимателей

Daniel Ek, основатель Spotify, поднял в Х (все еще хочу называть это твиттером) тему об идеальной локации для предпринимателей. Эк, который в последнее время все больше занимается экосистемными вещами в европейской стартап-индустрии, на первое место сам ставит доступ к капиталу. В треде на 700+ комментариев также упоминаются:

- доступ к талантам
- благоприятный регуляторный режим
- высокая терпимость к рискам и неудачам
- законы, позволяющие легко нанимать (и увольнять)
- доступ к клиентам
- культура празднования успеха (европейцы часто думают как социалисты)
- налоги
- высокий уровень образования инженеров
- доступ к капиталу на самых ранних стадиях

https://x.com/eldsjal/status/1793301935820325191

🤖 @migratorg

@startobus 🧠 запуск идей с AI
Привет, друзья! Многие из вас пользуются ИИ-инструментами для быстрого создания контента. Однако продвинутые ИИ-детекторы, такие как Copyleaks, стали серьезной проблемой для тех, кто использует ИИ. Пользователи ищут способы опубликовать или отправить на проверку сгенерированный контент, чтобы ИИ-детектор не обнаружил, что контент написан не человеком.

В статье на VC вы узнаете о всех способах, а также узнаете, как обойти ИИ-детектор Copyleaks и др.

@startobus 🧠 запуск идей с AI
👍1
Коммерсантъ: McKinsey отмечает рост уровня внедрения ИИ до 72%

– McKinsey опросили представителей 1,36 тыс. компаний
– Уровень внедрения ИИ за 2024 составил 72% (+17 п.п.)
– Применение ген. ИИ показало двукратный рост, до 65%
– Чаще всего (34%) применяют для маркетинга и продаж
– Также для разработки продуктов (23%) и IT-сферы (17%)
– Компании готовы инвестировать от 5% бюджетов в ИИ
– При этом 67% компаний увеличат инвестиции за 3 года
– ИИ может сократить расходы на управление персоналом
– Он также увеличивает доходы от цепочек поставок и др.
– Аналитический ИИ увеличивает доходы от продаж и др.
– Ранее исследование сделали «Яков и партнеры» и Яндекс
– Они посчитали экономический потенциал от внедрения ИИ
– Для России он будет 22-36 трлн руб. к 2028 (номинал. цены)
– Реальный эффект будет 4,2-6,9 трлн руб. (или до 4% ВВП)
– Из них пятая часть будет от применения генеративного ИИ

@ftsec

@startobus 🧠 запуск идей с AI
Наткнулся на интересный пейпер прошлой недели на любимую тему:
Межвидовая коммуникация и АИ

Есть такой алгоритм Wav2Vec2 от Facebook AI — он позволяет переводить нашу речь в текст. Алгоритм работает намного лучше многих альтернатив, так как не требует много размеченных данных и работает напрямую с аудио дорожками, не пытаясь их сначала конвертировать в текст для обработки. Вместо этого, Wav2Vec2 сам находит важные характеристики звука (тон, звуки, паузы и тп), после чего распознает речь.

Так вот, ученые взяли этот алгоритм и применили к лаю домашних песиков и в итоге решили четыре ML-задачи: распознавание конкретных собак, идентификацию породы, классификацию пола и привязку лая к контексту — модель может сама связать вокализации собаки с контекстом, в котором они были произведены (например, агрессивный лай на незнакомца, игривый лай и т.д.). Это важно, потому что у нас наконец-то есть эффективный способ разметки и обработки собачьих звуков.

Самое прикольное, что Wav2Vec2 обученный сначала на ЧЕЛОВЕЧЕСКОЙ РЕЧИ помогает решать эти задачи еще точнее — это довольно странная и клевая находка.

Короче, если исследование подтвердят другие желающие — то нас ждет зарождение стартапов в области переводчиков с собачьего, котячьего (в этих я не уверен), птичьего и тп и тд. Исследователи готовы поделиться собранным датасетом, если написать им на почту (есть в пейпере)

Сам пейпер тут:
https://arxiv.org/abs/2404.18739

@startobus 🧠 запуск идей с AI
🔥1