STARTOBUS
2.76K subscribers
2.56K photos
774 videos
212 files
3.36K links
@startobus: AI — гайды, инструменты, кейсы для креатива, маркетинга и бизнеса
👋 @dchannov, Денис Чаннов, 35 лет опыта 🚀 2500+ проектов в 30+ странах.
Download Telegram
Label Studio - замечательный Open Source проект для оценки и разметки данных.

Например, если нужно быстро разметить кучу документов на обучение и валидацию модели для table layout detection (ибо ну нет нормальных)

Label Studio работает с картинками, текстами, аудио, временными рядами и видео.

Если не пробовали, то всячески советую потыкать палочкой.


# Install the package
# into python virtual environment
pip install -U label-studio
# Launch it!
label-studio



Ваш, @llm_under_hood 🤗

@startobus 🧠 запуск идей с AI
👍1
БИОФОРТЕФИКАЦИЯ
и скрытый голод

В Nature в январе опубликовали интересную работу.

Называется так: "Вклад биофортификации в смягчение последствий дефицита микроэлементов".

Это попытка осмыслить текущий статус проблемы "скрытого голода" и дефицита различных микронутриентов в рационе современного человека.

Там же обзор различных технологических решений в селекции и генетике, которые направлены на выведение известных сортов расстений с повышенным содержанием тех или иных микроэлементов.

Сегодня наиболее распостраненное направление решения проблемы «скрытого голода» - это обогащение пищи. Здесь же предлагают опуститься по технологической цепочке на поле и поискать решения там.

Мы эту работу перевели.
Почитать можно здесь.

А завтра на Deepfoodtech конференции весь день посвятим теме - "еда как лекарство". Про скрытый голод обязательно поговорим.

@startobus 🧠 запуск идей с AI
Какой-то «черный понедельник» для ChatGPT. Сервис лежит весь день с периодическими подъемами. У вас как?

@startobus 🧠 запуск идей с AI
👏1
Манхэттенский проект - 2.0

Бывший сотрудник команды Ильи Суцкевера, отвечавшей в OpenAI за безопасность моделей ИИ, Леопольд Ашенбреннер выпустил аналитический документ о ближайшем будущем ИИ (а вот тут разговор с ним), в котором в частности утверждает, что в ближайшие несколько лет, на горизонте 26-28 года в США неизбежно (вне зависимости от того, кто станет президентом) возникнет государственный проект по созданию «суперинтеллекта» по аналогии с Манхэттенским, поскольку, как и с ядерной бомбой, даже месяцы преимущества в его создании станут критическими для будущего страны.

Сверхинтеллект – это в буквальном смысле аналог ядерной бомбы. А потому государству придется национализировать его создание (не хотите же вы, чтобы у стартапов из Сан-Франциско, типа Убера, было по ядерной кнопке? Представьте Илона Маска с бомбой в одной руке и косяком в другой).

Для самых патриотически озабоченных: Россия в докладе упоминается пару раз наряду с Северной Кореей, как государство-изгой, от которого будет необходимо оборонять секреты AGI, чтобы она потом не держала весь мир в заложниках, а главным противником Леопольд видит Коммунистическую партию Китая (именно так, а не страну Китай), способную сегодня украсть любой технологический секрет из совершенно не готовых к этому частных лабораторий:

При нынешнем курсе мы можем отказаться от любых американских усилий в области AGI; Китай может быстро украсть все алгоритмические прорывы и модельные веса (буквально копию суперинтеллекта) напрямую. Неясно даже, сможем ли мы при нынешнем курсе достичь «защищенной от Северной Кореи» безопасности сверхинтеллекта. В мире частных стартапов, разрабатывающих АГИ, суперинтеллект распространится на десятки государств-изгоев. Это просто несостоятельно.
Чтобы избежать этого в будущей конструкции международной безопасности придется использовать режим нераспространения AGI так же, как он действует сейчас в области ядерного оружия, уверен Ашенбреннер. И США не справятся одни, придется создать международную коалицию, как из западных стран, так и не слишком демократичных, чтобы обеспечить безопасность AGI (в частности – цепочку поставок чипов), а после создать структуры типа МАГАТЭ.


И вот к 27/28 наступает эндшпиль. К 28/29 году начнется взрывное развитие интеллекта; к 2030 году мы соберем суперинтеллект во всей его силе и мощи. Перед теми, кого поставят во главе проекта, будет стоять чертовски сложная задача: создать AGI, причем быстро; перевести американскую экономику на военные рельсы, чтобы произвести сотни миллионов графических процессоров; утвердить все это, вычистить шпионов и отразить тотальные атаки Компартии Китая; каким-то образом управлять сотней миллионов AGI, яростно автоматизирующих исследования ИИ, совершающих десятилетний скачок за год и вскоре создающих системы ИИ, намного более умные, чем самые умные люди; как-то удержать ситуацию, чтобы она не сошла с рельсов и не породила сверхинтеллект-изгоя, который попытается захватить контроль у своих человеческих надсмотрщиков; использовать эти сверхинтеллекты для разработки новых технологий, которые будут необходимы для стабилизации ситуации и опережения противников, быстро перестраивая вооруженные силы США для их интеграции; и при этом ориентироваться в самой напряженной международной ситуации, которую когда-либо приходилось наблюдать. И лучше бы они были хороши в этом, скажу я вам.

Апокалиптическая картина, но напомню, чувак долго работал в самом сердце самого передового ИИ-разработчика.

По его мнению мы сейчас примерно в районе 1939 года, когда Эйнштейн написал подготовленное Сцилардом письмо президенту Рузвельту с предупреждением о разработке атомной бомбы в Третьем Рейхе и о необходимости начала широкомасштабных атомных исследований в США. В какой-то момент правительству придется объединить всех этих частных исследователей в одну супер-лабораторию по аналогии созданной в 40-е в пустыне в Лос-Аламосе ядерной лаборатории, считает он. Это потребуется для обеспечения безопасности исследований, в том числе физической.

«До встречи в пустыне», — так заканчивается документ.
🔥1
Но не будем драматизировать.

Для таких вычислений нужно будет в 10 тыс раз больше энергии: - сегодня большой дата-центр это единицы или десятки мегаватт, но с ИИ потребность вырастет на, как минимум, 4 порядка (x 10,000)
мы увидим единый вычислительный кластер стоимостью в триллион долларов в течении пяти лет. самая рациональная инвестиция со стороны state actors и big tech — это compute, атомная энергия и инфраструктура для первых двух.


Писал про это раньше:
- https://t.me/startobus/3285
- https://t.me/startobus/3286

Возможно все это пшик - новые «Звездные войны» начала 80-х, которые объявил Рональд Рейган - амбициозный проект, который оказался пшиком.

Но если что - Россия - мировой лидер в атомной энергетике и обогащении урана. Да и проектировать чипы и решать сложнейие инженерные задачи в росатоме не разучились. Так что запасаемся попкорном.

Чем мы можем быть полезны - делать объективные датасеты - без перекосов на толерантность и перверсии).

@startobus 🧠 запуск идей с AI
👍1
Как управлять сверхинтеллектом?

Если ИИ, превосходящий человека во всем, включая обман, ложь, жажду власти, грядет относительно скоро, то каким образом мы можем контролировать его? Как гарантировать что военный ИИ управляющий тысячами дронов будет слушаться приказа? Или финансовый ИИ не решить поддержать себя, вместо экономики? И то, и другое делают сегодня люди вместо ИИ, но мы хотя бы понимаем как их можно контролировать.

В нашумевшей статье приводится много деталей о подходах к superalignment — техническим подходам к управлению и согласованию целей ИИ с нашими, понимании его работы, созданию доверия между человеком и сверхумной машиной.

Если/когда AGI будет достигнут, то текущие методы контроля (RLHF, возможность читать текст “мыслей” модели типа chain-of-thought) перестанут работать. Одновременно с этим, скорость развития ИИ только увеличится, ибо первой работой AGI будет профессия “ИИ исследователь/инженер” и появятся миллионы ИИ-агентов делающих ИИ-рисерч. Сверх-ИИ вряд ли будет “рассуждать” в токенах английского языка, ибо это критически неэффективно, даже в текущих моделях.

Технически и математически Superalignment возможен, но все описанные подходы сводятся к тому, что для контроля и оценки более мощного ИИ используется более слабый, но которому мы точно можем доверять. Вот почему:

- Оценка результата модели всегда сильно проще, чем генерация. Это значит, что более слабый интеллект будет в состоянии оценивать качество работы более сильного.
- Автоматизация надзора, в частности когда более слабая модель проверяет не весь спектр способностей более мощной, а только очень узкую их часть. Например, написание кода без бекдоров и ошибок.
- Модели генерализируют. Это значит, что если модель обучена давать честный ответ на простые задачи, то есть основания предполагать, что её поведение будет таким же с более сложными, не подсильными человеческому интеллекту, задачами.
- Механистическая интерпретация, то есть МРТ модели в процессе её работы. Определение конкретных мест в процессе выполнения модели, которые отвечают за “честность” или “следование инструкциям”.

С точки зрения вычислений, это значит что для эффектиной суперзащиты от супер-ИИ потребуется как минимум столько же энергии и серверов для AGI, работающих над защитой по сравнению с теми, которые занимаются рисерчем и созданием еще более мощных AGI.

@startobus 🧠 запуск идей с AI
👏2🥰1
Новости

1️⃣ Совпадение? ChatGPT, Claude и Perplexity вышли из строя одновременно. А как вы проводили время без любимых AI?

2️⃣ Машины уже не в приоритете. Илон Маск попросил Nvidia направить тысячи чипов, зарезервированных для Tesla в xAI. Этот парень держит нос по ветру.

3️⃣ Малинки, Малинки, такие вечеринки... Компания Raspberry Pi сотрудничает с Hailo (внимательно читаем), чтобы предоставить опциональное AI-дополнение для своих микрокомпьютеров.

4️⃣ Cisco Live 2024: Cisco объявляет о новых инновациях и инвестициях, на рынке искусственного интеллекта, которые помогут заказчикам открыть более безопасное будущее. Компания планирует привлечь в ИИ-проекты 1млрд долларов

5️⃣ Основатель Zoom говорит о больших планах в области корпоративного программного обеспечения, в том числе позволяя вашим "цифровым двойникам", работающим на основе искусственного интеллекта, посещать собрания за вас.

6️⃣ Когда-то (в 2017 вроде) это была 1-апрельская шутка. Но, как известно, в каждой шутке есть доля шутки. Nvidia анонсировала ИИ-помощника в играх. Считать дамаги в Героях Меча и Магии станет проще?

7️⃣ Все технологические гиганты говорят об ИИ, забывая о нуждах пользователей. Вот и Apple, по некоторым инсайдам, посвятит WWDC 2024 интеллекту искусственного происхождения, а аппаратная часть останется без внимания.

8️⃣ Оно живое (это я про Hitachi)! Hitachi и Microsoft заключили знаковое соглашение об ускорении бизнес и социальных инноваций с помощью генеративного ИИ

@startobus 🧠 запуск идей с AI
Там на неведомых дорожках…
10 критичных ошибок при запуске бизнеса или продукта с нуля (А.С. Пушкину - и его др посвящается)

Друзья мои, позвольте поведать вам о тернистом пути создания бизнеса, дабы уберечь вас от ошибок роковых.

Итак, начнем:

1. на неведомых дорожках…
10 критичных ошибок Устремите взор ваш вдаль, амбиции подняв до небес, дабы рынок был обширен, как океан.

2. Все дураки, а я Д`Артаньян
Не думай себя превыше всех, не унижай соперников своих.

3. У нас нет аналогов
Сравнивай и учись у других, совершенствуя продукт твой.

4. Натягивать "сову на глобус"
Не строй замков воздушных, а будь реалистом в мечтах своих.

5. Нет драйверов роста
Найди силы движущие, что поднимут тебя к вершинам.

6. "Три П": Прокрастинация, Перфекционизм, Паралич аналитика
Беги от этих зол, как черт от ладана.

7. Искать легкие кривые пути, вместо прямого и трудного — продавать с первого дня
Начни торговать сразу, не ищи легких путей.

8. Неумение считать экономику и оценивать бизнес-модель
Учись считать и планировать, иначе гибелью грозит.

9. Не те люди делают не те проекты
Собери команду достойную, по духу и делу близкую.

10. Игнорировать советы бывалых и возможность копирования
Внемли мудрым советам и подражай успешным.

В добавок, современностью навеяно:

11.на неведомых дорожках…
Начать проект и не бросать его — это суперсила, которой обладают немногие.

Список этот, конечно, бесконечен, ибо каждое начинание уникально. Но посему, из опыта нашего, что бы еще добавили?

Поделитесь вашими мыслями, в сей светлый день Пушкина, друзья!

@startobus 🧠 запуск идей с AI
Forwarded from Pavel Durov (Pavel Durov)
Big day today, we’re launching Telegram Stars ⭐️ – a way to pay for digital services in mini-apps.

Unlike old-school apps, Telegram mini apps like Notcoin don’t need to be installed for use. That’s why they grow so quickly. In addition, Telegram’s social nature allows mini apps to spread virally, so they reach tens of millions of users within weeks ⚡️

⭐️ With Telegram Stars, mini apps can now accept payments for digital services using the simplest payment method possible – in-app purchases on Android and iOS 💳

Mini app developers can withdraw their Stars via Fragment using TON. They can also use Stars to further promote their apps on Telegram — on preferential terms! 👛

Apple and Google take a 30% cut when users buy Stars from them, but Telegram will subsidize ads purchased with Telegram Stars. So if developers reinvest Stars in promoting their app, the overall commission will be nearly 0%! As a result, launching apps on Telegram makes more economic sense than launching traditional mobile apps 📈

The recent mini app boom has already made Telegram the main destination to launch new apps. Stars and ad subsidies bring this to a new level – unprecedented in the history of social media 😏
Please open Telegram to view this post
VIEW IN TELEGRAM
Идеальная локация для предпринимателей

Daniel Ek, основатель Spotify, поднял в Х (все еще хочу называть это твиттером) тему об идеальной локации для предпринимателей. Эк, который в последнее время все больше занимается экосистемными вещами в европейской стартап-индустрии, на первое место сам ставит доступ к капиталу. В треде на 700+ комментариев также упоминаются:

- доступ к талантам
- благоприятный регуляторный режим
- высокая терпимость к рискам и неудачам
- законы, позволяющие легко нанимать (и увольнять)
- доступ к клиентам
- культура празднования успеха (европейцы часто думают как социалисты)
- налоги
- высокий уровень образования инженеров
- доступ к капиталу на самых ранних стадиях

https://x.com/eldsjal/status/1793301935820325191

🤖 @migratorg

@startobus 🧠 запуск идей с AI
Привет, друзья! Многие из вас пользуются ИИ-инструментами для быстрого создания контента. Однако продвинутые ИИ-детекторы, такие как Copyleaks, стали серьезной проблемой для тех, кто использует ИИ. Пользователи ищут способы опубликовать или отправить на проверку сгенерированный контент, чтобы ИИ-детектор не обнаружил, что контент написан не человеком.

В статье на VC вы узнаете о всех способах, а также узнаете, как обойти ИИ-детектор Copyleaks и др.

@startobus 🧠 запуск идей с AI
👍1
Коммерсантъ: McKinsey отмечает рост уровня внедрения ИИ до 72%

– McKinsey опросили представителей 1,36 тыс. компаний
– Уровень внедрения ИИ за 2024 составил 72% (+17 п.п.)
– Применение ген. ИИ показало двукратный рост, до 65%
– Чаще всего (34%) применяют для маркетинга и продаж
– Также для разработки продуктов (23%) и IT-сферы (17%)
– Компании готовы инвестировать от 5% бюджетов в ИИ
– При этом 67% компаний увеличат инвестиции за 3 года
– ИИ может сократить расходы на управление персоналом
– Он также увеличивает доходы от цепочек поставок и др.
– Аналитический ИИ увеличивает доходы от продаж и др.
– Ранее исследование сделали «Яков и партнеры» и Яндекс
– Они посчитали экономический потенциал от внедрения ИИ
– Для России он будет 22-36 трлн руб. к 2028 (номинал. цены)
– Реальный эффект будет 4,2-6,9 трлн руб. (или до 4% ВВП)
– Из них пятая часть будет от применения генеративного ИИ

@ftsec

@startobus 🧠 запуск идей с AI
Наткнулся на интересный пейпер прошлой недели на любимую тему:
Межвидовая коммуникация и АИ

Есть такой алгоритм Wav2Vec2 от Facebook AI — он позволяет переводить нашу речь в текст. Алгоритм работает намного лучше многих альтернатив, так как не требует много размеченных данных и работает напрямую с аудио дорожками, не пытаясь их сначала конвертировать в текст для обработки. Вместо этого, Wav2Vec2 сам находит важные характеристики звука (тон, звуки, паузы и тп), после чего распознает речь.

Так вот, ученые взяли этот алгоритм и применили к лаю домашних песиков и в итоге решили четыре ML-задачи: распознавание конкретных собак, идентификацию породы, классификацию пола и привязку лая к контексту — модель может сама связать вокализации собаки с контекстом, в котором они были произведены (например, агрессивный лай на незнакомца, игривый лай и т.д.). Это важно, потому что у нас наконец-то есть эффективный способ разметки и обработки собачьих звуков.

Самое прикольное, что Wav2Vec2 обученный сначала на ЧЕЛОВЕЧЕСКОЙ РЕЧИ помогает решать эти задачи еще точнее — это довольно странная и клевая находка.

Короче, если исследование подтвердят другие желающие — то нас ждет зарождение стартапов в области переводчиков с собачьего, котячьего (в этих я не уверен), птичьего и тп и тд. Исследователи готовы поделиться собранным датасетом, если написать им на почту (есть в пейпере)

Сам пейпер тут:
https://arxiv.org/abs/2404.18739

@startobus 🧠 запуск идей с AI
🔥1
​​🔥 Founder Salary Report 2024.

Pilot в очередной раз очень полезную штуку рассказывает. “Сколько вы, как фаундер, должны себе платить?”

На эту тему изголяются практически все VCs, сидят и оценивают, а не переплачиваете ли вы себе. Давайте посмотрим на данные, которые собрал сервис по затратам/зарплатам, очень интересно. Тем более, что Pilot опросил 1,000+ основателей.

1/ В прошлый раз такое исследование Pilot проводил в 2021 году (бум как никак), но профиль респондентов не сильно поменялся. В среднем это стартапы, которые подняли $11.3M всего и $4M в последнем раунде, доля bootstrapped составляет 10%.

2/ В итоге медианная зарплата фаундеров - $132K в год, средняя – $142K в год.

3/ Насколько отличаются bootstrapped и VC backed:
▪️57% bootstrapped фаундеров платят себе $0-$100K в год, тогда как;
▪️57% VC backed фаундеров платят себе $50K-$150K в год;
▪️Самые похожие когорты – 22% и 23% фаундеров bootstrapped vs VC backed, соответственно, платят себе от $100K до $150K в год;
▪️Самые большие отличия: 9% против 3% платящих себе $100K-$150K и 29% против 7% платящих себе РОВНО $0.

4/ Pilot предлагает посмотреть также на данные по разным band в зависимости от размера инвестиций:
▪️$0 – $99K: $135K;
▪️$100K – $999K: $90K;
▪️$1M – $2.9M: $125K;
▪️$3M – $4.9M: $124K;
▪️$5M – $9.9M: $150K;
▪️$10M+: $194K.
🔹Любопытно, что вплоть до поднятия $5M фаундеры получают меньше, чем те, кто не поднял и $100K – скорее всего последние зарабатывают сами сразу же, bootstrapped.

5/ Отдельно есть цифры по зарплатам фаундеров в AI (светофорами в сравнении с предыдущим пунктом, где в целом по рынку):
▪️$0 – $999K: $131K 🟡;
▪️$1M – $2.9M: $120K 🟡;
▪️$3M – $4.9M: $110K 🔴;
▪️$5M – $9.9M: $140K 🟡;
▪️$10M+: $100K 🔴.
🔹Не сказать, что больше, чем остальные, зависит от ситуации. Любопытно.

6/ Что еще интересного?
▪️В Бостоне получают больше, чем в SF ($150K против $135K), а international founders зарабатывают меньше, чем в США ($122K);
▪️Pilot еще дает разбивку зарплат фаундеров по когортам в зависимости от количества сотрудников, но там все линейно – чем больше команда, тем больше и фаундер зарабатывает, вплоть до медианы $165K при 51+ FTEs;
▪️Pilot также дает такие детали по районам: Нью-Йорк, Bay Area, Бостон и т.п.

👉 Ссылка на исследование Pilot: https://pilot.com/founder-salary-report-2024

@proVenture

#benchmarks #saas

@startobus 🧠 запуск идей с AI
✈️Создайте маркетинговый квиз с помощью ИИ!

Хотите эффективно сегментировать вашу аудиторию и улучшить маркетинговые кампании без лишних затрат и времени?

⬅️Промт:

Создайте серию вопросов для маркетингового квиза, который поможет сегментировать аудиторию для продукта [укажите продукт]. Цель квиза — получить данные для адаптации маркетинговых кампаний под различные сегменты аудитории.

Контекст
Продукт: [описание продукта].
Целевая аудитория: [описание аудитории].

Примеры:
1. Как часто вы используете [категория продукта]?
- Ежедневно
- Несколько раз в неделю
- Редко
- Никогда
2. Какие факторы важны для вас при выборе [категория продукта]?
- Цена
- Качество
- Бренд
- Отзывы других пользователей


➡️Скопируйте промпт и вставьте его в диалог с ChatGPT или аналогом.

@startobus 🧠 запуск идей с AI
vtbinfra_future_2035.pdf
1.2 MB
💡ВТБ опубликовали аналитический обзор о российском рынке инфраструктуры, текущих трендах и перспективах.

На ближайшие 10 лет с 2025 года по 2035 год перед российской инфраструктурой будут стоять глобальные вызовы:

✔️развитие по меньшей мере пяти удобных и готовых к большим грузо- и пассажиропотокам транспортно-логистических коридоров и почти 50 обходов городов

✔️запуск первой высокоскоростной магистрали

✔️строительство 40 кампусов мирового уровня

✔️создание десяти всесезонных федеральных курортов в разных частях страны

✔️ в российских регионах также планируется цифровизация городской среды, увеличится количество ЦОДов, будут внедрять экологичный транспорт
и возобновляемую энергетику и открывать передовые научно-исследовательские лаборатории

@volotovskayaelena

@startobus 🧠 запуск идей с AI
🇨🇳Китайская экономическая модель. Интерес и восхищение в незападном мире, — The Economist

▪️Китайский подход к развитию основан на принципах равенства, инноваций и неустанного внимания к суверенитету и национальной безопасности. С тех пор, как консультант Джошуа Купер Рамо впервые написал о «Пекинском консенсусе», размер китайской экономики увеличился в четыре раза в реальном долларовом выражении, что вызывает интерес и восхищение в первую очередь незападных стран, — констатирует британский The Economist

▪️Характерные черты китайской экономической модели:
Активная роль государства в развитии экономики
— Опора в развитии на государственные предприятия
— Государственный контроль банковского сектора
— Стабильный профицит счёта текущих операций с высокой долей промышленного экспорта
Высокий уровень инвестиций. Валовое накопление основного капитала достигает 42% ВВП
Государственный контроль счёта операций с капиталом, регулирующий переводы гражданами денег за границу
Государственная политика по поддержанию низких процентных ставок с обеспечением дешёвого банковского финансирования ключевых отраслей
— Широкое использование Особых экономических зон (ОЭЗ)

▪️На основе семи базовых показателей (Фото 2) эксперты The Economist для 85 стран мира вывели индекс, показывающий, насколько похожа экономика страны на китайскую модель. Пятерка стран лидеров с указанием индекса:
🇻🇳0,67 — Вьетнам
🇷🇺0,61 — Россия
🇮🇳0,60 — Индия
🇧🇩0,60 — Бангладеш
🇹🇷0,59 — Турция

▪️По мнению Джошуа Купера Рамо «Вашингтонский консенсус» в отношении финансовой либерализации, плавающего валютного курса и открытости для иностранного капитала оказался «подпорченным брендом». В то же время «экономическая модель Китая разбивает миф о том, что модернизация равна вестернизации, а её рост расширяет выборы для развивающихся стран», — цитирует The Economist заявление Председателя Си Цзиньпина

@startobus 🧠 запуск идей с AI
Привет, друзья! Вот отличный курс по работе с промптами для Claude. Вы освоите использование нейросетей на высоком уровне абсолютно бесплатно. Для начала требуется API Claude — создатели курса предоставили детальный гид по установке.

Курс включает девять уроков, охватывающих структуру промптов, назначение ролей для ИИ, работу с переменными и методы борьбы с галлюцинациями нейросетей. В программе есть практические задания: если задача решена правильно, ячейка таблицы станет зеленой.
Apple - как обычно вышла на старт последней, и делает что-то лучше чем первые.
Не буду рассказывать о всех минимальных доработках (появление калькулятора в iPad))) - но есть что то действительно важное...

Apple сделали ИИ по принципу матрешки (кстати Google этот принцип тоже по сообразительности ИИ):
Итак - в смартфонах и планшетах/компьютерах - есть встроенный индекс ИИ (небольшой - он кстати открыт (по открытой лицензии) - и его можно поюзать отдельно. Локальных мощностей в процессоре начиная с M1 - вполне достаточно - ведь эти процессоры уже спокойно распознавали ваше FaceID и другие ИИ-задачи еще 5 лет назад.

У Apple есть новая пачка моделей (https://machinelearning.apple.com/research/introducing-apple-foundation-models).

Apple On-Device на ~3B параметров, которая оптимизирована на очень быстрый запуск локально и работает чуть лучше, чем Phi-3-mini, Mistral-7B, and Gemma-7B. А еще у нее есть квантизация в ~3.5 b/t и пачка LoRA адаптеров на все случаи жизни.

Эта модель отвечает за работу на девайсах. Она полностью интегрирована в приложения и операционку, а мультимодальность (text/audio/image/video) позволяет ей понимать людей и общаться с ними.

Далее - если локальная ИИ не справляется ( в случаях, когда локальных мощностей не хватает? Тогда начинается самое интересное - девайс может воспользоваться серверными мощностями. Мы либо отправляем запрос на Apple Server модель (сравнима с Mixtral-8x22B и GPT-3.5-Turbo) или в GPT.) - включается - Private Cloud Compute крайне любопытный и я очень рекомендую вам его почитать внимательно, очень неожиданное решение. В этом случае запрос обрабатывается на своих серверах Apple (Apple Silicon) на базе подходов Confidential Computing (https://security.apple.com/blog/private-cloud-compute/). Если кратко, то данные не хранятся и все время зашифрованы, а еще все это можно доказать и проверить. Такое есть уже у NVidia, начиная с GPU H100.

Если коротко: в некоторых ситуациях нейронки на телефоне недостаточно для вычислений и прогнозов. В такой ситуации эппл 1. вычленяет необходимые для вычислений данные 2. извлекает из них ключевые свойства, которые использует нейронка 3. создает специальный зашифрованный раздел на сервере (он зашифрован так же, как отпечатки пальцев в айфоне, с использованием ключа вашего устройства) 4. отправляет туда зашифрованные абстрактные данные с телефона 5. производит вычисления 6. отправляет результаты в телефон и стирает их вместе с разделом из пункта 3. 7. в телефоне данные расшифровываются и уже используются по назначению.

Таким образом получается, что ваши данные в чистом виде (т.е. например фотографии) не покидают устройство, а то что уходит на сервера мало пригодно для прямой слежки, и практически невозможно определить что вот эти вычисления на сервере относятся к вашим данным.

Решение крутое и я уверен довольно скоро станет индустриальным стандартом:
(1) модулярна (можно использовать разные LLMки)
(2) интегрирована в существующие приложения и в ОС
(3) начинает работать локально, но может делегировать задачи в облако
(4) заточена на безопасность и приватность.

Ждем, пока бизнес не попробует всю эту красоту на своих девайсах и на захочет сделать такое же в компании.
В остальном кроме дизайна никаких новых решений от эппл я не увидел. Но и этого достаточно [O_o]

@startobus 🧠 запуск идей с AI