HubLab.ai – Ivan Kononov
В ближайшие 3-6 месяцев, Al будет генерировать 90% кода, и через 12 месяцев почти весь код будет сгенерирован ИИ - CEO ANTHROPIC Dario Amodei
В комментариях спросили моё мнение и оно не уместилось в комментарий, поэтому вот мои мысли:
Думаю что сейчас все упускают качество и правдивость, точность ответов от LLM как метрику.
На вчерашней презентации OpeanAI показали модели, которые сильно подтянулись по SimpleQA accuracy, думаю что если прогресс будет идти с той же скоростью, то обычный код(скрипты, веб-сайтики, простые функции и куски кода) мы и правда перестанем писать, но всё-равно будем тратить кучу времени чтобы понять, как он работает. Не говоря про оптимизации, архитектуру, большие системы, деплой. Это как с гуманоидными роботами которые все сейчас строят: IT мир построен под человека, деже не смотря на наличие кучи API и интеграций.
Ситуация похожа на исчезновение черчения вручную: появились CAD-системы которые помогают нам даже моделировать процессы нагрузки конструкций. Но инженер, который понимает что происходит - всё равно нужен. Генеративный 3D дизайн - это вообще давно существующая область. LLM - это тоже пока просто инструмент без воли и желания.
Да, есть попытки сделать агентов которые завязаны на какие-то рыночные метрики(CTR, CAC, LTV) и будут сами итерировать версии продуктов, но... думаю вот до полностью автономных систем ещё 3-5 лет, если не случится серьёзных прорывов. А это значит, что сама вероятность что такие системы появятся пока довольно низкая.
Поясню ход своих мыслей тут:
если до чего-то 3 мес - мы знаем как это сделать или уже сделали и тестим.
Если 1 год - мы знаем что нужно развить и улучшить, куда двигаться, у нас есть план.
5+ лет - мы думаем, что технологии достигнут необходимых нам результатов, но это предположение.
👍8🔥3
OpenAI релизнула самые точные модели распознавания речи
GPT-4o-transcribe и
GPT-4o-mini-transcribe
Уровень ошибок 2% и 3% соответственно🤔
Это значительно превосходит предыдущие модели, такие как whisper-large-v2, whisper-large-v3🚀
Для некоторых языков прирост точности очень существенный.
GPT-4o-transcribe и
GPT-4o-mini-transcribe
Уровень ошибок 2% и 3% соответственно
Это значительно превосходит предыдущие модели, такие как whisper-large-v2, whisper-large-v3
Для некоторых языков прирост точности очень существенный.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Google показал, что языковые модели (LLM), несмотря на статистический подход к языку, формируют эмбеддинги, удивительно схожие по геометрии и последовательности активаций с нейронными паттернами человеческого мозга во время восприятия и генерации речи.
Подробнее тут: https://research.google/blog/deciphering-language-processing-in-the-human-brain-through-llm-representations/
Подробнее тут: https://research.google/blog/deciphering-language-processing-in-the-human-brain-through-llm-representations/
👀3🔥2
Мне выдали доступы Manus 🍑😂
Дада, тому самому за $10,000-20,000 долларов 💸 про которого ходили слухи и якобы продавали инвайты 💅
Короче агент Manus (НЕ путать с агентом Anus) - это не Deep Research, это ещё и OpenAI Operator.
Очень круто сделано, даже с телефона доступен весь функционал 🔥😠
Закинул в него запрос по своей теме в Аспирантуре, как ответит - отпишу круче ли он DeepResearch от OpenAI в плане поиска информации 💁
Но уже сейчас могу сказать, то он не для этого в первую очередь, а для выполнения тасок автономно 🤖
Дада, тому самому за $10,000-20,000 долларов 💸 про которого ходили слухи и якобы продавали инвайты 💅
Короче агент Manus (НЕ путать с агентом Anus) - это не Deep Research, это ещё и OpenAI Operator.
OpenAI Operator и Manus это по сути удаленный браузер который использует VISION-LMM или VLM для просмотра запущенного инстанса🌐 Google Chrome, который можно остановить, вмешаться, залогиниться куда-нибудь например и отдать обратно контроль.
Очень круто сделано, даже с телефона доступен весь функционал 🔥
Закинул в него запрос по своей теме в Аспирантуре, как ответит - отпишу круче ли он DeepResearch от OpenAI в плане поиска информации 💁
Но уже сейчас могу сказать, то он не для этого в первую очередь, а для выполнения тасок автономно 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6😱1
Ходят слухи что OpenAI скоро выпустит GPT 4.1 👀
При том что есть модели: GPT-4o, GPT-o3, GPT-4.5, GPT-o1-Pro...
Пора пилить бенчмарк по типу сколько 'r' в слове "strawberry" только про названия моделей OpenAI🔥
При том что есть модели: GPT-4o, GPT-o3, GPT-4.5, GPT-o1-Pro...
Пора пилить бенчмарк по типу сколько 'r' в слове "strawberry" только про названия моделей OpenAI
Лично я вангую - это будет моделька на замену GPT-4, А не GPT-4o.
Please open Telegram to view this post
VIEW IN TELEGRAM
👀2
OpenAI GPT-4.1 выпущена 🎉
Все-таки это прокачанный вариант GPT-4o
Бенчмарки хороши, модельне только хорошо кодит на Python, но и на других языках, заявляют что сильно лучше следует пользовательским инструкциям 🎠
🎉 1 миллион токенов контекста🎉
32k токенов на выход(больше, чем у 4o в 2 раза)
Дешевле чем 4o
Так же появилась модель Nano, которая тупее 4o-mini, это интересно 🤔
Все-таки это прокачанный вариант GPT-4o
Бенчмарки хороши, модельне только хорошо кодит на Python, но и на других языках, заявляют что сильно лучше следует пользовательским инструкциям 🎠
32k токенов на выход(больше, чем у 4o в 2 раза)
Дешевле чем 4o
Так же появилась модель Nano, которая тупее 4o-mini, это интересно 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤2👍1
- Reasoning картинками
- Модели теперь используют инструменты: вытаскивает код из репозиториев с GitHub прям вот хорошо и вовремя
Цены на токены
o1 (базовая модель)
- Входящие: $15
- Исходящие: $60
o3 (дешевле на 33%)
- Входящие: $10
- Исходящие: $40
o4-mini (дешевле на 93%)
- Входящие: $1.1
- Исходящие: $4.4
И да, супер крутые результаты на бенчмарках по кодингу, агентных системах
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Meta запускает свое приложение Meta* AI app которое в первую очередь про диалог с ним голосом, беседу 🗣️💭
Похоже на копипасту с Алисы, если вы помните как она запускалась в формате приложения👀
О общем поигрался - у OpenAI получше в плане эмоций.
TLDR; Список новых фишек:
Похоже на копипасту с Алисы, если вы помните как она запускалась в формате приложения👀
О общем поигрался - у OpenAI получше в плане эмоций.
TLDR; Список новых фишек:
Приложение Meta View теперь называется Meta* AI.
- Получайте персонализированный опыт взаимодействия с Meta* AI, учитывающий ваши предпочтения и интересы.
- Общайтесь с Meta* AI легко и естественно, чтобы получать ответы, советы и вдохновение.
- Изучайте советы и подсказки от сообщества в ленте Discover и пробуйте их сами.
Продолжайте настраивать и управлять своими очками Ray-Ban Meta.
- Импортируйте и делитесь медиафайлами с ваших очков Ray-Ban Meta через приложение.
- Все ваши сопряжённые устройства, настройки и медиафайлы автоматически перенесутся после обновления приложения.
Некоторые функции Meta* AI доступны только в отдельных странах и на определённых языках. Распространение новых функций может происходить постепенно.
* Meta признана экстремистской организацией и запрещена на территории России - для тех кто будет репостить 📌
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1😁1
У меня взяли интервью, прошу поддержать лайком =)
https://www.instagram.com/reel/DJ6C2X8MbMc/?igsh=MTdnc2tmZGozdjZ1YQ==
https://www.instagram.com/reel/DJ6C2X8MbMc/?igsh=MTdnc2tmZGozdjZ1YQ==
❤11