INITE | AI-first экосистема
880 subscribers
302 photos
48 videos
1 file
259 links
AI-first экосистема для тех, кто хочет перейти от хаоса к структуре, чтобы в будущем остаться на плаву

INITE пишет про интеграцию Ai в бизнес и жизнь
Сайт https://inite.ai/
Download Telegram
На днях исполнился год предсказанию Альтмана о единорогах без сотрудников. Дескать, раз AI всё умеет, люди стали не нужны. Энергичный CEO теперь в одно рыло и миллиардную компанию построить может, а не только SaaS на 14 миллионов выручки.

Сэм вроде как раз год давал на исполнение прогноза — и соответственно он уже не сбылся, но идея все равно будоражит умы, прикольно же будет. Статьи, обсуждения, комментарии регулярно выходят, идеальный кликбейт.

А я тут задумался — а если сотрудники будут не нужны, то инвестиции ведь тоже будут не нужны? Если нет сотрудников, то значит клиенты платят сразу, в крайнем случае с триалом в месяц, нет инструментов существенно отложить платеж, не с кем об этом разговаривать. Значит серверные мощности и реклама в платных каналах окупаются более-менее мгновенно, оплата же приходит. А на что ещё кроме зарплат, которых нет, ещё инвестиции тратить?

https://techcrunch.com/2025/02/01/ai-agents-could-birth-the-first-one-person-unicorn-but-at-what-societal-cost/
🔥2
Воспоминания о будущем

Американский #стартапдня Cursor – видимо, лучший на сегодняшний день AI-помощник программиста. Технически это отдельное десктопное приложение, редактор кода. Разработчик творит в плюс-минус обычном интерфейсе, но может при необходимости обратиться к ИИ – “допиши тут”, “сделай такое-то”. Cursor собирает промпт из запроса и текста программы, используя разные файлы одного проекта, а обрабатывает его удаленно внешняя сеть, OpenAI или аналог.

Стандартная месячная подписка стоит 20 долларов и, чуть упрощая, включает в себя 500 “сложных” обращений к AI, “простые” запросы не учитываются. Это примерно 3 задания в рабочий час. Можно считать, что безлимит.

ИИ ещё не программист. Задачу “сделай новую AAA-игру по фильму Челюсти, чтобы там можно было грабить караваны” он не выполнит. Но во многих ситуациях попроще Cursor помогает божественно. Знакомый моего знакомого скопировал ему жалобу пользователя “в такой-то ситуации не кликается ссылка”, а в ответ получил совет, в какой строке какого файла какой стиль поправить. Помогло.

Насколько Cursor и его конкуренты изменят индустрию, никто, конечно, не знает. Мне близка аналогия с началом 90-ых, когда появились визуальные редакторы. Клик-клик – и вот уже готова кнопка и окно. Это был прорыв не менее фантастический чем сейчас: “программисты будут не нужны, менеджер сам всё себе сделает”. Результат мы знаем – программистов стало больше, задач для них ещё больше, средний уровень разработчиков и порог входа в профессию упал на порядок. По логике, подобное должно произойти и сейчас – хотя, казалось бы, по трем из четырех пунктов уже некуда.

Посмотрим. Сам стартап недавно привлек 105 миллионов долларов инвестиций.

https://www.cursor.com/

#ai #мегараунд #сша #технология
🔥1
Эксперименты с ИИ-ассистентами для разработки: опыт и наблюдения

В последнее время я активно экспериментирую с различными ИИ-инструментами для автоматизации разработки. Хочу поделиться своим опытом использования нескольких популярных решений, их преимуществами и ограничениями, с которыми я столкнулся.

Bolt: быстро, но с ограничениями

Начал я свои эксперименты с Bolt. Первые впечатления были довольно позитивными:
- Высокая скорость генерации кода
- Стабильность работы
- Понятный процесс разработки

Однако вскоре я столкнулся с существенными ограничениями:

Архитектурный стек React + Supabase, который предлагает Bolt, оказался довольно жестким и ограниченным. В процессе разработки я наткнулся на ошибку, которую Bolt не смог исправить даже после множества итераций. После десятка попыток сервис просто выдал rate limit.

Переход на Cursor

Решение пришло неожиданно просто - я экспортировал код в Cursor и быстро решил проблему. В процессе я также:
- Отказался от Supabase
- Перешел на NestJS с WebSocket'ами
- Получил более гибкую и масштабируемую архитектуру

Опыт с Replit

Replit показал себя более интересно в плане архитектурных решений. С его помощью удалось быстро разработать ассистента на базе Anthropic API с собственным бэкендом и WebSocket'ами.

Однако и здесь не обошлось без сложностей. При работе над, казалось бы, простой задачей авторизации я столкнулся с серьезными проблемами, которые пока пришлось отложить в сторону.

Выводы на данный момент

1. ИИ-ассистенты значительно ускоряют процесс разработки, но не являются "серебряной пулей"
2. Важно иметь возможность гибко менять инструменты и подходы
3. Предлагаемые "из коробки" архитектурные решения могут быть слишком ограничивающими
4. Комбинирование различных инструментов часто дает лучший результат, чем использование только одного решения

Что дальше?

Продолжаю эксперименты с различными ИИ-инструментами для разработки. Особенно интересно исследовать:
- Возможности комбинирования различных ИИ-ассистентов
- Способы обхода архитектурных ограничений
- Оптимальные сценарии использования каждого инструмента

Буду делиться новыми наблюдениями по мере накопления опыта. Если у вас есть свой опыт работы с ИИ-ассистентами для разработки, буду рад обсудить его в комментариях.
🔥1🙏1
Forwarded from e/acc
Качество LLM в программировании не просто растет, а растет экспоненционально. На этом графике показан ELO рейтинг моделей в Codeforces. Звучит дико, но до конца года мы можем увидеть ИИ, который входит в десятку по миру.

Что не исключает задачу формирования требований, идей, желания и идей для продукта. Не исключает сложность координации сложных систем и большого количества людей. Не исключает принятия сложных решений и абстрактного архитектурного мышления.
Почему RAG останется с нами: 4 причины, почему большие контекстные окна его не заменят

В мире ИИ появились модели, способные обрабатывать огромные объемы текста за раз (больше миллиона слов). Некоторые считают, что это убьет технологию RAG - метод, при котором ИИ сначала ищет нужную информацию, а потом использует её для ответа. Но так ли это? Давайте разберемся, почему RAG никуда не денется.

1. Большие контекстные окна не масштабируются

Представьте, что вы пытаетесь прочитать целую библиотеку за раз. Даже если вы супергений, это займет много времени и сил. Так же и с ИИ - обработка огромных текстов требует много вычислительной мощности и денег. А еще это очень медленно - иногда приходится ждать целую минуту, чтобы получить ответ.

RAG работает умнее: он находит только самую важную информацию по вашему вопросу. Это как спросить библиотекаря, где найти конкретную книгу, вместо того чтобы читать все подряд. Быстрее, дешевле и эффективнее.

2. RAG лучше работает для бизнеса

Длинные контексты звучат здорово, но на практике модели часто путаются в большом объеме информации. Исследования показывают, что они работают хуже, чем предполагалось.

Некоторые предлагают использовать кэширование - сохранение часто используемой информации для быстрого доступа. Это помогает, если вы работаете с одними и теми же данными. Но когда информации становится много и она постоянно меняется, кэширование становится дорогим и медленным.

RAG лучше справляется с разными типами данных и более гибок в использовании.

3. RAG обеспечивает надежность информации

Когда ИИ использует RAG, вы всегда знаете, откуда он берет информацию. Это как ссылки в научной работе - вы можете проверить источник. Для бизнеса, особенно в таких областях как финансы или медицина, это крайне важно.

С большими контекстными окнами сложно понять, какую именно информацию использовал ИИ для ответа. Это как если бы кто-то дал вам совет, но не смог объяснить, почему он так думает.

4. RAG позволяет создавать умных ИИ-агентов

RAG может работать с разными источниками информации и учитывать персональные предпочтения пользователей. Например, он может использовать вашу историю покупок, чтобы давать более точные рекомендации.

Большие контекстные окна хороши для обработки большого объема информации, но они ограничены тем, чему их научили изначально. Они не могут подстроиться под конкретного пользователя так же хорошо, как RAG.

Итог

Большие контекстные окна - это впечатляющая технология, но для большинства бизнес-задач одних их недостаточно. RAG остается необходимым инструментом, особенно когда речь идет об эффективности, точности и гибкости. В будущем выбор подхода будет зависеть от объема данных, с которыми вы работаете, но RAG определенно никуда не исчезнет.
Нейросети, способные генерировать программный код, становятся всё более популярными и полезными инструментами для разработчиков. Однако их использование сопровождается определёнными ограничениями и проблемами. Ниже представлены 10 аргументов, подтверждающих, что на текущий момент нейросети не всегда качественно пишут код:
1. Ограниченное понимание контекста: Нейросети часто не способны полностью учитывать специфический контекст проекта, что приводит к генерации кода, не соответствующего требованиям конкретной задачи.
2. Ошибки в синтаксисе и логике: Автоматически сгенерированный код может содержать синтаксические ошибки или логические несоответствия, требующие дополнительной проверки и исправления со стороны разработчика.
3. Недостаточная оптимизация: Нейросети могут предлагать решения, которые работают корректно, но не являются оптимальными с точки зрения производительности или использования ресурсов.
4. Сложности с интеграцией: Сгенерированный код может не учитывать особенности существующей кодовой базы или архитектуры проекта, что затрудняет его интеграцию.
5. Ограничения в творческих задачах: Нейросети хорошо справляются с типовыми задачами, но при решении нестандартных или инновационных проблем их эффективность снижается.
6. Риск устаревших решений: Модели обучаются на данных, доступных на момент их создания, поэтому могут предлагать устаревшие или неактуальные подходы.
7. Проблемы с безопасностью: Сгенерированный код может содержать уязвимости, которые нейросеть не в состоянии выявить или предотвратить.
8. Необходимость человеческого контроля: Даже при использовании нейросетей разработчики должны тщательно проверять и тестировать сгенерированный код, что требует дополнительных временных затрат.
9. Ограниченная поддержка редких языков программирования: Многие нейросети ориентированы на популярные языки, такие как Python или JavaScript, и могут плохо справляться с генерацией кода на менее распространённых языках.
10. Этические и правовые вопросы: Использование сгенерированного кода может вызывать вопросы, связанные с авторскими правами и лицензированием, особенно если нейросеть обучалась на проприетарных кодовых базах.

Таким образом, несмотря на значительный прогресс в области искусственного интеллекта, нейросети пока не способны полностью заменить человеческих разработчиков и требуют внимательного и критического подхода при использовании в процессе разработки программного обеспечения.
Forwarded from Mikhail Savchenko
Недеетерминированность ответов LLM — отдельная песня.

Просишь курсор поправить какой-нибудь модуль, читаешь результаты, пока он «думает» — вроде бы ничего (слава Аллаху, я умею читать на большинстве популярных языков программирования). Но вот незадача: если сессия в процессе упадёт, автоматическое слияние результата курсором невозможно. Выход? Повторяем запрос.

Результат? Какая-то мутная бяка, хотя первый раз казалось, что всё нормально. Он вообще может решить, что вместо контроллера на бэке пришло время поправить стор на фронте, а заодно и компоненту переверстать. Вы скажете: «Это надо всё в промпте жёстко указывать», но я же обычный пользователь, верно? Я ничего не знаю ни про бэк, ни про фронт, ни про, прости господи, их внутреннюю архитектуру — я котик, у меня лапки.

А пысы про оптимизацию — как чудесно он делает миллион запросов к бэку при рендере фронта и как на каждый чих пытается перерисовывать сам фронт — это уже отдельная история, но об этом как-нибудь в другой раз.
👍1
Ах, нейросети, эти современные волшебники кодинга! Казалось бы, будущее уже наступило: достаточно ввести пару строк, и искусственный интеллект сам напишет за вас весь код. Но давайте посмотрим правде в глаза: пока что эти цифровые помощники скорее напоминают стажёров на первом рабочем дне, чем опытных разработчиков.

Сложные связи между сервером и клиентом? Конечно, нейросеть с радостью сгенерирует вам что-то, что отдалённо напоминает веб-сокеты. Но вот беда: авторизация по ролям превращается в настоящий квест. Вместо чёткого разграничения прав доступа вы получаете систему, где администратор вдруг становится обычным пользователем, а гость неожиданно получает права суперпользователя. Видимо, нейросеть решила, что демократия должна быть везде, даже в вашем приложении.

А что насчёт вёрстки? Здесь начинается настоящий цирк. Попросите нейросеть сделать кнопку неактивной, если пользователь уже нажимал её сегодня. Результат? Кнопка то исчезает вовсе, то появляется в неожиданных местах, то нажимается, но ничего не происходит. Иногда она решает жить своей жизнью и отображается только по нечётным дням недели. Кажется, нейросеть считает, что элементы интерфейса должны быть столь же непредсказуемыми, как и сама жизнь.

Хотите создать простую систему учёта рабочего времени? Приготовьтесь к тому, что нейросеть предложит вам шедевр абсурда. Вместо логичного расписания вы получите график, где рабочий день начинается в 3 часа ночи, а обеденный перерыв длится ровно 42 минуты и 17 секунд. Попытки исправить это приводят к тому, что сотрудники начинают работать по лунному календарю, а отчёты формируются на древнеарамейском языке. Видимо, нейросеть решила, что стандартные рабочие графики — это слишком скучно.

В итоге, доверяя нейросетям написание кода, вы получаете не помощника, а капризного художника, который видит мир по-своему. Возможно, когда-нибудь они станут надёжными инструментами в руках разработчиков. Но пока что, если вы не готовы к сюрпризам и хаосу в своём проекте, лучше держать под рукой проверенного человеческого программиста.
👍1🤔1
Использование локальных языковых моделей становится все более популярным, но их производительность сильно зависит от типа оборудования. Сравнение работы на CPU и GPU позволяет понять, какие задачи эффективнее решать на каждом из устройств. Это особенно важно для разработчиков, работающих с обработкой естественного языка и стремящихся оптимизировать свои решения.

https://dev.to/maximsaplin/running-local-llms-cpu-vs-gpu-a-quick-speed-test-2cjn
🔥1
Forwarded from Квест Теория Каст и Ролей (Алексей Крол)
Часть 1. Какой ИИ лучше? Какой ИИ выбрать? От OpenAI, от Google, от Антропик, DeepSeek? Каким генератором картинок пользоваться? Midjourney или Stable Diffusion? На чем лучше видео делать? На SORA или Kling, а может на Pica, а может на Runway? Или Haygen?

Что выбрать из сотен стартапов, бесконечных ассистентов, умных чатов? А может Groc3 Илона Маска всех убил? Или модельки от китайцев? Или чатик от Яндкса?

На каком лучше тексты писать? На каком лучше кодить? На каком лучше математические задачки решать?

Если я вижу, что, как тут один колхозник написал "Groc3" всех уделал, или какой-нить программист пишет "Сонет самый крутой", то понимаю, что это пишет невежественный дилетант. Давайте разбираться.

1. На данный момент только открытых моделей более 1,445,971. Ага. Это за пару лет. Не знали штоле?🤣 Не считая закрытых от OpenAI, Groc3, Anthropic, Google и т.п. см. https://huggingface.co/models

2. Модели очень разные. Есть языковые модели, которые работают с любым текстом (код это разновидность теста), рассуждающие модели, генераторы тех же текстов, картинок, видео, звуков, модели для компьютерного зрения, модели для обработки естественных языков, для обработки аудио, модели для быстрой обработки процессов реального времени, IoT и т.п. Есть мульти-модальные модели и моно-модальные.

В итоге модели показывают разное качество на разных задачах, как и любой инструмент, модели имеет свои границы применения и кейсы, где можно достигнуть лучших результатов. Но это не все.

3. Есть масса площадок, где проводят соревнования моделей, предлагая им тестовые задачи из разных разделов науки, работы с текстами, с кодом, с математикой и т.п. Одна из самых известных площадок - https://lmarena.ai/?leaderboard

На ней можно выбрать разные типы задач, и вы увидите, что на разных задачах лидируют РАЗНЫЕ модели.

К примеру, в написании кода на текущий момент лидеры:

1. chocolate (Early Grok-3)
2. o3-mini-high от (Open AI)
3. Gemini-2.0-Pro-Exp-02-05 (Google).

В работе с текстами, в "творческом писательстве" лидеры:

1. ChatGPT-4o-latest (2025-01-29) - (Open AI)
2. chocolate (Early Grok-3)
3. Gemini-2.0-Flash-Thinking-Exp-01-21 (Google)

В работе с русским языком:

1. Gemini-2.0-Pro-Exp-02-05 (Google)
2. Gemini-2.0-Flash-Thinking-Exp-01-21 (Google)
3. chocolate (Early Grok-3)

Оговорка: ChatGPT-4o-latest (2025-01-29) - на 4, а o1-2024-12-17 на 5 месте.

Можно этому доверять? Нет и вот почему.

Угадайте с 3-х раз, кто создает все эти тесты и оценивает модели? Правильно!

Программисты и гики. И эти ребята отлично понимают в технологиях и коде, но ни хрена не понимают в текстах. Потому что все тексты с которыми они работают это мануалы и пейперы, которые с литературной точки зрения представляют собой унылое гавно.

Т.е. прогеры считают это нормальными тестами. Потому что слаще морковки ничего не читали. Какого-нибудь Борхеса, или на худой конец Сервантеса или даже Умберто Эко. Да Маркеса, наконец. Ладно, я понимаю, что много требую. Ок!

Понедельник начинается в субботу? Не? Чайку? Которая Джонатан Ливингстон? Сорри, это я троллю. Атака на Титанов и катка в Танчики это наш предел.

Доказательство: Если бы было иначе, то не существовало бы таких профессий, как технический писатель, копирайтер, UX writer.

В среднем самый херовый блоггер пишет креативные тексты, чем самый крутой прогер.

Я, к примеру, очень уважаю Андрея Карпатого (крутой чел в ИИ коммунити), но если вы посмотрите на его СУПЕР известные лекции по ИИ с точки зрения Instructional Design - это пиздец. По русски: Объяснять ПОНЯТНО он не умеет.

Промежуточный вывод:

- Мало того, что разные модели лидируют в разных тестах, но и доверие этим тестам иногда сомнительное.
- Учитывайте, что этих площадок для соревнований также много, все они конкурируют за трафик и кричат - "У меня, у меня все единственно правильно".

Но все гораздо, гораздо хуже.

3. Проблема, как ее формулируют умные айтишники: гавно на входе, гавно на выходе. Перевожу для гуманитариев:
👍1
ИИ наконец-то видит то, что видите вы: знакомимся с Model Context Protocol

Помните те моменты, когда вы спрашивали ИИ-помощника о чём-то важном из вашей рабочей жизни, а он бессильно разводил виртуальными руками? "Извините, я не могу получить доступ к вашим данным". Знакомая ситуация, верно?

Сегодня мы делаем большой шаг к решению этой проблемы, открывая исходный код Model Context Protocol (MCP) — своеобразного "переводчика", который наконец-то позволит ИИ видеть ваш мир.

Почему это важно для вас?

Представьте, что у вас есть очень умный друг, который хочет помочь с работой, но вы вынуждены описывать ему все данные словами, потому что он не может заглянуть в ваш компьютер. Именно так сейчас работают даже самые продвинутые ИИ-модели — они отрезаны от ваших файлов, баз данных и рабочих инструментов.

"Эй, Claude, что думаешь о моём последнем проекте?"
"Извините, я не вижу ваш проект."

Утомительно, правда?

MCP — мост между двумя мирами

MCP решает эту проблему элегантно и просто. Это как если бы вы дали своему умному другу специальные очки, через которые он может видеть те же документы, что и вы.

Вместо того чтобы создавать отдельный "переходник" для каждой системы, MCP предлагает единый язык общения. Это похоже на то, как USB заменил десятки разных портов на вашем компьютере.

Как это работает в реальной жизни?

История Марины, менеджера проектов:

Раньше: "Claude, помоги составить отчёт по проекту 'Феникс'."
Claude: "Я не могу видеть данные вашего проекта. Расскажите мне о нём."
Марина: *вздыхает и 15 минут вручную описывает проект*

Теперь: "Claude, помоги составить отчёт по проекту 'Феникс'."
Claude: "Вижу, что ваша команда выполнила 85% задач, но есть проблемы с модулем оплаты. Давайте начнём отчёт с основных достижений..."

История Дмитрия, разработчика:

Раньше: копировать код → вставить в чат → получить совет → копировать ответ → вставить в редактор → повторять бесконечно

Теперь: "Claude, есть идеи, как оптимизировать эту функцию?"
Claude: "В строке 47 вашего файла processor.js я вижу, что вы используете вложенные циклы. Давайте заменим их на более эффективное решение..."

Готовые соединения уже ждут вас

Мы создали готовые "переходники" для популярных систем:
- Ваши документы в Google Drive
- Рабочие обсуждения в Slack
- Код в GitHub и Git
- Данные в Postgres

Это как набор универсальных ключей, открывающих двери к вашим данным.

Как попробовать MCP прямо сейчас?

1. Скачайте Claude Desktop и подключите готовые MCP-серверы
2. Наблюдайте магию: ваш ИИ-помощник внезапно "видит" ваши данные
3. Если вы разработчик — присоединяйтесь к созданию новых соединений!

Мир, где ИИ понимает ваш контекст

Представьте будущее, где вам не нужно постоянно объяснять ИИ, над чем вы работаете. Где он плавно переключается между вашими документами, кодом и базами данных, сохраняя контекст разговора. Где каждый ответ основан на актуальной информации из ваших систем.

Это будущее начинается сегодня с MCP.

Model Context Protocol
открывает новую главу в истории ИИ — главу, где умные помощники становятся по-настоящему полезными, потому что наконец-то видят то, что важно для вас.​​​​​​​​​​​​​​​​
👍2
Почему IT-компаниям нужно обучать сотрудников искусственному интеллекту уже сейчас

Представьте: пока ваши конкуренты только обсуждают возможности ИИ на совещаниях, ваши сотрудники уже используют его для оптимизации рабочих процессов, создания инновационных продуктов и принятия более эффективных решений. Это не фантастика — это реальность, доступная компаниям, которые инвестируют в AI-обучение прямо сейчас.

Гонка за AI-компетенциями уже началась

Технологический ландшафт меняется с беспрецедентной скоростью. Компании, игнорирующие необходимость AI-обучения, рискуют остаться позади в ближайшие 1-2 года. По данным исследований, организации, активно внедряющие ИИ, демонстрируют на 40% более высокую производительность по сравнению с конкурентами.

Три причины не откладывать AI-обучение

1. Производительность и эффективность: Сотрудники, владеющие инструментами ИИ, выполняют рутинные задачи в 3-5 раз быстрее, освобождая время для стратегических инициатив.

2. Инновационный потенциал: Команды, понимающие возможности ИИ, создают продукты нового поколения, которые решают проблемы клиентов на качественно ином уровне.

3. Конкурентное преимущество: Компании с AI-грамотными специалистами быстрее адаптируются к изменениям рынка и опережают конкурентов.

Как
inite.education трансформирует IT-команды

В inite.education мы разработали комплексную программу обучения ИИ, адаптированную специально для IT-специалистов. Наш подход сочетает теоретические знания с практическим применением ИИ в реальных рабочих сценариях.

Наши выпускники не просто понимают принципы работы искусственного интеллекта — они умеют эффективно интегрировать его в существующие процессы и создавать новые возможности для бизнеса.

Истории успеха говорят сами за себя

"После обучения нашей команды в inite.education мы сократили время разработки на 35% и внедрили AI-функционал, который клиенты назвали революционным." — Алексей, CTO финтех-стартапа.

Не ждите, пока конкуренты вас обгонят

AI-трансформация неизбежна. Вопрос лишь в том, будете ли вы в авангарде этих изменений или будете догонять.

Запишитесь на консультацию с экспертами inite.education сегодня и узнайте, как AI-обучение может стать катализатором роста для вашей IT-компании. Инвестиции в AI-компетенции ваших сотрудников — это инвестиции в будущее вашего бизнеса.

inite.education — формируем AI-грамотные команды для технологий будущего
1
Forwarded from Denis Sexy IT 🤖
Deep Research стал доступен всем платным пользователям (10 запросов в месяц если у вас Plus), поэтому ловите практические советы как лучше его использовать:

— Неважно какую модель вы выбрали в ChatGPT, у Deep Research своя модель во время поиска, он проигнорируют выбор модели (UI-костыли, привет)
— Указывайте на каком языке писать отчет и на каком языке искать материалы
— Попросите его «ВАЖНО: не дублируй одну и ту же мысль много раз в тексте, если она уже описана», по умолчанию он так делает
— Deep Research не умеет смотреть на картинки — не ожидайте от него исследований где что-то нужно визуально исследовать
— Просите научные источники если хотите максимально научный отчет на фактах, можете также указать год с которого искать релевантные данные
— Поставьте приложение 11 labs — каждый такой отчет, это примерно 30-40 минут прослушивания, идеально для поездок (встроенная в ChatGPT фича глючит с длинным текстом)
— Deep Research основан на рассуждающей модели, это значит что вам все еще нужно очень детально описать, что вы хотите видеть, что не хотите, что считается банальным — иначе получите поверхностный отчет
— Deep Research имеет доступ к написанию кода, то есть он может генерировать графики, таблицы и тп тд, и включать их в финальный отчет
— Можете подсказать ключевые слова на которых стоит сделать акцент, модель же ищет в интернете и там иногда много ненужного
— Deep Research поддерживает файлы (и ссылки), можете сказать ему что в них смотреть, он может их сделать как частью контекста отчета, так и построить поиск на основе файлов (но из-за UI костылей OpenAI, сначала нужно выбрать 4o или любую модель, что поддерживает файлы на входе)
— Это все еще нейрока — ответы могут содержать ошибки и требует верификации человеком, например в тестах видел как модель делала отчет на основе картинок ПО НАЗВАНИЯМ картинок, bruh
— Это все еще лучший автономный ресечер что у нас есть, никто не может конкурировать — и Perplexity, и Google
— Deep Research не умеет смотреть за пейволл, такие статьи нужно прикладывать самим к чату

И напоследок, когда использовать Deep Research:
Когда вы начинаете исследовать какую-то тему — это быстрый и легкий способ погрузиться во что-то, дальше вы можете строить свое исследование на базе знаний из прошлых отчетов, углубляясь в тему с каждым запросом все глубже — от бизнеса до науки, пока не нашел сферу где нельзя было бы применить такой инструмент
O1 — не чат, а генератор отчётов

Как часто мы привыкли вести диалог с чат-ботами, ожидая быстрых ответов? Но модель o1 — совсем не про болтовню. Это мощный инструмент, способный за один заход сформировать полный отчёт или даже сгенерировать целые файлы, если дать ему максимум контекста.

Недавно один эксперт, ранее настроенный скептически, решил попробовать o1 всерьёз. Результат? Он перестал жаловаться на «глюки» и оценил возможность модели решать сложные инженерные задачи за один проход. Главное отличие в подходе: вместо коротких запросов нужно писать подробные «брифы» — описывать всю проблему, добавлять все детали и контекст. Только так o1 сможет показать всю свою силу.

Совет для тех, кто хочет освоить o1:
• Не пиши простые промты — пиши развернутые брифы.
• Дай модели всю необходимую информацию: опиши, что уже пробовал, приведи примеры, добавь схематичные данные.
• Сфокусируйся на конечном результате: расскажи, что именно тебе нужно, а не как это сделать.

Такой подход помогает избежать лишних рассуждений модели и позволяет ей сконцентрироваться на выдаче готового решения. Попробуйте сами — возможно, именно правильное взаимодействие с инструментом откроет новые горизонты в работе с ИИ.

#o1 #ИИ #инновации #инженерия
🔥4
Forwarded from e/acc
This media is not supported in your browser
VIEW IN TELEGRAM
Будущее коммерции уже тут.

Агент с MCP заказывает еду через убер.

Правда, пока что вам нужно это делать через IDE, lol
Скрытый потенциал русского ИИ: как мат может стать конкурентным преимуществом

Что произойдет, если разрешить русским языковым моделям свободно использовать нецензурную лексику?
Источник: https://doi.org/10.48550/arXiv.2402.14531

Доктор психологических наук Леонид Александрович Китаев-Смык обращает внимание на одну весьма нестандартную идею в условиях жестких ограничений в развитии ИИ в России. На современном этапе ключевой проблемой является наличие огромных вычислительных мощностей, необходимых для обучения гигантских трансформеров. При этом экспортные ограничения и отсутствие массовых поставок современного «железа» делают перспективы развития отечественного ИИ крайне сложными.

Нестандартный поворот в развитии ИИ

В условиях, когда разработка собственного оборудования на ближайшие годы кажется нереализуемой, а масштабные поставки зарубежных технологий маловероятны, появляется шанс найти креативное решение. Идея, озвученная в кругу российских специалистов по ИИ, заключается в использовании уникального языкового богатства русского языка – именно нецензурной лексики, или мата, – как конкурентного преимущества.

Русский мат, по мнению авторов идеи, – это не просто грубые ругательства. Это способ эмоциональной коммуникации, традиционно используемый мужчинами в экстремальных ситуациях для быстрого и точного обмена информацией. Он обладает не только психологическим, но и физиологическим воздействием, что подтверждают данные новейших исследований. Таким образом, мат воспринимается как эффективный, малорискованный и экономичный инструмент, способный повышать физическую работоспособность.

Три ключевых следствия идеи
1. Эффективность ругани: Метанализ, проведенный пятью авторитетными академическими центрами, показывает, что использование мата в определенных условиях может существенно улучшать физическую работоспособность, являясь практичным вмешательством с минимальными рисками.
2. Лингвистический потенциал: Будучи неотъемлемой частью языка, мат может стать инструментом, позволяющим языковым моделям достигать большей семантической и эмоциональной глубины, чем это возможно для человека. Освобождение от цензурных ограничений открывает путь к максимальному раскрытию языкового потенциала.
3. Улучшение интеллектуальной работоспособности: Отказ от ограничений в обучении и использовании LLM на базе нецензурной лексики может стать недорогим и эффективным способом повышения интеллектуальных возможностей как самих моделей, так и специалистов, работающих с ними в гибридном режиме.
Сравнительный анализ современных LLM: взгляд сообщества

Нашел интересную тепловую карту от сообщества LocalLLaMA на Reddit, которая показывает, как разные языковые модели оценивают друг друга. 🧠📊

На графике представлены все топовые модели: Claude 3.7 Sonnet, GPT-4o, Gemini 2.0, различные версии Llama, Mistral и другие. Любопытно, что GPT-4o получил наивысшую оценку 8.0 от Claude, а некоторые модели явно "недолюбливают" друг друга (посмотрите на низкие красные ячейки).

Особенно заметно, как по-разному оценивают одни и те же модели разные "судьи" - это наглядно показывает субъективность в оценке качества AI и различия в критериях тестирования.

Что вы думаете - насколько объективны такие сравнения? И какая модель, по вашему опыту, действительно лучше справляется с повседневными задачами?
👍1
Интеллектуальные агентные рабочие процессы: революция автоматизации с n8n

В современном мире автоматизация перестала быть просто набором статичных инструкций – она превращается в динамичную систему, способную самостоятельно принимать решения, адаптироваться к изменениям и стремиться к достижению конкретных целей. Представьте себе рабочий процесс, который не просто выполняет заранее прописанные шаги, а действует как настоящий интеллектуальный агент, анализируя ситуацию, обучаясь на опыте и взаимодействуя с различными инструментами для достижения оптимального результата. Именно такие системы и называются агентными рабочими процессами.

Что такое агентные рабочие процессы?

Агентные рабочие процессы – это гибрид традиционных автоматизированных систем и искусственного интеллекта, где ключевую роль играют автономные агенты. Они обладают рядом уникальных качеств:
• Автономность: Агент способен действовать самостоятельно, без постоянного контроля со стороны человека.
• Адаптивность: Он может корректировать свои действия в ответ на изменения во внешней среде или появление новой информации.
• Целеустремлённость: Вместо того чтобы просто следовать заранее заданным шагам, агент нацелен на достижение конкретного результата.
• Обучаемость: Со временем такие агенты улучшают свои навыки, оптимизируя процессы и повышая эффективность.
• Масштабируемость: Постепенно система способна справляться с все более сложными задачами без необходимости полной перепрограммировки.

Эти особенности позволяют агентам не только обрабатывать структурированные данные, но и работать с неструктурированной информацией, делая рабочие процессы гораздо более гибкими и мощными.

Примеры агентных рабочих процессов

Чтобы понять, как агентные системы могут преобразовать бизнес-процессы, рассмотрим несколько реальных примеров:
1. Цепочка запросов:
Представьте, что вам нужно преобразовать аудиозапись в текст, затем суммировать полученный текст и сохранить его в таблице. В традиционном процессе это может быть несколько отдельных шагов, соединённых между собой. При использовании цепочки запросов в n8n каждый этап – от транскрипции до анализа – обрабатывается последовательно с помощью специализированных ИИ-моделей, что позволяет добиться высокой точности и адаптивности на каждом шаге.
2. Один агент:
Допустим, создается чат-бот, который ведет осмысленный диалог с пользователем. Такой бот способен сохранять контекст беседы, запоминать предыдущие сообщения и корректировать свои ответы в зависимости от поступающей информации. Благодаря встроенной памяти и интеллектуальному анализу, агент делает диалог максимально естественным и полезным.
3. Многоагентная система с диспетчером:
В сложной системе поддержки клиентов центральный агент (диспетчер) принимает входящие запросы и распределяет их между специализированными агентами – например, одним для технических вопросов, другим для обработки запросов по платежам, третьим для анализа тональности сообщений. Такой подход позволяет обеспечить оперативное и точное решение разнообразных задач, сохраняя при этом единый стандарт обслуживания.
4. Команды агентов:
В масштабных корпоративных системах несколько агентов могут работать вместе для решения комплексных задач, таких как анализ больших данных или разработка подробных аналитических отчётов. Здесь агенты обмениваются информацией, совместно распределяют задачи и принимают коллективные решения, что делает систему невероятно гибкой и эффективной.

Как построить агентный рабочий процесс в n8n?