Генеративный Мир

Мы растем и развиваемся, запускаем новые амбициозные проекты по NLP и LLM. Поэтому я - в поиске 3 могучих джедаев в свою команду:

ИИ инженер, уверенный мидл и выше, о чьих славных подвигах потом будут сложены статьи на Хабре

QA с навыками аналитика, с которым наши метрики станут еще выше, а код надежнее

Руководитель проектов, который будет не только организовывать работу, но и вдохновлять команду на достижение амбициозных целей.

Если ты готов присоединиться к нашей команде и стать частью захватывающего путешествия в мир искусственного интеллекта, жду твоего отклика!

nn.hh.ru

Вакансия Инженер по искусственному интеллекту (middle/senior) в Нижнем Новгороде, работа в компании Группа IT-компаний Lad

Зарплата: не указана. Нижний Новгород. Требуемый опыт: 3–6 лет. Полная занятость. Дата публикации: 08.10.2024.

👍6🔥4

305 views15:48

Генеративный Мир

Интересная находка с ICML, фреймворк для параллельного вызова функций с помощью LLM. В процессе решения задачи LLMCompiler разбивает решение на несколько задач, определяет, какие из них могут быть выполнены параллельно и организует многофункциональный вызов. Результаты: 3,7х ускорения, 6,7х экономии на токенах, 9х повышения точности.
Авторы обещают, что будет работать не только с open AI моделями, но и моделями с открытым исходным кодом.

Код фреймворка тоже открытый, забираем и испытываем

#AI #LLM #ICML #fucntioncalling

👍7

324 viewsedited 07:35

Генеративный Мир

Мой сын, перешел в 6 класс, хочет принять участие в AI Challenge, возрастная группа до 13 лет. Решила поделиться тем, какие нынче задания дают деткам:
- чат-бот с графовой базой знаний
- бинарная классификация
- модель CV для подсчета животных в свинокомплексе
- математическая модель, которая будет оценивать семантическую близость между текстовым описанием изображения и его графическим контентом.

В школьной программе при этом официально даже питона не было, информатика шла как факультатив, мы с ним занимаемся понемногу и пробовали участвовать в конкурсе по анализу данных, но тут действительно челлендж, за оставшееся время школьных каникул показать ему бинарную классификацию, основы работы с CV и графами

Ссылка на конкурс не реклама)

Aiijc

AI Challenge – международный конкурс по искусственному интеллекту для молодежи

Мы подготовили для тебя по-настоящему интересные задачи. Принимай участие в нашем конкурсе!

🙈9👍2❤1😱1

382 views16:15

Генеративный Мир

Простым языком о том, как GROQ смог обогнать NVIDIA по скорости вычислений для LLM
https://digitalocean.ru/n/novyj-yazykovoj-processor

Спасибо Марату за ссылку)

#AI #LLM #GROQ #NVIDIA

Цифровой океан

Микрочип LPU

В феврале 2024 года малоизвестный стартап Groq представил LPU* — специальный микрочип, который делает ответ языковых моделей молниеносным. Новый процессор сходу показал десятикратное преимущество перед традиционными решениями на GPU. Вероятно, скоро такой…

👍5

343 views14:30

Генеративный Мир

Готовлю статью на VC и сегодня будет маленький спойлер. Расскажу про один из наших кейсов генеративного ИИ, в котором не так много романтики, но он оказался очень нужным и полезным для производственных предприятий.
Давайте представим, что мы хотим построить дом, уже нарисован чертеж и определены все-все-все материалы, которые нам потребуются для его сборки, включая краску, кисти. электрику, пластиковые трубы… На большом производственном предприятии такой список элементов проектировщики передают в отдел закупок, в нем легко может несколько тысяч изделий, и задача закупщиков приобрести материалы именно с указанными характеристиками. А так как у нас на рынке свободная конкуренция, далеко не все компании могут позволить себе указать в этом списке краску конкретного бренда или марки, а ограничиваются только ее цветом, матовостью, материалом поверхности и иногда какими-то особыми условиями, например, устойчивостью к низким температурам. И вот тут начинается боль закупщиков потому что в поисках товаров на сайтах или делая запросы коммерческих предложений, они бывают вынуждены сидеть и вручную сравнивать требуемые характеристики ВСЕХ указанных материалов со ВСЕМИ имеющимися предложениями. Это долгая, монотонная и совершенно не интересная работа, а в некоторых источниках еще может и не быть всей информации, чтобы сказать с полной уверенностью, что это именно то, что требуется. Эту задачу мы успешно решаем комплексным подходом - векторный поиск с дополнительным учетом артикулов и числовых характеристик, автоматизированный мониторинг цен на сайтах, так мы накапливаем большие базы товаров, сейчас нами ежедневно парсятся более 100 сайтов рынка стройматериалов и автозапчастей. И самая изюминка - интеллектуальный ассистент закупщика, в виде чат-бота, который способен освободить закупщика не только от ручного сравнения товаров и цен, но и полностью взять на себя переписку с постащиками.

👍6🔥2❤1

290 viewsedited 17:43

Генеративный Мир

Еще с 2 кейсами практического применения генеративного ИИ сейчас участвуем в конкурсе докладов на конференцию "Инфостарт".

Первый кейс в продолжение истории с закупками позволяет делать матчинг товаров в 1С МДМ. МДМ - (master data mangement) - место где хранятся эталонные данные, и кажется, что основная задача системы уже заключается в том, чтобы их сравнивать с новыми данными и сообщать, есть уже такой товар в системе или нет. Но на самом деле МДМ системы пока еще тоже в начале своего интеллектуального развития и не найдут совпадения между краской для ванной комнаты и краской для влажных помещений. А еще нам приходится решать задачу обогащения данных, когда поставщик присылает прайс-лист с неполной информацией, а регламент МДМ предполагает заполнение обязательных полей, без которых этот товар в систему просто не завести. Тут приходим на помощь мы, находя аналог товара во внешних источниках и проверяя их на содержание там нужной информации. И если 2-3 источника сообщают нам одинаковое значение поля, это повод порекомендовать его значение пользователю.

Второй кейс - это чат-бот, умеющий доставать из 1С все необходимые данные. Работает на технологиях, аналогичных text-to-sql с той разницей, что 1С это не sql и для него потребовалась отдельная нейронка. Завтра выложу по нему более подробный пост. А пока прошу поддержать доклады своими голосами (секция - интеграция и обмен данными)🙏

event.infostart.ru

INFOSTART EVENT 2024

🔥6

280 views15:01

Генеративный Мир

Обещала более подробно рассказать про 1С бота. 1С во многом похожа на BI системы, когда речь идет об отчетах, и в то же время - это отдельный мир, со своим стеком технологий, поэтому данные не агрегируют во внешних хранилищах, а используют их непосредственно в 1С. Цель была в том, чтобы научить его отвечать на вопросы вида:
- какие товары мы продали в этом месяце?
- у кого из клиентов самая большая задолженность по дебиторке?
- на сколько выросла прибыль с прошлого месяца?
Традиционный способ решения: 1С программист реализует в коде формирование отчета. Отчет доступен непосредственно в 1С, если требуется его куда-то передать, пишется интеграция. Для каждого отчета требуется программист. Про запросы на естественном языке можно забыть.
Наш способ решения: Исключаем из процесса 1С программиста, самостоятельно формируя правильные запросы, если данные забираем в сыром виде, то можем их агрегировать на стороне бота. На ИИ ложится задача использовать 1С как внешнюю базу знаний. Для ее решения оставалось правильно построить такой RAG.
Мы выяснили, что в 1С есть сведения о схеме баз данных, так же как и в sql, которые можно запросить и скормить боту в качестве знаний. На стороне 1С программисты сделали для нас универсальный API, который даст доступ ко всем разрешенным таблицам и полям, если правильно составить json, содержащий те самые таблицы, поля, фильтры, сортировки... API универсален и не требует дальнейшего привлечения 1С программистов. На стороне ИИ - самая ответственная часть - понять, как правильно сформировать json под конкретный запрос. Такая история уже работает в text-to-sql, поэтому было решено, не изобретая велосипедов, аналогичным образом обучить нейронку под формирование json. А дальше - собираем все в единого бота, упаковываем в интерфейс телеграмма или куда захочет заказчик, и вот он - профит! Готовим демо бота к конференции Инфостарт. Очень надеюсь туда попасть, в этом мне сильно помогли бы ваши голоса за доклад и про МДМ. Голосование идет еще 2 дня

👍8

258 viewsedited 09:38

Генеративный Мир

Тот редкий случай, когда не грустишь, а радуешься, увидев, как кто-то вместо тебя реализовал твою идею.

RagBuilder - инструментарий, который перебирая гиперпараметры, подбирает наилучшую конфигурацию RAG под конкретный набор файлов. Перебирает сплиттеры и их настройки, ретриверы, модели эмбеддингов, llm и т.п. Имеет пользовательский интерфейс, чтобы делать это no-code. Выпущен с открытым кодом и лицензией Apache 2.0.

Начинала делать такую же штуку полгода назад на уровне пет-проекта. Проект, как это часто бывает, был подзаброшен в суете рабочих будней, но с такой базой скорее всего получит вторую жизнь.
Код

👍6🔥5

454 views06:14

Генеративный Мир

Не успели мы привыкнуть к большим контекстам по 128к и более, как подъехала модель на целых 100 млн токенов! И даже ее разработчики назвали TM-2-mini, готовя нам что-то еще более грандиозное. Спойлер - это не трансформер поэтому такое длинное контекстное окно стоит в 1000 раз дешевле такого же объема контекста для Llama 3.1 405B. Контраст в требованиях к памяти еще больше — запуск Llama 3.1 405B с контекстом токенов 100M требует 638 H100 на пользователя только для хранения одного кэша KV размером 100M токенов. А LTM требует лишь небольшую часть HBM одного H100 на пользователя для того же контекста.

Модель работает на специальной технологии для длинного контекста HashHop. Хэши являются случайными и, следовательно, несжимаемыми, что требует от модели возможности хранить и извлекать максимально возможный объем информации для заданного размера контекста в любое время.

В открытый доступ модель к сожалению пока не выложили.

Источник

🔥5👍3

345 viewsedited 15:31

Генеративный Мир

Safe Superintelligence - новый стартап Ильи Суцкевера, бывшего ключевого сотрудника OpenIA, основавшего свою компанию всего 3 месяца назад, привлек инвестиции в размере 1 миллиард долларов.

Среди инвесторов: Andreessen Horowitz, Sequoia Capital
Средства будут использованы для приобретения вычислительной мощности и хантинга лучших талантов
Сама SSI на текущий момент оценивается в 5 миллиардов долларов

Из этой новости напрашиваются 2 вывода:
1. Личность основателя стартапа порой ценится больше. чем сам продукт.
2. Сама траектория взлета Суцкевера заслуживает особого внимания, он не стартапил по гаражам, не пилил по ночам пет-проекты, а вместо этого будучи наемным сотрудником максимально качественно выполнял свою работу, чем и завоевал столь высокий авторитет

🔥4👍2

347 views15:45

Генеративный Мир

Сегодня по миру разлетается новость, что производитель AI чипов SambaNova выпустил инференс LLM моделей со скоростью отдачи 1000 токенов в секунду. Проверила, действительно работает очень быстро, есть готовые тестовые запросы, но я сделала свой на русском…

спустя 3 месяца после выхода тестового инференса SambaNova,наконец-то появился API для пользователей

Он бесплатный, но с ограничениями. Попробовать можно тут
#AI #LLM #LLAMA #SAMBANOVA

🔥3👍1

281 viewsedited 11:38

Генеративный Мир

https://telegra.ph/Neskolko-idej-na-vooruzhenie-najdennyh-v-biografii-legendarnogo-konstruktora-Sergeya-Korolyova-09-13

Telegraph

Несколько идей на вооружение, найденных в биографии легендарного конструктора Сергея Королёва

Сегодня мой пост про интеллект естественный. Прочитала книгу про жизнь отца космонавтики Сергея Королёва, о котором последнее время редко вспоминают, и была сильно впечатлена. Это человек, который впервые оборудовал самолет реактивным двигателем и, увеличив…

👍4🔥3

278 views08:39

Генеративный Мир

а вот и обещанная статья
https://vc.ru/u/3943652-kseniya-plesovskih/1498437-kak-ii-pomozhet-uskorit-process-zakupok-i-uprostit-rabotu-zakupshikov-na-etape-vybora-luchshei-ceny

vc.ru

Как ИИ поможет ускорить процесс закупок и упростить работу закупщиков на этапе выбора лучшей цены — Ксения Плесовских на vc.ru

Ксения Плесовских 22.09.2024

🔥3

246 views08:16

Генеративный Мир

Наиболее полезные посты на этом канале

Применение ИИ в бизнесе
Генеративный ИИ в МДМ
Бот для 1С
Рекомендательная система для интернет-магазина

Полезные ИИ библиотеки, фреймворки, модели

RagBuilder
Фреймворк для параллельного вызова LLM
Метрики качества генеративного ИИ
Прогнозирование намерений пользователя
Языки программирования на LLM

Публикации
Что не так с Вашим кодом, сгенерированным LLM
Отчет о патентном ландшафте в генеративном ИИ 2024
Аналитический отчет Стенфордского университета про ИИ за 24 год

#AI #LLM

Генеративный ИИ

❤2

529 views08:27

Генеративный Мир

По интернету разлетается новость, о том, что у Nike новый CEO - Эллиот Хилл. но, что в ней действительно важно - этот человек отдал компании 36 лет своей жизни и прошел путь с самого низа, от стажера, год за годом постепенно поднимаясь все выше и выше.

Такую преданность своему делу считаю проявлением настоящей силы духа, ведь наверняка за эти годы у него не раз возникали ситуации, которые гораздо проще было решать сменой работы.

Таким же человеком был и мой отец. Он тоже больше 50 лет, проработал на одном месте, не стал большим боссом да никогда к этому и не стремился, просто хорошо делал свою работу и в ней был большим профессионалом.

❤5🔥1

338 views18:51

Генеративный Мир

Forwarded from IT Insider

В Ижевске установили памятник айтишникам, который уже стал местной достопримечательностью

Скульптура изображает программиста, за рабочим столом с ноутбуком, где рядом находится кот, сбрасывающий мышку и остывший кофе. Памятник быстро стал популярным, превращаясь в мем

👍4

328 views07:07

Генеративный Мир

⚡️⚡️⚡️ вышла llama 3.2!

В версиях 1B, 3B, 11B или 90B. Маленькие модели - текстовые, большие - от 11B - мультимодальные с возможностью обработки изображений. По бенчмарку видно, что 3B чуть проигрывает 3.1 8b, а 11 пытается догнать o-mini
модели

🔥3🐳1

453 views19:13

Генеративный Мир

Мучает вопрос, как проверить качество RAG?

Google разработал набор данных FRAMES (F actuality , R etrieval, And reasoning ME asurement Set ) , включающий 824 сложных вопроса, требующих использования нескольких источников информации, в данном случае речь про разные страницы Википедии.

Аннотаторы добавили дополнительный контекст для устранения неоднозначности ответов, которые могут меняться со временем. Например, вопрос типа «Какая страна была обладателем Кубка мира ФИФА в последний раз, когда Лигу чемпионов УЕФА выиграл клуб из Лондона?» был изменен на «По состоянию на 1 августа 2024 года, какая страна была обладателем Кубка мира ФИФА в последний раз, когда Лигу чемпионов УЕФА выиграл клуб из Лондона?»

датасет
источник
#AI #LLM #RAG

🔥4

544 viewsedited 14:29

About

Blog

Apps

Platform