Приставка в качестве портативного ПК #habr
https://habr.com/ru/articles/1052656/
Tags: retroid, retroid pocket flip 2, карманный компьютер, linux
Author: HOMPAIN
https://habr.com/ru/articles/1052656/
Tags: retroid, retroid pocket flip 2, карманный компьютер, linux
Author: HOMPAIN
Хабр
Приставка в качестве портативного ПК
Retroid Flip 2 - игровая приставка на базе arm64, которая поддерживает работу в Android и различных Linux-системах. В данной статье я хочу проверить, возможно ли применить такую приставку в качестве...
Великая иллюзия Agile: как индустрия променяла инженерную науку на средневековый эмпиризм #habr
https://habr.com/ru/articles/1052658/
Tags: стандарты, разработка
Author: jura-49
https://habr.com/ru/articles/1052658/
Tags: стандарты, разработка
Author: jura-49
Хабр
Великая иллюзия Agile: как индустрия променяла инженерную науку на средневековый эмпиризм
В последние десятилетия ИТ-индустрия живет в парадигме «победившего Agile». Любое сомнение в его эффективности клеймится как приверженность «устаревшему водопаду». Однако при более глубоком анализе...
Что такое Человек? #habr
https://habr.com/ru/articles/1052660/
Tags: человек, философия, эволюция
Author: annkpx
https://habr.com/ru/articles/1052660/
Tags: человек, философия, эволюция
Author: annkpx
Хабр
Что такое Человек?
Я всю жизнь занимаюсь программированием и привыкла смотреть на любую систему инженерно: искать паттерны, раскладывать сложное на части, строить модели. Через это же мышление я анализировала вопросы,...
Лучшие нейросети для генерации текста: Сравнение ТОП-13 ИИ, гайд по написанию без VPN #habr
https://habr.com/ru/companies/studyai/articles/1052664/
Tags: нейросеть для текстов, нейросеть для текстов блогера, нейросеть для текста, ии для текста, генерация текста, генерация текстов, генерация текста онлайн, chatgpt, gemini, claude
Author: FlyAI (StudyAI)
https://habr.com/ru/companies/studyai/articles/1052664/
Tags: нейросеть для текстов, нейросеть для текстов блогера, нейросеть для текста, ии для текста, генерация текста, генерация текстов, генерация текста онлайн, chatgpt, gemini, claude
Author: FlyAI (StudyAI)
Хабр
Лучшие нейросети для генерации текста: Сравнение ТОП-13 ИИ, гайд по написанию без VPN
Обзор 13 лучших ИИ для написания текстов в 2026 году: от ChatGPT 5.5 до DeepSeek V4. Сравнение, лимиты и жесткие советы по промптам для копирайтинга. Лучшие нейросети для генерации текста Синдром...
Метаболический ИИ показал логику хищника в решении практических задач #habr
https://habr.com/ru/articles/1052666/
Tags: ai, agents, claude, metabolicai
Author: linabesson
https://habr.com/ru/articles/1052666/
Tags: ai, agents, claude, metabolicai
Author: linabesson
Хабр
Метаболический ИИ показал логику хищника в решении практических задач
Вы замечали, что несмотря на прогресс, LLM остаются годами невыносимо услужливыми? Вы даете трансформеру сложную техническую задачу, он блестяще расписывает код на 200 строк, но стоит вам написать:...
Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front #habr
https://habr.com/ru/articles/1052678/
Tags: LLM, инференс, бенчмаркинг, vLLM, llama.cpp, метрики, воспроизводимость, энергоэффективность, производительность, gpu
Author: Happynood
https://habr.com/ru/articles/1052678/
Tags: LLM, инференс, бенчмаркинг, vLLM, llama.cpp, метрики, воспроизводимость, энергоэффективность, производительность, gpu
Author: Happynood
Хабр
Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front
LLM inference benchmark С чего все началось У меня была вполне приземленная задача: понять, на каком бэкенде гонять одну и ту же открытую модель — на vLLM, llama.cpp, ONNX Runtime или просто на...
Docker как место для сборки #habr
https://habr.com/ru/articles/1052692/
Tags: docker, rust, сборка проекта, рабочее место
Author: JBFW
https://habr.com/ru/articles/1052692/
Tags: docker, rust, сборка проекта, рабочее место
Author: JBFW
Хабр
Docker как место для сборки
Попался вот тут интересный проект https://habr.com/ru/articles/1052536 - дай, думаю, потестирую, как оно работает? А потестировать сходу нельзя, в релизах имеются разные сборки под разные платформы,...
С чем я сталкивался при найме на работу #habr
https://habr.com/ru/articles/1052708/
Tags: hr, программирование
Author: igumnov
https://habr.com/ru/articles/1052708/
Tags: hr, программирование
Author: igumnov
Хабр
С чем я сталкивался при найме на работу
Кейс первый, на собеседовании феерит и крутая. Вышла на работу и сидит как серая мышь, будто её нет. А потом в какой-то день тупо не выходит на работу. Звоню, а вы где? На что мне объясняют, мол, я...
Моё мнение о Лаборатории нейронаук и поведения человека Сбера #habr
https://habr.com/ru/articles/1052728/
Tags: сбер, ии
Author: Kamil_GR
https://habr.com/ru/articles/1052728/
Tags: сбер, ии
Author: Kamil_GR
Хабр
Моё мнение о Лаборатории нейронаук и поведения человека, подразделении Сбера
Впервые я столкнулся с Лабораторией нейронаук и поведения человека буквально на этой неделе, прочитав статью на Хабре «ИИ может менять мнение человека. Мы проверили это на моральных дилеммах»....
Как превратить ChatGPT.com в Codex (но без лимитов) #habr
https://habr.com/ru/articles/1052710/
Tags: chatgpt, javascript, chrome, agents, telegram
Author: Careviolan
https://habr.com/ru/articles/1052710/
Tags: chatgpt, javascript, chrome, agents, telegram
Author: Careviolan
Хабр
Как превратить ChatGPT.com в Codex (но без лимитов)
Codex это прекрасно, но лимиты все меньше, а цена все выше. Но ведь под капотом просто gpt-5.5 ? Один диалог пишет код, другой проверяет результат, третий ищет в интернете, а я в это время мог...
Claude Code за 5 минут вскрыл CAN-шину автомобиля — то, на что у инженера уходят часы #habr
https://habr.com/ru/news/1052740/
Tags: claude code, Anthropic claude
https://habr.com/ru/news/1052740/
Tags: claude code, Anthropic claude
Хабр
Claude Code за 5 минут вскрыл CAN-шину автомобиля — то, на что у инженера уходят часы
Датская компания CSS Electronics, известный производитель оборудования для работы с автомобильными шинами, показала необычный эксперимент: ее инженер Мартин Фальк собрал скилл для Claude...
Forwarded from 🏆 AIeron | Data Feeling (Aleron Milenkin)
Делюсь опытом, как резать косты на токены.
Я помню, как впервые столкнулся с API GPT - это был восторг, но вскоре пришла и головная боль. Мой первый MVP, бот для разговорного английского Speakadora в Telegram, работал как часы.
Число юзеров начало расти, счёт за токены рос тоже, будто я скупаю Биткоин в 2017-м. В стартапе каждая копейка на счету!
Я быстро понял: без жесткой дисциплины промптов я пойду ко дну. Пришлось буквально «зачистить» лишние слова в промптах, убирая "пожалуйста" и синтаксический мусор.
Я перестал думать о красоте и начал думать о плотности информации на токен. Это был первый, самый болезненный, но самый эффективный шаг.
Потом я заметил, что самые дорогие запросы - это те, где модель должна помнить весь контекст диалога с пользователем. Так я пришёл ко второму ключевому трюку стартаперов: грамотное управление окном контекста.
Я начал использовать резюмирование (summarization), чтобы сжать длинную старую часть диалога до нескольких ключевых тезисов. Модель помнит суть, а я экономлю токены. Это стало критически ощутимо, когда пользователи наговорили уже 1 600 часов!
Следующий прорыв случился, когда я осознал: не для всего нужен GPT-4. Зачем платить гпт’хе за задачу, которую ее младший нейро брат сделает не хуже? Третий подход - это каскадная архитектура (cascading).
Для быстрых, простых проверок грамматики в Speakadora я использовал GPT-3.5-Turbo. А вот для сложных ролевых игр или детальных объяснений - только GPT-4. По сути просто выбирал нужный "инструмент" под конкретную "гайку".
Финальный шаг был, пожалуй, самым хитрым. Я начал сравнивать сервисы-прослойки, которые продают доступ к тем же моделям. Такие стартапы закупают токены оптом или получают спец. условия как партнеры, и цена для конечного разработчика может быть ниже. В один момент я заметил, что одна и та же модель в разных сервисах имеет совсем разные цены (!!!).
Например, во vsellm.ru токены могут стоить до 90% от цены на openrouter.ai! Это стало четвертым, неочевидным источником экономии. Особенно на фоне того, что в первом можно еще и РФ картой платить. Ребята из таких сервисов будто специально продалбываются. Но нам все равно. Для нас это способ хакнуть юнит-экономику.
Суммарно эти подходы позволили мне кратно сократить расходы. Только посмотрите: за 30 дней мы сжигаем 12М+ токенов, и это при том, что у нас зарегистрировано 25к человек! Мы научились быть эффективными. Благодаря этой экономии мы смогли выйти на стабильный доход: общее число платных подписок 643.
Мой подход превратился из бездумного "дай мне ответ" в стратегическое "дай мне ответ с минимальными затратами токенов". Это позволило почти всем моим продуктам остаться на плаву дольше, не разорившись на хайпе AI.
И, честно говоря, это чувство победы над расходами не менее приятно, чем то, что мы помогаем людям: каждые 30 дней присоединяется по 500 новых "говорунов" чисто на органике.
И, если совсем честно, Разработку Спикадоры мы заморозили и перешли на другой продукт, где мы больше разбираемся в маркетинге. Как пойдут первые оплаты, я обязательно расскажу.
Я помню, как впервые столкнулся с API GPT - это был восторг, но вскоре пришла и головная боль. Мой первый MVP, бот для разговорного английского Speakadora в Telegram, работал как часы.
Число юзеров начало расти, счёт за токены рос тоже, будто я скупаю Биткоин в 2017-м. В стартапе каждая копейка на счету!
Я быстро понял: без жесткой дисциплины промптов я пойду ко дну. Пришлось буквально «зачистить» лишние слова в промптах, убирая "пожалуйста" и синтаксический мусор.
Я перестал думать о красоте и начал думать о плотности информации на токен. Это был первый, самый болезненный, но самый эффективный шаг.
Потом я заметил, что самые дорогие запросы - это те, где модель должна помнить весь контекст диалога с пользователем. Так я пришёл ко второму ключевому трюку стартаперов: грамотное управление окном контекста.
Я начал использовать резюмирование (summarization), чтобы сжать длинную старую часть диалога до нескольких ключевых тезисов. Модель помнит суть, а я экономлю токены. Это стало критически ощутимо, когда пользователи наговорили уже 1 600 часов!
Следующий прорыв случился, когда я осознал: не для всего нужен GPT-4. Зачем платить гпт’хе за задачу, которую ее младший нейро брат сделает не хуже? Третий подход - это каскадная архитектура (cascading).
Для быстрых, простых проверок грамматики в Speakadora я использовал GPT-3.5-Turbo. А вот для сложных ролевых игр или детальных объяснений - только GPT-4. По сути просто выбирал нужный "инструмент" под конкретную "гайку".
Финальный шаг был, пожалуй, самым хитрым. Я начал сравнивать сервисы-прослойки, которые продают доступ к тем же моделям. Такие стартапы закупают токены оптом или получают спец. условия как партнеры, и цена для конечного разработчика может быть ниже. В один момент я заметил, что одна и та же модель в разных сервисах имеет совсем разные цены (!!!).
Например, во vsellm.ru токены могут стоить до 90% от цены на openrouter.ai! Это стало четвертым, неочевидным источником экономии. Особенно на фоне того, что в первом можно еще и РФ картой платить. Ребята из таких сервисов будто специально продалбываются. Но нам все равно. Для нас это способ хакнуть юнит-экономику.
Суммарно эти подходы позволили мне кратно сократить расходы. Только посмотрите: за 30 дней мы сжигаем 12М+ токенов, и это при том, что у нас зарегистрировано 25к человек! Мы научились быть эффективными. Благодаря этой экономии мы смогли выйти на стабильный доход: общее число платных подписок 643.
Мой подход превратился из бездумного "дай мне ответ" в стратегическое "дай мне ответ с минимальными затратами токенов". Это позволило почти всем моим продуктам остаться на плаву дольше, не разорившись на хайпе AI.
И, честно говоря, это чувство победы над расходами не менее приятно, чем то, что мы помогаем людям: каждые 30 дней присоединяется по 500 новых "говорунов" чисто на органике.
И, если совсем честно, Разработку Спикадоры мы заморозили и перешли на другой продукт, где мы больше разбираемся в маркетинге. Как пойдут первые оплаты, я обязательно расскажу.
Forwarded from 🏆 AIeron | Data Feeling (Aleron M)
🕵️♀️ кто сжигает бабки у твоего стартапа больше всего?
Наткнулся на статью от a16z и Mercury: ребята проанализировали, куда 200k стартапов слили бабос на AI за лето.
Я немного скептически воспринял эти данные (все эти 200к стартапов - клиенты Mercury), но и в моём айти-бизнесе похожее ощущение: токены для OpenAI лохматят мою карту, плюс подписки на Lovable и Cursor..., но AI действительно меняет команду в сторону вайб кодеров.
Итак, вот выжимка:
✅ Тулзы для всей команды берут 60% бабок - это универсальные штуки, которые юзает вся команда, vs нишевые для конкретных ролей (40%).
Топ: #1 OpenAI, #2 Anthropic, #3 Replit (vibe coding рвёт - ~15x revenue Lovable, несмотря на их трафик; Replit для enterprise-аппов с агентами и облаком).
✅ Митинги: 6 сервисов в топе - Fyxer, Happyscribe, Plaud, Otter AI, Read AI, Cluely.
✅ Креатив: Больше денег уходит на креативные инструменты: Freepik, ElevenLabs, Canva, Photoroom, Midjourney, Descript, Opus Clip, Capcut, Arcad, Tavus.
✅Vibe coding: на третьем месте после OpenAI и Anthropic стоит Replit, ниже Cursor, Lovable и Emergent.
✅ Тулзы для конкретных ролей (40%): Усилители или замена
Perplexity (минус рутина), AI-employees (автоматизация). Последние: Cognition, Crosby Legal, 11x, Serval.
Категории: Customer service (Lorikeet, Ada), Sales (Instantly), HR (Micro1), Ops (Delve compliance).
✅ Тренд: Consumer → Enterprise 70% топа - инди-тулзы, тащат в команды (типа Midjourney и Cluely всё ещё consumer-heavy).
OpenAI: с 75% consumer до 50/50. AI ускоряет upmarket - product-led growth в год-два.
🔘 В общем, стартапы тратят на тулзы для всей команды: креатив, кодинг, митинги. Бабки улетают, но продуктивность дай бог +30%.
А у вас кто крадёт бюджет? Все ли расходы только во благо? Как насчет профита?
Дайте оценку в комментах от 1 до 10 по шкале результативности!🧑💻
Наткнулся на статью от a16z и Mercury: ребята проанализировали, куда 200k стартапов слили бабос на AI за лето.
Я немного скептически воспринял эти данные (все эти 200к стартапов - клиенты Mercury), но и в моём айти-бизнесе похожее ощущение: токены для OpenAI лохматят мою карту, плюс подписки на Lovable и Cursor..., но AI действительно меняет команду в сторону вайб кодеров.
Итак, вот выжимка:
Топ: #1 OpenAI, #2 Anthropic, #3 Replit (vibe coding рвёт - ~15x revenue Lovable, несмотря на их трафик; Replit для enterprise-аппов с агентами и облаком).
✅Vibe coding: на третьем месте после OpenAI и Anthropic стоит Replit, ниже Cursor, Lovable и Emergent.
Perplexity (минус рутина), AI-employees (автоматизация). Последние: Cognition, Crosby Legal, 11x, Serval.
Категории: Customer service (Lorikeet, Ada), Sales (Instantly), HR (Micro1), Ops (Delve compliance).
OpenAI: с 75% consumer до 50/50. AI ускоряет upmarket - product-led growth в год-два.
А у вас кто крадёт бюджет? Все ли расходы только во благо? Как насчет профита?
Дайте оценку в комментах от 1 до 10 по шкале результативности!
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🏆 AIeron | Data Feeling (Aleron Milenkin)
Не добавил сюда еще один тоже классный способ, про кэширование токенов в промпте. Я его по умолчанию всегда настраиваю, но вдруг кто-то не пользуется до сих пор и теряет.
Спасибо комментаторам.
Спасибо комментаторам.
Forwarded from Ivan Begtin (Ivan Begtin)
Полезные ссылки про данные, технологии и не только:
- coreutils Microsoft выпустили набор unix подобных инструментов для Windows. Хочется сказать не поздно ли? Ибо альтернативы были, тут главное достоинство в том что это родные утилиты от производителя, но со своими ограничениями. Полезно для всех кто использует W10/W11 и любит командную строку
- Pluto система тетрадок на базе языка Julia. Примеры на сайте не открываются, сложно посмотреть пока в действии, но само по себе интересно, хотя и врядли серьезно потеснит Python
- ingestr новая версия утилиты быстрой загрузки данных в огромное число источников из большого числа источников. Пишут что в версии 1 существенное ускорение по сравнению с другими инструментами и версией 0. Надо пробовать.
#opensource #data #tools
- coreutils Microsoft выпустили набор unix подобных инструментов для Windows. Хочется сказать не поздно ли? Ибо альтернативы были, тут главное достоинство в том что это родные утилиты от производителя, но со своими ограничениями. Полезно для всех кто использует W10/W11 и любит командную строку
- Pluto система тетрадок на базе языка Julia. Примеры на сайте не открываются, сложно посмотреть пока в действии, но само по себе интересно, хотя и врядли серьезно потеснит Python
- ingestr новая версия утилиты быстрой загрузки данных в огромное число источников из большого числа источников. Пишут что в версии 1 существенное ускорение по сравнению с другими инструментами и версией 0. Надо пробовать.
#opensource #data #tools
GitHub
GitHub - microsoft/coreutils: Coreutils for Windows: Installer & Packaging
Coreutils for Windows: Installer & Packaging. Contribute to microsoft/coreutils development by creating an account on GitHub.
Forwarded from Ivan Begtin (Ivan Begtin)
Мне много что есть сказать по поводу отзыва компанией GlobalSign сертификатов у российских доменов и недавнего изменения политики Let's Encrypt в части соблюдения санкций США (теперь соблюдают, если вкратце и не будут больше выдавать их санкционным компаниям).
Последствия этого будут для российских пользователей неприятными и пойдут эти действия скорее в копилку доводов тех кто говорит про суверенный интернет в РФ и как бы все не обернулось попытками усиления внедрения отечественных браузеров, сертификатов НУЦ и так далее. В чем, разумеется, ничего хорошего нет и быть не может, российский цифровой рынок не настолько большой чтобы усиливать собственную изоляцию, и множество продуктов поломается из-за невозможности проверки сертификатов так же как и риски взломов усилятся.
Но тема эта не про данные, а не про данные мне говорить скучно😉 так что я, всё таки, предложу посмотреть на эту проблему через данные.
Сертификаты для сайтов и других целей в мире выдаются не кем попало, а так называемыми Certificate Authority и крупнейшие вендоры браузеров, операционных систем и устройств проводят их верификацию/аттестацию и включают в списки признаваемых ими. Вот тут можно посмотреть примеры таких списков. Наиболее значимые - это списки Apple, Microsoft, Google для их операционных систем, но, в принципе, все они важны.
Наиболее крупный список Common CA Database ведет Linux Foundation в партнерстве с Microsoft, Mozilla, Cisco и Google. Он включает 10122 сертификата, выпущенных 186 корневыми CA из примерно 60 стран. Эти страны включают, практически все страны ЕС, многие азиатские и даже некоторые африканские страны.
А каких стран там нет? Из значимых там нет России, Беларуси и всех стран Центральной Азии и многих других.
Почему же так, спросите Вы? Может быть потому что они не могли бы пройти по требованиям для их аттестации? Может быть потому что не было и нет целенаправленной госполитики по их созданию? Или в том что зарубежные вендоры изначально не доверяют компаниям в области безопасности из ряда стран? Есть ли тут политические решения или только экономические?
У меня есть предположения и подозрения на этот счет, а пока для тех кто хочет изучить как устроен рынок CA в мире вот тут можно скачать напрямую этот файл для анализа в CSV формате. Он вполне поддается анализу и визуализации.
#opendata #certificates #russia #datasets #data
Последствия этого будут для российских пользователей неприятными и пойдут эти действия скорее в копилку доводов тех кто говорит про суверенный интернет в РФ и как бы все не обернулось попытками усиления внедрения отечественных браузеров, сертификатов НУЦ и так далее. В чем, разумеется, ничего хорошего нет и быть не может, российский цифровой рынок не настолько большой чтобы усиливать собственную изоляцию, и множество продуктов поломается из-за невозможности проверки сертификатов так же как и риски взломов усилятся.
Но тема эта не про данные, а не про данные мне говорить скучно😉 так что я, всё таки, предложу посмотреть на эту проблему через данные.
Сертификаты для сайтов и других целей в мире выдаются не кем попало, а так называемыми Certificate Authority и крупнейшие вендоры браузеров, операционных систем и устройств проводят их верификацию/аттестацию и включают в списки признаваемых ими. Вот тут можно посмотреть примеры таких списков. Наиболее значимые - это списки Apple, Microsoft, Google для их операционных систем, но, в принципе, все они важны.
Наиболее крупный список Common CA Database ведет Linux Foundation в партнерстве с Microsoft, Mozilla, Cisco и Google. Он включает 10122 сертификата, выпущенных 186 корневыми CA из примерно 60 стран. Эти страны включают, практически все страны ЕС, многие азиатские и даже некоторые африканские страны.
А каких стран там нет? Из значимых там нет России, Беларуси и всех стран Центральной Азии и многих других.
Почему же так, спросите Вы? Может быть потому что они не могли бы пройти по требованиям для их аттестации? Может быть потому что не было и нет целенаправленной госполитики по их созданию? Или в том что зарубежные вендоры изначально не доверяют компаниям в области безопасности из ряда стран? Есть ли тут политические решения или только экономические?
У меня есть предположения и подозрения на этот счет, а пока для тех кто хочет изучить как устроен рынок CA в мире вот тут можно скачать напрямую этот файл для анализа в CSV формате. Он вполне поддается анализу и визуализации.
#opendata #certificates #russia #datasets #data
Forwarded from Ivan Begtin (Ivan Begtin)
Подборка ссылок про данные, технологии и не только:
- Running local models is good now - автор пишет что, внезапно, но разработка ПО с помощью локальных моделей стала реалистичной. Она приводит в пример новую LLM Gemma-4-12b-qat достаточно компактную чтобы работать на ноутбуке с 64GB памяти и достаточно эффективную чтобы решать задачи работы с кодом.
- SpaceX to acquire Cursor for $60B in stock если кратко то компания AnySphere создателей среды разработки Cursor теперь куплена SpaceX. Я бы сказал что если Grok не начнут навязывать через Cursor, то это хорошая новость. Думаю что не будут и думаю что это не последнее приобретение SpaceX
- GenSpark - стартап/сервис-ИИ агента сравнимый с Manus. В моих тестах неожиданно хорошо показал себя на Deep Research задачах. Сервисов таких до сих пор не так уж много и можно разориться уже если тестировать их все.
- Bigset агент с открытым кодом по созданию датасетов из веб-поиска. Вбиваешь что-то вроде "AI infrastructure startups hiring backend engineers" и получаешь CSV файл на выходе. Концептуально напоминает сервис Webhound, там открытого кода нет, только SaaS. Правда и Bigset хоть и с открытым кодом, но зависит от коммерческого сервиса Tinyfish через который он делает веб поиск.
#opensource #ai #tools
- Running local models is good now - автор пишет что, внезапно, но разработка ПО с помощью локальных моделей стала реалистичной. Она приводит в пример новую LLM Gemma-4-12b-qat достаточно компактную чтобы работать на ноутбуке с 64GB памяти и достаточно эффективную чтобы решать задачи работы с кодом.
- SpaceX to acquire Cursor for $60B in stock если кратко то компания AnySphere создателей среды разработки Cursor теперь куплена SpaceX. Я бы сказал что если Grok не начнут навязывать через Cursor, то это хорошая новость. Думаю что не будут и думаю что это не последнее приобретение SpaceX
- GenSpark - стартап/сервис-ИИ агента сравнимый с Manus. В моих тестах неожиданно хорошо показал себя на Deep Research задачах. Сервисов таких до сих пор не так уж много и можно разориться уже если тестировать их все.
- Bigset агент с открытым кодом по созданию датасетов из веб-поиска. Вбиваешь что-то вроде "AI infrastructure startups hiring backend engineers" и получаешь CSV файл на выходе. Концептуально напоминает сервис Webhound, там открытого кода нет, только SaaS. Правда и Bigset хоть и с открытым кодом, но зависит от коммерческого сервиса Tinyfish через который он делает веб поиск.
#opensource #ai #tools
Vickiboykis
Running local models is good now
Local agentic coding has gotten great over the past few months
Forwarded from Ivan Begtin (Ivan Begtin)
Я тут регулярно рассказываю о реестре каталогов данных Dateno который доступен в виде открытого репозитория и на сайте Dateno и время от времени сетую как же так такая хорошая штука и мало кем используется. И вот нашлись живые пользователи. Поисковая система/ИИ агент по базам знаний и каталогам данных Climate Data Catalogue используют наш реестр в своем реестре каталогов данных по климатическим данным. Их там немного, но они синхронизованы с метаданными из реестра Dateno. Что тут скажешь, молодцы 😁 и для таких применений этот реестр и создавался как открытый дата-продукт. С подробными метаданными и всеми точками подключения API которые у каждого каталога данных есть.
Сам их продукт ответов на вопросы тоже интересный, правда для работы просит ключ для Mistral, но обещает что он используется только локально.
В отличии от Dateno они ищут по Wiki, SPARQL эндпоинтам и каталогам данных и заглядывают в метаданные Wikidata при поиске ответов на вопросы.
Бизнес модель их не понимаю, впрочем это академический проект WU Vienna с акцентом на связанные данные, можно сказать что монетизация через получение исследовательских грантов (это не монетизация, конечно).
#opendata #datasets #climate #datacatalogs
Сам их продукт ответов на вопросы тоже интересный, правда для работы просит ключ для Mistral, но обещает что он используется только локально.
В отличии от Dateno они ищут по Wiki, SPARQL эндпоинтам и каталогам данных и заглядывают в метаданные Wikidata при поиске ответов на вопросы.
Бизнес модель их не понимаю, впрочем это академический проект WU Vienna с акцентом на связанные данные, можно сказать что монетизация через получение исследовательских грантов (это не монетизация, конечно).
#opendata #datasets #climate #datacatalogs