ФАС выявила ограничения в доступе операторов связи в жилые комплексы застройщика ПИК #habr
https://habr.com/ru/news/910634/
Tags: фас, пик
https://habr.com/ru/news/910634/
Tags: фас, пик
Хабр
ФАС выявила ограничения в доступе операторов связи в жилые комплексы застройщика ПИК
19 мая 2025 года Федеральная антимонопольная служба РФ (ФАС) сообщила, что специалисты надзорного ведомства выявили ограничения в доступе операторов связи в жилые комплексы застройщика ПИК....
Forwarded from Ivan Begtin (Ivan Begtin)
Model Context Protocol (MCP) был разработан компанией Anthropic для интеграции существующих сервисов и данных в LLM Claude. Это весьма простой и неплохо стандартизированный протокол с вариантами референсной реализации на Python, Java, Typescript, Swift, Kotlin, C# и с большим числом реализаций на других языках.
Тысячи серверов MCP уже доступны и вот основные ресурсы где можно их искать:
- Model Context Protocol servers - большой каталог на Github
- Awesome MCP Servers - ещё один большой каталог с переводом на несколько языков
- Pipedream MCP - интеграция с 12.5 тысяч API и инструментов через сервис Pipedream
- Zapier MCP - интеграция с 8 тысячами приложений через сервис Zapier
- Smithery - каталог MCP серверов, 6200+ записей по множеству категорий
- MCP.so - каталог в 13100+ MCP серверов
Похоже мода на MCP пришла надолго и пора добавлять его к своим продуктам повсеместно.
#ai #opensource #aitools
Тысячи серверов MCP уже доступны и вот основные ресурсы где можно их искать:
- Model Context Protocol servers - большой каталог на Github
- Awesome MCP Servers - ещё один большой каталог с переводом на несколько языков
- Pipedream MCP - интеграция с 12.5 тысяч API и инструментов через сервис Pipedream
- Zapier MCP - интеграция с 8 тысячами приложений через сервис Zapier
- Smithery - каталог MCP серверов, 6200+ записей по множеству категорий
- MCP.so - каталог в 13100+ MCP серверов
Похоже мода на MCP пришла надолго и пора добавлять его к своим продуктам повсеместно.
#ai #opensource #aitools
Model Context Protocol
What is the Model Context Protocol (MCP)? - Model Context Protocol
Forwarded from Ivan Begtin (Ivan Begtin)
Полезные свежие научные статьи про работу с данными:
- Large Language Models for Data Discovery and Integration: Challenges and Opportunities - обзор подходов по обнаружению и интеграции данных с помощью LLM
- Unveiling Challenges for LLMs in Enterprise Data Engineering - оценка областей применения LLM в корпоративной дата инженерии
- Magneto: Combining Small and Large Language Models for Schema Matching - про одно из решений сопоставления схем через использование LLM и SLM
- Interactive Data Harmonization with LLM Agents - интерактивная гармонизация данных с помощью LLM агентов
- Towards Efficient Data Wrangling with LLMs using Code Generation - про автоматизацию обработки данных с помощью кодогенерирующих LLM
#readings #data
- Large Language Models for Data Discovery and Integration: Challenges and Opportunities - обзор подходов по обнаружению и интеграции данных с помощью LLM
- Unveiling Challenges for LLMs in Enterprise Data Engineering - оценка областей применения LLM в корпоративной дата инженерии
- Magneto: Combining Small and Large Language Models for Schema Matching - про одно из решений сопоставления схем через использование LLM и SLM
- Interactive Data Harmonization with LLM Agents - интерактивная гармонизация данных с помощью LLM агентов
- Towards Efficient Data Wrangling with LLMs using Code Generation - про автоматизацию обработки данных с помощью кодогенерирующих LLM
#readings #data
Forwarded from Ivan Begtin (Ivan Begtin)
Как читать отчёты Счетной палаты в РФ ? Не надо читать финальные выводы и довольно бесполезно читать вступление. Всё самое главное посередине там где изложение фактов. Какие-то факты могут отсутствовать, может не быть иногда глубины, но те что приведены, как правило, достаточно точны.
История с ГАС Правосудие и потерей огромного объёма данных судебных решений именно тот случай [1]. Спасибо ребятам из Если быть точным за подробное изложение и анализ этой истории [2]. Единственно с чем я несогласен, а это не надо сотням людей использовать один парсер. Нужна была бы открытая база судебных решений которая когда-то была в Росправосудии. Парсер - это плохой путь, приводящий к массовому применении каптчи. Но создать ресурс с данными тоже непросто, его могут быстро заблокировать.
Однако в этой истории про ГАС Правосудие я хочу сделать акцент на 60+ миллиардах потраченных на эту систему денег, и даже не на то что их взломали, и это всячески скрывали. А на том у что у системы не было резервных копий.
И скажу я вам не тая, подозреваю что это не единственная российская государственная информационная система резервных копий к которых нет. И не появится если за это не будет последствий, а их похоже что нет.
И, конечно, данные по судебным делам - это самое что ни на есть общественное достояние, общественно значимые данные которые безусловно и безальтернативно должны были бы быть открытыми. Вместо того чтобы отреагировать на парсеры данных выкладкой датасетов для массовой выгрузки, сотрудники Суддепа много лет развлекались встраиванием каптчи на страницах сайта. А то есть на "вредительство" у них время и ресурсы были, а на создание архивных копий нет?
Ссылки:
[1] https://t.me/expertgd/12660
[2] https://t.me/tochno_st/518
#opendata #closeddata #theyfailed #russia
История с ГАС Правосудие и потерей огромного объёма данных судебных решений именно тот случай [1]. Спасибо ребятам из Если быть точным за подробное изложение и анализ этой истории [2]. Единственно с чем я несогласен, а это не надо сотням людей использовать один парсер. Нужна была бы открытая база судебных решений которая когда-то была в Росправосудии. Парсер - это плохой путь, приводящий к массовому применении каптчи. Но создать ресурс с данными тоже непросто, его могут быстро заблокировать.
Однако в этой истории про ГАС Правосудие я хочу сделать акцент на 60+ миллиардах потраченных на эту систему денег, и даже не на то что их взломали, и это всячески скрывали. А на том у что у системы не было резервных копий.
И скажу я вам не тая, подозреваю что это не единственная российская государственная информационная система резервных копий к которых нет. И не появится если за это не будет последствий, а их похоже что нет.
И, конечно, данные по судебным делам - это самое что ни на есть общественное достояние, общественно значимые данные которые безусловно и безальтернативно должны были бы быть открытыми. Вместо того чтобы отреагировать на парсеры данных выкладкой датасетов для массовой выгрузки, сотрудники Суддепа много лет развлекались встраиванием каптчи на страницах сайта. А то есть на "вредительство" у них время и ресурсы были, а на создание архивных копий нет?
Ссылки:
[1] https://t.me/expertgd/12660
[2] https://t.me/tochno_st/518
#opendata #closeddata #theyfailed #russia
Telegram
Павел Склянчук
Forwarded from Ivan Begtin (Ivan Begtin)
Я давно не писал про наш поисковик по данным Dateno, а там накопилось множество обновлений, надеюсь что вот-вот уже скоро смогу об этом написать. А пока приведу ещё пример в копилку задач как ИИ заменяет человека. Я много рассказывал про реестр дата каталогов который Dateno Registry dateno.io/registry, полезный для всех кто ищет не только данные, но и их источник. Этот реестр - это основа Dateno, в нём более 10 тысяч дата каталогов размеченных по разным характеристикам и с большими пробелами в описаниях. Откуда пробелы? потому что автоматизировать поиск источников удалось, а вот описание требует (требовало) много ручной работы.
Когда мы запускали Dateno на текущем реестре я оценивал трудоёмкость по его улучшению и повышении качества в полгода работы для пары человек вручную. Совсем немало скажу я вам, учитывая что этих людей ещё и надо обучить и
ещё надо контролировать качество работы и ещё и нужны инструменты чтобы всё это редактировать без ошибок.
В общем, чтобы долго не ходить, ИИ почти полностью справляется с этой задачей. Достаточно предоставить url сайта с каталогом данных и из него хорошо извлекаются все необходимые метаданные.
Для стартапа на данных - это очень заметное изменение. И это маленькая и теперь недорогая задача. После всех проверок можно будет значительно обновить реестр.
Кстати, о том зачем он нужен. Реестр каталогов данных точно нужен Dateno для индексации датасетов, но он же нужен и всем тем кто строит национальные порталы данных потому что позволяет агрегировать в него данные из всех национальных источников.
#opendata #dateno #datasets #dataengineering #llm #ai #dataunderstanding
Когда мы запускали Dateno на текущем реестре я оценивал трудоёмкость по его улучшению и повышении качества в полгода работы для пары человек вручную. Совсем немало скажу я вам, учитывая что этих людей ещё и надо обучить и
ещё надо контролировать качество работы и ещё и нужны инструменты чтобы всё это редактировать без ошибок.
В общем, чтобы долго не ходить, ИИ почти полностью справляется с этой задачей. Достаточно предоставить url сайта с каталогом данных и из него хорошо извлекаются все необходимые метаданные.
Для стартапа на данных - это очень заметное изменение. И это маленькая и теперь недорогая задача. После всех проверок можно будет значительно обновить реестр.
Кстати, о том зачем он нужен. Реестр каталогов данных точно нужен Dateno для индексации датасетов, но он же нужен и всем тем кто строит национальные порталы данных потому что позволяет агрегировать в него данные из всех национальных источников.
#opendata #dateno #datasets #dataengineering #llm #ai #dataunderstanding
Dateno
Dateno - datasets search engine
A next-generation data search service provides fast, comprehensive access to open datasets worldwide, with powerful filters and an API-first architecture for seamless integration.
Forwarded from Ivan Begtin (Ivan Begtin)
Про MCP ещё полезное чтение
A Critical Look at MCP [1] автор задаётся вопросом о том как же так получилось что протокол MCP (Model Context Protocol) используемый для интеграции сервисов, инструментов и данных с LLM спроектирован так посредственно и описан довольно плохо. О том же пишет другой автор в заметке MCP: Untrusted Servers and Confused Clients, Plus a Sneaky Exploit [2].
Думаю что дальше будет больше критики, но популярности MCP это пока никак не отменяет
Ссылки:
[1] https://raz.sh/blog/2025-05-02_a_critical_look_at_mcp
[2] https://embracethered.com/blog/posts/2025/model-context-protocol-security-risks-and-exploits/
#ai #llm #readings
A Critical Look at MCP [1] автор задаётся вопросом о том как же так получилось что протокол MCP (Model Context Protocol) используемый для интеграции сервисов, инструментов и данных с LLM спроектирован так посредственно и описан довольно плохо. О том же пишет другой автор в заметке MCP: Untrusted Servers and Confused Clients, Plus a Sneaky Exploit [2].
Думаю что дальше будет больше критики, но популярности MCP это пока никак не отменяет
Ссылки:
[1] https://raz.sh/blog/2025-05-02_a_critical_look_at_mcp
[2] https://embracethered.com/blog/posts/2025/model-context-protocol-security-risks-and-exploits/
#ai #llm #readings
raz.sh
Raz Blog
Forwarded from Ivan Begtin (Ivan Begtin)
Для тех кто любит не только читать, но и слушать книжки. Audiblez [1] генератор аудиокниг по текстам, с открытым кодом, командной строкой и UI интерфейсом. Поддерживает английский, испанский, французский, хинди, итальянский, японский, португальский и китайский. Русский не поддерживает и даже армянского языка нет - это минус, в основном из-за того что внутри используется Kokoro-82M [2] модель где только эти языки. Можно выбрать книгу в epub формате и голос и создать аудиокнигу.
Сама генерация аудиокниги весьма ресурсоёмкая, но реалистичная.
Лицензия MIT.
Ссылки:
[1] https://github.com/santinic/audiblez
[2] https://huggingface.co/hexgrad/Kokoro-82M
#opensource #ai #books #readings
Сама генерация аудиокниги весьма ресурсоёмкая, но реалистичная.
Лицензия MIT.
Ссылки:
[1] https://github.com/santinic/audiblez
[2] https://huggingface.co/hexgrad/Kokoro-82M
#opensource #ai #books #readings
GitHub
GitHub - santinic/audiblez: Generate audiobooks from e-books
Generate audiobooks from e-books. Contribute to santinic/audiblez development by creating an account on GitHub.
Forwarded from TrendWatching
This media is not supported in your browser
VIEW IN TELEGRAM
Учимся в топовых зарубежных университетах БЕСПЛАТНО!
На сайте Mind Luster собрано 300 000 курсов от лучших учреждений мира по любым навыкам: программированию, дизайну, маркетингу, бизнесу, английскому языку и другим.
После прохождения вам также выдадут бесплатный сертификат, который можно будет добавить в резюме.
На сайте Mind Luster собрано 300 000 курсов от лучших учреждений мира по любым навыкам: программированию, дизайну, маркетингу, бизнесу, английскому языку и другим.
После прохождения вам также выдадут бесплатный сертификат, который можно будет добавить в резюме.
Forwarded from TrendWatching
This media is not supported in your browser
VIEW IN TELEGRAM
Удаляем скрытые МАЙНЕРЫ на своём компе — если вы часто качаете запрещёнку, ваш комп под угрозой.
Кто-то может тайно майнить крипту с вашего ноута — из-за этого он греется, тупит и выходит из строя.
Сохраняем и проверяем всю свою технику😄
Кто-то может тайно майнить крипту с вашего ноута — из-за этого он греется, тупит и выходит из строя.
• Жмём Win + R.
• В строке вводим resmon.
• Откроется окно, в котором кликаем на «Состояние» — отобразятся приостановленные процессы.
• Гуглим название каждой программы и вычисляем паразита.
Сохраняем и проверяем всю свою технику
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from TrendWatching
По неофициальной статистике, 8 из 10 задач теряются в переписке после фразы «потом гляну»
Яндекс Трекер оказался неожиданно крутым для командной работы. Там можно создавать и назначать задачи, следить за их выполнением и даже интегрироваться с другими сервисами.
Особенно зашло то, что можно легко мигрировать с других систем и настраивать доски под конкретные проекты. Сисадмины и тимлиды, которые постоянно пытаются навести порядок в рабочем хаосе, точно оценят🖥
Яндекс Трекер оказался неожиданно крутым для командной работы. Там можно создавать и назначать задачи, следить за их выполнением и даже интегрироваться с другими сервисами.
Особенно зашло то, что можно легко мигрировать с других систем и настраивать доски под конкретные проекты. Сисадмины и тимлиды, которые постоянно пытаются навести порядок в рабочем хаосе, точно оценят
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Хабр
«Сети Судного дня»: как разработка противоядерной ПВО привела к рождению Интернета
О том, как с технической и организационной стороны создавался ARPAnet, «дедушка» нашего Интернета, написано немало — в том числе и на Хабре. Однако причины и предыстория того, как в научно-исследовательском центре Пентагона DARPA/ARPA дошли до этой идеи и её реализации, обычно упоминаются почти скороговоркой: «нужна была распределённая сеть, которая при поражении части узлов атомными ударами продолжала бы работать». За этой фразой, однако, скрывается большая история, полная поисков, страхов, экспериментов и непростых решений.
Попробуем разобраться, как попытки решить сугубо военные проблемы ранней ядерной эпохи привели к появлению компьютерных сетей, без которых современный мир почти невообразим
О том, как с технической и организационной стороны создавался ARPAnet, «дедушка» нашего Интернета, написано немало — в том числе и на Хабре. Однако причины и предыстория того, как в научно-исследовательском центре Пентагона DARPA/ARPA дошли до этой идеи и её реализации, обычно упоминаются почти скороговоркой: «нужна была распределённая сеть, которая при поражении части узлов атомными ударами продолжала бы работать». За этой фразой, однако, скрывается большая история, полная поисков, страхов, экспериментов и непростых решений.
Попробуем разобраться, как попытки решить сугубо военные проблемы ранней ядерной эпохи привели к появлению компьютерных сетей, без которых современный мир почти невообразим
Forwarded from Ivan Begtin (Ivan Begtin)
Печальная новость, Microsoft выключает API к их поиску Bing [1] с 11 августа 2025 года, через менее чем 3 месяца. Учитывая что у Google нет API к их поисковому индексу, наличие поиска у второго по размерам поисковика мира (Bing'у) было важным подспорьем для многих.
В статье упоминается альтернатива в виде Brave Search API [2], но она не единственная. Есть ещё и API у you.com [3], Tavily [4], Exa [5] и LinkUp [6]. Почти все предлагают себя как "лучший поиск для ИИ".
У меня их обилие и развитие вызывает ассоциацию с теневыми кухнями. Новые AI поисковики могут использовать один из этих поисковиков не афишируя это, формируя промпты к поисковому движку (движкам).
В любом случае, больше разнообразного поиска и API - это к лучшему. Больше инструментов - меньше монополии.
Ссылки:
[1] https://www.neowin.net/news/microsoft-pulls-plug-on-bing-search-apis/
[2] https://brave.com/search/api/#api-features
[3] https://api.you.com/
[4] https://tavily.com/#api
[5] https://exa.ai/
[6] https://www.linkup.so/
#search #api #tools
В статье упоминается альтернатива в виде Brave Search API [2], но она не единственная. Есть ещё и API у you.com [3], Tavily [4], Exa [5] и LinkUp [6]. Почти все предлагают себя как "лучший поиск для ИИ".
У меня их обилие и развитие вызывает ассоциацию с теневыми кухнями. Новые AI поисковики могут использовать один из этих поисковиков не афишируя это, формируя промпты к поисковому движку (движкам).
В любом случае, больше разнообразного поиска и API - это к лучшему. Больше инструментов - меньше монополии.
Ссылки:
[1] https://www.neowin.net/news/microsoft-pulls-plug-on-bing-search-apis/
[2] https://brave.com/search/api/#api-features
[3] https://api.you.com/
[4] https://tavily.com/#api
[5] https://exa.ai/
[6] https://www.linkup.so/
#search #api #tools
Neowin
Microsoft pulls plug on Bing Search APIs
Microsoft has announced the retirement of its popular Bing Search APIs, effective August 11, 2025, surprising many developers who relied on them.
Развитие искусственного интеллекта: что такое AGI, когда он появится, и что потом? #habr
https://habr.com/ru/articles/911420/
Tags: искуственный интеллект, AI, AGI, ASI, ChatGPT, нейросети, LLM, Сэм Альтман, DeepMind, openai
Author: runaway_llm
https://habr.com/ru/articles/911420/
Tags: искуственный интеллект, AI, AGI, ASI, ChatGPT, нейросети, LLM, Сэм Альтман, DeepMind, openai
Author: runaway_llm
Хабр
Развитие искусственного интеллекта: что такое AGI, когда он появится, и что потом?
Изображение: ChatGPT 4o Тема искусственного интеллекта за последние полгода буквально заполнила информационное пространство. О ней говорят не только на Хабре или в профессиональных сообществах — в...
Google запускает «режим ИИ» в поиске: амбициозный ответ ChatGPT и другим конкурентам #habr
https://habr.com/ru/companies/finam_broker/news/911436/
Tags: google, поиск, gemini, chatgpt, поисковые системы, поисковые алгоритмы
https://habr.com/ru/companies/finam_broker/news/911436/
Tags: google, поиск, gemini, chatgpt, поисковые системы, поисковые алгоритмы
Хабр
Google запускает «режим ИИ» в поиске: амбициозный ответ ChatGPT и другим конкурентам
Google анонсировал новую функцию в поиске - “режим ИИ”, который позволит общаться с искусственным интеллектом прямо на странице выдачи. Это самый амбициозный на текущий момент шаг компании, которая...
Кого не заменит ИИ — смотрим суть #habr
https://habr.com/ru/articles/911268/
Tags: искусственный интеллект, работа
Author: codecity
https://habr.com/ru/articles/911268/
Tags: искусственный интеллект, работа
Author: codecity
Хабр
Кого не заменит ИИ — смотрим суть
Предлагаю подумать кто останется нужным/востребованным, даже если LLM многократно усилятся, смогут анализировать информацию и решать задачи лучше большинства людей, но не изменятся качественно и не...
Оценка киберугроз по стандартам ФСТЭК: комплексный подход к защите данных #habr
https://habr.com/ru/articles/911474/
Tags: фстэк, кибербезопасность
Author: SecNinja
https://habr.com/ru/articles/911474/
Tags: фстэк, кибербезопасность
Author: SecNinja
Хабр
Оценка киберугроз по стандартам ФСТЭК: комплексный подход к защите данных
ФСТЭК России разработала методику оценки угроз информационной безопасности, которая позволяет организациям выявлять, анализировать и минимизировать киберриски. Что такое актуальность угроз и почему...
[Перевод] Комбинация нового и старого препарата снизила уровень холестерина на 49% у людей #habr
https://habr.com/ru/articles/911476/
Tags: медицина, холестерин, ЛПНП, снижение колестерина, новые препараты, новые лекарства, липопротеины, сердце, сосуды, ССС
Author: MisterClever
https://habr.com/ru/articles/911476/
Tags: медицина, холестерин, ЛПНП, снижение колестерина, новые препараты, новые лекарства, липопротеины, сердце, сосуды, ССС
Author: MisterClever
Хабр
Комбинация нового и старого препарата снизила уровень холестерина на 49% у людей
Новости науки и медицины преимущественно воспринимаются через «открыли новый препарат, который…». Однако, с ростом научных баз, данных, способов анализа информации и лабораторных возможностей, уже...
Почему нельзя слепо доверять даже официальным источникам: история от юриста по интеллектуальной собственности #habr
https://habr.com/ru/articles/911494/
Tags: патенты, патент, авторское право, изобретения, изобретательство, изобретательская деятельность, патентование изобретений, патентование идеи, патентование программ, патентование
Author: IPLapa
https://habr.com/ru/articles/911494/
Tags: патенты, патент, авторское право, изобретения, изобретательство, изобретательская деятельность, патентование изобретений, патентование идеи, патентование программ, патентование
Author: IPLapa
Хабр
Почему нельзя слепо доверять даже официальным источникам: история от юриста по интеллектуальной собственности
Меня зовут Анна Лапа (Лапа - это моя реальная фамилия), я биотехнолог и юрист по образованию, патентный специалист по призванию. Занимаюсь патентами в сфере фармацевтики, медицины уже более 12 лет....
«Сбербанк» автоматизирует процедуры банкротства с помощью AI-агентов #habr
https://habr.com/ru/news/911512/
Tags: сбербанк, ai-агенты, искусственный интеллект, банкротство граждан, банкротство
https://habr.com/ru/news/911512/
Tags: сбербанк, ai-агенты, искусственный интеллект, банкротство граждан, банкротство
Хабр
«Сбербанк» автоматизирует процедуры банкротства с помощью AI-агентов
«Сбербанк» внедрит AI‑агентов в процессы банкротства граждан. Об этом сообщил вице‑президент и директор Департамента по работе с проблемными активами «Сбербанка» Кирилл Дёмин...
Google внедряет речевой перевод в Meet #habr
https://habr.com/ru/news/911534/
Tags: google, google meet, видеоконференцсвязь, видеозвонки, перевод, gemini
https://habr.com/ru/news/911534/
Tags: google, google meet, видеоконференцсвязь, видеозвонки, перевод, gemini
Хабр
Google внедряет речевой перевод в Meet
Google объявила о внедрении функции перевода речи в сервис для видеосвязи Google Meet. Функцию на базе Gemini представили на конференции Google I/O. Американская компания утверждает, что...
ТОП-5 AI-генераторов для транскрибации аудио в текст (часть 2) #habr
https://habr.com/ru/companies/bothub/articles/910530/
Tags: нейросети, транскрибация, расшифровка аудио, whisper, speech-to-text
Author: cognitronn (BotHub)
https://habr.com/ru/companies/bothub/articles/910530/
Tags: нейросети, транскрибация, расшифровка аудио, whisper, speech-to-text
Author: cognitronn (BotHub)
Хабр
ТОП-5 нейросетей для транскрибации аудио в текст (часть 2)
Сгенерировано нейросетью GPT Image В первой части мы проверили три сервиса: AssemblyAI , Riverside и Teamlogs . Все они обещали точную и быструю транскрибацию, но на деле… Первый оказался хорош на...