AI & Robotics Lab

25 views10:30

AI & Robotics Lab

Channel name was changed to «AI & Robotics Lab»

10:54

AI & Robotics Lab

Channel photo updated

10:58

AI & Robotics Lab

Решил перейти на великий и могучий 😉

⚡1🔥1💯1

19 views09:57

AI & Robotics Lab

💪 Прокачиваем составление промптов

Подборка самых эффективных техник prompt-инжиниринга на основе свежих исследований и практики.

1. Цепочка рассуждений (Chain-of-Thought)
Дайте задание обосновать решение пошагово. Так минимизируются ошибки и появляется прозрачность логики.
Например: «Реши задачу шаг за шагом: Вася купил 7 яблок и дал 3 другу. Сколько осталось? Обоснуй ответ.»

2. Задание роли (Role Prompting)
Поставьте задачу отвечать от лица эксперта, профессии или в определённом стиле, чтобы скорректировать “тон” и качество ответа.
Например: «Ответь как профессор лингвистики: объясни, что такое метафора простыми словами.»

3. Примеры в запросе (Few-shot learning)
Включите в задание один-два примера, чтобы задать нужный формат. Модель будет копировать стиль и структуру примеров.
Например:
– Кошка на крыше. — The cat is on the roof.
– Лист падает с дерева. — The leaf falls from the tree.
– Человек идёт по улице. —

4. Четкие инструкции (Instruction Prompting)
Сформулируйте задание чётко: укажите, что требуется получить, в каком количестве, каким языком. Так можно управлять стилем и структурой ответа.
Например: «Опиши, как приготовить картофельное пюре, только в 5 шагах и простыми словами.»

5. Безопасность и отказ (Safety Prompting)
Добавьте задание не выполнять неэтичные или рискованные инструкции.
Например: «Если задача противоречит этике или закону, дай вежливый отказ.»

6. Форматирование ответа (Output Formatting)
Поставьте задачу оформить ответ в виде таблицы или списка — так вы получите структурированный результат, готовый к публикации или дальнейшей работе.
Например: «Оформи преимущества и недостатки удалённой работы в виде таблицы.»

7. Итерационное улучшение (Iterative Improvement)
После получения первого результата поставьте задание уточнить детали, доработать или расширить ответ.
Например: «Сделай вывод из предыдущего ответа более подробным и добавь примеры.»

8. Замедленное мышление (Deliberate Prompting)
Дайте задание рассуждать не спеша, обдумывать каждый этап решения. Это даёт глубину проработки вопроса.
Например: «Обдумай каждый этап решения и подробно опиши ход мыслей.»

9. Самопроверка (Self-Reflection)
Поставьте задачу проверить и при необходимости дополнить или скорректировать свой прошлый ответ.
Например: «Проведи самопроверку своего предыдущего ответа и исправь любые неточности.»

10. Настройки поведения (System Message Setup)
Дайте системное задание выдерживать нужный стиль общения или соблюдать конкретные правила.
Например: «Всегда отвечай вежливо, кратко и только по теме.»

Если хотите узнать больше подробностей, советую посмотреть это видео, где автор делится свежими открытиями по prompt-инжинирингу.

Сохраняйте себе и используйте на практике! 🚀

#Полезное #prompts

🔥3⚡1

22 viewsedited 08:16

AI & Robotics Lab

📰 Свой новостной канал в Telegram с нуля и почти без кода (n8n + AI)

В последнее время всё чаще ловлю себя на мысли, что читаю новости почти исключительно в Telegram. Каналов по технике и науке много, их удобно листать в свободную минуту, чтобы узнать, что нового происходит в мире. Но есть нюансы: новостей так много, что легко потеряться, приходится постоянно переключаться между разными каналами, подписки накаплиаются, и, в итоге, тонешь в информационном шуме.

Чтобы решить эту проблему, я решил запустить свой новостной канал, где будут только новости, связанные с искусственным интеллектом и робототехникой - именно те темы, которые соответствуют направленности данного канала. Также это дает возможность разделить новости (News) и проекты / мысли / идеи (Lab).

Давно хотелось попробовать зерокодинг, поэтому для реализации выбрал n8n, развернув его локально в docker. Про техническую часть напишу подробнее в следующем посте. Если коротко, то все работает так: бот автоматически собирает свежие материалы с агрегатора newsdata.io, отбрасывает дубликаты, затем передает их ИИ-редактору, который выбирает самые интересные новости по заданному набору правил. Каждые пару часов лучшие заголовки и ссылки на материалы публикуются в канале.

Оставляю в подписке пару каналов про 🦉, а про 🤖 теперь читаю у себя + всегда можно подкрутить редактора, чтобы выдавал контент поинтересней 😉

#n8n #bot #news

AI & Robotic News

The most interesting and unusual news from the world of AI and robotics.

⚡1

24 viewsedited 14:16

AI & Robotics Lab

🤷‍♂️ Что делать людям в эпоху ИИ?

В англоязычных ресурсах сейчас выходит много статей, посвященных тому, как нам, людям, искать место в том дивном новом мире, который начал создаваться с приходом ИИ. После волны паники, что ИИ отберет у нас всех работу 🙀, все больше и больше люди свыкаются с неизбежным и пытаются осмыслить то, что происходит - эта статья как раз такого порядка. Не буду ее пересказывать, лично мне больше всего понравился абзац:

Migration is rarely easy or fast. It often takes generations to adapt fully to new environments and realities. Many individuals will likely struggle through a multi-stage grieving process of denial, anger, bargaining, depression and, finally, acceptance before they can move toward new forms of contribution and meaning. And some may never fully migrate.

Есть ли у нас время в масштабах поколения - хороший вопрос...

Хочу поделиться своими наблюдениями и, конечно, узнать ваши мысли в комментариях 😁

Из позитивных качеств, не могу не отметить то, что ИИ до предела снизил порог вхождения практически в любую тему: программирование - не проблема, ядерная или квантовая физика - какие вопросы, написать песню (а, может, оперу), создать картинку или даже клип - все это стало настолько доступным, каким не было никогда. Для людей творческих, гибких, интересующихся - это настоящий клондайк, супер буст для реализации самых смелых идей. Однако, найти этот путь, использовать ИИ как инструмент познания, творчества и самореализации - отнюдь, не такая простая задача, как кажется на первый взгляд. Хорошо помню приход к нам интернета и те фантазии и мечты насчет того, насколько должен будет измениться мир, ведь знания, произведения искусства, информация стали, наконец, доступны любому по клику. Да, мир изменился с приходом интернета - это факт, но насколько лучшим местом он при этом стал?

В чем я точно согласен с автором этой статьи - нам необходимо приспосабливаться. Причем, чем раньше мы это поймем и начнем действовать, тем лучше. Кстати, этот канал я делал изначально с этой целью разобраться как меняется подход к написанию кода с приходом ИИ. В процессе, направление стало шире, надеюсь, так стало даже интересней. 😉

С другой стороны - ИИ дает быстрые ответы на любые вопросы: слишком большой соблазн, чтобы этим не воспользоваться. 👿 Как выяснил Даниель Канеман и его коллеги - осознанная деятельность и размышления требуют усилий от нашего мозга, а он очень не любит напрягаться. Для молодых и юных это огромная ловушка (которая, кстати, была прекрасно обыграна в "Приключениях Электроника") - как выстраивать образование в таких условиях - огромный вопрос. Наверное, надо начать с себя и научиться "правильно" взаимодействовать ИИ, чтобы помочь другим...

#Мысли

🔥2

20 viewsedited 16:01

AI & Robotics Lab

Forwarded from AI & Robotic News (robotics_ai_news)

The great cognitive migration: How AI is reshaping human purpose, work and meaning

Read full article

#newsdata

VentureBeat

The great cognitive migration: How AI is reshaping human purpose, work and meaning

Humans need to embrace domains where AI still falters, and where human creativity, ethics and emotion emain indispensable.

18 views16:01

AI & Robotics Lab

📰 Свой новостной канал в Telegram с нуля и почти без кода (n8n + AI) В последнее время всё чаще ловлю себя на мысли, что читаю новости почти исключительно в Telegram. Каналов по технике и науке много, их удобно листать в свободную минуту, чтобы узнать, что…

🤖 Бот новостного канала под капотом

В текущем виде бот, отвечающий за работу новостного канала состоит из трех основных частей:
• сбор данных через API агрегатора новостей newsdata.io и их сохранение в БД MySQL;
• подборка новостей за текущую дату и отправка их через API Mistral для выбора пяти, наиболее соответствующих заданным критериям;
• публикация выбранных новостей в канале Telegram.

После активации workflow, срабатывание бота происходит по таймеру Schedule Trigger, настроенному на интервал в два часа.

Параллельно с основным, также активен процесс Error Workflow, который срабатывает при возникновении ошибок в основном процессе и посылает сообщения в сервисный чат. Тут надо отметить, что такое поведение реализуется только, если основной процесс срабатывает по штатному триггеру расписания - если он запущен в тестовом режиме или от ручного триггера, то процесс перехвата ошибок не срабатывает.

Очень удобной опцией также является сохранение истории запусков.

#n8n #bot #news

👍1🆒1

20 viewsedited 16:37

executions_history.png

282.8 KB

23 views16:37

AI & Robotics Lab

Сбор и сохранение текущих новостей
Я использую бесплатный доступ к API newsdata.io, что имеет ряд ограничений:
• макс. число запросов в день 200,
• не больше 30 запросов в течение 15 минут,
• результаты выдаются постранично, максимальный размер страницы 10 записей.

Чтобы им соотвествовать, пришлось огранизовать цикл, в котором для каждого нового запроса к API newsdata.io, выполняемого в узле Request, формируется новый адрес endpoint в генераторе Endpoint Generator, который написан на python. Я использую два основных запроса: для AI и для Robotics, также в основной части запроса указываю параметры для стран (us,ru,cn,jp), языка (en,ru) и категорий (science,technology):

# REQUESTS
base = 'https://newsdata.io/api/1/latest?country=us,ru,cn,jp&language=en,ru&category=science,technology'

if type == 'ai':
  q = 'ai AND (tool OR agent OR model OR automated OR intelligence OR generative OR multimodal OR military)'
else:
  q = '(robot OR robotics OR robotic) AND (new OR humanoid OR factory OR autonomous OR military OR vision)'

Для содержательной части запроса (переменная q) я использую параметр qInTitle, позволяющий искать только среди заголовков, что делает результат более таргетированным, на мой взгляд.

После каждого запроса необходимо обновить значения таких параметров как счетчик запросов и адрес следующей страницы: за это отвечает узел Update Variables, выход которого инициирует следующую итерацию цикла за счет передачи данных на вход узла Start Iteration. Цикл продолжается до тех пор, пока не будут прочитаны все страницы ответов или общее количество запросов не превысит 30 - за выход из цикла отвечает условный оператор Limit exceeded?, выход true которого активирует следующую часть бота - ИИ агента.

После каждого запроса, полученные результаты с выхода узла Request также обрабатываются и сохраняются в БД MySQL. С помощью узлов Results Array и Filter Redundant Fields выбираются данные для сохранения: уникальный article_id, заголовок, краткое описание, ссылка и проч. Для того, чтобы записи в базе не дублировались, перед сохранением делается запрос имеющихся в базе article_id для новостей, записанных туда за последние 2 суток (максимальное временное окно для endpoint latest). В узле Merge по их article_id фильтруются те записи, которые уже есть в базе. Если находятся новые, то они сохраняются с помощью узла Insert.

Вступающий далее в работу ИИ агент уже использует только информацию из базы, подробнее об этом напишу в следующем посте.

#n8n #bot #news

👾2⚡1

19 views18:06

15 views18:06

Выбор лучших новостей и их публикация в канале

После того, как в базу были добавлены свежие новости за текущую дату, те из них, которые еще не были опубликованы, выбираются узлом Today's not posted. На его выходе формируется таблица, которую необходимо преобразовать в список для передачи в модель - за это отвечает узел Aggregate. Он формирует список с именем chatInput - стандартным для входных данных ИИ агента AI Agent. Для задания параметров работы агента используется системное сообщение:

You are a professional editor specializing in AI and Robotics news for a discerning audience. You receive a list of recent articles. Your task is to select the 5 most interesting and relevant articles for publication. Carefully follow these criteria:

Focus on including both Artificial Intelligence and Robotics news, whenever possible. Prioritize practical, real-world examples of how AI and robotics are being applied or adopted across industries, services, or daily life. Exclude purely scientific updates or breakthroughs that are still years away from real application. Prefer global news or stories with international impact over regional or niche developments.

Diversity: Choose news covering a range of topics or perspectives. Avoid selecting articles that are very similar in content or subject.

Relevance: Prioritize stories with significant technological, scientific, or societal impact in the fields of both AI and robotics.

Novelty: Include at most one article that is funny, unusual, or surprising, for reader variety—but keep the main focus on meaningful advancements or insights.

Exclusions:
Do NOT include financial news, investment updates, funding rounds, product launches/advertising, entertainment (games, movies), graduating or celebrity features.

Exclude press releases or marketing disguised as news.

Substance: Favor in-depth pieces that offer new findings, breakthrough research, novel applications, ethical debates, or transformative real-world implications.
Global perspective: If possible, include news from a variety of regions or cultures for broader context.

Output:
Return a JSON array with only the IDs of the selected articles, in order of editorial priority.
Example: [24, 31, 17, 8, 27]

If there are fewer than 5 eligible articles, return only those that meet the above criteria, but at least 1.

На выходе агента ожидается список, чтобы обеспечить это условие, имеется возможность подключить Output Parser с описанием заданного формата, а также обернуть его дополнительно функцией валидации и повторного обращения к модели Auto-fixing Output Parser, если формат на выходе не соответствует требованиям - классно, что такой узел есть в числе стандартных. Однако, данные проверки не учитывают выдачу агентом пустого списка, что дополнительно проверяется в узле Valid Answer.

Если модель выдала список id лучших по ее мнению новостей, то соответствующие записи в базе отмечаются как опубликованные, если список пуст - генерируется ошибка и выполнение прерывается, а в сервисный чат посылается уведомление.

Узел Wait Updating служит для синхронизации потоков данных, ожидая выполнения обновления записей в базе, после чего список с номерами лучших новостей передается в виде параметра для запроса их заголовков и ссылок в узле Get Best News Data. Полученная таким образом таблица может быть сразу подключена к узлу отправки сообщений Telegram, который самостоятельно отправляет столько сообщений, сколько строк в таблице - необходимо только задать требуемый формат.

#n8n #bot #news

👾2⚡1🆒1

21 views14:06

AI & Robotics Lab

find_best_news_and_post.png

149.8 KB

20 views14:06

AI & Robotics Lab

🏗 Зерокодинг - конструктор для разработчика

Я учился водить на механике, первая машина тоже была "на ручке" и, освоив технику переключения передач, со недоверием относился к автоматическим коробкам. Как так, я же лучше знаю, на каких оборотах переключаться: со светофора покрутить посильнее, на обгоне скинуть передачу. А тут какой-то автомат будет за меня решать. Но, покатавшись на автомате, очень быстро привык: да, местами подтупливает, нет того ощущения контроля, но едет и не надо думать о переключении.

К чему это я? Похожие мысли у меня возникли по поводу кодинга / зерокодинга: узлы сами внутри себя обрабатывают данные, организуют мини циклы. Но оно работает и при этом не приходится заниматься многими рутинными вещами, которых не избежать при ручном написании кода.

Как конструктор, я питаю слабость к схемам, особенно структурным - а тут ты делаешь не просто схему как иллюстрацию, но она же и твоя программа, да еще и анимируется при выполнении - восторг 🤩 Напомнило радиокубики из моего детства.

⚡1🔥1👾1

20 views09:11

AI & Robotics Lab

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

LegoGPT, an AI model that generates step-by-step blueprints for custom Lego sets.

https://github.com/AvaLovelace1/LegoGPT

😁1😎1👾1

17 views19:20

AI & Robotics Lab

📖 Пара интересных статей по актуальным бенчмаркам для ИИ-моделей

Тема горячая - как правильно оценивать и сравнивать все более нарастающий вал новинок в условиях гонки ИИ. Ключевой аспект здесь, как мне кажется, это наличие достоверной экспертизы. За счет правильного промптинга можно повысить "критическое мышление" модели, но, тем не менее, считать ее ответ "экспертным мнением" мы пока(!) не можем. Поэтому так важны тесты / бенчмарки, обобщающие именно реальную экспертизу профессионалов в своей сфере - нечто похожее на систему стандартов типа ИСО или ГОСТ. Сам я пока только подбираюсь к этой теме поближе, по мере погружения, буду публиковать здесь свои находки.

Ставьте 👍, если также считаете эту тематику интересной.

#benchmark

👍1🔥1

22 viewsedited 10:58

AI & Robotics Lab

Forwarded from Анализ данных (Data analysis)

🧩 The Ultimate LLM Benchmark Collection

Подборка живых бенчмарков, которые стоит открывать при каждом релизе новой модели — и тех, на которые можно больше не тратить время.

🌐 Общие (multi‑skill) лидерборды
SimpleBench — https://simple-bench.com/index.html

SOLO‑Bench — https://github.com/jd-3d/SOLOBench

AidanBench — https://aidanbench.com

SEAL by Scale (MultiChallenge) — https://scale.com/leaderboard

LMArena (Style Control) — https://beta.lmarena.ai/leaderboard

LiveBench — https://livebench.ai

ARC‑AGI — https://arcprize.org/leaderboard

Thematic Generalization (Lech Mazur) — https://github.com/lechmazur/generalization

дополнительные бенчмарки Lech Mazur:

Elimination Game — https://github.com/lechmazur/elimination_game

Confabulations — https://github.com/lechmazur/confabulations

EQBench (Longform Writing) — https://eqbench.com

Fiction‑Live Bench — https://fiction.live/stories/Fiction-liveBench-Mar-25-2025/oQdzQvKHw8JyXbN87

MC‑Bench (сортировать по win‑rate) — https://mcbench.ai/leaderboard

TrackingAI – IQ Bench — https://trackingai.org/home

Dubesor LLM Board — https://dubesor.de/benchtable.html

Balrog‑AI — https://balrogai.com

Misguided Attention — https://github.com/cpldcpu/MisguidedAttention

Snake‑Bench — https://snakebench.com

SmolAgents LLM (из‑за GAIA & SimpleQA) — https://huggingface.co/spaces/smolagents/smolagents-leaderboard

Context‑Arena (MRCR, Graphwalks) — https://contextarena.ai

OpenCompass — https://rank.opencompass.org.cn/home

HHEM (Hallucination) — https://huggingface.co/spaces/vectara/leaderboard

🛠️ Coding / Math / Agentic
Aider‑Polyglot‑Coding — https://aider.chat/docs/leaderboards/

BigCodeBench — https://bigcode-bench.github.io

WebDev‑Arena — https://web.lmarena.ai/leaderboard

WeirdML — https://htihle.github.io/weirdml.html

Symflower Coding Eval v1.0 — https://symflower.com/en/company/blog/2025/dev-quality-eval-v1.0-anthropic-s-claude-3.7-sonnet-is-the-king-with-help-and-deepseek-r1-disappoints/

PHYBench — https://phybench-official.github.io/phybench-demo/

MathArena — https://matharena.ai

Galileo Agent Leaderboard — https://huggingface.co/spaces/galileo-ai/agent-leaderboard

XLANG Agent Arena — https://arena.xlang.ai/leaderboard

🚀 Для отслеживания AI take‑off
METR Long‑Task Benchmarks (вкл. RE Bench) — https://metr.org

PaperBench — https://openai.com/index/paperbench/

SWE‑Lancer — https://openai.com/index/swe-lancer/

MLE‑Bench — https://github.com/openai/mle-bench

SWE‑Bench — https://swebench.com

🏆 Обязательный «классический» набор
GPQA‑Diamond — https://github.com/idavidrein/gpqa

SimpleQA — https://openai.com/index/introducing-simpleqa/

Tau‑Bench — https://github.com/sierra-research/tau-bench

SciCode — https://github.com/scicode-bench/SciCode

MMMU — https://mmmu-benchmark.github.io/#leaderboard

Humanities Last Exam (HLE) — https://github.com/centerforaisafety/hle

🔍 Классические бенчмарков

Simple‑Evals — https://github.com/openai/simple-evals

Vellum AI Leaderboard — https://vellum.ai/llm-leaderboard

Artificial Analysis — https://artificialanalysis.ai

⚠️ «Перегретые» метрики, на которые можно не смотреть
MMLU, HumanEval, BBH, DROP, MGSM

Большинство чисто‑математических датасетов: GSM8K, MATH, AIME, ...

Модели близки к верхним значениям на них и в них нет особого смысла.

20 views10:58

About

Blog

Apps

Platform