Data2Good | Про данные, финансы, технологии и жизнь
923 subscribers
131 photos
7 videos
14 files
222 links
https://t.me/Data2Good_chat чат
LinkedIn.com/in/lasttrader - цифровизация бизнеса
trade2good.com - про финтех
https://github.com/Lasttrader - кодовая база

@GrigoriySokolov - для связи и вопросов
Download Telegram
Как люди реально используют GenAI в 2025 году?

По данным Harvard Business Review, в 2025 году наблюдается резкий сдвиг в том, как люди применяют генеративный ИИ — от технических задач к эмоциональным и личностным целям. Это говорит о трансформации приоритетов пользователей и новом этапе в развитии ИИ-инструментов.

Топ-10 кейсов использования GenAI в 2025:

Терапия и эмоциональная поддержка — теперь GenAI всё чаще выступает в роли "друга", слушателя и поддерживающего собеседника.

Организация жизни — новое направление! Пользователи используют ИИ как персонального ассистента по управлению временем и задачами.

Поиск смысла — ещё один новый кейс: помощь в самоопределении и постановке жизненных целей.

Углублённое обучение — персонализированные знания и помощь в освоении сложных тем.

Генерация кода (для профессионалов) — ИИ активно внедряется в рабочие процессы разработчиков.

Генерация идей — классика, но уже не на первом месте.

Развлечения и юмор — остаются популярными.

Улучшение кода (для профессионалов) — код-ревью от ИИ становится нормой.

Творчество — от написания текстов до создания визуального контента.

Здоровый образ жизни — рекомендации по питанию, сну и упражнениям от ИИ.

Что изменилось по сравнению с 2024?

В 2024 году лидировали технические задачи: генерация идей, поиск, редактирование текста.

В 2025 году — эмоции, поддержка и личностный рост. Люди больше ищут смысла, порядка в жизни и внутреннего баланса.

Темы, которые набирают вес:

Техническая помощь: с 23% до 31% — интерес к кодингу и ИИ-инструментам в работе растёт.

Личная и профессиональная поддержка: стабильные 16-17%.

Творчество и образование остаются востребованными.

Я уже почти уверен, что генеративный ИИ перестал быть просто «умным калькулятором». Он становится полноценным участником нашей личной жизни, помощником в саморазвитии и даже источником психологической поддержки.
👍9
Всем привет!

Мои знакомые из eduson.academy попросили меня сделать краткий обзор на их курсы.

Окэй, давайте попробую

КУРС: Аналитик данных

Плюсы:
- Практика: 62 тренажёра, 40 заданий + финальный проект на реальных данных (например, анализ кредитных историй для банков)
- Гибкость: Пожизненный доступ к материалам, учиться в своём темпе
- Карьера: Тренажёр собеседований, помощь с резюме и портфолио, рассылка партнёрам (Сбер, М.Видео)
Это реально помогает, когда нужен волшебный пинок в поиске работы))
- Документы: Диплом гос. образца + сертификат от Eduson (ну это сейчас в целом уже база)

Минусы:
- Обратная связь: Кураторы отвечают медленно, иногда встречаются ошибки в решениях заданий
- Поверхностность: Некоторые темы (например, A/B-тесты) разобраны слишком кратко
- Цена: Базовая стоимость завышена (хотя со скидкой адекватно)

Мой вывод:
Курс стоит присмотреться, если хотите баланс теории и практики с упором на трудоустройство. Особенно круто — тренажёр собеседований и работа с реальными кейсами. Но будьте готовы добирать знания по сложным темам самостоятельно.

Для кого: Новичкам в IT, маркетологам/финансистам для переквалификации, тем, кто ценит гибкий график

В целом можно еще рассмотреть альтернативы: Бесплатные вводные курсы на Stepik/Coursera — проверить интерес к теме перед покупкой

https://eduson.academy/data-analyst-new-short
👍4🔥1👌1
Google Vertex AI vs Yandex AI Studio — мой опыт и сравнение

Недавно попробовал обе платформы для создания и запуска AI-продуктов — делюсь наблюдениями.

🧩 Что это такое
Google Vertex AI — полноценная ML-платформа от Google Cloud. Поддерживает строительство, обучение, деплой моделей, Data Labeling, RAG, Agent Builder и интеграцию с BigQuery, Dataproc, Spark и другими сервисами

Yandex AI Studio (в составе Yandex Cloud) — универсальная среда от Yandex: ML SDK, AI Playground, API для YandexGPT, YandexART, SpeechKit, Visio‑OCR и т. д. Поддерживает конструирование решений без бород, с акцентом на скорость и инфраструктуру внутри экосистемы Yandex.


Vertex AI
- для data science и ML-инженеров полноценная
- по сути это ML-инфраструктура с мощной интеграция с GCP, AutoML и возможностью кастомной доработка, MLOps

Yandex AI Studio - подойдёт для бизнес‑пользователей
- типовой пользователь это разработчики
- в основе лежит no‑code + полный цикл
- Быстрый вход, AI Playground, API‑доступ к YandexGPT и мультимодальности

Если строить сложные ML‑проекты, выносить в продакшн с контролем и мониторингом то это Vertex AI.

Ну а если нужно быстро протестировать идеи на русском языке, собрать MVP чат‑бота или ассистента — Yandex AI Studio может быть удобнее.

P.S. Фанатею от ИИ агентов, и то, какие чудеса они могут творить при определенных подходах :)
👍11
https://github.com/google-gemini/gemini-cli

Gemini CLI – это командная строка для работы с Gemini API от Google, позволяющая взаимодействовать с мультимодальной моделью Gemini напрямую из терминала.

Основные возможности:
- Генерация текста по промпту.
- Поддержка мультимодальных запросов (текст + изображения).
- Работа с файлами (PDF, TXT и др.).
- Настройка параметров модели (температура, максимальная длина ответа и др.).
- Поддержка стриминга ответов.

gemini -p "Объясни квантовую запутанность простыми словами"

gemini -p "Напиши подробный план для статьи про ИИ" --stream

gemini -p "Что изображено на картинке?" --image photo.jpg

gemini -p "Кратко перескажи содержание" --file document.pdf

gemini -p "Придумай креативные названия для кофейни" \
--temperature 0.9 \
--max-output-tokens 500
🔥10👍4
Новый ИИ бот, пингует пользователей телеги? 🤔
😱4
Коллеги, привет!

Фуф, последние 1,5 года усиленно пилим ИИ ассистентов, для разных бизнес сфер.
Это вылилось в создание программно-аппаратного комплекса, где во всей красе сияют наша СХД и платформа ИИ.

Хочу подсветить, как мы пилим ИИ ассистентов на базе DAG.

1. Что такое DAG pipeline?

DAG (Directed Acyclic Graph) pipeline — это «умная» схема обработки данных, где каждый этап (узел) чётко связан с последующими и работает только после завершения своих «родителей». Такой подход часто используют в современных дата платформах (например, Airflow) для оркестрации сложных процессов.

2. Архитектура пайплайна для ИИ-ассистента

Схема типового пайплайна для ассистента:

1. Получение запроса пользователя
2. Нормализация и обработка текста
3. Параллельный поиск в разных источниках:
- ClickHouse
- PostgreSQL
- S3
- NFS
- Локальные файлы
4. Агрегация и ранжирование результатов
5. Генерация финального ответа
6. Логирование и аналитика (по желанию)

3. Пример кода на Python

from airflow import DAG
from airflow.operators.python import PythonOperator
from datetime import datetime
import psycopg2, boto3, fsspec, os
from clickhouse_driver import Client

def fetch_postgresql(**kwargs):
# Соединение и запрос к PostgreSQL
...

def fetch_clickhouse(**kwargs):
# Соединение и запрос к ClickHouse
...

def fetch_s3(**kwargs):
# Скачать файл с S3
...

def fetch_nfs_file(**kwargs):
# Прочитать файл из сетевого хранилища (NFS)
...

def fetch_local_file(**kwargs):
# Прочитать файл из локальной ФС
...

def aggregate_and_respond(**context):
# Агрегация результатов от всех fetch_* функций
...

default_args = {
'start_date': datetime(2023, 1, 1),
'owner': 'ai_assistant',
}

with DAG('multi_source_dag_pipeline', default_args=default_args, schedule_interval=None, catchup=False) as dag:
fetch_postgresql_task = PythonOperator(task_id='fetch_postgresql', python_callable=fetch_postgresql)
fetch_clickhouse_task = PythonOperator(task_id='fetch_clickhouse', python_callable=fetch_clickhouse)
fetch_s3_task = PythonOperator(task_id='fetch_s3', python_callable=fetch_s3)
fetch_nfs_file_task = PythonOperator(task_id='fetch_nfs_file', python_callable=fetch_nfs_file)
fetch_local_file_task = PythonOperator(task_id='fetch_local_file', python_callable=fetch_local_file)
aggregate_task = PythonOperator(task_id='aggregate_and_respond', python_callable=aggregate_and_respond, provide_context=True)

[fetch_postgresql_task, fetch_clickhouse_task, fetch_s3_task, fetch_nfs_file_task, fetch_local_file_task] >> aggregate_task


4. В чём смысл и основные плюсы?

- Масштабируемость: Хотите добавить ещё одну базу знаний? Просто добавь воды! Просто добавьте новый узел!
- Гибкость: Можно легко изменить этапы агрегации или поиска.
- Наглядность: Логика пайплайна прозрачна — всегда видно, на каком этапе и в каком источнике возникли проблемы.
- Параллельность: Данные собираются из нескольких систем одновременно — экономия времени!

5. Расширения

- Добавить обработку текста с помощью LLM (например, OpenAI или YandexGPT) на этапе агрегации.
- Встроить ассистента в Telegram-бот.
- Реализовать мониторинг выполнения шагов пайплайна и автоматическую обработку ошибок.
7🔥6
Ну а бонус, я тут наклепал (не без помощи ИИ😐) пример готового кода ассистента с графами!

# Импортируем необходимые компоненты из airflow
from airflow import DAG
from airflow.operators.python import PythonOperator
from datetime import datetime

# Импортируем библиотеки для работы с разными источниками данных
import psycopg2 # Для PostgreSQL
import boto3 # Для подключения к Amazon S3
import fsspec # Универсальный доступ к файловым системам, включая NFS
from clickhouse_driver import Client # Для подключения к ClickHouse
import os # Работа с файловой системой

# Функция для получения данных из PostgreSQL
def fetch_postgresql(**kwargs):
# Устанавливаем соединение с Postgres
conn = psycopg2.connect(
dbname='your_db', user='user', password='pass',
host='localhost', port=5432
)
# Создаём курсор для выполнения SQL-запроса
cur = conn.cursor()
# Выполняем SQL-запрос
cur.execute("SELECT * FROM your_table LIMIT 10;")
# Забираем результаты
result = cur.fetchall()
# Закрываем соединение
cur.close()
conn.close()
# Возвращаем результат
return result

# Функция для получения данных из ClickHouse
def fetch_clickhouse(**kwargs):
# Подключаемся к ClickHouse-серверу
client = Client('localhost')
# Выполняем SQL-запрос
data = client.execute('SELECT * FROM your_table LIMIT 10')
# Возвращаем результат
return data

# Функция для получения данных из AWS S3
def fetch_s3(**kwargs):
# Создаём клиент автомата S3
s3 = boto3.client('s3')
# Загружаем объект (например, JSON-файл)
obj = s3.get_object(Bucket='your-bucket', Key='example.json')
# Считываем содержимое файла
data = obj['Body'].read()
# Возвращаем данные (в байтах)
return data

# Функция для чтения файла с NFS-ресурса
def fetch_nfs_file(**kwargs):
# Путь к файлу на подключённом сетевом хранилище
file_path = '/mnt/nfs/data_file.txt'
# Читаем содержимое файла
with open(file_path, 'r') as f:
return f.read()

# Функция для чтения локального файла
def fetch_local_file(**kwargs):
# Путь к файлу в локальной ФС
file_path = 'local_data.txt'
# Читаем содержимое
with open(file_path, 'r') as f:
return f.read()

# Функция для агрегации данных из всех источников
def aggregate_and_respond(**context):
# Вытаскиваем данные из предыдущих задач через XCom
pg_data = context['ti'].xcom_pull(task_ids='fetch_postgresql')
ch_data = context['ti'].xcom_pull(task_ids='fetch_clickhouse')
s3_data = context['ti'].xcom_pull(task_ids='fetch_s3')
nfs_data = context['ti'].xcom_pull(task_ids='fetch_nfs_file')
file_data = context['ti'].xcom_pull(task_ids='fetch_local_file')

# Возвращаем агрегированные данные в виде словаря
return {
"PostgreSQL": pg_data,
"ClickHouse": ch_data,
"S3": s3_data.decode() if isinstance(s3_data, bytes) else s3_data, # Преобразуем байты в строку
"NFS": nfs_data,
"File": file_data,
}

# Настройки DAG: владелец, дата запуска (в прошлом, чтобы не было catchup)
default_args = {
'start_date': datetime(2023, 1, 1),
'owner': 'ai_assistant',
}

# Определяем DAG — главный объект пайплайна
with DAG(
'multi_source_dag_pipeline', # Уникальное имя пайплайна
default_args=default_args, # Параметры по умолчанию
schedule_interval=None, # Запускается вручную
catchup=False # Не выполняет предыдущие пропущенные запуски
) as dag:

# Задача: получить данные из PostgreSQL
fetch_postgresql_task = PythonOperator(
task_id='fetch_postgresql', # ID задачи
python_callable=fetch_postgresql # Указание, какую функцию вызывать
)

# Задача: получить данные из ClickHouse
fetch_clickhouse_task = PythonOperator(
task_id='fetch_clickhouse',
python_callable=fetch_clickhouse
)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
# Задача: получить файл из S3
fetch_s3_task = PythonOperator(
task_id='fetch_s3',
python_callable=fetch_s3
)

# Задача: получить файл с NFS
fetch_nfs_file_task = PythonOperator(
task_id='fetch_nfs_file',
python_callable=fetch_nfs_file
)

# Задача: получить локальный файл
fetch_local_file_task = PythonOperator(
task_id='fetch_local_file',
python_callable=fetch_local_file
)

# Задача: агрегировать и сформировать финальный ответ
aggregate_task = PythonOperator(
task_id='aggregate_and_respond',
python_callable=aggregate_and_respond,
provide_context=True # Передаёт context (для xcom_pull)
)

# Устанавливаем зависимости: все fetch задачи → агрегация
[
fetch_postgresql_task,
fetch_clickhouse_task,
fetch_s3_task,
fetch_nfs_file_task,
fetch_local_file_task
] >> aggregate_task

Что в результате?
Этот DAG:

выполняется вручную (schedule_interval=None);

сначала параллельно собирает данные из 5 разных источников (PostgreSQL, ClickHouse, S3, NFS, local);

затем всё агрегирует в одном таске (aggregate_and_respond);

А ещё можно, легко адаптировать его под NLP, RAG и ассистентов.

На базе этого уже можно:

Добавить генерацию ответа через LLM к этому пайплайну;

Представить это как Telegram-бота;

Создать mock-версию без БД и развернуть на машинах быстро.
6👍2🔥2
От всей ИИ души )
🔥13😁8
Ну и на последок - боль перфекциониста )))
😁10😱2
Современный маркетинг — это что-то невероятное.

покупал кухню — оказалась бракованная столешница. Пришлось ехать менять. Чтобы время не терять, заказал срочную доставку через «Яндекс». Продиктовал номер… и буквально через 10-15 минут мне уже звонит робот!

Предлагает «экспресс-ремонт» и строительные услуги.

Вот она — скорость реакции. Вот оно — будущее, где технологии настигают тебя мгновенно.

Человеку в этом мире будет всё труднее сопротивляться. Мы уже внутри системы, где алгоритмы знают о нас больше, чем мы сами.

💭 Как думаете, это тотальный контрольи или тотальное удобство?🤔
👍4👌1
Проводим мастер-класс (30 или 31 августа) по созданию ИИ ассистента на базе YandexGPT ?
Anonymous Poll
88%
Да
12%
Нет
Входной билет будет символическим (в районе 3000 руб. скинуться на токены и пиццу команде)
🔥8👍5👎2
Цифра дня:

8️⃣0️⃣🔤

Топ менеджеров компаний России не понимают ценности цифровизации бизнеса и пользы от ИИ...

P.s. кстати, мы даже были вынуждены создать воркшопы по повышению квалификации ключевых сотрудников компаний, чтобы говорить с ними на одном языке...🤷‍♀️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁4😱31
Коллеги, всем привет!

Создал свой небольшой блог в телеге. Где собираю контент из свей личной и профессиональной жизни
Язык блога: Русский и Английский

С удовольствием приглашаю вас присоединиться!


https://t.me/sgv1985
9🔥4
У меня есть цель:
Создать ИИ платформу, которой будут пользоваться десятки тысяч пользователей

И в последней итерации наша платформа обросла реальным маркетплейсом, где каждый желающий может создавать свои плагины, и творить ИИ своей мечты...

И вот что я нашел!
ЭТО 500 ИИ АГЕНТОВ на все (ну почти на все) случаи жизни)

дублирую ссылку:
https://github.com/Lasttrader/ai-agents-marketplace

И вот порой кажется, что всё сходиться - продукт, рынок, пользователи...
Но вклиниваются события, которые призваны тебя отбросить еще на какое-то расстояние назад... и опять отдалить тебя от цели... 🤔

P.S. Пользуйтесь репозиторием, и не забывайте ставить звездочки 🫡🌟 И возможно, в скором времени увидимся с вами на просторах платформы ИИ, где уже вы сможете создать ассистентов и агентов своей мечты.
8👍4
Сегодня тестировал GPT-5 для написания кода, не могу сказать, что есть кардинальные отличия...
И кстати в Gemini контекст расширяется до 2 млн токенов...

Так что сейчас становится ощущение, что прокачка GPT, это как айфон. Разница между 15 и 16 настолько мала, что почти не видна.

Или нет?🤔
👍5