Градиент обреченный

Так, очередной подгон от китайских коллег. Пойдемте посмотрим.

https://chat.qwenlm.ai/

Upd. Инференс дорогой, в 3-4 раза дороже gpt-4o.

👍5👀4🔥2

4.02K viewsSergei Averkiev, 09:07

Градиент обреченный

😁84⚡7👏4🗿4✍32❤1🍓1

4.79K viewsSergei Averkiev, 09:34

Градиент обреченный

Хорошая статья от Антона про обучение R1, test-time scaling, «озарение» и про то как Zero версия убирает узкое горлышко в виде человека из обучения модели рассуждениям.

👍8🤗3

3.09K viewsSergei Averkiev, 06:56

Градиент обреченный

Forwarded from AbstractDL

DeepSeek-R1 для чайников

Ну и наделала же DeepSeek шуму. Мне пришлось целый хабропост написать 😁

TLDR: мало слов про сравнение с ChatGPT и метрики, много слов про технические детали обучения, датасеты, GRPO и якобы эмерджентный «Aha! moment».

❤20👍13🔥4⚡1

3.13K viewsSergei Averkiev, 06:56

Градиент обреченный

Интересный эфир на youTube, популяризаторы науки Сурдин и Семихатов смотрят и обсуждают фильм Интерстеллар.

https://www.youtube.com/watch?v=miheS43AasA

🔥21👍10❤3👀2💅1

3.72K viewsSergei Averkiev, 18:28

Градиент обреченный

#perplexity_clone

Попробовал накидать страничку со стримингом из API Perplexity. Прикольно, из коробки работают поиск и рассуждения.

Жалко, что фильтр по поисковым источникам только на высоком tier'е работает (надо закинуть $500 на счет), а то бы поигрались.

👍16❤3🔥2

4.65K viewsSergei Averkiev, edited 08:31

Градиент обреченный

DeepSeek начал открывать кофейни, в меню LatteGPT, Turing Tea, Backpropagation Raf

😁118❤11🔥6👀3💅2👍1

12.4K viewsSergei Averkiev, 10:41

Градиент обреченный

Работы венгерского художника Иштвана Ороса.

По мотивам журнала Проектор про венгерский плакат.

❤16👍6🆒32💅1

5.45K viewsSergei Averkiev, 09:23

Градиент обреченный

Forwarded from Lingtrain (Sergei Averkiev)

🔺 Обновление Lingtrain

По просьбам учащихся добавил в lingtrain-aligner и Lingtrain Alignment Studio армянский язык. Спасибо Максиму Степанянцу из ВШЭ за помощь!

🔸 Отдельный язык нужен, чтобы текст корректно делился на предложения (при делении по привычным знакам препинания можно выбрать язык General).

🔸 В армянском пунктуация как раз своя, вместо точек используются двоеточия, а признаки вопросительного предложения могут стоять внутри, причем их может быть несколько в разных словах.

🔸 P.S. На каникулах добавил в библиотеку много нового — расчет эмбеддингов по API, хранение их в БД, новый модуль corrector. Никак руки не дойдут описать все это, но скоро сделаю.

🔥28❤9❤‍🔥2👍21

3.51K viewsSergei Averkiev, 10:52

Градиент обреченный

🔺 Мультиязычные MoE эмбеддинги

Nomic выложили модель Embed Text V2 в открытый доступ, можно запускать через sentence_transformers, обещают добавить в ollama.

🔸 Эмбеддинги используются, чтобы перенести тексты в единое векторное пространство, благодаря чему можно количественно посчитать насколько два текста близки по смыслу. В данном случае это можно применить для текстов на разных языках.

🔸 Поддерживается 100+ языков (в табличке, которую прилагают авторы языков 96, но для родственных им языков также будет работать). Обучали на 1.6B пар предложений.

🔸 Архитектура MoE. По-моему, для эмбеддингов такой еще не было. Это значит, что при использовании будет активироваться только часть весов модели, всего 300M параметров, это немного.

🔸 Данные, веса и код выкладывают в открытый доступ, что мы, конечно, приветствуем.

🔸 Эмбеддинги для экономии можно обрезать до 256, так как обучали с подходом Matryoshka.

🔸 Языков России/СНГ не так много, по качеству надо смотреть.

from sentence_transformers import SentenceTransformer

model = SentenceTransformer("nomic-ai/nomic-embed-text-v2-moe", trust_remote_code=True)
sentences = ["Hello!", "Привет!"]
embeddings = model.encode(sentences, prompt_name="passage")

similarity = model.similarity(embeddings[0], embeddings[1])

👉 Пост | GitHub | HF

🔥23👍7❤4🐳2

4.99K viewsSergei Averkiev, edited 08:08

Градиент обреченный

Все думал, что у DeepSeek'а шрифт уж больно знакомый. И точно, это же Каспер после ребрендинга.

😁56🔥5🤯2🐳2😱1

4.12K viewsSergei Averkiev, 10:53

About

Blog

Apps

Platform