🔥10👍3🕊1
Forwarded from Lingtrain
Всем слова
Написал небольшую статью про создание новых слов. Если кто-то задумывался про создание своего языка, то будет проще выдумывать новые языковые единицы ☺️
Слова генерируются нейросетью, сам скрипт на Python очень компактный и понятный. Для обучения потребуется только файл со списком слов, под одному на строку. Например, можно взять словарь Ожегова. Язык не важен (что я говорю! Язык, конечно, всегда важен, просто тут он может быть любой).
Попробовал на списке городов и именах. Можно нагенерировать выдуманных стран, компаний и просто слов.
https://habr.com/ru/post/672434/
Написал небольшую статью про создание новых слов. Если кто-то задумывался про создание своего языка, то будет проще выдумывать новые языковые единицы ☺️
Слова генерируются нейросетью, сам скрипт на Python очень компактный и понятный. Для обучения потребуется только файл со списком слов, под одному на строку. Например, можно взять словарь Ожегова. Язык не важен (что я говорю! Язык, конечно, всегда важен, просто тут он может быть любой).
Попробовал на списке городов и именах. Можно нагенерировать выдуманных стран, компаний и просто слов.
https://habr.com/ru/post/672434/
Хабр
Я уеду жить в Лейнвуд. Создаем новые слова при помощи GPT
Фантастический город. Нарисовано нейросетью. Предлагаю немного поразвлечься и научиться придумывать новые слова, которые звучат совсем как настоящие (прям как товары в Икее). Для начала вот вам...
👍2💯1
#nlp #big #news
🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ
Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.
Яндекс выложил веса своей YaLM 100B в открытый доступ!
• Модель основана на Megatron'e от Microsoft
• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.
• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.
GitHub
🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ
Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.
Яндекс выложил веса своей YaLM 100B в открытый доступ!
• Модель основана на Megatron'e от Microsoft
• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.
• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.
GitHub
🔥6🐳2👍1
#cv #gen #fun
Просто корги Джонни Депп, дракон имени Боуи и запрещенный в Китае Винни Пух.
#рисуемнейросетью
Просто корги Джонни Депп, дракон имени Боуи и запрещенный в Китае Винни Пух.
#рисуемнейросетью
😁3💯2
#news #nlp #tool
🦾 Intellisense на стероидах. Github Copilot открыли для всех
Copilot — это штука, которая будет дописывать за вас код по названию функции или комментам. Само собой, для более-менее сложной логики это не подойдет, но для каких-нибудь helper функций или запросиков должно работать.
• Предлагают подписку за $10 в месяц
• Работает через сервис Codex от OpenAI
• Интегрируется в различные IDE типа VS Code
🦾 Intellisense на стероидах. Github Copilot открыли для всех
Copilot — это штука, которая будет дописывать за вас код по названию функции или комментам. Само собой, для более-менее сложной логики это не подойдет, но для каких-нибудь helper функций или запросиков должно работать.
• Предлагают подписку за $10 в месяц
• Работает через сервис Codex от OpenAI
• Интегрируется в различные IDE типа VS Code
👍4
#misc
🎹 Попалась на глаза вот такая замечательная штука — ритмотека. Определяет песню по настукиванию ритма на клавиатуре!
Это вам не мел-спектрограммы сравнивать.
🎹 Попалась на глаза вот такая замечательная штука — ритмотека. Определяет песню по настукиванию ритма на клавиатуре!
Это вам не мел-спектрограммы сравнивать.
🔥4👍2
#useful #tools #cv #data
LAION 5B. 5 миллиардов подписанных картинок
🌗 Если вам понадобится датасет с картинками и подписями к ним, — например, для дообучения генеративной сети или для любых других нужд, то вы должны знать про самый большой открытый датасет LAION 5B. Он на порядок больше своего предшественника LAION 400M, и к нему есть удобный интерфейс.
Просто вбиваете запрос, смотрите и скачиваете json со всеми картинками.
Сайт, Проект
LAION 5B. 5 миллиардов подписанных картинок
🌗 Если вам понадобится датасет с картинками и подписями к ним, — например, для дообучения генеративной сети или для любых других нужд, то вы должны знать про самый большой открытый датасет LAION 5B. Он на порядок больше своего предшественника LAION 400M, и к нему есть удобный интерфейс.
Просто вбиваете запрос, смотрите и скачиваете json со всеми картинками.
Сайт, Проект
👍4🔥3
Forwarded from Kali Novskaya (Tatiana Shavrina)
Ну что, вы этого хотели.
Бот YaLM-100B
@inhumanly_sentient_bot
Токен
Поскольку число карт не резиновое, может работать не супер быстро, чекайте через
В бот можно писать тексты, он будет продолжать.
Стоят дефолтные настройки с сэмплингом, но вы можете их менять. Делитесь в комментариях!
Бот YaLM-100B
@inhumanly_sentient_bot
Токен
L0NG_L1V3_ML5P4C3
Поскольку число карт не резиновое, может работать не супер быстро, чекайте через
/qsize
В бот можно писать тексты, он будет продолжать.
Стоят дефолтные настройки с сэмплингом, но вы можете их менять. Делитесь в комментариях!
🔥4😱1
#habr #articles #pr
〰️ Инфоинженер
Однажды мне довелось провести несколько занятий по NLP в своем родном ВУЗе по просьбе друзей. Оказалось это очень не простым делом и заняло кучу времени. Зато, как говорится, получен ценный опыт.
В связи с этим написал небольшую статью на Хабре, возможно, кому-то будет полезным.
Ссылка
〰️ Инфоинженер
Однажды мне довелось провести несколько занятий по NLP в своем родном ВУЗе по просьбе друзей. Оказалось это очень не простым делом и заняло кучу времени. Зато, как говорится, получен ценный опыт.
В связи с этим написал небольшую статью на Хабре, возможно, кому-то будет полезным.
Ссылка
Хабр
Инфоинженер. Как я делал курс по NLP для МГТУ им. Баумана
Новый кампус Бауманки. Нарисовано нейросетью. Пандемия. Осень. Друг и бывший одногруппник, работающий на кафедре прикладной математики, попросил меня сделать курс по обработке естественного языка для...
👍8🔥2
#fun #cv #gen
♟ Магнус и Ян
Пока продолжается турнир за право сыграть в чемпионском матче с Магнусом Карлсеном, сгенерировал пару картинок с ним и Яном Непомнящим (Ян, кстати, лидирует за четыре матча до конца).
Сурового норвежца сеть явно знает лучше, зато Ян выглядит позитивней.
P.S. Сгенерировано в midjourney.
♟ Магнус и Ян
Пока продолжается турнир за право сыграть в чемпионском матче с Магнусом Карлсеном, сгенерировал пару картинок с ним и Яном Непомнящим (Ян, кстати, лидирует за четыре матча до конца).
Сурового норвежца сеть явно знает лучше, зато Ян выглядит позитивней.
P.S. Сгенерировано в midjourney.
😁2👍1
Forwarded from Градиентное погружение
VQ-Diffusion
Что это такое?
Это модель от microsoft. Смысл этой модели и различие её от обычной диффузии(glide, dalle2, imagen) заключается в том, что она генерирует латентное пространство vqvae, вместо того, чтобы генерировать сразу картинку.
Они заменили unet на трансформер dalle, что позволяет им без проблем генерировать сразу пространство vqvae.
Также они считают текстовые эмбеддинги с помощью клипа, что довольно интересно.
Собрал колаб для этой модели.
гитхаб
пейпер
@gradientdip
Что это такое?
Это модель от microsoft. Смысл этой модели и различие её от обычной диффузии(glide, dalle2, imagen) заключается в том, что она генерирует латентное пространство vqvae, вместо того, чтобы генерировать сразу картинку.
Они заменили unet на трансформер dalle, что позволяет им без проблем генерировать сразу пространство vqvae.
Также они считают текстовые эмбеддинги с помощью клипа, что довольно интересно.
Собрал колаб для этой модели.
гитхаб
пейпер
@gradientdip
👍5🤔1
#misc
Systems analyst or systems programmer
👓 Билл Гейтс выложил в соцсетях свое резюме 70-х годов.
Если вы думаете, что ваше резюме не важно выглядит, то не расстраивайтесь. У человека было вот такое и где он теперь. 😁
Systems analyst or systems programmer
👓 Билл Гейтс выложил в соцсетях свое резюме 70-х годов.
Если вы думаете, что ваше резюме не важно выглядит, то не расстраивайтесь. У человека было вот такое и где он теперь. 😁
👍4😁1