🔥10👍3🕊1
Forwarded from Lingtrain
Всем слова
Написал небольшую статью про создание новых слов. Если кто-то задумывался про создание своего языка, то будет проще выдумывать новые языковые единицы ☺️
Слова генерируются нейросетью, сам скрипт на Python очень компактный и понятный. Для обучения потребуется только файл со списком слов, под одному на строку. Например, можно взять словарь Ожегова. Язык не важен (что я говорю! Язык, конечно, всегда важен, просто тут он может быть любой).
Попробовал на списке городов и именах. Можно нагенерировать выдуманных стран, компаний и просто слов.
https://habr.com/ru/post/672434/
Написал небольшую статью про создание новых слов. Если кто-то задумывался про создание своего языка, то будет проще выдумывать новые языковые единицы ☺️
Слова генерируются нейросетью, сам скрипт на Python очень компактный и понятный. Для обучения потребуется только файл со списком слов, под одному на строку. Например, можно взять словарь Ожегова. Язык не важен (что я говорю! Язык, конечно, всегда важен, просто тут он может быть любой).
Попробовал на списке городов и именах. Можно нагенерировать выдуманных стран, компаний и просто слов.
https://habr.com/ru/post/672434/
Хабр
Я уеду жить в Лейнвуд. Создаем новые слова при помощи GPT
Фантастический город. Нарисовано нейросетью. Предлагаю немного поразвлечься и научиться придумывать новые слова, которые звучат совсем как настоящие (прям как товары в Икее). Для начала вот вам...
👍2💯1
#nlp #big #news
🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ
Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.
Яндекс выложил веса своей YaLM 100B в открытый доступ!
• Модель основана на Megatron'e от Microsoft
• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.
• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.
GitHub
🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ
Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.
Яндекс выложил веса своей YaLM 100B в открытый доступ!
• Модель основана на Megatron'e от Microsoft
• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.
• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.
GitHub
🔥6🐳2👍1
#cv #gen #fun
Просто корги Джонни Депп, дракон имени Боуи и запрещенный в Китае Винни Пух.
#рисуемнейросетью
Просто корги Джонни Депп, дракон имени Боуи и запрещенный в Китае Винни Пух.
#рисуемнейросетью
😁3💯2
#news #nlp #tool
🦾 Intellisense на стероидах. Github Copilot открыли для всех
Copilot — это штука, которая будет дописывать за вас код по названию функции или комментам. Само собой, для более-менее сложной логики это не подойдет, но для каких-нибудь helper функций или запросиков должно работать.
• Предлагают подписку за $10 в месяц
• Работает через сервис Codex от OpenAI
• Интегрируется в различные IDE типа VS Code
🦾 Intellisense на стероидах. Github Copilot открыли для всех
Copilot — это штука, которая будет дописывать за вас код по названию функции или комментам. Само собой, для более-менее сложной логики это не подойдет, но для каких-нибудь helper функций или запросиков должно работать.
• Предлагают подписку за $10 в месяц
• Работает через сервис Codex от OpenAI
• Интегрируется в различные IDE типа VS Code
👍4
#misc
🎹 Попалась на глаза вот такая замечательная штука — ритмотека. Определяет песню по настукиванию ритма на клавиатуре!
Это вам не мел-спектрограммы сравнивать.
🎹 Попалась на глаза вот такая замечательная штука — ритмотека. Определяет песню по настукиванию ритма на клавиатуре!
Это вам не мел-спектрограммы сравнивать.
🔥4👍2
#useful #tools #cv #data
LAION 5B. 5 миллиардов подписанных картинок
🌗 Если вам понадобится датасет с картинками и подписями к ним, — например, для дообучения генеративной сети или для любых других нужд, то вы должны знать про самый большой открытый датасет LAION 5B. Он на порядок больше своего предшественника LAION 400M, и к нему есть удобный интерфейс.
Просто вбиваете запрос, смотрите и скачиваете json со всеми картинками.
Сайт, Проект
LAION 5B. 5 миллиардов подписанных картинок
🌗 Если вам понадобится датасет с картинками и подписями к ним, — например, для дообучения генеративной сети или для любых других нужд, то вы должны знать про самый большой открытый датасет LAION 5B. Он на порядок больше своего предшественника LAION 400M, и к нему есть удобный интерфейс.
Просто вбиваете запрос, смотрите и скачиваете json со всеми картинками.
Сайт, Проект
👍4🔥3
Forwarded from Kali Novskaya (Tatiana Shavrina)
Ну что, вы этого хотели.
Бот YaLM-100B
@inhumanly_sentient_bot
Токен
Поскольку число карт не резиновое, может работать не супер быстро, чекайте через
В бот можно писать тексты, он будет продолжать.
Стоят дефолтные настройки с сэмплингом, но вы можете их менять. Делитесь в комментариях!
Бот YaLM-100B
@inhumanly_sentient_bot
Токен
L0NG_L1V3_ML5P4C3
Поскольку число карт не резиновое, может работать не супер быстро, чекайте через
/qsize
В бот можно писать тексты, он будет продолжать.
Стоят дефолтные настройки с сэмплингом, но вы можете их менять. Делитесь в комментариях!
🔥4😱1
#habr #articles #pr
〰️ Инфоинженер
Однажды мне довелось провести несколько занятий по NLP в своем родном ВУЗе по просьбе друзей. Оказалось это очень не простым делом и заняло кучу времени. Зато, как говорится, получен ценный опыт.
В связи с этим написал небольшую статью на Хабре, возможно, кому-то будет полезным.
Ссылка
〰️ Инфоинженер
Однажды мне довелось провести несколько занятий по NLP в своем родном ВУЗе по просьбе друзей. Оказалось это очень не простым делом и заняло кучу времени. Зато, как говорится, получен ценный опыт.
В связи с этим написал небольшую статью на Хабре, возможно, кому-то будет полезным.
Ссылка
Хабр
Инфоинженер. Как я делал курс по NLP для МГТУ им. Баумана
Новый кампус Бауманки. Нарисовано нейросетью. Пандемия. Осень. Друг и бывший одногруппник, работающий на кафедре прикладной математики, попросил меня сделать курс по обработке естественного языка для...
👍8🔥2
#fun #cv #gen
♟ Магнус и Ян
Пока продолжается турнир за право сыграть в чемпионском матче с Магнусом Карлсеном, сгенерировал пару картинок с ним и Яном Непомнящим (Ян, кстати, лидирует за четыре матча до конца).
Сурового норвежца сеть явно знает лучше, зато Ян выглядит позитивней.
P.S. Сгенерировано в midjourney.
♟ Магнус и Ян
Пока продолжается турнир за право сыграть в чемпионском матче с Магнусом Карлсеном, сгенерировал пару картинок с ним и Яном Непомнящим (Ян, кстати, лидирует за четыре матча до конца).
Сурового норвежца сеть явно знает лучше, зато Ян выглядит позитивней.
P.S. Сгенерировано в midjourney.
😁2👍1