MiaoTony's Box

不知道你们还记不记得当年 Google 的 Alpha Go，就是下围棋超级牛的人工智能，早已经打赢了人类。而且值得一提的是，最开始它是用人类的棋谱训练的，后来在人类的棋谱训练完了后，它开始自己和自己下棋，也就是说是自己生成棋谱自己训练自己。

在GPT-4训练的时候，几乎用到了所有互联网上能用到的文本，很多人都担心GPT-4训练完了后在没有高质量的文本供训练了。

在前面《独家：OpenAI 研究员在 CEO 被撤职前向董事会发出 AI 突破警告 — 据知情人士透露》https://twitter.c…

311 viewsMiaoTony 🐱, 09:41

MiaoTony's Box

#今天又看了啥 #LLM #NLP #tutorial
大规模语言模型：从理论到实践
https://intro-llm.github.io/chapter/LLM-TAP.pdf

课件/slides: https://intro-llm.github.io/

347 viewsMiaoTony 🐱, edited 10:38

MiaoTony's Box

#今天又看了啥 #LLM #prompt #NLP #tutorial
提示工程指南
提示工程（Prompt Engineering）是一门较新的学科，关注提示词开发和优化，帮助用户将大语言模型（Large Language Model, LLM）用于各场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。
研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力，如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术，实现和大语言模型或其他生态工具的高效接轨。
提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接，以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性，也可以赋能大语言模型，比如借助专业领域知识和外部工具来增强大语言模型能力。
基于对大语言模型的浓厚兴趣，我们编写了这份全新的提示工程指南，介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。

https://www.promptingguide.ai/zh

www.promptingguide.ai

提示工程指南 | Prompt Engineering Guide

A Comprehensive Overview of Prompt Engineering

312 viewsMiaoTony 🐱, 12:39

MiaoTony's Box

#今天又看了啥 #LLM #GLM
智谱AI推出新一代基座模型 GLM-4

2024年01月16日，我们在「智谱AI技术开放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。发布 All Tools、GLMs、MaaS API、大模型科研基金、大模型开源基金以及「Z计划」创业基金等内容。

GLM-4
新一代基座大模型GLM-4，整体性能相比GLM3全面提升60%，逼近GPT-4；支持更长上下文；更强的多模态；支持更快推理速度，更多并发，大大降低推理成本；同时GLM-4增强了智能体能力。

https://mp.weixin.qq.com/s/QfVM52oecfjLVDz-EXRyHA

Weixin Official Accounts Platform

智谱AI推出新一代基座模型 GLM-4

We Are More Open

286 viewsMiaoTony 🐱, 17:06

MiaoTony's Box

#羊毛「通义灵码 · 体验 AI 编码，开 AI 盲盒」玩法简述：用户进入活动页面后，随机参与或体验活动页面中通义灵码的任一场景，即可获取一次开“AI盲盒”的资格。用户获取资格后，需要在IDE端下载通义灵码插件并输入“@灵码开盲盒”，即可打开盲盒并查看盲盒内奖品。具体活动玩法以届时活动页面实际指引、提示为准。活动期间同一用户仅能参与一次活动玩法。整体活动时间为2024年3月8日00:00:00—2024年4月30日00:00:00。（活动期间如有调整，以届时活动页面展示为准） https://…

#tools #LLM
BTW, 还可以试试智谱 AI 家的 VSC 插件 CodeGeeX 智能编程助手
CodeGeeX is a powerful intelligent programming assistant based on LLMs. It provides functions such as code generation/completion, comment generation, code translation, and AI-based chat, helping developers significantly improve their work efficiency. CodeGeeX supports multiple programming languages.

Feature：代码自动生成和补全，代码翻译，自动添加注释，智能问答等
CodeGeeX 插件支持 Visual Studio Code 及 IntelliJ IDEA、PyCharm、GoLand 等 JetBrains IDE，对个人用户完全免费

https://codegeex.cn/
https://marketplace.visualstudio.com/items?itemName=aminer.codegeex

Visualstudio

CodeGeeX: AI Code AutoComplete, Chat, Auto Comment - Visual Studio Marketplace

Extension for Visual Studio Code - CodeGeeX is an AI-based coding assistant, which can suggest code in the current or following lines. It is powered by a large-scale multilingual code generation model with 13 billion parameters, pretrained on a large code…

231 viewsMiaoTony 🐱, edited 13:33

MiaoTony's Box

#今天又看了啥 #paper #LLM #academic
【LLM-数学】MathGenie：利用问题反向翻译生成合成数据来增强LLM的数学推理能力
https://zhuanlan.zhihu.com/p/688779138

论文标题：MathGenie: Generating Synthetic Data with Question Back-translation for Enhancing Mathematical Reasoning of LLMs
论文链接：https://arxiv.org/pdf/2402.16352.pdf

知乎专栏

【LLM-数学】MathGenie：利用问题反向翻译生成合成数据来增强LLM的数学推理能力

一、结论写在前面论文提出了一个流程，包括迭代解决方案增广和问题反向翻译来生成大规模合成数学问题，以及基于验证的解决方案过滤来过滤生成的集成代码解决方案。这三个组件的有效结合创建了新的问题，并确保了相…

308 viewsMiaoTony 🐱, 10:00

MiaoTony's Box

弱智吧上大分？弱智吧友 AI 比小红书、豆瓣、知乎更聪明！当今的 AI 模型以学习英语为主，为了使它们更好地与中国用户保持一致，中科院的研究员创建了 COIG-CQIA 数据集。该数据集收集了中文互联网上的高质量语料，包括知乎高赞回答、豆瓣影评、小红书帖子互动、弱智吧高赞贴、IT 社区问答和各种专业百科网站。在这些数据的熏陶下，模型 Yi-34B 展现出了惊人的反差,“最弱智的 AI”不仅是最聪明的还是最文明的，它以“全学科全班级第一”的姿态遥遥领先于其他平台，并且在安全测试集上同样稳居最高分。 …

#今天又看了啥 #LLM #NLP
量子位的报道
弱智吧竟成最佳中文AI训练数据？！中科院等：8项测试第一，远超知乎豆瓣小红书
InstantView from Source

Telegraph

弱智吧竟成最佳中文AI训练数据？！中科院等：8项测试第一，远超知乎豆瓣小红书

离大谱了，弱智吧登上正经AI论文，还成了最好的中文训练数据？？具体来说，使用弱智吧数据训练的大模型，跑分超过百科、知乎、豆瓣、小红书等平台，甚至是研究团队精心挑选的数据集。在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。没错，论文中的Ruozhiba就是指百度贴吧弱智吧，一个充满荒谬、离奇、不合常理发言的中文社区，画风通常是这样的：最离谱的是，弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI，这下吧友自己都闹不明白了。其他平台围观网友也纷纷蚌埠住。这项研究来自…

312 viewsMiaoTony 🐱, 06:21

MiaoTony's Box

#今天又看了啥 #LLM
国内百模谁第一？清华14大LLM最新评测报告出炉，GLM-4、文心4.0站在第一梯队
InstantView from Source

几个主要结论：
● 整体来说，GPT-4系列模型和Claude-3等国外模型在多个能力上依然处于领先地位，国内头部大模型GLM-4和文心一言4.0表现亮眼，与国际一流模型水平接近，且差距已经逐渐缩小。
● 国外大模型中，GPT-4系列模型表现稳定，Claude-3也展现了较强的综合实力，在语义理解和作为智能体两项能力评测中更是获得了榜首，跻身国际一流模型。
● 国内大模型中，GLM-4和文心一言4.0在本次评测中表现最好，为国内头部模型；通义千问2.1、Abab6、moonshot网页版以及qwen1.5-72b-chat紧随其后，在部分能力评测中亦有不俗表现；但是国内大模型对比国际一流模型在代码编写、作为智能体两个能力上依然有较大差距，国内模型仍需努力。

Telegraph

在2023年的「百模大战」中，众多实践者推出了各类模型，这些模型有的是原创的，有的是针对开源模型进行微调的；有些是通用的，有些则是行业特定的。如何能合理地评价这些模型的能力，成为关键问题。尽管国内外存在多个模型能力评测榜单，但它们的质量参差不齐，排名差异显著，这主要是因为评测数据和测试方法尚不成熟和科学。我们认为，好的评测方法应当具备开放性、动态性、科学性和权威性。为提供客观、科学的评测标准，清华大学基础模型研究中心联合中关村实验室研制了SuperBench大模型综合能力评测框架，旨在推动大模型技术、应用和生态的健康发展。…

364 viewsMiaoTony 🐱, edited 03:16

MiaoTony's Box

#今天又看了啥 #LLM
DeepSeek发布全球最强开源MoE模型

一句话总结DeepSeek-V2：参数更多、能力更强、成本更低！

https://mp.weixin.qq.com/s/3AmJpYe1eLPHk7HJLYM24A

模型权重：
https://huggingface.co/deepseek-ai
技术报告：
https://github.com/deepseek-ai/DeepSeek-V2/blob/main/deepseek-v2-tech-report.pdf
对话官网：
chat.deepseek.com ，免费开启对话
API 开放平台：
platform.deepseek.com

358 viewsMiaoTony 🐱, edited 02:51

MiaoTony's Box

#今天又看了啥 #academic #LLM #ICLR
量子位对于 ICLR 的报道

AI顶会ICLR，今年只有一家中国大模型公司受邀演讲
智谱 AI：The ChatGLM’s Road to AGI
from source

Telegraph

AI顶会ICLR，今年只有一家中国大模型公司受邀演讲

机器学习三大顶会之一的ICLR 2024，正在维也纳如火如荼地举行。虽然首个时间检验奖、杰出论文奖等“重头戏”已经陆续颁布，但在其它环节中，我们却发现了一件更有意思的事情。同样是作为ICLR重要组成部分的特邀演讲（Invited Talk），每年都会邀请在机器学习领域有突出贡献和影响力的专家学者进行演讲。而今年，中国只有一位！并且仅从他的演讲主题The ChatGLM’s Road to AGI中，我们就能挖到更多的线索—— ChatGLM，正是由清华系初创智谱AI所推出的千亿参数大语言模型。 …

309 viewsMiaoTony 🐱, 19:46

MiaoTony's Box

#今天又看了啥 #academic #LLM #ICLR 量子位对于 ICLR 的报道 AI顶会ICLR，今年只有一家中国大模型公司受邀演讲智谱 AI：The ChatGLM’s Road to AGI from source

#今天又看了啥 #academic #LLM #ICLR
唐杰的 PPT: The ChatGLM’s Road to AGI
https://keg.cs.tsinghua.edu.cn/jietang/publications/iclr24-chatglm-en-v2.pdf

348 viewsMiaoTony 🐱, 08:14

MiaoTony's Box

Please open Telegram to view this post

VIEW IN TELEGRAM

363 viewsMiaoTony 🐱, edited 19:39

MiaoTony's Box

#今天又看了啥 #OpenAI #LLM
IT之家报道：
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供
OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o，该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是，GPT-4o 将免费提供给所有用户使用。
https://www.ithome.com/0/767/693.htm

Ithome

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供 - IT之家

303 viewsMiaoTony 🐱, 19:45

MiaoTony's Box

#今天又看了啥 #OpenAI #LLM
机器之心报道：
OpenAI颠覆世界：GPT-4o完全免费，实时语音视频交互震撼全场，直接进入科幻时代
from source

Telegraph

OpenAI颠覆世界：GPT-4o完全免费，实时语音视频交互震撼全场，直接进入科幻时代

原创关注大模型的机器之心

329 viewsMiaoTony 🐱, 05:57

MiaoTony's Box

#今天又看了啥 #LLM
❤️❤️ 给主人留下些什么吧 ❤️❤️
https://zhuanlan.zhihu.com/p/697685138

737 viewsMiaoTony 🐱, 17:20

MiaoTony's Box

#今天又看了啥 #paper #academic #通信 #LLM
WirelessLLM: 面向无线智能的通信大模型

定义了一种全新的无线通信大模型——WirelessLLM。这个模型的目标是让大语言模型具备无线领域的专业知识和技能，能够解决无线通信中面临的各种挑战和问题。比如，资源分配、频谱感知和协议理解等。通过这项研究，我们希望为实现智能化和自主化的无线通信系统迈出重要的一步。

论文链接：https://arxiv.org/abs/2405.17053
团队主页：https://eejzhang.people.ust.hk/

https://mp.weixin.qq.com/s/-qL3kDFQlvOPAvwIySgTAQ

arXiv.org

WirelessLLM: Empowering Large Language Models Towards Wireless Intelligence

The rapid evolution of wireless technologies and the growing complexity of network infrastructures necessitate a paradigm shift in how communication networks are designed, configured, and managed....

315 viewsMiaoTony 🐱, 06:39

MiaoTony's Box

#今天又看了啥 #LLM
GLM-4-9B 开源，探索模型极限
https://mp.weixin.qq.com/s/osbpRJPRGET_0s3k0mfdxw

Weixin Official Accounts Platform

GLM-4-9B 开源，探索模型极限

更强，更丰富~

290 viewsMiaoTony 🐱, 08:15

MiaoTony's Box

#今天又看了啥 #LLM #academic
力压GPT-4o！新王Claude 3.5 Sonnet来了，直接免费可用

from mp.weixin.qq.com