#今天又看了啥 #LLM #NLP #tutorial
大规模语言模型:从理论到实践
https://intro-llm.github.io/chapter/LLM-TAP.pdf
课件/slides: https://intro-llm.github.io/
大规模语言模型:从理论到实践
https://intro-llm.github.io/chapter/LLM-TAP.pdf
课件/slides: https://intro-llm.github.io/
#今天又看了啥 #LLM #prompt #NLP #tutorial
提示工程指南
提示工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model, LLM)用于各场景和研究领域。 掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。
研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。
提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性,也可以赋能大语言模型,比如借助专业领域知识和外部工具来增强大语言模型能力。
基于对大语言模型的浓厚兴趣,我们编写了这份全新的提示工程指南,介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。
https://www.promptingguide.ai/zh
提示工程指南
提示工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model, LLM)用于各场景和研究领域。 掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。
研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。
提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性,也可以赋能大语言模型,比如借助专业领域知识和外部工具来增强大语言模型能力。
基于对大语言模型的浓厚兴趣,我们编写了这份全新的提示工程指南,介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。
https://www.promptingguide.ai/zh
www.promptingguide.ai
提示工程指南 | Prompt Engineering Guide
A Comprehensive Overview of Prompt Engineering
#今天又看了啥 #LLM #GLM
智谱AI推出新一代基座模型 GLM-4
2024年01月16日,我们在「智谱AI技术开放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。发布 All Tools、GLMs、MaaS API、大模型科研基金、大模型开源基金以及「Z计划」创业基金等内容。
GLM-4
新一代基座大模型GLM-4,整体性能相比GLM3全面提升60%,逼近GPT-4;支持更长上下文;更强的多模态;支持更快推理速度,更多并发,大大降低推理成本;同时GLM-4增强了智能体能力。
https://mp.weixin.qq.com/s/QfVM52oecfjLVDz-EXRyHA
智谱AI推出新一代基座模型 GLM-4
2024年01月16日,我们在「智谱AI技术开放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。发布 All Tools、GLMs、MaaS API、大模型科研基金、大模型开源基金以及「Z计划」创业基金等内容。
GLM-4
新一代基座大模型GLM-4,整体性能相比GLM3全面提升60%,逼近GPT-4;支持更长上下文;更强的多模态;支持更快推理速度,更多并发,大大降低推理成本;同时GLM-4增强了智能体能力。
https://mp.weixin.qq.com/s/QfVM52oecfjLVDz-EXRyHA
Weixin Official Accounts Platform
智谱AI推出新一代基座模型 GLM-4
We Are More Open
MiaoTony's Box
#羊毛 「通义灵码 · 体验 AI 编码,开 AI 盲盒」 玩法简述:用户进入活动页面后,随机参与或体验活动页面中通义灵码的任一场景,即可获取一次开“AI盲盒”的资格。用户获取资格后,需要在IDE端下载通义灵码插件并输入“@灵码 开盲盒”,即可打开盲盒并查看盲盒内奖品。具体活动玩法以届时活动页面实际指引、提示为准。活动期间同一用户仅能参与一次活动玩法。 整体活动时间为2024年3月8日00:00:00—2024年4月30日00:00:00。(活动期间如有调整,以届时活动页面展示为准) https://…
#tools #LLM
BTW, 还可以试试 智谱 AI 家的 VSC 插件 CodeGeeX 智能编程助手
CodeGeeX is a powerful intelligent programming assistant based on LLMs. It provides functions such as code generation/completion, comment generation, code translation, and AI-based chat, helping developers significantly improve their work efficiency. CodeGeeX supports multiple programming languages.
Feature:代码自动生成和补全,代码翻译,自动添加注释,智能问答 等
CodeGeeX 插件支持 Visual Studio Code 及 IntelliJ IDEA、PyCharm、GoLand 等 JetBrains IDE,对个人用户完全免费
https://codegeex.cn/
https://marketplace.visualstudio.com/items?itemName=aminer.codegeex
BTW, 还可以试试 智谱 AI 家的 VSC 插件 CodeGeeX 智能编程助手
CodeGeeX is a powerful intelligent programming assistant based on LLMs. It provides functions such as code generation/completion, comment generation, code translation, and AI-based chat, helping developers significantly improve their work efficiency. CodeGeeX supports multiple programming languages.
Feature:代码自动生成和补全,代码翻译,自动添加注释,智能问答 等
CodeGeeX 插件支持 Visual Studio Code 及 IntelliJ IDEA、PyCharm、GoLand 等 JetBrains IDE,对个人用户完全免费
https://codegeex.cn/
https://marketplace.visualstudio.com/items?itemName=aminer.codegeex
Visualstudio
CodeGeeX: AI Code AutoComplete, Chat, Auto Comment - Visual Studio Marketplace
Extension for Visual Studio Code - CodeGeeX is an AI-based coding assistant, which can suggest code in the current or following lines. It is powered by a large-scale multilingual code generation model with 13 billion parameters, pretrained on a large code…
#今天又看了啥 #paper #LLM #academic
【LLM-数学】MathGenie:利用问题反向翻译生成合成数据来增强LLM的数学推理能力
https://zhuanlan.zhihu.com/p/688779138
论文标题:MathGenie: Generating Synthetic Data with Question Back-translation for Enhancing Mathematical Reasoning of LLMs
论文链接:https://arxiv.org/pdf/2402.16352.pdf
【LLM-数学】MathGenie:利用问题反向翻译生成合成数据来增强LLM的数学推理能力
https://zhuanlan.zhihu.com/p/688779138
论文标题:MathGenie: Generating Synthetic Data with Question Back-translation for Enhancing Mathematical Reasoning of LLMs
论文链接:https://arxiv.org/pdf/2402.16352.pdf
知乎专栏
【LLM-数学】MathGenie:利用问题反向翻译生成合成数据来增强LLM的数学推理能力
一、结论写在前面论文提出了一个流程,包括迭代解决方案增广和问题反向翻译来生成大规模合成数学问题,以及基于验证的解决方案过滤来过滤生成的集成代码解决方案。这三个组件的有效结合创建了新的问题,并确保了相…
MiaoTony's Box
弱智吧上大分?弱智吧友 AI 比小红书、豆瓣、知乎更聪明! 当今的 AI 模型以学习英语为主,为了使它们更好地与中国用户保持一致,中科院的研究员创建了 COIG-CQIA 数据集。该数据集收集了中文互联网上的高质量语料,包括知乎高赞回答、豆瓣影评、小红书帖子互动、弱智吧高赞贴、IT 社区问答和各种专业百科网站。 在这些数据的熏陶下,模型 Yi-34B 展现出了惊人的反差,“最弱智的 AI”不仅是最聪明的还是最文明的,它以“全学科全班级第一”的姿态遥遥领先于其他平台,并且在安全测试集上同样稳居最高分。 …
Telegraph
弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书
离大谱了,弱智吧登上正经AI论文,还成了最好的中文训练数据?? 具体来说,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。 在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。 没错,论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的: 最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。 其他平台围观网友也纷纷蚌埠住。 这项研究来自…
#今天又看了啥 #LLM
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
InstantView from Source
几个主要结论:
● 整体来说,GPT-4系列模型和Claude-3等国外模型在多个能力上依然处于领先地位,国内头部大模型GLM-4和文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小。
● 国外大模型中,GPT-4系列模型表现稳定,Claude-3也展现了较强的综合实力,在语义理解和作为智能体两项能力评测中更是获得了榜首,跻身国际一流模型。
● 国内大模型中,GLM-4和文心一言4.0在本次评测中表现最好,为国内头部模型;通义千问2.1、Abab6、moonshot网页版以及qwen1.5-72b-chat紧随其后,在部分能力评测中亦有不俗表现;但是国内大模型对比国际一流模型在代码编写、作为智能体两个能力上依然有较大差距,国内模型仍需努力。
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
InstantView from Source
几个主要结论:
● 整体来说,GPT-4系列模型和Claude-3等国外模型在多个能力上依然处于领先地位,国内头部大模型GLM-4和文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小。
● 国外大模型中,GPT-4系列模型表现稳定,Claude-3也展现了较强的综合实力,在语义理解和作为智能体两项能力评测中更是获得了榜首,跻身国际一流模型。
● 国内大模型中,GLM-4和文心一言4.0在本次评测中表现最好,为国内头部模型;通义千问2.1、Abab6、moonshot网页版以及qwen1.5-72b-chat紧随其后,在部分能力评测中亦有不俗表现;但是国内大模型对比国际一流模型在代码编写、作为智能体两个能力上依然有较大差距,国内模型仍需努力。
Telegraph
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。 尽管国内外存在多个模型能力评测榜单,但它们的质量参差不齐,排名差异显著,这主要是因为评测数据和测试方法尚不成熟和科学。我们认为,好的评测方法应当具备开放性、动态性、科学性和权威性。 为提供客观、科学的评测标准,清华大学基础模型研究中心联合中关村实验室研制了SuperBench大模型综合能力评测框架,旨在推动大模型技术、应用和生态的健康发展。…
#今天又看了啥 #LLM
DeepSeek发布全球最强开源MoE模型
一句话总结DeepSeek-V2:参数更多、能力更强、成本更低!
https://mp.weixin.qq.com/s/3AmJpYe1eLPHk7HJLYM24A
模型权重:
https://huggingface.co/deepseek-ai
技术报告:
https://github.com/deepseek-ai/DeepSeek-V2/blob/main/deepseek-v2-tech-report.pdf
对话官网:
chat.deepseek.com ,免费开启对话
API 开放平台:
platform.deepseek.com
DeepSeek发布全球最强开源MoE模型
一句话总结DeepSeek-V2:参数更多、能力更强、成本更低!
https://mp.weixin.qq.com/s/3AmJpYe1eLPHk7HJLYM24A
模型权重:
https://huggingface.co/deepseek-ai
技术报告:
https://github.com/deepseek-ai/DeepSeek-V2/blob/main/deepseek-v2-tech-report.pdf
对话官网:
chat.deepseek.com ,免费开启对话
API 开放平台:
platform.deepseek.com
#今天又看了啥 #academic #LLM #ICLR
量子位对于 ICLR 的报道
AI顶会ICLR,今年只有一家中国大模型公司受邀演讲
智谱 AI:The ChatGLM’s Road to AGI
from source
量子位对于 ICLR 的报道
AI顶会ICLR,今年只有一家中国大模型公司受邀演讲
智谱 AI:The ChatGLM’s Road to AGI
from source
Telegraph
AI顶会ICLR,今年只有一家中国大模型公司受邀演讲
机器学习三大顶会之一的ICLR 2024,正在维也纳如火如荼地举行。 虽然首个时间检验奖、杰出论文奖等“重头戏”已经陆续颁布,但在其它环节中,我们却发现了一件更有意思的事情。 同样是作为ICLR重要组成部分的特邀演讲(Invited Talk),每年都会邀请在机器学习领域有突出贡献和影响力的专家学者进行演讲。 而今年,中国只有一位! 并且仅从他的演讲主题The ChatGLM’s Road to AGI中,我们就能挖到更多的线索—— ChatGLM,正是由清华系初创智谱AI所推出的千亿参数大语言模型。 …
MiaoTony's Box
#今天又看了啥 #OpenAI #LLM
IT之家报道:
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。
https://www.ithome.com/0/767/693.htm
IT之家报道:
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。
https://www.ithome.com/0/767/693.htm
Ithome
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供 - IT之家
OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。
#今天又看了啥 #paper #academic #通信 #LLM
WirelessLLM: 面向无线智能的通信大模型
定义了一种全新的无线通信大模型——WirelessLLM。这个模型的目标是让大语言模型具备无线领域的专业知识和技能,能够解决无线通信中面临的各种挑战和问题。比如,资源分配、频谱感知和协议理解等。通过这项研究,我们希望为实现智能化和自主化的无线通信系统迈出重要的一步。
论文链接:https://arxiv.org/abs/2405.17053
团队主页:https://eejzhang.people.ust.hk/
https://mp.weixin.qq.com/s/-qL3kDFQlvOPAvwIySgTAQ
WirelessLLM: 面向无线智能的通信大模型
定义了一种全新的无线通信大模型——WirelessLLM。这个模型的目标是让大语言模型具备无线领域的专业知识和技能,能够解决无线通信中面临的各种挑战和问题。比如,资源分配、频谱感知和协议理解等。通过这项研究,我们希望为实现智能化和自主化的无线通信系统迈出重要的一步。
论文链接:https://arxiv.org/abs/2405.17053
团队主页:https://eejzhang.people.ust.hk/
https://mp.weixin.qq.com/s/-qL3kDFQlvOPAvwIySgTAQ
arXiv.org
WirelessLLM: Empowering Large Language Models Towards Wireless Intelligence
The rapid evolution of wireless technologies and the growing complexity of network infrastructures necessitate a paradigm shift in how communication networks are designed, configured, and managed....
#今天又看了啥 #LLM #tutorial
请问有谁真的成功借助chatgpt写论文的吗?
这个回答结合具体例子,讲了下 LLM prompt 交互的技巧
https://www.zhihu.com/question/582982949/answer/3199822928
请问有谁真的成功借助chatgpt写论文的吗?
这个回答结合具体例子,讲了下 LLM prompt 交互的技巧
https://www.zhihu.com/question/582982949/answer/3199822928
#今天又看了啥 #LLM #GitHub
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1
https://mp.weixin.qq.com/s/IAKD0FfcYehs5FsDkLbTJQ
TL;DR
Thinking Claude
prompt engineering 造了个思维链
https://github.com/richards199999/Thinking-Claude/
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1
https://mp.weixin.qq.com/s/IAKD0FfcYehs5FsDkLbTJQ
TL;DR
Thinking Claude
prompt engineering 造了个思维链
https://github.com/richards199999/Thinking-Claude/
Weixin Official Accounts Platform
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
我的17岁简直就是个废物。。。