DPS Build
720 subscribers
120 photos
3 videos
10 files
462 links
AI, coding, data science and startups
Download Telegram
OpenAI 刚刚发布了 GPT-4,以下四张图表说明了它的大幅提升:

1. GPT-4 模拟参与了各类考试,比如 LSAT 之类的律师执照考试,得到了 88 percentile 的高分,SAT 阅读写作得到了 93 percentile 的高分,GRE 词汇得了 99 percentile 的高分

2. 在各类公认的 NLP 测试上,GPT-4 也有着优良表现

3. 除了在英语数据上有着巨大提升 (MMLU 的测试中,GPT-4 从 GPT-3 的 70.1% 提高到了 85.5%),在其他语言上也有极大进步,比如中文到了 80.1%,阿语到了 80%

4. 作为多模态的模型, GPT-4 在图像/视频类的测试上也有不错的表现

https://openai.com/research/gpt-4
1
除了 GPT-4,昨天还有其他公司发布了 AI 产品

https://twitter.com/nathanbenaich/status/1635708064555847681
GPT-4 早在去年八月就完成了训练,后面的这半年都是在做测试等工作。按照这个时间线,GPT-5 也快了。

https://twitter.com/abacaj/status/1635837820270002178
🙉4
DPS Build
这几天在看如何用自己的语料库结合 ChatGPT API 来使用,目前找到两个方案: 1. 利用最新的 gpt-turbo-3.5 模型:先建立 doc embedding,然后利用 query embedding,通过文本相似度从 doc embddding 中找到和 query embedding 最接近的数据,然后讲这些数据作为 context 填写在 prompt 里一起发起请求; 2. 利用之前的 davinci / ada 模型:先建立 doc embedding,然后将这一 embedding…
第一个方案已经写完了,结果很迷。有的时候答案非常棒,有的时候完全找不到北。

目前可能的优化空间:

1. 把计算相似度的算法调整,默认是 cosine;
2. 把文本数据进一步清洗,尽可能去除噪音数据;
3. 调整 embedding 的 chunk 的大小
4. 准备更多高质量的文本数据。
HackerNews 这么大的网站,登陆系统运行在单核上。所以过早优化毫无必要。

https://twitter.com/npew/status/1635743304209043462
Forwarded from AI News
Midjourney v5 正式发布

图:左边V4, 右边V5

🎏 主要特性:

-更丰富的风格
-更高质量的图像(2倍分辨率增加)
-动态范围改善
-图像细节更丰富更准确
-改进了图像提示性能,prompt优化
-支持无缝平铺
-支持大于 2:1 的纵横比 --ar (实验)
👍31
看了一下微软的发布会,基本上就是用 ChatGPT 来整合用户的数据,从而帮助用户提高生产力。

https://news.microsoft.com/reinventing-productivity/
1
一图看懂 Adobe 在 2023Q1 的业绩

https://twitter.com/economyapp/status/1636462312096927744