网络资源报
1.68K subscribers
874 photos
21 videos
25 files
542 links
分享互联网的新鲜事,分享互联网的技术资源
Download Telegram
米哈游最近与复旦NLP实验室合著了一篇86页的AI Agent论文,该论文从认知核心(推理,记忆,规划)、感知(文本,视觉,听觉)、行动(文本,工具使用,具身)、参与者(单智能体,多智能体,真人与智能体)和环境(虚拟沙盒,物理引擎)等方面做了一个很好的AI Agent概述。

如果“斯坦福小镇”这样的生成式Agent可以应用到《原神》或其他大型MMORPG游戏中,那无疑将带来令人难以预料的惊喜。但目前来看大规模部署Agent的成本和效率等关键难题还有待突破。

论文链接:https://arxiv.org/abs/2309.07864
🆔 网站名称: Pixian.AI

⭐️ 网站功能:图像背景去除

📁 网站简介:一款基于AI的图像背景去除工具。实测效果很好。免费版只能保证两百万的分辨率。

🌐 网站网址:点击打开
🆔 网站名称:获取OneDrive直链

⭐️ 网站功能:OneDrive直链获取

📁 网站简介:一款批量获取OneDrive直链的工具,方便在其他站点外链。

🌐 网站网址:点击打开
Umi-OCR #开源 #OCR

OCR 图片转文字识别软件,基于 PaddleOCR 完全可以离线使用,支持截屏、粘贴、批量导入图片,多国语言、合并段落、竖排文字等,可排除水印区域,提取干净的文本

https://github.com/hiroi-sora/Umi-OCR
这一波生成式AI浪潮在我的知识体系中,第一次看到的相对完整且偏行业(而非技术向)的梳理是去年9月红杉美国发的那篇:《Generative AI: A Creative New World》
这里https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/
当时红杉给出了很多观点以及画了好几张直到今天你依然可以在各种关于AI的演讲中会出现的偏行业Maps性质的图片(图1,图2);

然后时隔一年,红杉美国最近又发了这个文章系列的更新:《
Generative AI’s Act Two》
https://www.sequoiacap.com/article/generative-ai-act-two/

文章的内容质量还是很高的,我简单总结下:

1、定义了ACT 1是发现了新的“锤子”---基础模型,现在在向ACT 2(端到端的解决问题)演进;
2、重新画了行业地图(图3),并且按照2C\2B\2内容生产者的框架重新划分;
3、增加了LLM开发者生态的行业地图;(图4)
4、回溯了之前判断中的错误:发展速度比所有人预期的都快、瓶颈不是客户需求而是GPU、应用和底层模型并未分离、竞争的急速加剧、大家伙们并没有落下、壁垒在客户而不是数据;
5、当然也确定了之前一些推论是正确的:生成式AI是一件大事、杀手级应用出现(ChatGPT\Character AI\Midjourney)、开发者很关键、大模型能力持续进化、版权/道德/伦理问题;
6、从月留存和用户活跃(DAU/MAU)数据对比,现在的AI应用相较于古典web2的那些大家伙们还有比较大的差距,他们需要持续的“证明价值”,以度过“awkward teenage years.”;

以及英文不好的同学可以看译稿,这里:
https://mp.weixin.qq.com/s/e2bOOnRfuV36WylWLidLxw
(国内的自媒体生态啊,也是真的够卷的了……)
🆔 插件名称:KAYAK

⭐️ 插件功能:旅行助手

➡️ 支持平台:#ChatGPT

📁 插件简介:ChatGPT GPTs中的一款旅行助手。

主要功能
航班搜索和预订:找到从特定出发地到您想要目的地的航班信息。
酒店搜索和预订:在特定城市或地点附近找到住宿。
租车服务:在特定地点租车,需要提供取车地点、取车日期和时间、还车日期和时间等信息。
旅行规划:规划旅行,提供目的地建议,以及根据您的预算和时间安排找到合适的航班和住宿。
🆔 插件名称:Prompt Perfect

⭐️ 插件功能:提示词优化

➡️ 支持平台:#ChatGPT

📁 插件简介:ChatGPT里的提示词优化插件,可以将你的提示词改善并获取更完美的回答。在prompt前加上perfect即可。在提示词后要标注用中文回答,不然会自动以英文回答。

🌐 插件下载:在ChatGPT Plugins里安装