AI探索指南
30K subscribers
11.1K photos
1.15K videos
539 files
4.5K links
关于DeepSeek、ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
Download Telegram
Runway 刚也发布了文字生成视频的模型 —— Gen-2 (对,Gen-1 的内测还没拿到,2 就来了...)

功能没什么好讲的,就是文字生成视频。宣传视频中同时提到风格化模型 Gen-1 也进行了优化。

项目地址:https://research.runwayml.com/gen2
论文地址:https://arxiv.org/abs/2302.03011

从生成结果来看,个人觉得 Gen-1 的可玩性高于 Gen-2,毕竟对现有的视频风格化肯定比无中生有更稳定。

最后再补一下 Gen-1 的介绍和内测申请:http://t.cn/A6Cu1cdy

Invalid media: video
文心一言确实是懂谐音梗的。
最近一直在被问到类似于「OpenGPT」和「AI帮个忙」这样的工具到底是不是多此一举,之前也有很多用户或者朋友会好奇产品的价值。
直到这个周末完全放松下来,我有时间完整地去思考这个问题,有了些许明确的想法,想跟大家分享一下我的答案:

我觉得「AI帮个忙」之于现有的ChatGPT和「文心一言」这类LLMs(大型语言模型),就像滤镜软件之于相机📷

不是每个人都能拥有徕卡、Fuji,也不是每个人都懂完美的调色、裁切,一款优秀的滤镜产品就可以更便捷地表达出照片想传达的信息和情绪。亦然,「AI帮个忙」就像是给文字加滤镜的工具,避免了反复的调参折腾,避免了因为长长的步骤而影响了获得一个好作品的机会,把魔法藏在文本框的背面,滤去繁琐重复,滤出aha moment。

之前提到过make something people want,而在思考「AI帮个忙」是不是符合这个标准时,我没有很准确的答案,但我想到的是另一个比喻:下象棋——你需要不断地获得小小的成功,虽然有时候会走一步臭棋,有时候会被吃掉很重要的棋子,但只有一直向着最终到胜利努力,你才能赢下这盘棋(当然你也可以说是「日拱一卒」,但我觉得那些错缪对我来说反而更加有帮助)。

就像在拍照时,懂得摄影技巧和后期操作的专业玩家往往能得到90分的作品,但帮助更多人把照片从45分快速优化到65分,也许就是像「AI帮个忙」这类产品的价值所在吧。
AI女友练成了!
👍6
我接到一个电话说话很正经
我说你是真人还是机器人
他说哦呵呵 可能是我的说话方式让您误会了
继续说说说
我还不死心 又问那你是真人还是机器人
他竟然回答:被您猜到了,我是xx智能语音助理
🥶
他开始还不承认他是机器人🤖️
🤔31👍1
OpenAI 等机构上周发布论文,研究 GPT 这类大语言模型对劳动力市场的潜在影响。

个人笔记💡
研究方法上,文章主要衡量某个具体工作任务对 GPT 的「暴露」程度(exposure)。

「暴露」指利用 GPT 和延伸技术,可以把完成一个具体任务的时间缩短 50% 以上。需留意,「暴露」不意味着这些任务能被GPT独立完成,研究时也没区分“劳动替代 / 劳动增强”,所以数据不能完全对应「人类被 GPT 抢工作而下岗」。

文章初步结论💡
1)约 19% 的工作者,将面临 50%+ 的具体工作任务暴露于 GPT;约 80% 的工作者,将面临 10%+ 的任务暴露于 GPT;各职业中位数暴露程度为 15% 。

2)高收入、高门槛、需要高学历的工作,对 GPT 暴露程度更高。

3)如果任务需要编程、写作,暴露程度会更高;
如果任务高度依赖于科学素养和批判性思维,暴露程度会更低。
(简而言之,作者做研究的暴露程度低,我写这篇笔记的暴露程度高👻

4)行业维度,数据处理、信息处理和医院相关行业暴露程度高。

5)哪些职业 100% 的工作任务暴露于 GPT?
人类专家认为包括税务人员、金融量化分析师、写作者、UI设计师、数学家(?)等 15 种职业;
GPT 认为包括会计师和审计师、记者和新闻工作者、法律秘书和行政助理等 86 种职业。

文章认为,GPT 与印刷术、蒸汽机类似,属于通用技术(general-purpose technologies)。通用技术特点是扩散广、不断改进、激发新的创新,对经济、社会和政策影响显著。要实现通用技术的全部潜力,需要各界广泛参与、共同发明。

一言以蔽之:挑战与机遇并存(你够了

论文链接:https://arxiv.org/abs/2303.10130
🥱31
无意发现一个可以免费用GPT-4的小技巧🤖

早上,重看GPT-4论文的时候,我发现了一个无需注册和购买ChatGPTplus,就能免费使用GPT-4的小技巧(你值得拥有)🤯

就是很火的ChatPDF辅助阅读工具: www.chatpdf.com

🦾操作很简单:
1.打开 www.chatpdf.com
2.上传一个PDF(注意不要上传隐私内容)
3.先跟ChatGPT聊聊PDF的内容(预热下)
4.向它提问PDF以外的话题,并引导它回答(有点不讲武德)
5.保持聊天页面在线(最好不要关闭,因为该工具免费版一天只能上传3个PDF)

🤏🏻不过也有局限:
—免费版每天只能问50个问题,如果不是常用的话,应该够用了,需要省点。
—付费版本:每天可以问1000个问题,对于常用者应该也够用了,且每个月才5美元,也挺优惠的。

可以试试看,速度还不受影响☄️
👍3
ChatHub v1.5.3 已更新到Chrome Web Store,在最近的版本中更新了这些功能:

- Prompt Library:自定义常用prompt,或使用社区共享的prompt
- 支持GPT-4模型
- 复制聊天消息、复制代码
- 修复国内访问new Bing接口404的问题

正在开发中:历史聊天记录

ChatHub是一个chatbot聚合客户端,目前支持ChatGPT和new Bing
安装地址:https://chathub.gg
代码开源:https://github.com/chathub-dev/chathub
下午把控制机器人(硬件)的API给GPT-4,让它写一段控制机器人的脚本,没想到它写的代码真的能让机器人动起来。
但愿AI不会产生自主意识。
浅玩了下midjourney 🌝
1
This media is not supported in your browser
VIEW IN TELEGRAM
突发:New Bing 直接出图了?!

🌊对话式AI 引发的交互革命,如海啸前的退潮,悄无声息就来了。

🗞️以下来自官方信息:

https://blogs.microsoft.com/blog/2023/03/21/create-images-with-your-words-bing-image-creator-comes-to-the-new-bing/

微软推出 Bing Image Creator、Stories、Knowledge Cards 2.0:
- Image Creator 根据描述生成图像
- 故事呈现搜索主题的图像和视频
- 知识卡 2.0 提供交互式事实和信息。

New Bing和Edge预览版带来必应图片制作工具、新的人工智能驱动的视觉故事和更新的知识卡片。由OpenAI的提供的DALL∙E模型的高级版本提供支持,Bing Image Creator允许你仅仅通过使用你自己的语言来描述你想看到的图片来创建一个图像。现在你可以在一个地方,从聊天中生成书面和视觉内容。

对于那些在Bing预览中的人来说,Bing Image Creator将被完全整合到Bing聊天体验中,最初在创意模式下推出。通过输入图片描述,提供额外的背景,如地点或活动,并选择一种艺术风格,Image Creator将根据你自己的想象力生成一张图片。

此外, 支持更多视觉搜索体验,我们还向Bing用户提供了故事和知识卡2.0。

故事提供了一种更有吸引力的搜索和与内容互动的方式,提供图片和短视频。知识卡片2.0也是今天向必应用户提供的新内容,它是一种由AI驱动的信息图激发的体验,提供有趣的事实和关键信息,让人一目了然。它已被更新,包括互动的动态内容,如图表、图形、时间线、视觉故事和更多。 我们的目标是在Bing和Edge中提供更多的沉浸式体验,使寻找答案和探索网络更加有趣、有用和好玩。
试了一款新的文档ChatDOC:
chatdoc.com
支持上传PDF,针对全文或选择部分内容,直接向PDF提问/对话,快速获得想要的信息。
相比之前已经比较火的 ChatPDF 还有两个很实用的功能:
1. 所有回答均可以溯源到原文片段,就像 New Bing 一样,避免胡说八道嫌疑
2. 可以鼠标选中表格/文本内容进行针对性提问

另外虽然界面是英文的,但其实中文支持和英文支持都不错