AI Digest Today - 效率工具箱📦
438 subscribers
32 photos
3 videos
2 files
36 links
个人知识管理,效率软件工作流分享,最新AI资讯(插件,新闻,使用案例)
#ToolForThought #DeepLearning #AI
讨论群: @aitoolkit
Download Telegram
🗳️ AI chrome extension

🌐 Sider - 最大化利用侧边栏

Sider.AI是一个Chrome扩展,提供多种AI驱动功能,让用户在浏览网页时可以选择任何文本执行诸如解释、总结、翻译或重写等操作。这一切都通过ChatGPT边栏完成。它集成了包括ChatGPT 3.5、GPT-4、Claude和Google Gemini等多种AI模型,直接在浏览器中使用。Sider还具有一个多任务边栏,可以并行使用多个网络标签页,以及一个群组聊天功能,实时比较多个AI的回应。此外,Sider Vision结合了图像识别和AI技术,允许用户与图像进行对话,用于提取文本、理解图像、识别语言、解决数学方程等。

2023年,Sider被谷歌评选为年度最受欢迎的12款Chrome扩展之一

相关链接:
[Sider AI](https://sider.ai/)
[Sider: ChatGPT Sidebar + Vision & GPT-4 Turbo - Microsoft Edge Addons](https://microsoftedge.microsoft.com/addons/detail/sider-chatgpt-sidebar-vi/ohapdchccmigcoicblllihpjlgphpjpk)
[Mastering Sider Vision: A Comprehensive User Guide - Sider](https://sider.ai/guides/sider-vision)

🏷️ #extension
🐟 @protoolkit
All about AI and Productivity.
🗳️ 限免AI Tool

🌐 Perplexity Pro

获取两个月免费的Perplexity Pro
[http://pplx.ai/holidays]或在接下来的 10 天内使用代码 HOLIDAYS23。

随便在知乎搜了下关于Perplexity AI的详细介绍: https://zhuanlan.zhihu.com/p/668071933

🏷️ #SearchEngine

🐟 @protoolkit
All about AI and Productivity.
🗳️ 效率工作流
🌐 定制学术研究的ChatGPT GPTs

文章介绍了如何利用OpenAI在2023年11月推出的自定义GPTs功能,为学术目的定制机器人。文章详细描述了创建过程,包括机器人的创建、上传专业知识、定义角色、指定研究问题、描述期望输出、测试和调整。这种机器人能够深入了解特定研究领域,并用学术语言回答问题,对提高学术研究效率很有帮助。

评论区会放出定义的instruction的英文原版与中文翻译👇

Related Links:
[如何为学术目的定制自己的ChatGPT机器人](https://effortlessacademic.com/tutorial-building-your-own-custom-chatgpt-for-academics/)

🏷️ #chatgpt #workflow #academic
🐟 @protoolkit
All about AI and Productivity.
🗳️ 探索RAG系统构建的独特视角
🌐 逆向思维:如何构建一个糟糕的RAG系统

在AI领域,构建高效的检索增强生成(RAG)系统至关重要。jxnl.github.io上的一篇文章《逆向思维:如何构建一个糟糕的RAG系统》以幽默的方式,探讨了构建RAG系统的常见错误。文章通过列举不推荐的策略,暗示逆向思维可能导向更有效的实践。这包括对数据延迟、中间结果展示、数据管理、用户界面定制、嵌入调优、查询分析及A/B测试的讨论。文章为构建成功的RAG系统提供了反思的角度。

Related Links:
[How to build a terrible RAG system](https://jxnl.github.io/blog/writing/2024/01/07/inverted-thinking-rag/)

🏷️ #RAG #Prompt
🐟 @protoolkit
All about AI and Productivity.
🗳️ 效率工作流
🌐 Tana任务时间追踪

tana官方创建了task time tracking模板,可以方便的为任务完成时间计时。可以追踪任务每天的花费时间以及自动计算总花费时间。

template : https://app.tana.inc/?bundle=QqCyxij1M5.Shs5e9K3QQRg

🏷️ #workflow #tana
🐟 @protoolkit
All about AI and Productivity.
Media is too big
VIEW IN TELEGRAM
🗳️ AI News
🌐 OpenAI发布新模型"Sora"

OpenAI今天宣布推出一种新型的文本到视频模型——Sora。这一创新模型能够创建长达60秒的视频,展现出高度详尽的场景、复杂的摄像机运动以及充满活力、情感丰富的角色。尽管Sora在模拟复杂场景的物理现象和理解特定因果关系方面可能遇到挑战——例如,在模拟人物咬饼干时未能显示出饼干的咬痕——它仍标志着AI技术在内容创作领域的一大步进。此外,该模型在处理空间细节(如区分左右)和描述随时间变化的事件(如遵循特定摄像机轨迹)时也可能面临困难。尽管存在这些限制,Sora的发布无疑为视频内容创造提供了新的可能性。

除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,准确地动画图像的内容并关注小细节。该模型还可以获取现有视频并对其进行扩展或填充缺失的帧。今天晚些时候OpenAI会发布科技论文介绍更多细节

所示视频的prompt:
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
一位时尚女性走在东京的街道上,街道上到处是温暖的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子,手拿黑色钱包。她戴着太阳镜,涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光,与五颜六色的灯光形成镜面效果。许多行人走来走去。

Related Links:
https://openai.com/sora

🏷️ #text2video
🐟 @protoolkit
All about AI and Productivity.
🗳️ AI News
🌐 Stability AI 发布 Stable Diffusion 3.0 内测申请

Stability AI邀请大家参与Stable Diffusion 3.0的早期预览,以探索模型的能力并提供宝贵的反馈。此预览阶段对于收集改进性能和安全性的见解至关重要,以便开放发布之前做好充分准备。被选中参与预览的人将通过电子邮件收到邀请,并获得加入Discord服务器的权限。

Related Links:
[Stability AI Stable Diffusion 3.0内测申请](https://stability.ai/stablediffusion3)

🏷️ #StableDiffusion
🐟 @protoolkit
All about AI and Productivity.
🗳️ AI Resource
🌐 通往AGI 之路 - 飞书文档

全面系统的AI学习路径,包含关于AGI的各种优秀资源。十分值得学习(or进收藏夹吃灰😌

Related Links:
waytoagi

🏷️ #AIresources
🐟 @protoolkit
All about AI and Productivity.
🗳️ OpenAI 春季更新发布会全面解析
🌐 The future is Coming!!!!!🤯

OpenAI 在今天刚刚的春季更新发布会中推出了一系列创新功能和服务,进一步巩固了其在人工智能领域的领导地位。发布的亮点包括桌面应用与网页界面的全面更新,以及对 GPT-4o 的广泛改进,特别强调了跨语音、文本和视觉的综合理解能力。

桌面应用和网页界面更新
- GPT-4o 将为所有用户提供免费访问,付费用户则享有五倍的使用容量。

GPT-4o 实时研究演示
展示了其在实时语音响应和视觉反馈上的进步。
- 语音部分,GPT-4o 能够进行实时且带有情感的响应【观看演示】(https://youtu.be/DQacCB9tDaw?t=4318)。这下翻译是真的要失业了....😶‍🌫️
- 视觉方面,桌面应用能实时解析屏幕内容,协助用户解决数学方程、讨论编程问题或进行自拍讨论【观看演示】(https://youtu.be/DQacCB9tDaw?t=4402)。

GPT-4o API
- 相较于 GPT-4 Turbo,GPT-4o 的 API 速度提高了两倍,价格降低了 50%,并且使用限制提高了五倍。

Related Links:
OpenAI spring update

🏷️ #OpenAI #GPT4o
🐟 @protoolkit
All about AI and Productivity.
🗳️ AI Resource
🌐 Ilya Sutskever 推荐的40篇AI 文章

推上有博主整理了其中20篇文章的思维导图

Related Links:

https://x.com/marcosgorgojo/status/1788535395740762186?s=46

🏷️ #AIresources #paper
🐟 @protoolkit
All about AI and Productivity.
🗳️ AI News最强大模型又卷出新人
🌐 Claude 3.5 Sonnet:Anthropic 最新的 AI 模型
Anthropic近期发布了Claude 3.5 Sonnet,这是一款在多个基准测试中表现优异的AI模型。相比之前的版本,Claude 3.5 Sonnet在编码、多步骤工作流程、图表解读和文本提取等领域表现出显著提升。
Claude 3.5 Sonnet具备以下主要特点:
- 高效的数据处理能力:该模型能够快速处理和检索大量知识,适合企业级任务。
- 图像输入功能:支持从图像中提取文本和信息,使其在处理文档、图表和技术图示方面具有优势。- 长上下文窗口:能够处理多达200,000个tokens的上下文输入,为复杂任务提供更强大的支持。
- 较高的性价比:与其他同类智能模型相比,Claude 3.5 Sonnet提供了更高的性能和更快的响应速度,且成本更低。

访问方式
你可以通过以下几种方式访问Claude 3.5 Sonnet:
1. Claude.ai:创建Anthropic账户并登录Claude.ai界面。2. TextCortex:通过TextCortex平台使用Claude 3.5 Sonnet模型。
3. API接口:使用Anthropic提供的API接口。4. Anthropic工作台:通过API密钥访问。

价格
Claude 3.5 Sonnet的价格如下:
- 输入tokens:每百万tokens收费$3.00
- 输出tokens:每百万tokens收费$15.00

与其他模型的比较
https://pbs.twimg.com/media/GQhW2Y6WgAABTGV?format=png&name=4096x4096
Sonnet 现在在关键评估方面优于竞争对手模型,其速度是 Claude 3 Opus 的两倍,而成本却是 Claude 3 Opus 的五分之一。

交互能力
Artifacts 是 Anthropic 的一项令人惊叹的新功能。 使用 Claude 3.5 Sonnet,您可以生成工件(例如,代码片段、文本文档或网站设计)并在同一窗口中对其进行迭代。
推上有人使用sonnet制作神经网路的动画视频: link

相关链接:
- Anthropic官方网站:https://www.anthropic.com
- https://claude.ai/

注:本介绍基于公开信息整理,具体功能和价格可能会随时间变化,建议以Anthropic官方最新公布的信息为准。
🏷️ #llm
🐟 @protoolkit
All about AI and Productivity.
🗳️ LLM101n: 从零开始实现大型语言模型
🌐 Karpathy 开发的LLM教程

LLM101n是Andrej Karpathy开发的一套从零开始实现大型语言模型(LLM)的教程和代码库。在本课程中,我们将构建一个 Storyteller AI 大语言模型 (LLM)。携手并进,您将能够使用 AI 创建、完善和阐释小故事。我们将使用 Python、C 和 CUDA 从头开始​​,以最少的计算机科学先决条件构建从基础知识到类似于 ChatGPT 的功能性 Web 应用程序的端到端的一切。最后,您应该对 AI、LLMs 和更广泛的深度学习有相对深入的了解。


Syllabus:
Chapter 01 Bigram Language Model (language modeling)
Chapter 02 Micrograd (machine learning, backpropagation)
Chapter 03 N-gram model (multi-layer perceptron, matmul, gelu)
Chapter 04 Attention (attention, softmax, positional encoder)
Chapter 05 Transformer (transformer, residual, layernorm, GPT-2)
Chapter 06 Tokenization (minBPE, byte pair encoding)
Chapter 07 Optimization (initialization, optimization, AdamW)
Chapter 08 Need for Speed I: Device (device, CPU, GPU, ...)
Chapter 09 Need for Speed II: Precision (mixed precision training, fp16, bf16, fp8, ...)
Chapter 10 Need for Speed III: Distributed (distributed optimization, DDP, ZeRO)
Chapter 11 Datasets (datasets, data loading, synthetic data generation)
Chapter 12 Inference I: kv-cache (kv-cache)
Chapter 13 Inference II: Quantization (quantization)
Chapter 14 Finetuning I: SFT (supervised finetuning SFT, PEFT, LoRA, chat)
Chapter 15 Finetuning II: RL (reinforcement learning, RLHF, PPO, DPO)
Chapter 16 Deployment (API, web app)
Chapter 17 Multimodal (VQVAE, diffusion transformer)

Further topics to work into the progression above:
Programming languages: Assembly, C, Python
Data types: Integer, Float, String (ASCII, Unicode, UTF-8)
Tensor: shapes, views, strides, contiguous, ...
Deep Learning frameowrks: PyTorch, JAX
Neural Net Architecture: GPT (1,2,3,4), Llama (RoPE, RMSNorm, GQA), MoE, ...
Multimodal: Images, Audio, Video, VQVAE, VQGAN, diffusion

🔥Karpathy昨天刚上传的github repo,内容尚未更新,可以先收藏下来!!!

Related Links:
- LLM101n GitHub仓库

🏷️ #course
🐟 @protoolkit
All about AI and Productivity.
🗳️ AI工具的墓地
🌐 曾经辉煌,如今谢幕

在AI领域,有许多工具和服务曾经风靡一时,如今却被遗弃。这个页面列出了这些已经停用或不再维护的AI项目,如Neeva、Airgram、Drayk.it等。每个工具都曾经在某一领域内有所创新,但由于各种原因,如技术局限、市场需求变动等,最终被放弃。

甲子光年对该网站的AI项目进行了总结和分析,并试图找到其失败原因。738 个人工智能项目因各种原因而夭折,如缺乏用户采用和商业模式不可持续。一些项目由于专注于会员销售或有限的收入流而失败,而成功的人工智能初创企业则找到了大型科技公司无法服务的利基市场。为了避免失败,人工智能公司应优先考虑市场适应性而不是技术进步,并寻求可持续的商业模式。

Related Links:
AI Graveyard - List of Dead AI Tools & Services

AI墓地,和738个死去的AI项目|甲子光年

🏷️ #创业
🐟 @protoolkit
All about AI and Productivity.
原来Karpathy的 LLM101n 是为了自己的AI教育公司做准备,就在刚刚,他官宣了自己的AI +Education company - Eureka Labs

公司官方推特的背景图显然AI生成,人脸都奇形怪状的🤣
🗳️ 9.11和9谁大?
🌐 绝大多数大模型错误回答

绝大部分大语言模型无法正确回答9.11和9谁大。然而,有两种提示方法可以有效解决这个问题:

1. 借用外部工具:通过让模型调用外部计算工具或API来精确进行数值比较。这样可以确保答案的准确性。
(因为这个问题很简单不涉及复杂运算,所以在题目后面加一句:“借用外部工具”,gpt 4o便会使用python比较两数大小,正确回答。)

2. 借用emoji输入数字:利用emoji的独特编码特性,将数字转化为特定的emoji符号,让模型更好地区分和处理这些符号代表的数值。
(在推上学到的很有意思的小技巧,猜测可能与tokenizer有关)

🏷️ #prompt
🐟 @protoolkit
All about AI and Productivity.
🗳️ GPT-4o Mini:OpenAI加入大模型拼多多价格大战
🌐 OpenAI发布新模型GPT-4o Mini

OpenAI推出了其最具成本效益的小型模型GPT-4o Mini。这一新模型在性能上优于GPT-3.5 Turbo,尤其在数学、编码和多模态推理方面表现突出,价格也更加低廉。GPT-4o Mini支持文本和视觉输入,未来将扩展到视频和音频输入输出。

它的定价为每百万个输入代币 15 美分,每百万个输出代币 60 美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。

Related Links:
[OpenAI GPT-4o Mini](https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/)

🏷️ #llm
🐟 @protoolkit
All about AI and Productivity.
🗳️ Arc浏览器:Copy Link to Highlight
🌐 精准分享网页内容

刚刚发现Arc 浏览器有一个非常实用的功能——Copy Link to Highlight。这个功能允许用户选择网页上的任意一段文字,并生成对应到这段文字的URL链接,方便用户分享精确内容。

要使用这个功能,只需按以下步骤操作:
1. 打开网页。(对某些网页可能不适用)
2. 用光标选中需要分享的文本。
3. 右键单击选择“Copy Link to Highlight”。
4. 生成的链接可以直接粘贴到邮件、信息、社交媒体等,并且接收者点击链接后,会自动跳转并高亮显示选中的文本。

此功能不仅提高了分享的精准度,还能增强交流的效果,使分享的内容更加明确和直接。

Related Links:
How to Share Quotes in Arc Browser

🏷️ #Browser #Productivity
🐟 @protoolkit
All about AI and Productivity.
🗳️ Keyboard Maestro
🌐 一键获得选中文字+选中文字位置url的markdown link

上面有提到arc跳转highlight url的功能, 进一步我用keyboard maestro制作了一个简单的脚本.

如何使用:
‼️在arc浏览器中鼠标选中一段文字,调用该macro,即可得到选中文字形式的Markdown url。
点开直接跳转到选中文本位置

如何快速调用macro:
方法1. 给该macro设置快捷键
方法2. (推荐) 找到你keyboard maestro自带的名为Trigger Macro by Name的macro,设置快捷键(比如: option+command+enter)。屏幕跳出面板可以直接输入该macro的名字,选中回车即可使用。当你macro太多记不住快捷键的时候很好用!

🔆 文件放在评论区, 可自行下载

🏷️ #KeyboardMaestro #Productivity #script
🐟 @protoolkit
All about AI and Productivity.