YuTalk
188 subscribers
24 photos
1 video
1 file
77 links
这是 @yym68686 的个人频道 科技/日常
Blog: https://yym68686.top
email: yym68686@outlook.com
Download Telegram
哈哈🤣,绝了。等GPT-4V API 出来我第一时间适配。
被Zeabur创始人加星了。😱💦
#推荐 #pplx

pplx 10月份送了两个月会员,今天又开始送两个月会员了
🎉

过去两个月自己用下来确实是不错的,免费使用gpt4,Claude2.1等,还可以联网搜索🔍,太香了。

接下来十天
访问链接http://pplx.ai/holidays 或者输入优惠码HOLIDAYS23 领取会员
#文章 #Blog

基于 Transformer 的生成模型可能是未来一个重要的研究方向。目前 MAGViTv2 已经证明比 Diffusion 性能还要好。本篇文章主要讲解了视觉分词器的历史,还有 MAGViTv2 模型一些改进细节。

https://yym68686.top/post/MAGVITv2/
#文章 #Blog #转发

渐入佳境:斜杠程序员的数字游民转型之旅

这篇博客讲述了张小吉,一位斜杠程序员,如何在被裁员后开始自己的数字游民转型之旅,并最终成功创建了三个可以带来持续睡后收入的小产品。在这个过程中,他经历了从最初的焦虑和迷茫,到逐渐找到方向并坚持下来的心路历程。他分享了自己的经验和学习到的教训,希望能够给那些正在探索副业或数字游民之路的人一些启发。

张小吉的三个产品分别是:

1. Table To Figma:一个将表格数据应用到设计稿的Figma插件,帮助用户快速批量作图。通过一年的打磨,现在能获得月均100美元的收入。

2. Fit Curve:一个帮助设计师更方便地画出平滑曲线的工具,开发花了一周时间,现在能获得月均10+美元的收入。

3. 吉光卡片:一个让分享的内容更具设计感的App,开发花了小半年时间,上线当天就获得了70+美元的收入。

在分享自己的成功经验的同时,张小吉也总结了五条锦囊妙计,包括提前设计好商业模式、为需求而非直觉开发、边开发边经营(build in public)、顺势而为以及行动力的重要性。通过这些经验分享,张小吉希望能够帮助其他创业者或者想要转型的人避免走弯路,更快地实现自己的目标。

此外,张小吉强调了营销的重要性,指出现在即使产品再好,没有足够的曝光和用户基础也很难成功。他通过自己的经历表明,创业不仅仅是产品开发,还包括市场营销、用户交流和品牌建设等多个方面的工作。

最后,张小吉鼓励大家进行自我评估,找到适合自己的发展路径,并且勇敢地去尝试和实践,即使面对失败也要从中学习和成长。

https://www.bmms.me/blog/slash-programmer-digital-nomad-transition
#开源

第一次收到台湾网友100美元的开源赞助。此前也收到过 Zeabur 25 美元的赞助。总之感谢大家的认可。🥰

这个项目已经很成熟了。还没尝试过的快来试试吧:https://github.com/yym68686/ChatGPT-Telegram-Bot

后面打算在readme放上收款码吧。顺便开通一下GitHub Sponsor。
#sideproject #DeepLX

写了一个带有负载均衡的免费Deeplx翻译docker服务。自动挑选可以使用的Deeplx节点。可以满足沉浸式翻译的高并发需求。虽然Deeplx翻译质量上不如gpt-3.5,但是一些简单的翻译任务完全可以胜任。

https://github.com/yym68686/DeepLX

不过发现虽然进行了两阶段构建,python服务的docker镜像体积还是太大了,后面有时间用go重构一下。
#sideproject #ModelMerge

把聊天机器人的大语言模型请求后端重构了一下封装成了独立的 python 包:ModelMerge。支持gpt4, gpt3.5 ,claude3, Claude2,Gemini1.5 pro,dalle3,groq 等模型。支持gpt格式的function call,内置了google搜索,URL总结以及多模态(图片、文档)问答。

快速上手:


from modelmerge.models import chatgpt
bot = chatgpt(api_key="{API}", engine="gpt-4-turbo-2024-04-09")
for text in bot.ask_stream("python list use"):
print(text, end="")


https://github.com/yym68686/ModelMerge
#issue #bug

(已修复)观测到上游python包构建依赖importlib_metadata刚刚更新的新版本(8.0.0)出现bug。GitHub action现在所有的python包都无法自动构建成功。issue

建议修改GitHub action回退importlib_metadata版本到7.2.1:


...
- name: Install dependencies
run: |
python -m pip install --upgrade pip
pip install setuptools wheel twine
+ pip install importlib_metadata==7.2.1
- name: Build and publish
...
#SideProject #UniAPI

如果你不想使用 one/new-api 前端页面来管理自己多个API,可以试试我写的 uni-api。uni-api 使用纯配置文件的方式管理 API。支持轮训,高并发。

这是一个统一管理大模型API的项目,可以通过一个统一的API接口调用多个后端服务,统一转换为 OpenAI 格式,支持负载均衡。目前支持的后端服务有:OpenAI、Anthropic、DeepBricks、OpenRouter、Gemini等。

有 bug 可以联系我☺️。项目地址: https://github.com/yym68686/uni-api
1
#doLinuxRadar #SideProject #Linuxdo

新搓了一个Linuxdo网站监控机器人。提高你白嫖的手速,自动推送感兴趣的话题。

项目地址:GitHub - yym68686/doLinuxRadar: Linuxdo Radar

telegram 机器人体验地址: @doLinuxRadarBot

使用方法:

通过关键词匹配 linux.do 话题标题。匹配上就推送给你。比如你对白嫖 免费比较感兴趣。就发送:/tags 免费 白嫖 给机器人。机器人会每30秒检测最新的帖子。要是有你感兴趣的话题就直接推送消息给你。/tags 命令支持正则表达式。

机器人其他命令:

• /tags: 设置监控关键词(空格隔开), 例如: /tags 免费 linux
• /set: 设置嗅探间隔(秒), 例如: /set 60
• /unset: 取消或者打开消息推送, 例如: /unset
• /start: linux.do 风向标使用简介, 例如: /start
1
#Markdown #i18n #SideProject

写了个脚本来帮我更新双语README文档,否则每次更新都要同时维护两份或者多种语言的文档实在过于痛苦了。我希望可以用自己的母语写文档,并能同时翻译到任何语言,并且保持文档格式不变。

Markdown-i18n 解决了这些痛点:1. 完美遵循原文件的格式。2. 同时保证翻译地道、准确。3. 高效翻译。

https://github.com/yym68686/Markdown-i18n
🥰4
#开源

做开源快两年今天终于挣到总数 1000 个 star了。感触就是:

1. 两年前我可能无法想象这是什么水平,现在我也可以说不过如此。但依然无法想象 10000 🌟到底是什么水平😭

2. 在项目刚起步的时候,除了写的软件确实好用以外,还需要学会自己会把东西宣传出去,不然等着GitHub自然流量几乎不会有人发现。后期星星多了以后,随着项目在GitHub搜索排名里面的上升,才会有自然流量。

3. 在项目早期,我使用过三个比较适合宣传的地方:telegram频道、X大v和Linux.do 论坛。很多tg频道都很愿意接受投稿,喜欢折腾的人也比较多。被X大v转发这种机会可遇不可求,有过两次被5万粉的博主主动发推帮我宣传的机会,保底能涨 50 个🌟。L站是今年刚创建的论坛,用户基本都是鉴模师(每次发新LLM都会出来测评的一群人),发项目基本也会被关注到。

4. 星星数不能线性代表项目的水平,但是能反映作者本人的影响力或者说营销水平。500星的项目跟3000🌟的项目水平差不多,甚至会更好。差距就是别人会有更好的宣传渠道,比如Reddit,至今Reddit没玩明白,发帖子会被删帖😭

5. 你要问我怎么开始自己的第一个项目,那就是从日常生活入手,如果你觉得哪个步骤能自动化解决,那大概率这个世界上有一群人跟你有相同的需求。而且现在利用cursor这样的代码生成IDE,半个小时就能从零构建完整的项目,效率提升99%,你唯一要做的就是自然语言描述需求。

6. 开源可以获得:被人认可的爽感、提高代码能力、微薄的赞助收入、一些志同道合的朋友。只有真的喜欢写代码的人才会做开源。
Please open Telegram to view this post
VIEW IN TELEGRAM
13🥰1
#Cerebr #sideproject

项目地址,欢迎 star 或者提出改进意见👏

https://github.com/yym68686/Cerebr

我试了市面上的侧边栏插件都不太满意,于是自己写了一个。集中开发了两个月,目前应该算是功能稳定了。已经上架 chrome 商店,目前快 300 个用户了。

写了一个 chrome 浏览器插件:Cerebr(/ˈsɛrɪbr/)。使用过 HARPA 发现真的很好用,但是免费对话次数只有 50 次,即使自定义自己的 api 也只有 50 次。又下载了 sider,打开就是一股浓烈的国产软件味儿,各种广告和花里胡哨的界面,遂卸载之。

很遗憾市场上没有找到我喜欢的侧边栏产品,有时候浏览网页想问点东西确实是我的刚需。perplexity 也挺好用的,但是用久了发现我甚至连切换 tab 都懒的切换。所以我还是打算可以自己写一个。于是就诞生了 Cerebr。

"Cerebr" 是一个源自拉丁语的词根,主要与"大脑"或"脑"相关。这个词根出现在许多与大脑或思维相关的词汇中,我希望整合 Claude,OpenAI 等 AI 的强大能力,Cerebr 就像是您的第二大脑,为您提供深度阅读和理解支持。

主要特性:

• 使用一套代码实现了多端应用。侧边栏:在浏览器中打开的任意标签页中,通过快捷键(默认 Windows: Alt+Z / Mac: Ctrl+Z)唤出侧边栏。

• 支持自部署为网页使用,支持部署在 Cloudflare Pages,GitHub Pages,vercel 上。无需安装,通过任何浏览器访问,随时随地打开自己专属的网页对话。

• 支持 mac 桌面应用。支持 PWA 安装。

• 配置同步:支持跨浏览器的 API 配置同步,轻松在不同设备间共享设置。

• 多 API 支持:支持多个 API 配置,并根据不同的 API 配置生成不同的 AI 助手。

• 支持对网页内容 和 PDF 问答:可以在侧边栏中开启对网页内容的问答,自动识别网页是 PDF 文件自动下载解析并对 pdf 内容进行问答,支持本地 pdf 文件问答。pdf 功能非常有用,我每天浏览 Arxiv,基本上 Cerebr 已经变成我的论文伴侣。

• 支持图片问答,支持直接将图片粘贴到输入框,拖动网页图片、拖动桌面图片到 Cerebr。

• 支持 markdown 渲染,支持 Latex 公式显示。花大量时间专门优化了数学公式渲染,化学方程式渲染,因为我经常读论文,需要理解各种数学原理。

• 快捷操作:支持快捷键清空聊天(Windows: Alt+X / Mac: `Ctrl+X`)、输入框向上键快速补全为最新的提问。

• 支持流式输出。

• 支持浅色模式和深色模式主题切换。

chrome 商店直接安装,快 300 个用户了:

https://chromewebstore.google.com/detail/cerebr/kjojanemcpiamhohkcpcddpkbnciojkj
👍5
#2024年度回顾 #uniapi #LinuxDO

今年uni-api这个开源项目上了linuxdo“开发调优”板块的年度《最佳话题》的榜单,同时获得「最多阅读」和「最多回复」。累计被人阅读了311小时。一共获得647条回复。希望2025年能持续扩大影响力。😍
🔥5
#web3 #Hackathon

今年 ETH Hangzhou Hackathon 报名还有两天截止,感兴趣的可以报个名。去年还没听说过,今年去玩玩。😂

报名链接:https://www.ethhangzhou.xyz/
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1
#AI #深度学习 #CTM #人工智能 #前沿科技 #机器思考

解构 CTM:神经同步驱动的 AI 思考新范式

本文将深度剖析 Continuous Thought Machine (CTM) 项目,该项目致力于构建一种新型人工智能模型,使其能够进行内在的、持续的“思考”过程,以期更接近生物智能的本质。文章将详细阐述 CTM 的整体架构、两大核心创新机制——神经元级的时间处理与作为核心潜在表征的神经同步,并分析其在图像分类、2D 迷宫导航、算法学习以及综合认知问答等多样化任务中的应用表现与内在机理。若您对人工智能前沿研究,特别是机器如何实现复杂推理与自适应计算的机制感兴趣,本文将提供有价值的见解与讨论。详情请阅全文。

https://yym68686.top/#ai/ctm.md
🔥2
#RPA #技术解析

告别重复,拥抱自动化 - workflow-use 为你而来

前几天 browser-use 发了一个项目 workflow-use,还挺感兴趣的。本文主要深入剖析了 workflow-use 技术架构,这是一款通过录制用户行为并结合大型语言模型(LLM)智能构建自动化流程的创新工具。

https://yym68686.top/#ai/workflow_use.md
🔥2
#观点 #不务正业 #知乎 #涌现现象

为什么有时候上课会突然全班很默契的安静了,静到丧心病狂的那种?


我在知乎上偶然翻到这个问题,但是我没找到我满意的答案。关于这个问题我给出另外一个视角,这个问题提出十年了都没有人提到涌现论。有人用数学建模模拟了整个过程。比如这篇回答:当教室突然安静——扰动,突变与回复 - Baopinsui的文章 - 知乎 https://zhuanlan.zhihu.com/p/679862117 ,但是作者没有提到这背后有一个广泛又普遍的理论。下面完全是我对这个问题的理解,如有错误还请大家见谅。

涌现现象简单来说就是一个极其简单的局部规则,通过迭代,如何自发地生成出极其丰富和复杂的宏观结构与规律。比如人是否说话会收到周围人的影响,以一定概率转换自己的状态,随着系统的演化会出现相变,就是突然安静的现象。类似的例子还有很多:

杨辉三角每个数字等于它正上方和左上方两个数字的和,这个规则很简单,但是行数越大数字的分数越趋向于正态分布,此外如果你把杨辉三角中所有的奇数涂成黑色,偶数留白,你会得到一个著名的分形图案——谢尔宾斯基三角,该分形会频繁出现上一行还是满格的状态,下一行突然就全部消失了,还有就是每一行的数字和是2的幂,斜着相加可以得到斐波那契数列。这个想法来自于这个视频:https://www.bilibili.com/video/BV1ii421h7uk 我觉得这个up的视频非常有意思,推荐大家看看。

单个蚂蚁非常简单,但它们通过释放和感知信息素来相互沟通,从而涌现出寻找最优路径、建造复杂蚁巢等惊人的集体智能。沃尔夫勒姆就是大家常用的Wolfram这个数学工具的发明者还提出过基于超图的物理模型也是基于涌现现象,当然目前还处于民科的范畴。再比如用伊辛模型来解释磁化现象,温度升高到居里点附近会突然消磁。水结冰是通过水分子间的氢键,在0度附近会突然相变结冰。人的意识也是从复杂的生物化学反应中涌现的。温度和压力是从大量分子的统计行为中涌现的。生命游戏,乌合之众,超导,凝聚态物理等等。总之当系统的尺寸远大于其基本相互作用的尺度时,宏观涌现行为就开始变得明显。

涌现现象还可以用来解释为啥相对论和量子力学很难融合。宇宙有可能本质上是涌现驱动的。所以宇宙的结构是分层的,而且不止两层。在每一个层次上,都有其独特的、无法被完全还原到底层细节的规律。这些规律是通过大量简单组件在下一层次的相互作用中,经由尺度分离、对称性破缺、信息处理和自组织等机制而“涌现”出来的。量子力学可以解释微观世界,相对论解释了宏观物体的相互作用。但是相对论无法解释星系级别的旋转,星系旋转的速度远超根据其可见物质(恒星、气体等)计算出的引力所能束缚的速度。如果没有额外的引力来源,这些星系应该会分崩离析。类似的引力异常也存在于星系团和宇宙大尺度结构中。广义相对论无法解释这种“多出来的引力”。目前的主流解释是,宇宙中存在一种不发光、不与电磁波相互作用的神秘物质——暗物质,它贡献了这部分额外的引力。然而,尽管经过数十年搜寻,我们仍未直接探测到任何暗物质粒子。

黑洞奇点这同样是广义相对论失效的标志。一个完备的引力理论必须能描述黑洞中心到底是什么,并消除这个无限大。这里存在一个不被注意到的细节,前面那个建模模拟教室声音的作者建模图上面明显能在声音突然变小前有一个尖刺,这其实是相变的一个特征,在水变成气态过程中也有这个现象。当我们用标准的热力学理论去描述水的液-气临界点时,理论预言比热容会变成无穷大。这个无穷大告诉我们,描述单个分子或小尺度行为的简单理论在这里已经崩溃了。系统不再是局部粒子行为的简单加总。同样对于黑洞的“奇点”,当我们用爱因斯坦的广义相对论去描述黑洞中心时,理论预言时空曲率和物质密度会变成无穷大。这个无穷大同样告诉我们,描述宏观引力的广义相对论在这里也崩溃了。在这两种情况下, “无穷大” 都不是一个真实的物理结果,而是我们现有理论发出的一个响亮的警报,它在呐喊:“到此为止!在这里,你需要一个更根本、更强大的新理论!”。我问AI说这可能还跟弦理论里面的AdS/CFT对偶有关系,这个我是一点不懂,各位读者可以自己搜搜看。

因此对于宇宙级别的尺度来说,我们的宏观世界其实相当于微观世界,在比我们更大的尺度上,是另外一个体系的物理定律在发挥作用。因此对于力图结合量子力学和相对论的结合是很困难的,因为我觉得在宇宙不同层次是由不同的物理定律在驱动。这里我引申一个不太相关的话题:为什么100年来基础物理学没有根本性变革?我觉得是因为我们在更大的尺度上证明或者证伪提出的理论相当困难。2012年刚发现的希格斯玻色子的欧洲大型强子对撞机(LHC)耗资巨大,周长达27公里。而要探索比LHC更高一个数量级的能量尺度(这是许多新物理理论预测的区域),可能需要建造周长达100公里的下一代对撞机(如FCC或CEPC),其成本和技术挑战都是空前的。2015年探测引力波(LIGO)才探测到引力波。需要在星系尺度,黑洞边界证明新提出的理论几乎不可能。这可能是我们100年来基础物理学几乎停滞的根本原因。哈哈,不过关于用涌现现象来解释为什么量子力学和相对论无法统一,以及宇宙尺度相对论的失效这本身也是无法证明或者证伪的。所以我也是妥妥的民科,大家权当看个乐吧。

我们大多数人从小接受的还是线性、还原论的思维方式,习惯于寻找“A导致B”的直接因果链。而涌现论所揭示的非线性、自下而上、自组织的因果关系,是反直觉的。理解“宏观秩序可以从无中心的微观互动中自发产生”,本身就需要一次思维模式的转变。许多看似无关的复杂现象背后,都回响着同样的、关于自组织和涌现的深刻旋律。

我一直对各种现象背后的本质特别感兴趣,我觉得研究这些东西对我来说非常有意思,虽然在大多数人看来是不务正业。维特根斯坦说过语言的边界即世界的边界,这暗示着我们学习知识的目的会为了理解世界复杂与非二元的本质,我觉得这可能对我们理解社会现象和面临人生决策时会有帮助。
1👍1