DPS Build
684 subscribers
100 photos
3 videos
9 files
392 links
AI, coding, data science and startups
Download Telegram
六十种融资模式,总有一款适合你:
Framework 发布12吋的笔记本:

1. 屏幕可翻转360度;
2. 支持触控笔,可以当平板使用;
3. 使用上一代 Intel 旗舰 CPU,达到性能和价格的平衡;
4. 一共五个配色,拓展接口也有相应的配色;

https://frame.work/blog/introducing-the-framework-laptop-12
Forwarded from C’s Random Collection
https://ai-2027.com “We predict that the impact of superhuman AI over the next decade will be enormous, exceeding that of the Industrial Revolution.” 不管怎样,这个页面的 interaction 很棒 #ai
介绍一个略有一些 Sad 的故事。大家可能都用过 matplotlib 这个库。但是可能并不知道它的作者是 John D. Hunter。他因癌症逝世于2012年8月28日,在他逝世前的一个月,他创建了最后一个 PR,在他逝世前的25天,他提名了新的项目领导者。他所创建的项目迄今依旧福泽后人。
距离他逝去已经13年,如果你之前不了解他也没有关系,请以后在使用 matplotlib 的时候,默默告诉自己,一个叫 John D. Hunter 的人,为这个美丽的世界贡献了一份自己的心血
R.I.P. Love live the open source.
https://github.com/jdh2358
https://web.archive.org/web/20201027122844/http://matplotlib.1069221.n5.nabble.com/ANN-Michael-Droettboom-matplotlib-lead-developer-td5037.html
晚饭见了之前一手招进来的手下,这几年成长飞速。无奈因为大环境,最近他们整个组被解散,他拿到了 relocation 的 offer。

我和他吹牛说,我最引以为傲的职业技能是,每次换工作都在一个组势头最好的时候加入,然后在势头稍微有点问题的时候弃船而走,为走之后,不到一年那个组必然解散。回头一看,五份工作都是如此。😂

我和他共事的时候,我是整个组的第一个成员,比我们组的经理还早了四个月。等经理加入之后,我们开始招兵买马,三个月才面到一个让我眼前一亮的候选人。出来之后,我就和那个经理说,无论如何也要把这个姑娘招进来。她问我为啥,我说你去面了就知道。结果她面完第二轮,也是同样的结论。我们一起说服 CTO 把这个姑娘录用了,这姑娘最后接了。

之后,我们又问她,有没有同学什么的,因为她毕业于英国排名最好的 NLP 专业。她陆续又拉了两个同学过来,其中一个就是今晚和我吃饭的这个同事。

就这样,我和他们共事了一年多。后来因为一些很不愉快的事,我就离职了。不到一年,这个组就解散了,他们各奔东西,都去了很不错的外资大厂。这三个分别去了 Apple / MS / Paypal。

所以我还有一个引以为傲的职业技能就是很会挑人 🤣其实是他们既聪明又努力。
前阵子和创业的朋友聊天,尽管大厂有大厂的毛病,但至少还有相对完善的晋升/培养体系,还有足够的资源找到足够聪明的人。而创业的话,刚起步时,这两点都很难做到。

举个例子,最近对接工厂的平面设计,真的是无奈至极:

第一次给了需求,拿到的结果,肉眼可见地没有居中;标注尺寸的箭头是拿鼠标手绘的,都不知道用内置组件。

第二次给了需求,拿回来的结果里,每一个字母的间距都不一样。我都怀疑她是不是每个字母都用了一个单独的 textbox,问她怎么回事,答曰这是字体问题。

第三次给了需求,要求把图标缩小,她把图标缩小之后,内嵌的产品截了一半,都不知道把这个产品图等比例缩小放上去。

前两次我都忍着脾气自己改了,第三次实在忍不了,直接和对接的其他同事直言不讳了。要是我在工厂的话,估计真的要走过去拍桌子了。😂

这既不是审美有问题,也不是技能有问题,分明就是不动脑子🧠
Forwarded from DPS Main
Daily Productive Sharing 1232 - Making Uncommon Knowledge Common

Expedia、Glassdoor 和 Zillow 这三家公司市值都超过十亿美金,而且都由 Rich Barton 创建。 Kevin Kwok 介绍了这其中的商业逻辑:

1. 在消费科技这个极难成功的领域里,可复制的成功至关重要。能稳定成功地投资消费科技公司本就难能可贵,而反复创办成功公司几乎闻所未闻。这说明 Barton 很可能掌握了一套尚未广为人知或被复制的底层结构化策略。

2. Rich Barton 的策略核心是通过构建“数据内容飞轮”(Data Content Loop)绕过传统中间商、主导搜索引擎流量,并利用这份势能掌控行业需求。

3. 掌控用户需求能带来复利优势,但一开始必须“自我造血”。

4. 初创公司起步时,不仅未掌控需求,还要与已掌控需求的巨头竞争,处于劣势。

5. Barton 的公司通过“数据内容飞轮”打造独特内容、建立线上行业索引(Zillow 为房产、Expedia 为酒店与航班、Glassdoor 为公司信息),从而建立用户访问的入口。

https://letters.acacess.com/daily-productive-sharing-1232/
用 OpenAI 和 gemini 写代码,确实提升了不少效率,但还是需要一些基础。

从一个 PDF 提取文本信息,用 Gemini 迭代了十多次仍旧无法提取信息,改了各种 prompt 都没用。

再仔细看那些 PDF 文件,发现其中一部分内容是从文本生成的,另一部分是从图片直接压成的。两部分组合成一个 PDF 文件。要不是之前和这类数据打过交道,我都没有 OCR 的概念,也不可能在 prompt 调用 OCR。

最后调用 Tesseract 成功提取了这些图片里的文本数据 🤷
DPS Build
用 OpenAI 和 gemini 写代码,确实提升了不少效率,但还是需要一些基础。 从一个 PDF 提取文本信息,用 Gemini 迭代了十多次仍旧无法提取信息,改了各种 prompt 都没用。 再仔细看那些 PDF 文件,发现其中一部分内容是从文本生成的,另一部分是从图片直接压成的。两部分组合成一个 PDF 文件。要不是之前和这类数据打过交道,我都没有 OCR 的概念,也不可能在 prompt 调用 OCR。 最后调用 Tesseract 成功提取了这些图片里的文本数据 🤷
又折腾了大半天,总算修复了所有问题,简单记录一下:

1. 使用 Gemini 2.5 Pro
2. 提取 PDF 文件里的文本数据,首先直接把 PDF 转换成文本提取;
3. PDF 内嵌的图片上的文本提取失败,使用 tesseract 提取,可以部分提取成功;
4. 失败的数据尝试用 easyOCR 提取,解决问题,但是速度很慢;
5. 所以告诉模型,依次使用 2,3,4 来提取,兼顾准确性和效率

一开始只给了输入输出样本,模型只想到了上面的第二步。直到我看到了 log 之后,才发现识别不出的问题,所以才加上 OCR。

使用 tesseract 只解决了部分问题,直到看到更详细的 log,才知道 tesseract 识别有局限。调了部分参数也没用,要求模型换一种 OCR,这才用了 easyOCR。

识别准确性上去了,但是性能不行,于是要求模型依次执行 2,3,4。

下次再写的话,应该一开始输出详细的 log 文件,方便我分析问题,也方便模型根据 log 来定位问题。
看到 Antinote 上了 Setapp,本来以为是一个简单的笔记 app ,结果看到它的用户手册,被惊到了。这么小的一个 app 有这么详尽的用户手册,还有这么多的快捷键。要知道这是今年一月才发布的 app。

https://antinote.io/user-manual

再一看开发者也很有意思,Johnson Fung 原来已经做到 Adobe 的高层,现在是独立开发者。

https://johnsoncfung.medium.com/hi-im-johnson-61971cef78e8
Please open Telegram to view this post
VIEW IN TELEGRAM