This media is not supported in your browser
VIEW IN TELEGRAM
#程序员
gpt-crawler,https://github.com/BuilderIO/gpt-crawler,一款可以将网站内容全部爬取下来,并转换成可以作为 GPTs 学习的结构化知识的工具。
例如你想制作一个数字人分身,不妨把自己在社交媒体或者个人博客的内容先抓取下来,提交给 ChatGPT 作为储备知识。
顺便推荐下它背后使用的技术框架,crawlee,https://crawlee.dev,它是一个网络爬虫工具,也是一款浏览器自动化工具,在实现上,它提供了 DOM 解析能力、无头浏览器模式、异常状态码处理、队列和存储,以及大量的配置项来增强爬虫。它也是一款开源产品:https://github.com/apify/crawlee
gpt-crawler,https://github.com/BuilderIO/gpt-crawler,一款可以将网站内容全部爬取下来,并转换成可以作为 GPTs 学习的结构化知识的工具。
例如你想制作一个数字人分身,不妨把自己在社交媒体或者个人博客的内容先抓取下来,提交给 ChatGPT 作为储备知识。
顺便推荐下它背后使用的技术框架,crawlee,https://crawlee.dev,它是一个网络爬虫工具,也是一款浏览器自动化工具,在实现上,它提供了 DOM 解析能力、无头浏览器模式、异常状态码处理、队列和存储,以及大量的配置项来增强爬虫。它也是一款开源产品:https://github.com/apify/crawlee
👍4🐳1
上次我妈说我不给大炮买衣服,给我打了一万块钱让我去给儿子买衣服。
我花了100多给他买了两件短袖,其他的钱自己用光了。
我妈今天来我家,带了她自己给大炮买的羽绒服。
不再让我这样的中间商赚差价了。
做人真的要诚信,不然赚的全是一次性的买卖。😭
群响一再说了,在私域做高客单价一定要提供好的交付,我这就属于只满足了私域和高客单价两个条件。
注定失败。
我花了100多给他买了两件短袖,其他的钱自己用光了。
我妈今天来我家,带了她自己给大炮买的羽绒服。
不再让我这样的中间商赚差价了。
做人真的要诚信,不然赚的全是一次性的买卖。😭
群响一再说了,在私域做高客单价一定要提供好的交付,我这就属于只满足了私域和高客单价两个条件。
注定失败。
❤1
#职场社畜日常
总监职级现场竞聘,92年却已有资深司龄的女生在回答第2个问题时突然就哭了,哭得那么委屈和真诚,好几分钟止不住。
问题是:如果你获得总监这个岗位,你会怎么做?
她冷静下来回答说:
我是个自驱力很强的人,是否有这个title,是否加给我新的考核指标,于我都是一样执著认真地工作。
这么多年来,我总是最晚离开办公室,我在利用一切的时间来学习,总结每一次受批评的原因,思考每一个事情怎么办,琢磨方案中的每一句话怎么写。
我的团队人手少,任务很重,我很感激我这几年的辛苦让我有了快速的成长,我已经能够在专业上、沟通上做到让自己满意,但是在外部资源积累和项目判断经验上还有很多不足。不论是否能有新的职级,我都会一如既往的全力以赴,毫不懈怠,在工作中上进是我的一种生活方式。
我给了她最高分。
总监职级现场竞聘,92年却已有资深司龄的女生在回答第2个问题时突然就哭了,哭得那么委屈和真诚,好几分钟止不住。
问题是:如果你获得总监这个岗位,你会怎么做?
她冷静下来回答说:
我是个自驱力很强的人,是否有这个title,是否加给我新的考核指标,于我都是一样执著认真地工作。
这么多年来,我总是最晚离开办公室,我在利用一切的时间来学习,总结每一次受批评的原因,思考每一个事情怎么办,琢磨方案中的每一句话怎么写。
我的团队人手少,任务很重,我很感激我这几年的辛苦让我有了快速的成长,我已经能够在专业上、沟通上做到让自己满意,但是在外部资源积累和项目判断经验上还有很多不足。不论是否能有新的职级,我都会一如既往的全力以赴,毫不懈怠,在工作中上进是我的一种生活方式。
我给了她最高分。
👀2
This media is not supported in your browser
VIEW IN TELEGRAM
#程序员
如果你想对站点内容进行爬虫,还有一条最简洁的系统原生命令可以搞定:
wget --random-wait -r -p -e robots=off -U mozilla Website_URL
加上 -nv 或 --no-verbose 参数后,输出的内容会变得更加简洁;加上 --accept-regex 参数后,你可以根据正则来过滤你需要的 uri。
下面是爬取 babel 站点文档的一个演示:
如果你想对站点内容进行爬虫,还有一条最简洁的系统原生命令可以搞定:
wget --random-wait -r -p -e robots=off -U mozilla Website_URL
加上 -nv 或 --no-verbose 参数后,输出的内容会变得更加简洁;加上 --accept-regex 参数后,你可以根据正则来过滤你需要的 uri。
下面是爬取 babel 站点文档的一个演示:
OpenAI 闹剧还在继续。
Wired 最新报道,OpenAI 95%的员工,约738人,签署公开信,要求董事会成员全体辞职,召回 Altman 继续担任CEO 。并威胁如果不能达成,就全体跟随Altman去微软成立新公司。
耐人寻味的是 Ilya 也签名了。Ilya 发推说后悔参加董事会的行动。所以,谁主导了董事会的行动?
Altman 带人出走,OpenAI 还有灵魂人物 Ilya 尚可一战。Ilya 也走,那 OpenAI 就只剩一个壳。
硅谷一直信奉 hire slowly, fire quickly。现在应该能意识到,开除重要的人,必须缓慢且谨慎。
公司由人组成,而人是什么?公司不是章程和董事会的决议,公司是充满不确定性的水面之下涌动的混沌。
开除CEO 不是开董事会那么简单。需要长期摸民意,进行动员和激励,寻求内部外部支持,安排迅捷的重组计划和及时的公关,以及 plan B、C、D。这和发动一场全面战争一样。
能这么乱来,只能说明OpenAI 的架构有严重问题。
Wired 最新报道,OpenAI 95%的员工,约738人,签署公开信,要求董事会成员全体辞职,召回 Altman 继续担任CEO 。并威胁如果不能达成,就全体跟随Altman去微软成立新公司。
耐人寻味的是 Ilya 也签名了。Ilya 发推说后悔参加董事会的行动。所以,谁主导了董事会的行动?
Altman 带人出走,OpenAI 还有灵魂人物 Ilya 尚可一战。Ilya 也走,那 OpenAI 就只剩一个壳。
硅谷一直信奉 hire slowly, fire quickly。现在应该能意识到,开除重要的人,必须缓慢且谨慎。
公司由人组成,而人是什么?公司不是章程和董事会的决议,公司是充满不确定性的水面之下涌动的混沌。
开除CEO 不是开董事会那么简单。需要长期摸民意,进行动员和激励,寻求内部外部支持,安排迅捷的重组计划和及时的公关,以及 plan B、C、D。这和发动一场全面战争一样。
能这么乱来,只能说明OpenAI 的架构有严重问题。