#py #tool 浏览器缓存 图片 爬虫
#code
你可以逐文件夹拼图: #bash 各种相对路径真的吐了
python a.py 'x\.com' 200 ~/.cache/chromium/Default/Cache/Cache_Data/*python imgdump.py 'www' 100 `ls --sort time --reverse ~/.cache/chromium/Default/Cache/Cache_Data/*`
#code
import re,struct, os
def ls_cache(urlRegex, kbSizeMin, *cache_files):
key_marker = struct.pack('Q', 0xf4fa6f45970d41d8)
def deco(b):
# header is 8+4+4:keylen+4+ bytes[keylen]
key_len = struct.unpack('I', b[12:16])[0]+4
key = b[20:20+key_len].decode()
body = b[20+key_len:b.find(key_marker)]
if len(body)>kbSizeMin*1024 and re.search(urlRegex,key):
return mstrip(100,re.sub('[\x00/]','', key)),body
mapFiles(cache_files,deco)
mstrip=lambda n,s: s if len(s)<n else f"{s[:n//2-2 -2]}..{s[n//2:]}"
def mapFiles(a, fOut):
os.system('rm -rf png;mkdir png')
for i,file in enumerate(a):
with open(file, 'rb') as f:
if f1:=fOut(f.read()):
k,v=f1
with open(f'png/{i}-{k}', 'wb+') as out_f:out_f.write(v)
if __name__ == '__main__':
import fire
fire.Fire(ls_cache)
你可以逐文件夹拼图: #bash 各种相对路径真的吐了
vcat() { cd $1;a=`find *|sort -n|xargs printf "-i %s\n"`
ffmpeg $a -filter_complex vstack=inputs=`wc -l <<<$a` ../$1.png ;cd -;}
for f in `ls`;do vcat $f;done
for f in find * -type d; do thunar -B $f/*; done #按文件夹 批量重命名
cp-id() { i=1; for x in "$@"; do X=$(basename "$x"); cp "$x" "${i}-${X%.*}.${X##*.}"; i=$((i+1)); done; }
最开始考虑了 https://t.me/dsuses/5305 和binwalk但太慢mkdir a tar
cp `grep 'x.com' -FRl ~/.cache/chromium/Default/Cache/|find -size +200k` tar
binwalk -C a -D image:png tar/*
find a/ -name '*.png'|nl
Telegram
duangsues.is_a? SaltedFish
To retrieve the N most recent images from the Chrome cache in Linux that are greater than 100KB in size using Python, you can use the following script. This script uses the sqlite3 library to access Chrome's cache database. Please note that accessing the…
#bin 仅仅是load一个
struct 和 cffi 都太垃圾了。我让AI用mmap解指针,
SO上有一个非常幽默的
可以流 https://construct.readthedocs.io/en/latest/
感觉比protoc编译好
Web ArrayBuffer 也是支持的,包括 array('B') 和一些有趣的社区库
pickle,marshal就不说了,和JDK OOStream 一样不规范到需要内定的程度(还不如巨硬的COM呢..)
而且还破坏了 load/dump 的弱类型接口
bytes[lenPrefix] 有啥好库推荐?struct 和 cffi 都太垃圾了。我让AI用mmap解指针,
ffi.cast("header_t *", mm[:ffi.sizeof("header_t")])
ffi.unpack(ffi.cast("char *", mm + key_offset), keylen)
毫无数组结构给我干懵了SO上有一个非常幽默的
(i,), data = struct.unpack("I", data[:4]), data[4:]
s, data = data[:i], data[i:]
还提了个helper,但只能兼容尾部数组,连流解析都没有from construct import *
format = Struct(
"signature" / Const(b"BMP"),
"width" / Int8ub,
"height" / Int8ub,
"pixels" / Array(this.width * this.height, Byte),
)
format.build(dict(width=3,height=2,pixels=[7,8,9,11,12,13]))
format.parse(b'BMP\x03\x02\x07\x08\t\x0b\x0c\r')
可以流 https://construct.readthedocs.io/en/latest/
感觉比protoc编译好
Web ArrayBuffer 也是支持的,包括 array('B') 和一些有趣的社区库
mm = np.memmap(filename, np.int16, 'r', shape=(1000, 64))
import binaryfile
import deconstruct as c
class InputEvent(c.Struct):
time: c.uint64[2]
value: c.int32
# Define the file structure&read()
def file_spec(f):
size = f.count('size', 'text', 2) # A two-byte unsigned integer
f.bytes('text', size)
pickle,marshal就不说了,和JDK OOStream 一样不规范到需要内定的程度(还不如巨硬的COM呢..)
👍1
Forwarded from Hacker News
Opus 1.5 released: Opus gets a machine learning upgrade (🔥 Score: 151+ in 2 hours)
Link: https://readhacker.news/s/63tqs
Comments: https://readhacker.news/c/63tqs
Link: https://readhacker.news/s/63tqs
Comments: https://readhacker.news/c/63tqs
#china #history 方脸 小翠 朽木:吸气要扣税..
🤔:让老板帮你缴税,是遥遥领先的人性服务,还是偷钱闷声发大财呢?
明税=个人所得+社保起步价
暗税=老板的5险1金+小微企业什一税 (+户口土地财政+县城皇粮阶级转移支付)
+没有合法工会和《劳动法》造成的压榨
+生产者地摊逃税、做黑心油烂尾楼、监管躺平 对社会均价质量造成的冲击 (参考东北/电商/外卖低物价)
+同时有《宪法》和《国安法》激化的外资出逃
+马云余明鸿和滴滴被红孩儿共同富裕,以及对游戏GPU和AI的市场打击
+无代表就纳税,煽动民粹碍国,以及计生核酸等人权红利对正常中国公民造成的精神损失费
+初次被村公仆服务后,做公仆梦的小粉红所遭受的世界观冲击
—上海vs台湾健保
加拿大BC的普通人税率是15.7%
上海税率,与🇨🇦年收入5亿持平
考虑到中国是法治的高隐形税负福利社会,这钱花的不太值啊..
🤔:让老板帮你缴税,是遥遥领先的人性服务,还是偷钱闷声发大财呢?
明税=个人所得+社保起步价
暗税=老板的5险1金+小微企业什一税 (+户口土地财政+县城皇粮阶级转移支付)
+没有合法工会和《劳动法》造成的压榨
+生产者地摊逃税、做黑心油烂尾楼、监管躺平 对社会均价质量造成的冲击 (参考东北/电商/外卖低物价)
+同时有《宪法》和《国安法》激化的外资出逃
+马云余明鸿和滴滴被红孩儿共同富裕,以及对游戏GPU和AI的市场打击
+无代表就纳税,煽动民粹碍国,以及计生核酸等人权红利对正常中国公民造成的精神损失费
+初次被村公仆服务后,做公仆梦的小粉红所遭受的世界观冲击
—上海vs台湾健保
加拿大BC的普通人税率是15.7%
上海税率,与🇨🇦年收入5亿持平
考虑到中国是法治的高隐形税负福利社会,这钱花的不太值啊..
Forwarded from Solidot
Linux 桌面操作系统市场份额突破 4%
2024-03-05 16:37 by 机械人生
根据 StatCounter 的最新统计数据,Linux 桌面操作系统市场份额突破 4% 达到 4.03%。它对 Linux 桌面系统的统计没有包含 Chrome OS,而 Chrome OS 是基于 Linux 的操作系统,早期是基于 Ubuntu、Gentoo 和 Debian 发行版。如果将 Chrome OS 包含在内,Linux 的份额增加到 6.3%,次于 Windows 的 72.13% 和 OS X 的 15.46%。不包含 Chrome OS 的 Linux 桌面份额是在 2023 年 6 月首次突破 3%,仅仅 8 个月增加 1% 这一数字还是令人惊讶的。
https://gs.statcounter.com/os-market-share/desktop/worldwide
#Linux
2024-03-05 16:37 by 机械人生
根据 StatCounter 的最新统计数据,Linux 桌面操作系统市场份额突破 4% 达到 4.03%。它对 Linux 桌面系统的统计没有包含 Chrome OS,而 Chrome OS 是基于 Linux 的操作系统,早期是基于 Ubuntu、Gentoo 和 Debian 发行版。如果将 Chrome OS 包含在内,Linux 的份额增加到 6.3%,次于 Windows 的 72.13% 和 OS X 的 15.46%。不包含 Chrome OS 的 Linux 桌面份额是在 2023 年 6 月首次突破 3%,仅仅 8 个月增加 1% 这一数字还是令人惊讶的。
https://gs.statcounter.com/os-market-share/desktop/worldwide
#Linux
❤2
duangsuse::Echo
#china #history 方脸 小翠 朽木:吸气要扣税.. 🤔:让老板帮你缴税,是遥遥领先的人性服务,还是偷钱闷声发大财呢? 明税=个人所得+社保起步价 暗税=老板的5险1金+小微企业什一税 (+户口土地财政+县城皇粮阶级转移支付) +没有合法工会和《劳动法》造成的压榨 +生产者地摊逃税、做黑心油烂尾楼、监管躺平 对社会均价质量造成的冲击 (参考东北/电商/外卖低物价) +同时有《宪法》和《国安法》激化的外资出逃 +马云余明鸿和滴滴被红孩儿共同富裕,以及对游戏GPU和AI的市场打击 +无代表就纳…
#china #tw https://youtu.be/oqYaTuCfucg?t=251 自由 限制新闻流通 危机感 #nCov19 😨⚖️
一个人就连名字都打不出来,这还不足以成为批评他的理由吗?
9:00 莫言的风向右变了,要被朝鲜爱好者立案起诉了……
他的《酒国》还挺精彩的,我喜欢里面唯一一次吃人的桥段 ☺️
https://www.tianyabooks.com/cn/my2678/105646.html#:~:text=金黄色的遍体流油、异香扑鼻的男孩
酒国市的官员吃掉了无数婴儿。但到酒国市的人没有能经得起诱惑的,丁钩儿虽不断提醒自己不喝酒,最后却醉酒淹死在茅厕里。《酒国》中的官员之所以为官,不是因为他们才华高过他人,而是因为海量,并且食欲旺盛。
挺新鲜的文笔☺️ 这里没有什么阴谋论,也不是为了钱和物价而出卖道德。 纯粹是太阳光下的普世社达与平庸之恶。
1986年出版的诺奖小说,到2024年,竟不合法了 🇰🇵
「你需要知道许多当前你不被允许知道的事情, 如果它觉得你知道了,没人知道什么会发生在你家三代身上」
——文革史前传
> 你好,没有恶意,为什么你要在外网上发这么多抹黑xjp 的帖子?方脸:这里是墙外,不需要用英文字母
一个人就连名字都打不出来,这还不足以成为批评他的理由吗?
9:00 莫言的风向右变了,要被朝鲜爱好者立案起诉了……
他的《酒国》还挺精彩的,我喜欢里面唯一一次吃人的桥段 ☺️
https://www.tianyabooks.com/cn/my2678/105646.html#:~:text=金黄色的遍体流油、异香扑鼻的男孩
酒国市的官员吃掉了无数婴儿。但到酒国市的人没有能经得起诱惑的,丁钩儿虽不断提醒自己不喝酒,最后却醉酒淹死在茅厕里。《酒国》中的官员之所以为官,不是因为他们才华高过他人,而是因为海量,并且食欲旺盛。
挺新鲜的文笔☺️ 这里没有什么阴谋论,也不是为了钱和物价而出卖道德。 纯粹是太阳光下的普世社达与平庸之恶。
1986年出版的诺奖小说,到2024年,竟不合法了 🇰🇵
「你需要知道许多当前你不被允许知道的事情, 如果它觉得你知道了,没人知道什么会发生在你家三代身上」
——文革史前传
YouTube
台灣人冷靜點!
#台灣 #中國 #小鄭在日本
為什麼台灣人在這件事上,比日本人缺乏同理心?小鄭和日本議員到底在怕什麼?為什麼去年有120位國會議員訪問台灣,但訪問中國的只有個位數?鐘明軒 台灣 中國 小鄭在日本
商業合作 | 影片授權 | 赴日咨詢
teteforjapan@gmail.com
為什麼台灣人在這件事上,比日本人缺乏同理心?小鄭和日本議員到底在怕什麼?為什麼去年有120位國會議員訪問台灣,但訪問中國的只有個位數?鐘明軒 台灣 中國 小鄭在日本
商業合作 | 影片授權 | 赴日咨詢
teteforjapan@gmail.com
Forwarded from 科技圈🎗在花频道📮
Google在中国大陆上线官方镜像资源站
Google 中国近日在其运营的公众号「谷歌开发者」中发布公告:目前国内开发者可通过 google.cn 直接访问 web.dev 以及 Chrome for Developers 的镜像站。Google 在公告中提到:除了提供所有镜像后的内容以外,网站还借助 Cloud Translation API 提供了包括中文在内的多种语言。
镜像资源部的slogan为:携手打造更出色的网络
镜像资源站网址
线索:@ZaiHuabot
投稿:@TNSubmbot
频道:@TestFlightCN
Google 中国近日在其运营的公众号「谷歌开发者」中发布公告:目前国内开发者可通过 google.cn 直接访问 web.dev 以及 Chrome for Developers 的镜像站。Google 在公告中提到:除了提供所有镜像后的内容以外,网站还借助 Cloud Translation API 提供了包括中文在内的多种语言。
镜像资源部的slogan为:携手打造更出色的网络
镜像资源站网址
线索:@ZaiHuabot
投稿:@TNSubmbot
频道:@TestFlightCN
Forwarded from 层叠 - The Cascading
无锡一法院作出判决,驳回了织梦 CMS 软件著作权人向此 GPL 软件使用者要求授权许可费的诉求。
oschina 的文章还提到:
- 法院认可了织梦 CMS (DedeCMS) 之 GPL 授权的有效性。用户有权力使用此软件而不必向其著作权人卓卓公司支付授权费用,惟不得侵犯著作权人之署名权。
- 法院判决还称,原告卓卓公司在使用他人代码时未遵守他人软件的 GPL 协议,有违诚信原则;卓卓公司以 DedeCMS 在全国法院提起大量著作权纠纷之维权模式不利于打击侵权源头,而大量占用公共资源,不宜提倡。
https://www.oschina.net/news/280518/gpl-dedecms
The Cascading 不提供法律意见。
#China #GPL #DedeCMS
oschina 的文章还提到:
- 法院认可了织梦 CMS (DedeCMS) 之 GPL 授权的有效性。用户有权力使用此软件而不必向其著作权人卓卓公司支付授权费用,惟不得侵犯著作权人之署名权。
- 法院判决还称,原告卓卓公司在使用他人代码时未遵守他人软件的 GPL 协议,有违诚信原则;卓卓公司以 DedeCMS 在全国法院提起大量著作权纠纷之维权模式不利于打击侵权源头,而大量占用公共资源,不宜提倡。
https://www.oschina.net/news/280518/gpl-dedecms
The Cascading 不提供法律意见。
#China #GPL #DedeCMS
www.oschina.net
GPL抗辩成功——织梦CMS“系列”版权纠纷迎来重大转折 - OSCHINA - 中文开源技术交流社区
摘要 原告:上海卓卓网络科技有限公司(以下简称:卓卓公司) 被告:****医院 事件:****医院使用 DedeCMSV5.7-sp1 软件开发网站,卓卓公司以拥有 DedeCMS Biz V1.0 以及后续多个版本的著作权为由,认为医院侵犯了...
#learn #cg #go #bilibili #algorithm
> https://www.bilibili.com/video/BV16g411B7Ff
尝试实现下视频里的”大一“代码,感兴趣的话可以深耕
并不天才啊,就是 https://www.desmos.com/calculator/ 里像素化个灰度函数 (y-abs(x)^c)^2+x^2=1
可以把每个运算当成对样条的变换,例如删掉abs(x)不会对称
https://mathworld.wolfram.com/HeartCurve.html
推荐这个超好玩的 https://www.shadertoy.com/results?query=Boids
https://golang.google.cn/tour/moretypes/18
你可以 在Go入门试玩一下
或者下载 Jupyter , p5js
推荐 https://jupyterlite.github.io/demo/lab/index.html?path=p5.ipynb
> 我记得大学的时候,我实现一个水波纹,搞了快一星期
那是因为你的工具没用对
只要降低五花八门IDE的杂音,只交互式写代码就可以了
创作式编程就是需要注意力
https://codelabclub.github.io/blog/2020/06/28/当我们谈论编程时,其实是在谈论玩乐与创作/
就是吧,你用jspy写,不关心杂七杂八的部署问题
就ok了
> 像素着色器才能并行,利用GPU的性能
当时就是C++写的,有个很垃圾的国产引擎(cocos2dx)
numpy,torch也行啊…… GLSL也不是很难
性能不是最重要的,主要是效果好
其实你在墙外,会搜关键字就能比许多人强了
因为编程的本质是摘抄缝合
像百度那种垃圾搜索引擎是不用看的
用那种工具搜那种圈子的程序员没有进步能力
https://coolshell.cn/ 已猝死的陈大佬说的很清楚,程序员的第一工作就是拉黑内容农场
陈大佬自己也开公司呢,不过去年猝死了
挺可惜 他也是个公知
他明明是个很广的全栈程序员
可惜天妒英才, 每次都是优秀的程序员死,称职的活
然后七大姑八大夷拿这个去劝退称职的程序员
>那么要用哪种搜索引擎好?墙外那些吗?
duck.com bing.com 什么的啊
反正不能用墙内的
对程序员来说一手资料是最重要的
英文wiki都比中文全面
其实不要以为只有抖音快手在洗稿,GFW只是内对外的墙
中国内部各圈层的资讯都是极不流通的
所以张雪峰这种人能火
> https://www.bilibili.com/video/BV16g411B7Ff
尝试实现下视频里的”大一“代码,感兴趣的话可以深耕
并不天才啊,就是 https://www.desmos.com/calculator/ 里像素化个灰度函数 (y-abs(x)^c)^2+x^2=1
可以把每个运算当成对样条的变换,例如删掉abs(x)不会对称
https://mathworld.wolfram.com/HeartCurve.html
推荐这个超好玩的 https://www.shadertoy.com/results?query=Boids
https://golang.google.cn/tour/moretypes/18
你可以 在Go入门试玩一下
或者下载 Jupyter , p5js
推荐 https://jupyterlite.github.io/demo/lab/index.html?path=p5.ipynb
> 我记得大学的时候,我实现一个水波纹,搞了快一星期
那是因为你的工具没用对
只要降低五花八门IDE的杂音,只交互式写代码就可以了
创作式编程就是需要注意力
https://codelabclub.github.io/blog/2020/06/28/当我们谈论编程时,其实是在谈论玩乐与创作/
就是吧,你用jspy写,不关心杂七杂八的部署问题
就ok了
> 像素着色器才能并行,利用GPU的性能
当时就是C++写的,有个很垃圾的国产引擎(cocos2dx)
numpy,torch也行啊…… GLSL也不是很难
性能不是最重要的,主要是效果好
其实你在墙外,会搜关键字就能比许多人强了
因为编程的本质是摘抄缝合
像百度那种垃圾搜索引擎是不用看的
用那种工具搜那种圈子的程序员没有进步能力
https://coolshell.cn/ 已猝死的陈大佬说的很清楚,程序员的第一工作就是拉黑内容农场
陈大佬自己也开公司呢,不过去年猝死了
挺可惜 他也是个公知
他明明是个很广的全栈程序员
可惜天妒英才, 每次都是优秀的程序员死,称职的活
然后七大姑八大夷拿这个去劝退称职的程序员
>那么要用哪种搜索引擎好?墙外那些吗?
duck.com bing.com 什么的啊
反正不能用墙内的
对程序员来说一手资料是最重要的
英文wiki都比中文全面
其实不要以为只有抖音快手在洗稿,GFW只是内对外的墙
中国内部各圈层的资讯都是极不流通的
所以张雪峰这种人能火
Bilibili
国产剧里天才程序员期中考试写的爱心代码,真的现实么?我来复刻一下!_哔哩哔哩_bilibili
这期视频聊一下最近开播的国产剧《点燃我,温暖你》里面的一个桥段,天才程序员男主李峋期中考试中完成的爱心代码,究竟可行么?, 视频播放量 1146208、弹幕量 3453、点赞数 40955、投硬币枚数 12823、收藏人数 12366、转发人数 23975, 视频作者 码农高天, 作者简介 清华毕业,Python核心开发者,无业游民,环球旅行中。知乎:高天。,相关视频:这个是真的复刻出来了!#李峋同款爱心(有源码),国产程序员剧里的爱心代码,算是完美复刻吗?,文科生学计算机编程语言现状,果然天生就是吃程…
duangsuse::Echo
#china #history 方脸 小翠 朽木:吸气要扣税.. 🤔:让老板帮你缴税,是遥遥领先的人性服务,还是偷钱闷声发大财呢? 明税=个人所得+社保起步价 暗税=老板的5险1金+小微企业什一税 (+户口土地财政+县城皇粮阶级转移支付) +没有合法工会和《劳动法》造成的压榨 +生产者地摊逃税、做黑心油烂尾楼、监管躺平 对社会均价质量造成的冲击 (参考东北/电商/外卖低物价) +同时有《宪法》和《国安法》激化的外资出逃 +马云余明鸿和滴滴被红孩儿共同富裕,以及对游戏GPU和AI的市场打击 +无代表就纳…
#china 文昭:消费投资出口,中国的GDP为何将卡在12000美元?
方脸:这届人大 https://youtu.be/qW-20GqIbl4?t=653
中国经济陷阱与传统的拉美化有何不同?
低福利「人矿」资源陷阱 vs 新质生产力
“只有人被尊重才会有理想, 有理想在才能有创造嘛”
https://youtu.be/jyLKIJwiZFA?t=880
方脸:这届人大 https://youtu.be/qW-20GqIbl4?t=653
中国经济陷阱与传统的拉美化有何不同?
低福利「人矿」资源陷阱 vs 新质生产力
“只有人被尊重才会有理想, 有理想在才能有创造嘛”
https://youtu.be/jyLKIJwiZFA?t=880
YouTube
方脸说:解读两会,两会传达出了什么样的信号?取消总理记者会,习近平一人独大丨保守的经济政策和激进的GDP目标丨扶持电动车丨对台态度强硬丨李强
00:00 两会一场精心策划的政治表演
01:24 总理记者会取消-李强终成习近平的附庸
06:52 激进的GDP目标和保守的经济政策
15:13 扶持电动车,战斗准备
01:24 总理记者会取消-李强终成习近平的附庸
06:52 激进的GDP目标和保守的经济政策
15:13 扶持电动车,战斗准备
#ai #tool #algorithm 对比
我比较了一下三个AI免费码农,发现还是bing稍微有点能力
但实际上还是不如手写的(只需replace(/RE/)1次)可能我问的太杂了,GPT基建还任重道远啊
我也是说可以直接compile() 一个字典来分词
这样真的很慢
不过jspy界也确实是天上地下,很多人不会正则只知AC
这样GPT5应该就能代替程序员写全栈了
> 正则不太适合做这个业务,还是用原汁原味AC自动机,再优化的话研究下GPT的token怎么搞的
GPT确实要涉及到NLP。BERT,LSTM 什么的seq2seq推理技术
它应该不是一个按关键词或简单的权重图来分
只是一个计费手段而已,好像也没法省token
非AI的算法往往更快 也不靠GPU
都是应用层的程序员太垃圾,才给人一种算法很慢的错觉
unity内核的开发者和jspy人根本不是一个级别, 学信号处理和数控的都是魔鬼
>做GPT接入的时候,又套了层向量数据库和Java的注解开关,以优化上下文接口的流量
https://cloud.tencent.com/developer/article/2356967
搜了一下,发现VecDB是用于Fine-tune的知识库文件吧,
通过 openai.Embedding API 可以查找问题相似度,类似人脸匹配,从而实现领域术语prompt
我还以为是要webhook让openai反查的,原来只是prompt工程
我比较了一下三个AI免费码农,发现还是bing稍微有点能力
但实际上还是不如手写的(只需replace(/RE/)1次)可能我问的太杂了,GPT基建还任重道远啊
我也是说可以直接compile() 一个字典来分词
dicts=Object.entries({你:"我", 好:"坏" })
dicts.reduce((s, [A,B])=> s.replace(A,B), "你好" )这样真的很慢
不过jspy界也确实是天上地下,很多人不会正则只知AC
请编写关键词替换.js
let [str, hint]=subs("这群老 板指鼠为鸭,简直是黄 世 仁" )
dicts=[[{黑:"白", 鼠:"鸭"}, "请勿造谣呦"], [{黄世仁:"人民公仆", 老板:"周扒皮"}, "用词不合社会主义"] ]
去空格匹配,期待 hint=="请勿造谣呦\n用词不合社会主义"
若无匹配回null
这样GPT5应该就能代替程序员写全栈了
> 正则不太适合做这个业务,还是用原汁原味AC自动机,再优化的话研究下GPT的token怎么搞的
GPT确实要涉及到NLP。BERT,LSTM 什么的seq2seq推理技术
它应该不是一个按关键词或简单的权重图来分
只是一个计费手段而已,好像也没法省token
非AI的算法往往更快 也不靠GPU
都是应用层的程序员太垃圾,才给人一种算法很慢的错觉
unity内核的开发者和jspy人根本不是一个级别, 学信号处理和数控的都是魔鬼
>做GPT接入的时候,又套了层向量数据库和Java的注解开关,以优化上下文接口的流量
https://cloud.tencent.com/developer/article/2356967
搜了一下,发现VecDB是用于Fine-tune的知识库文件吧,
通过 openai.Embedding API 可以查找问题相似度,类似人脸匹配,从而实现领域术语prompt
我还以为是要webhook让openai反查的,原来只是prompt工程
Forwarded from Solidot
大模型如何工作仍然是个谜团
2024-03-06 23:02 by 霸主的影子
两年前 OpenAI 研究员 Yuri Burda 和 Harri Edwards 试图找到方法让大模型做基本算术。他们想知道需要多少两数相加的例子才能让大模型能完成任意两数相加的算术。一开始,他们进展不是很顺利。大模型能记住例子但无法解决新的加法。他们意外的让部分实验运行数天时间而不是预期的数小时。结果他们发现实验成功了,大模型能完成任意加法,只是所需的时间超出任何人的想象。他们和同事对这种现象展开了研究,发现在特定情况下大模型会突然从无法完成任务到能完成任务,他们称之为“领悟(grokking)”。领悟是让 AI 研究员摸不着头脑的多个现象之一。这突出了深度学习背后的一个引人注目的事实:没人知道它是如何工作,或为什么它能工作。现在最大的模型是如此复杂,以至于研究人员像研究奇特的自然现象那样研究它们,他们进行实验并试图解释结果。很多观察结果违背了经典统计学。
https://www.technologyreview.com/2024/03/04/1089403/large-language-models-amazing-but-nobody-knows-why/
#人工智能
2024-03-06 23:02 by 霸主的影子
两年前 OpenAI 研究员 Yuri Burda 和 Harri Edwards 试图找到方法让大模型做基本算术。他们想知道需要多少两数相加的例子才能让大模型能完成任意两数相加的算术。一开始,他们进展不是很顺利。大模型能记住例子但无法解决新的加法。他们意外的让部分实验运行数天时间而不是预期的数小时。结果他们发现实验成功了,大模型能完成任意加法,只是所需的时间超出任何人的想象。他们和同事对这种现象展开了研究,发现在特定情况下大模型会突然从无法完成任务到能完成任务,他们称之为“领悟(grokking)”。领悟是让 AI 研究员摸不着头脑的多个现象之一。这突出了深度学习背后的一个引人注目的事实:没人知道它是如何工作,或为什么它能工作。现在最大的模型是如此复杂,以至于研究人员像研究奇特的自然现象那样研究它们,他们进行实验并试图解释结果。很多观察结果违背了经典统计学。
https://www.technologyreview.com/2024/03/04/1089403/large-language-models-amazing-but-nobody-knows-why/
#人工智能
Forwarded from 乙烷日报
香港本地国安法:知情不报可判14年
《维护国家安全条例草案》第12条规定,任何中国公民知悉他人已犯、正犯或即将犯叛国罪,应尽快向警方披露犯罪事宜,否则可处监禁14年。
《维护国家安全条例草案》第12条规定,任何中国公民知悉他人已犯、正犯或即将犯叛国罪,应尽快向警方披露犯罪事宜,否则可处监禁14年。
duangsuse::Echo
#learn #cg #go #bilibili #algorithm > https://www.bilibili.com/video/BV16g411B7Ff 尝试实现下视频里的”大一“代码,感兴趣的话可以深耕 并不天才啊,就是 https://www.desmos.com/calculator/ 里像素化个灰度函数 (y-abs(x)^c)^2+x^2=1 可以把每个运算当成对样条的变换,例如删掉abs(x)不会对称 https://mathworld.wolfram.com/HeartCurve.html…
This media is not supported in your browser
VIEW IN TELEGRAM
#cg #code 国产剧《点燃我,温暖你》/110w 里面的一个桥段,天才程序员男主李峋期中考试中完成的爱心代码
效仿评论区就自己写了个…… 另外GL里字体/for循环是较难的
在 https://www.shadertoy.com/view/llGSzw main尾部加上
原up清华毕业,加州工作,微软码农 收获5w播放, 我寻思这好像也不难…… Shader试错比IDE还容易
B站大佬也挺多的,这种开源易懂的少
其实glsl会 desmos.com 都能模拟的
https://www.geogebra.org/calculator 这些工具超好用
主要还是靠工具和html,svg 这些基础知识
现在numpy+opencv 也普及了,PIL那样的canvas库也会慢慢淘汰吧
一切皆向量 一切皆矩阵
canvas就是一个比较装B的
但学了svg后 就真不是啥
反而gl滤镜更有趣
因为现在对app程序员的要求太低了
转个str, list 绑下sql就能用, 涉猎范围都被框架堵住了
效仿评论区就自己写了个…… 另外GL里字体/for循环是较难的
float heart(vec2 P) {
float t= mix(.3,.8, mod(iTime,1.2)),//心跳
r=pow(P.y-pow(abs(P.x),t), 2.)+pow(P.x,2.) -1.;//灰度函数
return r<.3? mix(1.,4.,-r) : r; //黑心换白心
} 在 https://www.shadertoy.com/view/llGSzw main尾部加上
fragColor = heart(fragCoord.xy/iResolution.xy/.2 -2. - sin(iTime)) ; 原up清华毕业,加州工作,微软码农 收获5w播放, 我寻思这好像也不难…… Shader试错比IDE还容易
B站大佬也挺多的,这种开源易懂的少
其实glsl会 desmos.com 都能模拟的
https://www.geogebra.org/calculator 这些工具超好用
主要还是靠工具和html,svg 这些基础知识
现在numpy+opencv 也普及了,PIL那样的canvas库也会慢慢淘汰吧
一切皆向量 一切皆矩阵
canvas就是一个比较装B的
但学了svg后 就真不是啥
反而gl滤镜更有趣
因为现在对app程序员的要求太低了
转个str, list 绑下sql就能用, 涉猎范围都被框架堵住了