标题: GPT 给的【知识库】方案,这样是不是当下最好的?
作者: #qppq54s
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1771058
时间: 2026-03-17 15:08:01
摘要:
作者: #qppq54s
板块: #开发调优
编号:
1771058帖子: https://linux.do/t/topic/1771058
时间: 2026-03-17 15:08:01
摘要:
最近公司要搞知识库,也看了很多佬友的提问,好多都说目前 RAG 已经过时了。
开发过程中也发现,一旦中间存在切片或者生成树结构,就会很依赖 markdown 的解析质量,例如一级目录和二级目录得解析出来,但是目前的 pdf 解析 markdown 工具很难做到 100% 的正确,然后导致无法给 ai 提供正确的文件片单引用。但是把 markdown 直接丢给 ai 去理解,又是能正确解答问题的。
所以深度咨询了下 GPT,得到了以下回答。
所以来咨询下佬友们,这样做是不是当下最好的方案了?
标题: 被禁言和举报过帖子,还能升三级吗,谢谢
作者: #zapp
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771059
时间: 2026-03-17 15:08:28
摘要:
作者: #zapp
板块: #搞七捻三
编号:
1771059帖子: https://linux.do/t/topic/1771059
时间: 2026-03-17 15:08:28
摘要:
之前不了解论坛的规则和限制,发了一个不合适的帖子,被举报了。
然后在聊天频道里面看到别人发签到,也跟着发了一个签到,被禁言了。
想问下各位佬,这种情况还能升三级吗?可以的话,什么时候才能升到三级。谢谢佬。
标题: 油管封号到底是啥机制?莫名其妙就被封了
作者: #Zz
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771064
时间: 2026-03-17 15:08:51
摘要:
作者: #Zz
板块: #搞七捻三
编号:
1771064帖子: https://linux.do/t/topic/1771064
时间: 2026-03-17 15:08:51
摘要:
我油管唯一用途就是用来听歌,有事没事就挂着歌单听歌,没有评论没有发视频,然后上个月用了领英的三个月会员。是因为这个吗?申诉一次他说核实了的确违规,我看违规项目都是需要发评论区和视频才会被封啊。。。不懂他的封号逻辑
标题: 写了一个nanobot-playbook,放Github了
作者: #天行健
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1771066
时间: 2026-03-17 15:09:14
摘要:
作者: #天行健
板块: #开发调优
编号:
1771066帖子: https://linux.do/t/topic/1771066
时间: 2026-03-17 15:09:14
摘要:
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的项目是免费使用的,无收费(变相收费、赞助)部分: 是
我的帖子已经打上 公益推广 标签: 是
我的项目属于个人项目,与公司或商业机构无关: 是
我的项目不存在QQ、TG等群组引流: 是
我的项目不存在非运营必要的网站引流: 是
我的项目不存在为他人推广、AFF: 是
我的项目无关联的商业项目: 是
我的 GitHub 项目无未开源部分: 是
我的站点存在登录,并已接入 LINUX DO Connect: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
最近一直在用nanobot,也一直在研究。我在玩一款产品的时候,喜欢研究它的实现或者原理(说白了,就是爱瞎折腾)。就结合claude,写了一个教程和复刻nanobot教程。放到了Github上,希望对佬友们有些许帮助。持续迭代中,教程写的不深,希望大佬不要嫌弃。不足之处请佬们见谅,轻喷。如果有写的不对的地方,还请提issue和PR,感激不尽。
地址:从零打造你的 AI Bot
标题: PointNext+自建数据集(自用记录)
作者: #milayakiya
板块: #文档共建
编号:
帖子: https://linux.do/t/topic/1771069
时间: 2026-03-17 15:10:01
摘要:
作者: #milayakiya
板块: #文档共建
编号:
1771069帖子: https://linux.do/t/topic/1771069
时间: 2026-03-17 15:10:01
摘要:
准备:点云数据,cloudcompare
一、数据标注
在cloudcompare里进行标注,其核心就是通过裁剪点云,给点云加上一个New SF Name即新字段,然后合并点云,这是时候同样的字段合并,标签就合一起了。
①点云分割,按照自己的需求进行分割
②添加标签,地面点赋值1,非地面点0(注意赋值字段相同)
③合并点云,导出las格式
二、数据格式转换
①官方数据集用的是npy格式,模仿github官方代码,下载源代码,模仿collect_indoor3d_data.py与indoor3d_util.py编辑
GitHub - yanx27/Pointnet_Pointnet2_pytorch: PointNet and PointNet++ implemented by pytorch (pure python) and on ModelNet, ShapeNet and S3DIS. · GitHub
用PointNet++训练自己的数据集(语义分割模型semseg)_pointnet训练自己的数据-CSDN博客
②模仿indoor3d_util.py,可根据实际需求增加或减少输出的字段
import numpy as np
import os
import sys
import laspy
import open3d as o3d
BASE_DIR = os.path.dirname(os.path.abspath(__file__))
ROOT_DIR = os.path.dirname(BASE_DIR)
sys.path.append(BASE_DIR)
# 请根据你的实际路径修改
DATA_PATH = r"xxxxxxxxxxxxx"
# 标签定义 自建数据已经是按数字存贮在字段中,就无需映射,这段可删去
g_classes = [
'grund', # 0
'stem', # 1
'tree-crown', # 2
'Low-vegetation',
]
g_class2label = {cls: i for i, cls in enumerate(g_classes)}
def compute_normals_o3d(x, y, z, knn=30):
valid_mask = np.isfinite(x) & np.isfinite(y) & np.isfinite(z)
if not np.all(valid_mask):
x = np.nan_to_num(x, nan=0.0, posinf=0.0, neginf=0.0)
y = np.nan_to_num(y, nan=0.0, posinf=0.0, neginf=0.0)
z = np.nan_to_num(z, nan=0.0, posinf=0.0, neginf=0.0)
points = np.ascontiguousarray(np.vstack((x, y, z)).T, dtype=np.float64)
num_points = points.shape[0]
if num_points < 3:
return np.zeros_like(x), np.zeros_like(y), np.zeros_like(z)
actual_knn = min(knn, num_points - 1)
pcd = o3d.geometry.PointCloud()
pcd.points = o3d.utility.Vector3dVector(points)
pcd.estimate_normals(search_param=o3d.geometry.KDTreeSearchParamKNN(knn=actual_knn))
normals = np.asarray(pcd.normals)
if normals.ndim != 2 or normals.shape[1] != 3:
return np.zeros_like(x), np.zeros_like(y), np.zeros_like(z)
return normals[:, 0], normals[:, 1], normals[:, 2]
def collect_plot_data(las_path, out_filename):
# 1. 提取
# cls = np.array(las.label, dtype=np.int32)
# 2. 提取高精度坐标
x = np.array(las.x, dtype=np.float64)
y = np.array(las.y, dtype=np.float64)
z = np.array(las.z, dtype=np.float64) # 此时 Z 是 HAG
# 3. 平移到原点,变成样地相对坐标
x -= np.min(x)
y -= np.min(y)
# 安全转回 float32
x = x.astype(np.float32)
y = y.astype(np.float32)
z = z.astype(np.float32)
# 4. 实时计算法向量
nx, ny, nz = compute_normals_o3d(x, y, z, knn=30)
# 5. 提取并缩放强度 (Intensity)
intensity = np.array(las.intensity, dtype=np.float32)
i_min, i_max = np.min(intensity), np.max(intensity)
if i_max > i_min:
intensity = (intensity - i_min) / (i_max - i_min)
else:
intensity = np.zeros_like(intensity)
# 6. 安全提取 Original Z 维度
try:
orig_z = np.array(las.orginalZ, dtype=np.float32)
except AttributeError:
try:
orig_z = np.array(las["OriginalZ"], dtype=np.float32)
except Exception as e:
print(f"警告: 在 {os.path.basename(las_path)} 中未找到 OriginalZ 属性,暂时用 z 填充。")
orig_z = np.copy(z)
# 7. 拼装成终极 (N, 9) 矩阵
# 顺序: [X_relative, Y_relative, Z_HAG, nx, ny, nz, intensity, cls, orig_z]
# 使用 ascontiguousarray 防止后续 PyTorch 报 non-contiguous tensor 警告
data = np.ascontiguousarray(
np.vstack([x, y, z, nx, ny, nz, intensity, cls, orig_z]).T,
dtype=np.float32
)
# 8. 保存一整个样地数据
np.save(out_filename, data)
return True
③模仿collect_indoor3d_data.py,注意一定要导入模块
import os
import sys
import glob
from tqdm import tqdm
# 导入我们刚刚精简到极致的核心处理函数
from XXX_util39 import collect_plot_data
BASE_DIR = os.path.dirname(os.path.abspath(__file__))
ROOT_DIR = os.path.dirname(BASE_DIR)
sys.path.append(BASE_DIR)
def process_split(split_name, input_dir, output_dir):
"""
处理单个数据集划分 (train 或 test)
"""
# 查找该文件夹下所有的 .las 和 .LAS 文件
las_files = glob.glob(os.path.join(input_dir, '
标题: 【抽奖】JetBrains Educational Pack一年期送大家啦!
作者: #yybbtech
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1771070
时间: 2026-03-17 15:10:05
摘要:
作者: #yybbtech
板块: #福利羊毛
编号:
1771070帖子: https://linux.do/t/topic/1771070
时间: 2026-03-17 15:10:05
摘要:
RT.偶然得之,本欲换米,无人问津,也罢,倾囊相赠吧!望得者惜之!
活动时间:
开始时间:[开贴之时]
截止时间:[2026/03/18 20:00]
参与方式:
在本帖下回复任意内容
抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 12 小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
上面的抽奖开始时间不准确的话按照实际帖子发布时间为准
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: 论文下载求助
作者: #Wayne Yao
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1771074
时间: 2026-03-17 15:10:38
摘要:
作者: #Wayne Yao
板块: #开发调优
编号:
1771074帖子: https://linux.do/t/topic/1771074
时间: 2026-03-17 15:10:38
摘要:
学校的数据库过期了欸,有没有大佬,帮我下载一下这篇论文呀
Modeling and performance analysis of underwater wireless optical absorption, scattering, and turbulence channels employing Monte Carlo-multiple phase screens
标题: 刷推看到了linuxdo的信息,貌似是被封号的人的控诉,说实话略显小丑,惹人发笑
作者: #蓝极北
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771080
时间: 2026-03-17 15:10:56
摘要:
作者: #蓝极北
板块: #搞七捻三
编号:
1771080帖子: https://linux.do/t/topic/1771080
时间: 2026-03-17 15:10:56
摘要:
标题: 佬们,初入L站有无注意事项啊?
作者: #FfTiGeR
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771081
时间: 2026-03-17 15:11:27
摘要:
作者: #FfTiGeR
板块: #搞七捻三
编号:
1771081帖子: https://linux.do/t/topic/1771081
时间: 2026-03-17 15:11:27
摘要:
佬们,初入L站刚申请的账号不容易,有没有啥需要注意的事项,或者说有啥要求没有? 拜谢拜谢
标题: 有没有什么”特别便宜“好用的人体工学椅
作者: #宁缺无滥
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771087
时间: 2026-03-17 15:12:25
摘要:
作者: #宁缺无滥
板块: #搞七捻三
编号:
1771087帖子: https://linux.do/t/topic/1771087
时间: 2026-03-17 15:12:25
摘要:
RT,公司配的牛马椅子真的不是给人坐的,坐一会腰老酸了。在公司又不想买太贵的,感觉像在付费上班。
有没有300左右质量还可以的人体工学椅推荐的
标题: 如何将有限的认知带宽用在有意义的事情上
作者: #King的坐标系
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1771091
时间: 2026-03-17 15:13:15
摘要:
作者: #King的坐标系
板块: #开发调优
编号:
1771091帖子: https://linux.do/t/topic/1771091
时间: 2026-03-17 15:13:15
摘要:
AI从业者是不是尽量少被动接受外界输入,或者说严格控制质量:比如看热搜,刷L站,看新智元/机器之心/量子位,follow x上的大佬 (出发点是外界信息->我能不能用/学)
尽量不用推荐算法,不刷视频,不被动接受垃圾消息,高强度使用ai来探索问题,主动查找分析自己发现的问题。(出发点是我->用/学外界信息)
我目前是两者都有,并且比例不固定,有没有高手告诉我最佳实践是什么?
当然提升自己精力上限也算:保持充足睡眠;锻炼身体;洗冷水澡/做痛苦的事(提高多巴胺基线水平和注意力);注意饮食(传统健康饮食?+激进健康饮食【素食主义+辟谷+这那的饮食法?】)等等。——虽然好像我一个都没做到
最后可能最重要的一点是:天生的素质(智商,精力,品味【品味决定选择】)
标题: 如何推广自己的ai产品?
作者: #一只不会飞的猪
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771096
时间: 2026-03-17 15:14:08
摘要:
作者: #一只不会飞的猪
板块: #搞七捻三
编号:
1771096帖子: https://linux.do/t/topic/1771096
时间: 2026-03-17 15:14:08
摘要:
如题 最近coding了个AI生图工具 功能都较为完善 但是不知道如何推广出去 大家有什么好的建议吗?!!
另外 L站哪些分区可以贴链接呢?之前发的一个帖子被删了 因为我贴了链接 而且有支付系统
标题: LDC可交易次数进行限制,交易给卖方后,其中大部分不可再进行消费,只能作为提升成就感的积分
作者: #T_ACGN
板块: #运营反馈
编号:
帖子: https://linux.do/t/topic/1771097
时间: 2026-03-17 15:14:19
摘要:
作者: #T_ACGN
板块: #运营反馈
编号:
1771097帖子: https://linux.do/t/topic/1771097
时间: 2026-03-17 15:14:19
摘要:
可以做一个累计积分
在LDC交易中,其中按收款方的累计积分和当前积分,进行比例收税
累计积分和当前积分作为因子,计算收税比例
交易中使用的LDC,其中一部分依然是LDC,另一部分转为不再有交易功能的累计积分【即保留公益佬的成就感,也不至于让公益佬持有大量可交易LDC用于兑现】
比如交易100LDC,买家支付100LDC,卖家只能收到一定比例,剩下的只是累计卖家的累计积分,不能用于交易消费,只是好看和成就感(或者兑换头像框、勋章之类的)
收税比例加入累计积分作为因子,也是避免卖家收到一点就直接用掉,维持当前积分较低逃避税收
标题: 亲测!摸鱼佬好多啊哈哈
作者: #Bany
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771101
时间: 2026-03-17 15:14:36
摘要:
作者: #Bany
板块: #搞七捻三
编号:
1771101帖子: https://linux.do/t/topic/1771101
时间: 2026-03-17 15:14:36
摘要:
刚发了帖子 想知道L站里有多少三级佬?有入口可以看吗?基本就被秒回
一支穿云箭,千军万佬来相见!
标题: 小白安装龙虾求助
作者: #lixiaoyao
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771107
时间: 2026-03-17 15:15:40
摘要:
作者: #lixiaoyao
板块: #搞七捻三
编号:
1771107帖子: https://linux.do/t/topic/1771107
时间: 2026-03-17 15:15:40
摘要:
之前买了个腾讯云海外服务器 部署龙虾调用codex成功了
现在打算弄自己的window部署龙虾 但是调用codex的时候说地区不可用 但我已经开了全局魔法 还是不行 这个是什么情况 大家有遇到过吗
标题: 想请问一下antigravity 反重力ultra的情况
作者: #Kevin1812
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1771109
时间: 2026-03-17 15:17:06
摘要:
作者: #Kevin1812
板块: #开发调优
编号:
1771109帖子: https://linux.do/t/topic/1771109
时间: 2026-03-17 15:17:06
摘要:
使用pro的的时候,一直会出现提示说opus 余量不足的情况,如果拼车ultra会有这种情况吗,google会优先保障ultra的使用体验吗
标题: 新人报道,请多关照,终于有自己的身份了!
作者: #lukane
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771110
时间: 2026-03-17 15:17:09
摘要:
作者: #lukane
板块: #搞七捻三
编号:
1771110帖子: https://linux.do/t/topic/1771110
时间: 2026-03-17 15:17:09
摘要:
2026年3月17日 记录自己在L站发布的第一条帖子!
向各位佬友们多学习交流!
标题: ldc不可能采纳但是能管好的一种方案
作者: #Isla7940
板块: #运营反馈
编号:
帖子: https://linux.do/t/topic/1771115
时间: 2026-03-17 15:17:54
摘要:
作者: #Isla7940
板块: #运营反馈
编号:
1771115帖子: https://linux.do/t/topic/1771115
时间: 2026-03-17 15:17:54
摘要:
这次直接把ldc关了要出问题的,等新方案出来恢复运行百分百大规模挤兑,然后又有多少人愿意接受随时失效的ldc呢,不知新方案能不能同时适配挤兑期的高拥挤度和大幅缩水和后期正常运行期重新恢复价值呢?
这波急了,其实临时限制每日交易次数交易金额,再把E卡,服务器之类的先临时撤掉,做一个过渡期会更好
我觉得可以收税,流转税,财产税,这部分税收放到一个池子
然后每天低保从直接给积分变成计算贡献点,用当日总税收加上温和通胀(如社区积分总量的0.5个点)去匹配每个贡献点得多少分,把供给量限制住
接着把特殊商品下掉。再把所有商品分为三类,写一个目录出来,一种自由交易,各类ai token,一种禁止交易,如e卡,一种限制交易,如服务器,限制交易需要人工审批,审批者可以查看历史交易和发帖情况,就能判断这笔交易合不合理了,不合理就驳回
当然,这样就更把ldc货币化了,肯定不能采纳,但是要管好或许只能这样
此外ldc除了交易肯定要让用户在社区内消化掉一部分,比如三级要满足持有ldc大于多少,可以兑换某些稀有称号,甚至可以发帖要消耗ldc但一个回复量返回多少直到全部返还,等等
标题: 看热闹不嫌事多这样?
作者: #羽橙
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1771117
时间: 2026-03-17 15:18:14
摘要:
作者: #羽橙
板块: #搞七捻三
编号:
1771117帖子: https://linux.do/t/topic/1771117
时间: 2026-03-17 15:18:14
摘要:
对于一部分佬友这样子的发言,我实在不敢苟同
对于做公益的大佬们划分三六九等就算了(我也不太清楚为什么这些人认为自己有资格指手画脚?)
更有甚者连“打土豪分田地”这种封建遗毒的谬论都敢说出来
说完之后发现LDC暂时下线了,马上又是另一种观点的发言
这不禁让我怀疑图二图三的这位佬是否有在发言前先思考了,是真心的想要维护社区的风气?还是只是为了支持管理层的决定呢?
话都是你们在说,真的是看热闹不嫌事多耶,能不能成熟一点,发言前多思考?