信息论分解方法助力多模态交互学习研究
近日,一篇题为“Information-Theoretic Decomposition for Multimodal Interaction Learning”的论文在arXiv预印本平台发布。该论文由Zequn Yang等五位作者完成,提交于2026年6月10日。论文提出了一种基于信息论的多模态交互学习分解方法,旨在更有效地理解和建模不同模态之间的交互关系。该研究有望推动多模态人工智能系统的发展,为视觉、语言等多模态融合任务提供新的理论框架。目前,论文已开放PDF全文下载,并获得了学术界的关注。 #多模态学习 #信息论 #人工智能 #arXiv #论文 #机器学习 #AI研究
近日,一篇题为“Information-Theoretic Decomposition for Multimodal Interaction Learning”的论文在arXiv预印本平台发布。该论文由Zequn Yang等五位作者完成,提交于2026年6月10日。论文提出了一种基于信息论的多模态交互学习分解方法,旨在更有效地理解和建模不同模态之间的交互关系。该研究有望推动多模态人工智能系统的发展,为视觉、语言等多模态融合任务提供新的理论框架。目前,论文已开放PDF全文下载,并获得了学术界的关注。 #多模态学习 #信息论 #人工智能 #arXiv #论文 #机器学习 #AI研究
大型语言模型驱动的物理蒸馏神经网络,助力制造过程属性预测建模
近日,一篇题为《Physics-Distilled Neural Network enabled by Large Language Models for Manufacturing Process-Property Predictive Modeling》的论文提交至arXiv预印本平台。该研究由Ge Song等五位作者完成,旨在利用大型语言模型(LLM)实现物理知识的蒸馏,构建面向制造过程属性预测的神经网络模型。传统物理建模往往依赖大量实验与领域知识,而数据驱动方法又缺乏可解释性。作者提出将LLM作为知识抽取工具,从文献或专家描述中提取物理规律,并融入神经网络训练,从而在保证预测精度的同时增强模型的可解释性与泛化能力。该方法有望在材料加工、工艺优化等工业场景中降低建模成本,提升预测效率。论文已开放PDF全文供学术社区参考。 #AI #机器学习 #制造 #物理蒸馏 #大语言模型 #神经网络 #过程建模 #工智能 #论文
近日,一篇题为《Physics-Distilled Neural Network enabled by Large Language Models for Manufacturing Process-Property Predictive Modeling》的论文提交至arXiv预印本平台。该研究由Ge Song等五位作者完成,旨在利用大型语言模型(LLM)实现物理知识的蒸馏,构建面向制造过程属性预测的神经网络模型。传统物理建模往往依赖大量实验与领域知识,而数据驱动方法又缺乏可解释性。作者提出将LLM作为知识抽取工具,从文献或专家描述中提取物理规律,并融入神经网络训练,从而在保证预测精度的同时增强模型的可解释性与泛化能力。该方法有望在材料加工、工艺优化等工业场景中降低建模成本,提升预测效率。论文已开放PDF全文供学术社区参考。 #AI #机器学习 #制造 #物理蒸馏 #大语言模型 #神经网络 #过程建模 #工智能 #论文
Kuramoto Attention
近日,一篇题为《Kuramoto Attention: Synchronizing Self-Attention on the Torus》的预印本论文在arXiv上公开发布。论文作者Joshua Nunley提出了一种将Kuramoto模型与自注意力机制相结合的新方法,旨在通过环面(torus)上的同步动力学改进注意力计算。Kuramoto模型是一种经典的同步现象数学模型,常被用于描述耦合振荡器的集体行为。该研究将这一理论引入深度学习领域,探索如何使注意力头之间实现更高效的同步,从而提升Transformer架构的性能。目前论文尚未提供开源代码或详细实验数据,但已引起学术界的关注。研究人员认为,这一方向可能为增强注意力机制的可解释性和计算效率提供新思路。 #AI #深度学习 #注意力机制 #Kuramoto模型 #arXiv #论文
近日,一篇题为《Kuramoto Attention: Synchronizing Self-Attention on the Torus》的预印本论文在arXiv上公开发布。论文作者Joshua Nunley提出了一种将Kuramoto模型与自注意力机制相结合的新方法,旨在通过环面(torus)上的同步动力学改进注意力计算。Kuramoto模型是一种经典的同步现象数学模型,常被用于描述耦合振荡器的集体行为。该研究将这一理论引入深度学习领域,探索如何使注意力头之间实现更高效的同步,从而提升Transformer架构的性能。目前论文尚未提供开源代码或详细实验数据,但已引起学术界的关注。研究人员认为,这一方向可能为增强注意力机制的可解释性和计算效率提供新思路。 #AI #深度学习 #注意力机制 #Kuramoto模型 #arXiv #论文
LLM
研究人员提出一种创新的图学习范式,即通过大型语言模型(LLM)与图神经网络(GNN)的协同教学来替代传统“金标准教师”模式。该研究认为,传统依赖单一预训练教师模型的方式限制了图学习在复杂场景下的泛化能力,而LLM与GNN的互补特性——LLM擅长语义理解与推理,GNN擅长结构化信息建模——能够实现更有效的知识迁移与联合优化。实验表明,该协同教学框架在多个图学习基准任务上取得了显著性能提升,尤其是在零样本和少样本场景下优势明显。这一工作为图学习与语言模型的深度结合提供了新思路,有望推动知识图谱、推荐系统等领域的进一步发展。 #图学习 #LLM #GNN #协同教学 #人工智能 #机器学习 #知识图谱
研究人员提出一种创新的图学习范式,即通过大型语言模型(LLM)与图神经网络(GNN)的协同教学来替代传统“金标准教师”模式。该研究认为,传统依赖单一预训练教师模型的方式限制了图学习在复杂场景下的泛化能力,而LLM与GNN的互补特性——LLM擅长语义理解与推理,GNN擅长结构化信息建模——能够实现更有效的知识迁移与联合优化。实验表明,该协同教学框架在多个图学习基准任务上取得了显著性能提升,尤其是在零样本和少样本场景下优势明显。这一工作为图学习与语言模型的深度结合提供了新思路,有望推动知识图谱、推荐系统等领域的进一步发展。 #图学习 #LLM #GNN #协同教学 #人工智能 #机器学习 #知识图谱
APEX:专为无线边缘运营设计的网络原生时间序列基础模型
该论文提出了APEX,一种专为无线边缘运营设计的网络原生时间序列基础模型,主要用于预测和异常检测。APEX由Swadhin Pradhan、Niloo Bahadori和Peiman Amini共同完成,在arXiv上提交,状态为“等待注册”。该模型针对无线边缘环境中的时间序列数据特点进行了优化,能够有效提升预测准确性和异常检测效率。论文详细介绍了模型架构、训练方法及其在无线网络运营中的潜在应用,为边缘计算和网络运维提供了新的解决方案。 #APEX #时间序列 #基础模型 #无线边缘 #预测 #异常检测 #网络运营 #arXiv #AI #论文
该论文提出了APEX,一种专为无线边缘运营设计的网络原生时间序列基础模型,主要用于预测和异常检测。APEX由Swadhin Pradhan、Niloo Bahadori和Peiman Amini共同完成,在arXiv上提交,状态为“等待注册”。该模型针对无线边缘环境中的时间序列数据特点进行了优化,能够有效提升预测准确性和异常检测效率。论文详细介绍了模型架构、训练方法及其在无线网络运营中的潜在应用,为边缘计算和网络运维提供了新的解决方案。 #APEX #时间序列 #基础模型 #无线边缘 #预测 #异常检测 #网络运营 #arXiv #AI #论文
用推理智能体进行大规模反例引导学习
近日,一篇题为《Counterexample Guided Learning in the Large using Reasoning Agents》的论文在arXiv预印本平台上线。该研究由Hongyi Liu等四位作者共同完成,主要探讨如何利用推理智能体在大型系统中进行反例引导学习。反例引导学习是一种通过寻找反例来迭代改进模型或程序正确性的方法,而借助推理智能体,该方法有望扩展到更大规模、更复杂的问题领域。论文可能涉及将形式化验证、自动推理与机器学习相结合,以提升系统可靠性和鲁棒性。目前论文以PDF和HTML格式提供,并附有源代码及相关引用链接。该工作对人工智能安全性、形式化验证以及自动程序修复等领域具有潜在参考价值。 #arXiv #反例引导学习 #推理智能体 #机器学习 #形式化验证 #AI安全 #学术论文
近日,一篇题为《Counterexample Guided Learning in the Large using Reasoning Agents》的论文在arXiv预印本平台上线。该研究由Hongyi Liu等四位作者共同完成,主要探讨如何利用推理智能体在大型系统中进行反例引导学习。反例引导学习是一种通过寻找反例来迭代改进模型或程序正确性的方法,而借助推理智能体,该方法有望扩展到更大规模、更复杂的问题领域。论文可能涉及将形式化验证、自动推理与机器学习相结合,以提升系统可靠性和鲁棒性。目前论文以PDF和HTML格式提供,并附有源代码及相关引用链接。该工作对人工智能安全性、形式化验证以及自动程序修复等领域具有潜在参考价值。 #arXiv #反例引导学习 #推理智能体 #机器学习 #形式化验证 #AI安全 #学术论文
SirenFNO
一篇题为《SirenFNO: Efficient and Full Frequency Learning of Fourier Neural Operators》的论文于2026年6月9日提交至arXiv预印本平台。该论文由Pengqing Shi等四位作者完成,提出了一种名为SirenFNO的新型神经网络架构,旨在解决傅里叶神经算子(FNO)在全频率学习中的效率瓶颈。传统FNO在处理高频成分时往往计算成本高昂或精度不足,SirenFNO通过引入正弦激活函数与频率自适应机制,实现了对全频段特征的高效捕获,在保持较低计算开销的同时显著提升了模型对复杂物理场(如流体动力学、弹性力学)的逼近能力。该工作为科学计算与偏微分方程求解领域提供了新的工具,有望加速相关工业仿真与工程优化进程。 #论文 #AI #机器学习 #傅里叶神经算子 #科学计算 #SirenFNO #arXiv #深度学习
一篇题为《SirenFNO: Efficient and Full Frequency Learning of Fourier Neural Operators》的论文于2026年6月9日提交至arXiv预印本平台。该论文由Pengqing Shi等四位作者完成,提出了一种名为SirenFNO的新型神经网络架构,旨在解决傅里叶神经算子(FNO)在全频率学习中的效率瓶颈。传统FNO在处理高频成分时往往计算成本高昂或精度不足,SirenFNO通过引入正弦激活函数与频率自适应机制,实现了对全频段特征的高效捕获,在保持较低计算开销的同时显著提升了模型对复杂物理场(如流体动力学、弹性力学)的逼近能力。该工作为科学计算与偏微分方程求解领域提供了新的工具,有望加速相关工业仿真与工程优化进程。 #论文 #AI #机器学习 #傅里叶神经算子 #科学计算 #SirenFNO #arXiv #深度学习
概率对比预训练用于多任务ADME属性预测
来自arXiv预印本的一篇新论文提出了一种名为概率对比预训练(Probabilistic Contrastive Pretraining)的方法,用于多任务ADME属性预测。ADME即药物在体内的吸收、分布、代谢和排泄特性,是药物研发中至关重要的环节。该研究由Yifan Xue等五位作者完成,旨在通过对比学习和概率建模,提升模型在不同ADME任务间的泛化能力。传统的预训练方法往往忽略任务间的不确定性差异,而新方法通过引入概率分布,更有效地捕捉多任务间的共享与特有信息。实验结果显示,该方法在多项ADME预测基准上取得了显著提升,为计算机辅助药物设计提供了更高效的解决方案。目前该论文已可在arXiv上获取全文。 #药物研发 #ADME #对比学习 #概率建模 #多任务学习 #AI #arXiv
来自arXiv预印本的一篇新论文提出了一种名为概率对比预训练(Probabilistic Contrastive Pretraining)的方法,用于多任务ADME属性预测。ADME即药物在体内的吸收、分布、代谢和排泄特性,是药物研发中至关重要的环节。该研究由Yifan Xue等五位作者完成,旨在通过对比学习和概率建模,提升模型在不同ADME任务间的泛化能力。传统的预训练方法往往忽略任务间的不确定性差异,而新方法通过引入概率分布,更有效地捕捉多任务间的共享与特有信息。实验结果显示,该方法在多项ADME预测基准上取得了显著提升,为计算机辅助药物设计提供了更高效的解决方案。目前该论文已可在arXiv上获取全文。 #药物研发 #ADME #对比学习 #概率建模 #多任务学习 #AI #arXiv
OmniLoc:面向多样室内环境的几何感知无锚点用户设备定位基础模型
arXiv近日发布了一篇题为《OmniLoc: A Geometry-Aware Foundation Model for Anchor-Free UE Localization Across Diverse Indoor Environments》的论文。该研究由Lei Chu等四位作者共同完成,提出了一种基于几何感知的基础模型,专用于在多样化室内环境中实现无需锚点的用户设备定位。传统定位方法依赖部署固定锚点(如基站或Wi-Fi热点),但OmniLoc通过深度融合空间几何信息与信号特征,可在无锚点场景下高精度估计设备位置,显著提升了对复杂室内布局(如办公楼、商场、工厂)的适应能力。该模型采用预训练范式,具备跨场景迁移能力,有望降低室内定位系统的部署成本,并为自动驾驶、机器人导航及智慧城市中的位置服务提供新方案。论文于2026年6月9日提交至arXiv,目前尚待正式注册DOI。 #室内定位 #基础模型 #几何感知 #无锚点 #arXiv #人工智能 #机器人导航
arXiv近日发布了一篇题为《OmniLoc: A Geometry-Aware Foundation Model for Anchor-Free UE Localization Across Diverse Indoor Environments》的论文。该研究由Lei Chu等四位作者共同完成,提出了一种基于几何感知的基础模型,专用于在多样化室内环境中实现无需锚点的用户设备定位。传统定位方法依赖部署固定锚点(如基站或Wi-Fi热点),但OmniLoc通过深度融合空间几何信息与信号特征,可在无锚点场景下高精度估计设备位置,显著提升了对复杂室内布局(如办公楼、商场、工厂)的适应能力。该模型采用预训练范式,具备跨场景迁移能力,有望降低室内定位系统的部署成本,并为自动驾驶、机器人导航及智慧城市中的位置服务提供新方案。论文于2026年6月9日提交至arXiv,目前尚待正式注册DOI。 #室内定位 #基础模型 #几何感知 #无锚点 #arXiv #人工智能 #机器人导航
语言模型对抗鲁棒性的计算感知评估方法
一篇题为《Risk Under Pressure: Compute-Aware Evaluation of Adversarial Robustness in Language Models》的论文由Malikeh Ehghaghi等作者在arXiv上预发布。该研究聚焦于语言模型在对抗攻击下的鲁棒性评估,提出一种计算感知(compute-aware)的评估框架。传统鲁棒性测试往往忽略攻击者的计算资源限制,而新方法通过将计算预算纳入评估指标,更真实地反映模型在有限计算条件下的防御能力。实验表明,考虑计算成本后,模型的鲁棒性排名可能发生显著变化。这项工作为语言模型的安全部署提供了更细致的评估工具,有助于开发者识别在现实资源约束下更易受攻击的模型弱点。 #语言模型 #对抗鲁棒性 #计算感知 #AI安全 #arXiv论文
一篇题为《Risk Under Pressure: Compute-Aware Evaluation of Adversarial Robustness in Language Models》的论文由Malikeh Ehghaghi等作者在arXiv上预发布。该研究聚焦于语言模型在对抗攻击下的鲁棒性评估,提出一种计算感知(compute-aware)的评估框架。传统鲁棒性测试往往忽略攻击者的计算资源限制,而新方法通过将计算预算纳入评估指标,更真实地反映模型在有限计算条件下的防御能力。实验表明,考虑计算成本后,模型的鲁棒性排名可能发生显著变化。这项工作为语言模型的安全部署提供了更细致的评估工具,有助于开发者识别在现实资源约束下更易受攻击的模型弱点。 #语言模型 #对抗鲁棒性 #计算感知 #AI安全 #arXiv论文
新研究提出子空间切割张量记忆递归绑定方法
据arXiv预印本,一篇题为《Recursive Binding on a Budget: Subspace Carving in Order-p Tensor Memories》的论文被提交至第43届国际机器学习大会(ICML 2026)。该研究由Travis Pence、Daisuke Yamada和Vikas Singh完成,聚焦于在有限计算预算下实现递归绑定的新方法。作者提出“子空间切割”技术,用于阶p张量记忆,旨在提高张量绑定操作的效率,减少资源消耗。这一突破可能为大规模机器学习中的记忆建模和符号推理提供更实用的解决方案,推动相关领域的发展。 #机器学习 #ICML2026 #张量记忆 #递归绑定 #子空间切割 #AI #学术论文
据arXiv预印本,一篇题为《Recursive Binding on a Budget: Subspace Carving in Order-p Tensor Memories》的论文被提交至第43届国际机器学习大会(ICML 2026)。该研究由Travis Pence、Daisuke Yamada和Vikas Singh完成,聚焦于在有限计算预算下实现递归绑定的新方法。作者提出“子空间切割”技术,用于阶p张量记忆,旨在提高张量绑定操作的效率,减少资源消耗。这一突破可能为大规模机器学习中的记忆建模和符号推理提供更实用的解决方案,推动相关领域的发展。 #机器学习 #ICML2026 #张量记忆 #递归绑定 #子空间切割 #AI #学术论文
SwiftCTS:通过少样本校准实现跨设计时钟树指标快速预测与帕累托优化
一项名为SwiftCTS的新方法,旨在解决集成电路设计中时钟树综合(CTS)的优化难题。传统CTS设计空间探索耗时且成本高昂,而SwiftCTS提出了一种基于少样本校准的跨设计预测技术,能够快速且准确地预测不同时钟树设计下的关键指标(如功耗、延迟和面积),并实现帕累托优化。该方法利用少量已有设计数据对新设计进行校准,显著降低了对大量仿真数据的依赖,从而大幅提升设计效率。实验结果表明,SwiftCTS在多种时钟树结构上均能实现高效预测与优化,为芯片设计自动化提供了新的思路。 #芯片设计 #时钟树综合 #少样本学习 #帕累托优化 #EDA #集成电路 #人工智能
一项名为SwiftCTS的新方法,旨在解决集成电路设计中时钟树综合(CTS)的优化难题。传统CTS设计空间探索耗时且成本高昂,而SwiftCTS提出了一种基于少样本校准的跨设计预测技术,能够快速且准确地预测不同时钟树设计下的关键指标(如功耗、延迟和面积),并实现帕累托优化。该方法利用少量已有设计数据对新设计进行校准,显著降低了对大量仿真数据的依赖,从而大幅提升设计效率。实验结果表明,SwiftCTS在多种时钟树结构上均能实现高效预测与优化,为芯片设计自动化提供了新的思路。 #芯片设计 #时钟树综合 #少样本学习 #帕累托优化 #EDA #集成电路 #人工智能