AlphaFold 发现了潜在的迷幻药物
研究人员使用蛋白质结构预测工具 AlphaFold,发现了可能有助于开发新型抗抑郁药物的潜在迷幻分子。
这表明 AlphaFold 的预测结果在药物发现中可以与实验得到的蛋白质结构一样有用。
AlphaFold 的结构预测可以识别能够改变蛋白质活性的药物,尽管预测和实验结构产生了不同的药物候选物。
对预测蛋白质结构的信心可能会改变药物发现的格局。
DeepMind 的子公司 Isomorphic Labs 正在利用 AlphaFold 进行药物发现工作。
评论讨论了 AlphaFold 对药物发现的潜在影响,人工智能在各个领域的好处,以及对这项技术的怀疑和担忧。
🔗 https://www.nature.com/articles/d41586-024-00130-8
💬 https://news.ycombinator.com/item?id=39049703
研究人员使用蛋白质结构预测工具 AlphaFold,发现了可能有助于开发新型抗抑郁药物的潜在迷幻分子。
这表明 AlphaFold 的预测结果在药物发现中可以与实验得到的蛋白质结构一样有用。
AlphaFold 的结构预测可以识别能够改变蛋白质活性的药物,尽管预测和实验结构产生了不同的药物候选物。
对预测蛋白质结构的信心可能会改变药物发现的格局。
DeepMind 的子公司 Isomorphic Labs 正在利用 AlphaFold 进行药物发现工作。
评论讨论了 AlphaFold 对药物发现的潜在影响,人工智能在各个领域的好处,以及对这项技术的怀疑和担忧。
🔗 https://www.nature.com/articles/d41586-024-00130-8
💬 https://news.ycombinator.com/item?id=39049703
Nature
AlphaFold found thousands of possible psychedelics. Will its predictions help drug discovery?
Nature - Researchers have doubted how useful the AI protein-structure tool will be in discovering medicines — now they are learning how to deploy it effectively.
微软对国家级黑客组织「午夜暴风雪」的攻击采取行动
微软发现了一次国家级黑客组织「午夜暴风雪」的攻击,该组织入侵了一个测试账户并访问了少量企业电子邮件账户。
然而,没有证据表明客户环境或生产系统受到了攻击。
微软立即采取措施加强安全措施,并将继续调查此事件。
一些评论者对此次入侵的严重性和对用户的潜在影响表示担忧。
其他人则讨论了「生产系统」的定义以及此次攻击的影响。
🔗 https://msrc.microsoft.com/blog/2024/01/microsoft-actions-following-attack-by-nation-state-actor-midnight-blizzard/
💬 https://news.ycombinator.com/item?id=39061800
微软发现了一次国家级黑客组织「午夜暴风雪」的攻击,该组织入侵了一个测试账户并访问了少量企业电子邮件账户。
然而,没有证据表明客户环境或生产系统受到了攻击。
微软立即采取措施加强安全措施,并将继续调查此事件。
一些评论者对此次入侵的严重性和对用户的潜在影响表示担忧。
其他人则讨论了「生产系统」的定义以及此次攻击的影响。
🔗 https://msrc.microsoft.com/blog/2024/01/microsoft-actions-following-attack-by-nation-state-actor-midnight-blizzard/
💬 https://news.ycombinator.com/item?id=39061800
Microsoft
Microsoft Actions Following Attack by Nation State Actor Midnight Blizzard | MSRC Blog
| Microsoft Security Response Center
| Microsoft Security Response Center
雅恩・勒孔:实现人级人工智能还需要很长时间
雅恩・勒孔,Meta 首席人工智能科学家,认为实现人级人工智能需要很长时间,并需要新的科学突破。
他反对在这个阶段对人工智能进行监管,并表示对超人级智能的担忧还为时过早。
Meta 全球事务总裁尼克・克莱格呼吁对人工智能产品进行监管,但不对研发进行限制。
勒孔和克莱格都对公众辩论转向与人工智能相关的具体问题和挑战感到满意。
勒孔解释说,当前的人工智能系统在狭窄领域内表现出智能,但缺乏理解物理世界、推理和规划的能力。
人工智能监管的辩论仍在进行中,欧盟引入了开创性的立法,但克莱格批评欧盟进展缓慢,可能阻碍了欧洲的竞争力。
勒孔对人工智能的潜在好处持谨慎乐观态度,但强调需要负责任的部署以减轻风险。
🔗 https://english.elpais.com/technology/2024-01-19/yann-lecun-chief-ai-scientist-at-meta-human-level-artificial-intelligence-is-going-to-take-a-long-time.html
💬 https://news.ycombinator.com/item?id=39059897
雅恩・勒孔,Meta 首席人工智能科学家,认为实现人级人工智能需要很长时间,并需要新的科学突破。
他反对在这个阶段对人工智能进行监管,并表示对超人级智能的担忧还为时过早。
Meta 全球事务总裁尼克・克莱格呼吁对人工智能产品进行监管,但不对研发进行限制。
勒孔和克莱格都对公众辩论转向与人工智能相关的具体问题和挑战感到满意。
勒孔解释说,当前的人工智能系统在狭窄领域内表现出智能,但缺乏理解物理世界、推理和规划的能力。
人工智能监管的辩论仍在进行中,欧盟引入了开创性的立法,但克莱格批评欧盟进展缓慢,可能阻碍了欧洲的竞争力。
勒孔对人工智能的潜在好处持谨慎乐观态度,但强调需要负责任的部署以减轻风险。
🔗 https://english.elpais.com/technology/2024-01-19/yann-lecun-chief-ai-scientist-at-meta-human-level-artificial-intelligence-is-going-to-take-a-long-time.html
💬 https://news.ycombinator.com/item?id=39059897
EL PAÍS English
Yann LeCun, chief AI scientist at Meta: ‘Human-level artificial intelligence is going to take a long time’
Nick Clegg, president of the company’s Global Affairs, argues that regulation should not be rushed in a conversation with EL PAÍS and four other media outlets in Davos
首个能够检测主要皮肤癌症的 AI 医疗设备获得 FDA 批准。
DermaSensor 是第一个获得 FDA 批准的 AI 动力医疗设备,可以检测三种最常见的皮肤癌症。
该设备使用非侵入性光学技术分析可疑的皮肤病变,并提供实时癌症风险评估。
临床试验显示该设备在检测皮肤癌症方面具有高灵敏度和特异性,有潜力提高医生的诊断率并增强初级护理能力。
然而,评论者对该设备的准确性、其作为诊断辅助而非筛查工具的用途以及设备和订阅模式的成本存在一些争议。
🔗 https://digialps.com/the-first-ai-medical-device-that-can-detect-all-major-skin-cancers-just-received-fda-approval/
💬 https://news.ycombinator.com/item?id=39058808
DermaSensor 是第一个获得 FDA 批准的 AI 动力医疗设备,可以检测三种最常见的皮肤癌症。
该设备使用非侵入性光学技术分析可疑的皮肤病变,并提供实时癌症风险评估。
临床试验显示该设备在检测皮肤癌症方面具有高灵敏度和特异性,有潜力提高医生的诊断率并增强初级护理能力。
然而,评论者对该设备的准确性、其作为诊断辅助而非筛查工具的用途以及设备和订阅模式的成本存在一些争议。
🔗 https://digialps.com/the-first-ai-medical-device-that-can-detect-all-major-skin-cancers-just-received-fda-approval/
💬 https://news.ycombinator.com/item?id=39058808
DigiAlps LTD
The First AI Medical Device That Can Detect All Major Skin Cancers Just Received FDA Approval
FDA approves DermaSensor, the first AI-powered medical device which can detect all major types of skin cancer! Get the full details.
🎉 Voxos.ai – 开源桌面语音助手
HackerNews 发布了一篇文章介绍 Voxos.ai,这是一个开源的桌面语音助手,旨在改进 Clippy 并支持新的桌面工作流程。
它让用户可以轻松在浏览器和 IDE 之间复制和粘贴 ChatGPT 的回答。
文章中还包括了关于 Voxos.ai 功能的评论、改进建议以及对其依赖专有 API 的担忧。
Voxos.ai 的开发者回应了这些评论,解答了关于其功能和未来计划的问题,包括支持本地 LLM 和离线使用。
一些用户对 Voxos.ai 的演示表示了兴趣。
🔗 https://gitlab.com/literally-useful/voxos
💬 https://news.ycombinator.com/item?id=39057005
HackerNews 发布了一篇文章介绍 Voxos.ai,这是一个开源的桌面语音助手,旨在改进 Clippy 并支持新的桌面工作流程。
它让用户可以轻松在浏览器和 IDE 之间复制和粘贴 ChatGPT 的回答。
文章中还包括了关于 Voxos.ai 功能的评论、改进建议以及对其依赖专有 API 的担忧。
Voxos.ai 的开发者回应了这些评论,解答了关于其功能和未来计划的问题,包括支持本地 LLM 和离线使用。
一些用户对 Voxos.ai 的演示表示了兴趣。
🔗 https://gitlab.com/literally-useful/voxos
💬 https://news.ycombinator.com/item?id=39057005
高效的 Intel GPU 上的 LLM 推理解决方案
这篇 HackerNews 帖子讨论了一篇论文,提出了一种在 Intel GPU 上执行大型语言模型(LLM)推理的高效解决方案。
该解决方案简化了 LLM 解码器层,引入了段 KV 缓存策略,并设计了一个定制的 Scaled-Dot-Product-Attention 内核。
与标准的 HuggingFace 在 Intel GPU 上的实现相比,该解决方案实现了更低的令牌延迟和更高的吞吐量。
评论中讨论了使用 SYCL 编写内核的方法、Intel 在 LLM 领域的软件和硬件工作以及运行 LLM 的不同硬件选项的性价比和性能。
🔗 https://arxiv.org/abs/2401.05391
💬 https://news.ycombinator.com/item?id=39069816
这篇 HackerNews 帖子讨论了一篇论文,提出了一种在 Intel GPU 上执行大型语言模型(LLM)推理的高效解决方案。
该解决方案简化了 LLM 解码器层,引入了段 KV 缓存策略,并设计了一个定制的 Scaled-Dot-Product-Attention 内核。
与标准的 HuggingFace 在 Intel GPU 上的实现相比,该解决方案实现了更低的令牌延迟和更高的吞吐量。
评论中讨论了使用 SYCL 编写内核的方法、Intel 在 LLM 领域的软件和硬件工作以及运行 LLM 的不同硬件选项的性价比和性能。
🔗 https://arxiv.org/abs/2401.05391
💬 https://news.ycombinator.com/item?id=39069816
arXiv.org
Efficient LLM inference solution on Intel GPU
Transformer based Large Language Models (LLMs) have been widely used in many fields, and the efficiency of LLM inference becomes hot topic in real applications. However, LLMs are usually...
🎉 营养洞察从你的购物小票开始
HackerNews 发布了一篇帖子,介绍了 Nutri,一个基于购物小票提供营养洞察的测试平台。
尽管结果有时可能不准确,但 Nutri 计划通过食品数据库提高准确性。
该平台还计划提供关于如何搭配和准备食物以增强营养价值的建议。
Nutri 通过集成 QR 码以便上传小票,并提供营养改善的分析,旨在提高用户体验。
该平台还可以作为追踪高糖和加工食品的伙伴。
评论中,用户建议使用像美国农业部的食品数据中心这样的数据库获取更准确的营养数据。
一些用户讨论了使用 GPT 模型根据购物账单生成故事的潜力。
其他人提到了已有的提供类似功能的平台。
还有关于该平台的局限性的讨论,比如无法准确追踪日常营养和分析餐食照片的挑战。
用户还提到了潜在的商机,并对隐私和监控表示担忧。
🔗 https://nutri.adrianstobbe.com/
💬 https://news.ycombinator.com/item?id=39077428
HackerNews 发布了一篇帖子,介绍了 Nutri,一个基于购物小票提供营养洞察的测试平台。
尽管结果有时可能不准确,但 Nutri 计划通过食品数据库提高准确性。
该平台还计划提供关于如何搭配和准备食物以增强营养价值的建议。
Nutri 通过集成 QR 码以便上传小票,并提供营养改善的分析,旨在提高用户体验。
该平台还可以作为追踪高糖和加工食品的伙伴。
评论中,用户建议使用像美国农业部的食品数据中心这样的数据库获取更准确的营养数据。
一些用户讨论了使用 GPT 模型根据购物账单生成故事的潜力。
其他人提到了已有的提供类似功能的平台。
还有关于该平台的局限性的讨论,比如无法准确追踪日常营养和分析餐食照片的挑战。
用户还提到了潜在的商机,并对隐私和监控表示担忧。
🔗 https://nutri.adrianstobbe.com/
💬 https://news.ycombinator.com/item?id=39077428
再见 LoRAs👋InstantID 可以从一张参考图片生成各种姿势或风格的定制图片,而无需任何训练!尤其是多个身份证生成看起来非常有帮助。
https://instantid.github.io/?ref=aiartweekly
🔗 https://fxtwitter.com/i/status/1749051862551019943
https://instantid.github.io/?ref=aiartweekly
🔗 https://fxtwitter.com/i/status/1749051862551019943
FxTwitter / FixupX
Dreaming Tulpa 🥓👑 (@dreamingtulpa)
Bye bye LoRAs 👋
InstantID can generate customized images with various poses or styles from a single reference image without any training! Especially the multi-ID generations look super helpful.
https://instantid.github.io/?ref=aiartweekly
InstantID can generate customized images with various poses or styles from a single reference image without any training! Especially the multi-ID generations look super helpful.
https://instantid.github.io/?ref=aiartweekly
HaptX 手套在虚拟空间中提供高保真触感反馈。
利用微流体技术,通过向手套特定位置发送压缩空气来模拟触感。
目前,这款手套正在为工业、制造和政府部门开发,用于培训目的。
它们可用于教授需要真实触感反馈的技能,如医疗程序和设备维修。
HaptX 还在探索机器人领域的应用。
目前,这款手套因复杂和昂贵而不适合消费者使用。
评论讨论了手套在远程操作机器人手和模拟纹理和物理阻力方面的潜在用途和挑战。
🔗 https://www.freethink.com/ar-vr/we-tested-the-most-advanced-haptic-gloves-in-the-world
💬 https://news.ycombinator.com/item?id=39061457
利用微流体技术,通过向手套特定位置发送压缩空气来模拟触感。
目前,这款手套正在为工业、制造和政府部门开发,用于培训目的。
它们可用于教授需要真实触感反馈的技能,如医疗程序和设备维修。
HaptX 还在探索机器人领域的应用。
目前,这款手套因复杂和昂贵而不适合消费者使用。
评论讨论了手套在远程操作机器人手和模拟纹理和物理阻力方面的潜在用途和挑战。
🔗 https://www.freethink.com/ar-vr/we-tested-the-most-advanced-haptic-gloves-in-the-world
💬 https://news.ycombinator.com/item?id=39061457
Freethink
We tested the most advanced haptic gloves in the world
HaptX gloves provide high-fidelity touch feedback of virtual spaces (and they look cool, too).
AI 可以将图像纹理转移到 3D 网格上!TextureDreamer 是一种方法,可以将来自 3-5 张图像的逼真、高保真且具有几何感知的纹理放置在任意 3D 网格上。
https://texturedreamer.github.io/?ref=aiartweekly
🔗 https://fxtwitter.com/i/status/1748991997648507008
https://texturedreamer.github.io/?ref=aiartweekly
🔗 https://fxtwitter.com/i/status/1748991997648507008
FxTwitter / FixupX
Dreaming Tulpa 🥓👑 (@dreamingtulpa)
AI can transfer textures from images onto 3D meshes!
TextureDreamer is a method that can put photorealistic, high-fidelity, and geometry-aware textures from 3-5 images onto arbitrary 3D meshes.
https://texturedreamer.github.io/?ref=aiartweekly
TextureDreamer is a method that can put photorealistic, high-fidelity, and geometry-aware textures from 3-5 images onto arbitrary 3D meshes.
https://texturedreamer.github.io/?ref=aiartweekly
自我奖励语言模型
该文章讨论了自我奖励语言模型(SRLMs)的概念及其改进语言模型的潜力。
作者认为,目前从人类偏好中训练奖励模型的方法存在局限性,而 SRLMs 在训练过程中使用语言模型本身提供奖励,从而提高了指令遵循能力和高质量奖励。
作者通过使用他们的方法对 Llama 2 70B 进行微调,证明了 SRLMs 的有效性,该模型优于现有系统。
评论中讨论了语言模型自我改进的潜力、使用合成数据的可能性、开源 GPT4 竞争对手的可能性,以及自我评估和将语言模型与现实规则联系起来的挑战。
还讨论了与 AlphaGo 的自我对弈类比以及 SRLMs 中幻觉和过拟合的潜在问题。
🔗 https://arxiv.org/abs/2401.10020
💬 https://news.ycombinator.com/item?id=39051279
该文章讨论了自我奖励语言模型(SRLMs)的概念及其改进语言模型的潜力。
作者认为,目前从人类偏好中训练奖励模型的方法存在局限性,而 SRLMs 在训练过程中使用语言模型本身提供奖励,从而提高了指令遵循能力和高质量奖励。
作者通过使用他们的方法对 Llama 2 70B 进行微调,证明了 SRLMs 的有效性,该模型优于现有系统。
评论中讨论了语言模型自我改进的潜力、使用合成数据的可能性、开源 GPT4 竞争对手的可能性,以及自我评估和将语言模型与现实规则联系起来的挑战。
还讨论了与 AlphaGo 的自我对弈类比以及 SRLMs 中幻觉和过拟合的潜在问题。
🔗 https://arxiv.org/abs/2401.10020
💬 https://news.ycombinator.com/item?id=39051279
arXiv.org
Self-Rewarding Language Models
We posit that to achieve superhuman agents, future models require superhuman feedback in order to provide an adequate training signal. Current approaches commonly train reward models from human...
智能化搜索:智利利用人工智能寻找皮诺切特独裁时期失踪的 1000 多人。
该项目通过分析数百万页的文件来确定失踪者。
目前项目正处于预编程阶段,已处理超过 470 万页的扫描文件。
利用人工智能将有助于对文件进行分类,将其转化为可搜索的数据,并在不同页面、人物、地点和日期之间建立联系。
OCR 技术的初步应用已经发现了数千个涉及侵犯人权的军官的提及。
评论中讨论了独裁时期的暴行、美国的参与以及评估复杂情况下行动的挑战。
🔗 https://english.elpais.com/international/2024-01-18/chile-searches-for-those-missing-from-pinochet-dictatorship-with-the-help-of-artificial-intelligence.html
💬 https://news.ycombinator.com/item?id=39066801
该项目通过分析数百万页的文件来确定失踪者。
目前项目正处于预编程阶段,已处理超过 470 万页的扫描文件。
利用人工智能将有助于对文件进行分类,将其转化为可搜索的数据,并在不同页面、人物、地点和日期之间建立联系。
OCR 技术的初步应用已经发现了数千个涉及侵犯人权的军官的提及。
评论中讨论了独裁时期的暴行、美国的参与以及评估复杂情况下行动的挑战。
🔗 https://english.elpais.com/international/2024-01-18/chile-searches-for-those-missing-from-pinochet-dictatorship-with-the-help-of-artificial-intelligence.html
💬 https://news.ycombinator.com/item?id=39066801
EL PAÍS English
Chile searches for those missing from Pinochet dictatorship with the help of artificial intelligence
At the end of August, Chilean president Gabriel Boric launched the Search Plan for more than 1,000 Chileans. Today, old judicial documents, many typewritten, have been digitized to apply cutting edge technology and cross-reference data
在 ComfyUI 中使用 GragNUWA 复刻 Runway Multi Motion Brush,效果基本上没有差别,而且还更加灵活,可以增加更多细节的运动路径。
GragNUWA 的潜力无限!#ComfyUI #GragNUWA #RunwayMultiMotionBrush
🔗 https://fxtwitter.com/i/status/1749003377810522416
GragNUWA 的潜力无限!#ComfyUI #GragNUWA #RunwayMultiMotionBrush
🔗 https://fxtwitter.com/i/status/1749003377810522416
FxTwitter / FixupX
-Zho- (@ZHOZHO672070)
在 ComfyUI 中用 GragNUWA 复刻 Runway Multi Motion Brush,效果基本没差别,并且还更灵活,可以增加更多细节的运动路径,GragNUWA 潜力无限!!!
↘️ Quoting Always Editing (@notiansans)
Okay, my new favorite thing to do with Multi Motion Brush is dramatic western inspired squints 🤠😑
↘️ Quoting Always Editing (@notiansans)
Okay, my new favorite thing to do with Multi Motion Brush is dramatic western inspired squints 🤠😑
谷歌 AI 研究员和 NeRF 的原始作者之一,@jon_barron,已经发布了 Zip-NeRF 和 CamP 的代码。
不要忽视 CamP!CamP 解决了在空间中理解相机位置的问题,其结果比 COLMAP 要好得多。
🔗https://radiancefields.com/camp-and-zipnerf-released/
🔗 https://fxtwitter.com/i/status/1748742982054879638
不要忽视 CamP!CamP 解决了在空间中理解相机位置的问题,其结果比 COLMAP 要好得多。
🔗https://radiancefields.com/camp-and-zipnerf-released/
🔗 https://fxtwitter.com/i/status/1748742982054879638
Radiance Fields
CamP And Zip-NeRF Released | Radiance Fields
In a surprising move, Jon Barron, one of the original authors of NeRF and a Google AI Researcher has released the code for not only Zip-NeRF, but also for CamP.
我们开发了一个系统,可以将所有的小说游戏转化为全语音小说游戏。
通过屏幕截图识别文字,并使用 VoiceVox 为每个角色朗读,朗读完毕后自动翻页。
🔗 https://fxtwitter.com/i/status/1748989326447554827
通过屏幕截图识别文字,并使用 VoiceVox 为每个角色朗读,朗读完毕后自动翻页。
🔗 https://fxtwitter.com/i/status/1748989326447554827
🧵 Thread • FxTwitter / FixupX
猩々 博士🧪💻 研究開発系V (@Mega_Gorilla_)
すべてのノベルゲームをフルボイスノベルゲームにしてくれるシステム作った。
スクリーンショットで文字読み込みして、キャラごとにVoiceVoxで読み上げ、読み上げ後自動送りしてくれる。
スクリーンショットで文字読み込みして、キャラごとにVoiceVoxで読み上げ、読み上げ後自動送りしてくれる。
TikTok 发布了 Depth Anything 释放大规模无标签数据的力量
论文页面:https://huggingface.co/papers/2401.10891
演示:https://huggingface.co/spaces/LiheYoung/Depth-Anything
Depth Anything 是在 150 万张标记图像和 6200 万 + 无标签图像的联合训练下得到的,提供了最强大的单目深度估计(MDE)基础模型,具备以下特点:
零样本相对深度估计,优于 MiDaS v3.1(BEiTL-512)
零样本度量深度估计,优于 ZoeDepth
在 NYUv2 和 KITTI 上进行了最佳领域内微调和评估
🔗 https://fxtwitter.com/i/status/1749284669936275463
论文页面:https://huggingface.co/papers/2401.10891
演示:https://huggingface.co/spaces/LiheYoung/Depth-Anything
Depth Anything 是在 150 万张标记图像和 6200 万 + 无标签图像的联合训练下得到的,提供了最强大的单目深度估计(MDE)基础模型,具备以下特点:
零样本相对深度估计,优于 MiDaS v3.1(BEiTL-512)
零样本度量深度估计,优于 ZoeDepth
在 NYUv2 和 KITTI 上进行了最佳领域内微调和评估
🔗 https://fxtwitter.com/i/status/1749284669936275463
huggingface.co
Paper page - Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
Join the discussion on this paper page
GPT-3.5 模型在过度思考 "使用路径" 时会崩溃
作者发现,当回应中包含特定短语 "使用路径" 时,GPT-3.5 模型会崩溃。
而 GPT-4 模型则不会出现此问题。
这个错误可能是由于 GPT-3.5 模型中存在一个拼写错误的标记,导致训练不充分。
作者认为这个问题可能被用于数据污染目的。
评论中讨论了故障标记、GPT 模型的训练数据以及使用 "杀死" 词汇作为安全措施的概念。
还讨论了 GPT 中计算的冗余性,由于单词的不同拼写以及使用 "口令" 作为识别机器人的方法。
🔗 https://iter.ca/post/gpt-crash/
💬 https://news.ycombinator.com/item?id=39086106
作者发现,当回应中包含特定短语 "使用路径" 时,GPT-3.5 模型会崩溃。
而 GPT-4 模型则不会出现此问题。
这个错误可能是由于 GPT-3.5 模型中存在一个拼写错误的标记,导致训练不充分。
作者认为这个问题可能被用于数据污染目的。
评论中讨论了故障标记、GPT 模型的训练数据以及使用 "杀死" 词汇作为安全措施的概念。
还讨论了 GPT 中计算的冗余性,由于单词的不同拼写以及使用 "口令" 作为识别机器人的方法。
🔗 https://iter.ca/post/gpt-crash/
💬 https://news.ycombinator.com/item?id=39086106
Smitop
GPT-3.5 crashes when it thinks about useRalativeImagePath too much
Asking it to repeat "ponyuseRal ponyuseRal ponyuseRal pony" makes API requests fail
阿里巴巴发布了 SCEPTER 演示:https://huggingface.co/spaces/modelscope/scepter_studio
GitHub:https://github.com/modelscope/scepter?tab=readme-ov-file#% EF% B8%8F-scepter-studio
SCEPTER 是一个开源代码仓库,专注于生成式训练、微调和推理,涵盖了一系列下游任务,如图像生成、转换和编辑。
🔗 https://fxtwitter.com/i/status/1749206336355602491
GitHub:https://github.com/modelscope/scepter?tab=readme-ov-file#% EF% B8%8F-scepter-studio
SCEPTER 是一个开源代码仓库,专注于生成式训练、微调和推理,涵盖了一系列下游任务,如图像生成、转换和编辑。
🔗 https://fxtwitter.com/i/status/1749206336355602491
huggingface.co
Scepter Studio - a Hugging Face Space by modelscope
Discover amazing ML apps made by the community
从零开始的 LoRA:LLM 微调的实现
HackerNews 的帖子讨论了 LoRA(低秩适应)在 LLM(语言模型)微调中的实现。
评论涵盖了人工智能的工程与发现方面、微调的用例、LoRA 和 LoRa(一种无线协议)之间的混淆,以及 LoRA 的性能影响。
一些评论者还提供了与微调相关的资源和库,并分享了他们的经验和观点。
🔗 https://lightning.ai/lightning-ai/studios/code-lora-from-scratch?view=public§ion=all
💬 https://news.ycombinator.com/item?id=39091777
HackerNews 的帖子讨论了 LoRA(低秩适应)在 LLM(语言模型)微调中的实现。
评论涵盖了人工智能的工程与发现方面、微调的用例、LoRA 和 LoRa(一种无线协议)之间的混淆,以及 LoRA 的性能影响。
一些评论者还提供了与微调相关的资源和库,并分享了他们的经验和观点。
🔗 https://lightning.ai/lightning-ai/studios/code-lora-from-scratch?view=public§ion=all
💬 https://news.ycombinator.com/item?id=39091777
Lightning AI
Code LoRA from Scratch - a Lightning Studio by sebastian
LoRA (Low-Rank Adaptation) is a popular technique to finetune LLMs more efficiently.
This Studio explains how LoRA works by coding it from scratch, which is an excellent exercise for looking under …
This Studio explains how LoRA works by coding it from scratch, which is an excellent exercise for looking under …