拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理，事实证明，聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪

零槐 • 2025年09月02日 12:03 • 游戏资讯 • 阅读 46

　　这是一个奇特的事实，我们不了解大型语言模型（LLM）的实际工作方式。我们设计了它们。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的。好吧，他们是。现在，由于人类的一些新研究，这种研究灵感来自脑扫描技术，并有助于解释为什么聊天机器人幻觉并对数字糟糕。

　　问题在于，尽管我们了解如何设计和构建模型，但我们不知道所有的重量和参数如何，即训练过程产生的模型内部数据之间的关系，实际上导致了似乎是有能力的输出的。

　　“打开一个大型语言模型，您所看到的只是数十亿个数字＆mdash;“参数 ”。他指出：“这没有启发性。”

　　为了了解实际发生的事情，Anthropic的研究人员开发了一种新技术，称为电路跟踪，以跟踪大型语言模型内部的决策过程。然后，他们将其应用于自己的Claude 3.5 Haiku LLM。

　　拟人化表示，其方法的灵感来自神经科学中使用的脑扫描技术，并且可以识别模型在不同时间活跃的组件。换句话说，这有点像一个大脑扫描仪，在认知过程中发现了哪些部分大脑正在发射。

　　人类使用这种方法进行了许多有趣的发现，这尤其是LLM在基本数学上如此糟糕的原因。要求克劳德（Claude）添加36和59 ，该模型将采取一系列奇怪的步骤，包括首先添加一系列近似值（添加40ish和60ish，添加57ish和36ish）。在其过程结束时，它提出了92ish的值。与此同时，一系列步骤，另一个步骤集中在最后一个数字，6和9的答案中，并确定了92个答案。麻省理工学院文章解释。

　　但这是真的很时髦。如果您问克劳德（Claude）如何获得95的正确答案，显然会告诉您：“我添加了1（6+9 = 15），携带1 ，然后添加10s（3+5+1 = 9），导致95 。”但这实际上仅反映了其培训数据中有关总和如何完成的共同答案，而不是实际做的。

　　换句话说，该模型不仅使用非常非常奇怪的方法来进行数学，而且您不能相信其对其刚刚做的事情的解释。这很重要，表明在为AI设计护栏时，不能依靠模型输出。他们的内部运作也需要理解。

　　这项研究的另一个非常令人惊讶的结果是，发现这些LLMS并不能仅仅通过预测下一个单词来运作。通过追踪克劳德（Claude）如何产生押韵对联，人类发现它首先选择了诗歌末尾的押韵词，然后填充在该行的其余部分中。

　　巴特森说：“诗歌中的计划使我震惊了。 ”“它没有在最后一刻试图使押韵变得有意义，而是知道它的去向。”

　　拟人化还发现，除其他外，克劳德“有时会在语言之间共享的概念空间中进行思考，这表明它具有一种通用的“思想语言”。 ”

　　任何人，这项研究显然还有很长的路要走。根据拟人化的说法，“目前，即使在只有数十句话的提示上，也需要花费几个小时的人力来了解我们看到的电路。”研究并不能说明LLM内部的结构首先是如何形成的。

　　但是，它至少阐明了这些奇怪的神秘的人的众生＆mdash;我们已经创建但不理解“实际上是在起作用。那一定是一件好事。

本文来自作者[零槐]投稿，不代表乐悠悠立场，如若转载，请注明出处：https://edecn.cn/news/145.html

46 5

关于作者

零槐认证作者

34 文章

274769 阅读

46 粉丝

我是乐悠悠的签约作者[零槐],本篇文章《拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理，事实证明，聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪》主要讲述了:　　这是一个奇特的事实，我们不了解大型语言模型（LLM）的实际工作方式。我们设计了它们。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的。好吧，他们是。现...

游戏资讯

求火影疾风传佐助出场的级数

网上有关“求火影疾风传佐助出场的级数”话题很是火热，小编也是针对求火影疾风传佐助出场的级数寻找了一些与之相关的一些信息进行分析，如果能碰巧解决你现在面临的问题，希望能够帮助到您。火影忍者疾风传221归乡267毒蛇的巢穴271-272佐助登场309力量的代价310忍者的决心311发现大

补股嚷
2025年09月07日
5530007
作者专栏

被困电梯的复杂朋友圈文案锦集四十句

网上有关“被困电梯的复杂朋友圈文案锦集四十句”话题很是火热，小编也是针对被困电梯的复杂朋友圈文案锦集四十句寻找了一些与之相关的一些信息进行分析，如果能碰巧解决你现在面临的问题，希望能够帮助到您。被困电梯的复杂朋友圈文案篇一1.我第一次被困在电梯里，我的心中好像有一面小鼓，一直在“咚咚咚”的敲着

贴诚狮
2025年09月15日
2931715
股票基金

玩家必搜“河北家乡麻将亲友圈怎么开挂”真实开挂技巧分享

玩家必搜“河北家乡麻将亲友圈怎么开挂”真实开挂技巧分享认准官方唯一联系方式客服24小时在线关于！河北家乡麻将亲友圈怎么开挂是不是有挂，有没有挂!很多玩家在这款游戏中打牌都会发现很多玩家的牌特别好，总是好牌，而且好像能看到其他

赴触呜
2025年09月21日
1632321
经验分享

用什么垫花盆对花卉植物最好

网上有关“用什么垫花盆对花卉植物最好”话题很是火热，小编也是针对用什么垫花盆对花卉植物最好寻找了一些与之相关的一些信息进行分析，如果能碰巧解决你现在面临的问题，希望能够帮助到您。1、盆底垫丝袜首先说的，就是让花花觉得十分惊讶的丝袜。原来丝袜还能够垫在花盆底，不仅不透土，而且排水性还很棒！

忌淹款
2025年09月22日
1830022
游戏资讯

一键必胜“中至南昌麻将有没有挂”(详细透视教程)-哔哩哔哩

一键必胜“中至南昌麻将有没有挂”(详细透视教程)-哔哩哔哩>>亲，中至南昌麻将有没有挂这款游戏原来确实可以开挂，详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明，就是全场，公司软件防封号、防检测、正版软件、非诚勿扰。2022首推。

灌蚁九
2025年09月22日
2130322
作者专栏

苹果电脑目前最高配置是多少

网上有关“苹果电脑目前最高配置是多少”话题很是火热，小编也是针对苹果电脑目前最高配置是多少寻找了一些与之相关的一些信息进行分析，如果能碰巧解决你现在面临的问题，希望能够帮助到您。2022款苹果a2338配置参数？a2338是苹果MacbookPro13.3英寸的内部型号，MacbookPro13.3

绞续芦
2025年09月22日
1731022
生活百科

6秒懂!新玉海楼茶苑有没有透视挂”分享开挂教程

6秒懂!新玉海楼茶苑有没有透视挂”分享开挂教程您好：新玉海楼茶苑有没有透视挂这款游戏可以开挂，确实是有挂的，很多玩家在小程序雀神麻将开挂这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏

培仍
2025年09月25日
1831625
常识科普

实测分享“闲来贵州麻将有挂吗(真的有挂)

实测分享“闲来贵州麻将有挂吗(真的有挂)闲来贵州麻将有挂吗是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用户可以加入我们（QQ群聊）免费测试，先看效果下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单，打开这个应用便可以自定义手机打牌系统规

公亿梳
2025年09月26日
1630826
股票基金

基金从业考试/基金从业考试科目

文章一览：①、基金从业资格考试都要考哪些内容②、基金从业考试科目有哪些③、基金从业考试考几门④、基金从业资格证考试考哪几门⑤、基金从业人员的考试科目有什么⑥、基金从业资格考试是什么基金从业资格考试都要考哪些内容①、科目一：《基金法律法规、职业道德与业务规范》。此

型迷予
2025年10月06日
2032006
股票基金

基金定投的好处？基金定投的好处和缺点

文章一览：①、长期定投基金有什么好处②、基金定投的好处③、基金定投是什么有什么好处④、基金定投有什么好处?⑤、基金定投的几大好处!⑥、基金定投是什么好处长期定投基金有什么好处①、长期定投基金的好处主要包括以下几点：降低投资风险：定期定投基金可以分散投资时点，避免

抽拍
2025年10月16日
1432216

发表回复

本站作者才能评论

评论列表（3条）

零槐 2025年09月02日

我是乐悠悠的签约作者“零槐”

回复
零槐 2025年09月02日

本文概览：　　这是一个奇特的事实，我们不了解大型语言模型（LLM）的实际工作方式。我们设计了它们。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的。好吧，他们是。现...

回复
用户090212 2025年09月02日

文章不错《拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理，事实证明，聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪》内容很有帮助

回复

拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理，事实证明，聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪

关于作者

文章推荐

发表回复

评论列表（3条）

联系我们