拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理,事实证明,聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪

  这是一个奇特的事实 ,我们不了解大型语言模型(LLM)的实际工作方式。我们设计了它们 。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的 。好吧,他们是。现在,由于人类的一些新研究 ,这种研究灵感来自脑扫描技术,并有助于解释为什么聊天机器人幻觉并对数字糟糕。

  问题在于,尽管我们了解如何设计和构建模型 ,但我们不知道所有的重量和参数如何,即训练过程产生的模型内部数据之间的关系,实际上导致了似乎是有能力的输出的 。

  “打开一个大型语言模型 ,您所看到的只是数十亿个数字—“参数 ”。他指出:“这没有启发性。”

  为了了解实际发生的事情 ,Anthropic的研究人员开发了一种新技术,称为电路跟踪,以跟踪大型语言模型内部的决策过程 。然后 ,他们将其应用于自己的Claude 3.5 Haiku LLM 。

  拟人化表示,其方法的灵感来自神经科学中使用的脑扫描技术,并且可以识别模型在不同时间活跃的组件。换句话说 ,这有点像一个大脑扫描仪,在认知过程中发现了哪些部分大脑正在发射。

  人类使用这种方法进行了许多有趣的发现,这尤其是LLM在基本数学上如此糟糕的原因 。要求克劳德(Claude)添加36和59 ,该模型将采取一系列奇怪的步骤,包括首先添加一系列近似值(添加40ish和60ish,添加57ish和36ish)。在其过程结束时 ,它提出了92ish的值。与此同时,一系列步骤,另一个步骤集中在最后一个数字 ,6和9的答案中 ,并确定了92个答案 。麻省理工学院文章解释。

  但这是真的很时髦。如果您问克劳德(Claude)如何获得95的正确答案,显然会告诉您:“我添加了1(6+9 = 15),携带1 ,然后添加10s(3+5+1 = 9),导致95 。”但这实际上仅反映了其培训数据中有关总和如何完成的共同答案,而不是实际做的。

  换句话说 ,该模型不仅使用非常非常奇怪的方法来进行数学,而且您不能相信其对其刚刚做的事情的解释。这很重要,表明在为AI设计护栏时 ,不能依靠模型输出 。他们的内部运作也需要理解。

  这项研究的另一个非常令人惊讶的结果是,发现这些LLMS并不能仅仅通过预测下一个单词来运作。通过追踪克劳德(Claude)如何产生押韵对联,人类发现它首先选择了诗歌末尾的押韵词 ,然后填充在该行的其余部分中 。

  巴特森说:“诗歌中的计划使我震惊了 。 ”“它没有在最后一刻试图使押韵变得有意义,而是知道它的去向。”

  拟人化还发现,除其他外 ,克劳德“有时会在语言之间共享的概念空间中进行思考 ,这表明它具有一种通用的“思想语言”。 ”

  任何人,这项研究显然还有很长的路要走 。根据拟人化的说法,“目前 ,即使在只有数十句话的提示上,也需要花费几个小时的人力来了解我们看到的电路。”研究并不能说明LLM内部的结构首先是如何形成的。

  但是,它至少阐明了这些奇怪的神秘的人的众生—我们已经创建但不理解“实际上是在起作用 。那一定是一件好事。

本文来自作者[零槐]投稿,不代表乐悠悠立场,如若转载,请注明出处:https://edecn.cn/news/145.html

(20)

文章推荐

  • 英特尔的下一批CPU可能仍然称为Core Ultra 200s,可能是因为Arrow Lake Refresh并不是很大的提升

      在生产CPU的几年中,英特尔拥有悠久的历史,可以使其目前的建筑刷新,而不是批发替换它。更新通常提供更高的时钟速度,偶尔会提供一两个新功能,但它们始终涉及处理器的新名称。但是,对于ArrowLake刷新而言,据称该调整的芯片仍然称为CoreUltra200s。  诚然,这只是提出索赔

    2025年09月01日
    12314
  • 华硕ZenFone 3 Zoom怎么样值得买吗

    网上有关“华硕ZenFone3Zoom怎么样值得买吗”话题很是火热,小编也是针对华硕ZenFone3Zoom怎么样值得买吗寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。从整机的配置以及参数上来看,华硕Zenfone3Zoom确实是一款相当不错的手

    2025年09月01日
    14323
  • 所有宝藏地图位置和奖励

      有12个宝藏图供您在其四个主要地区均匀分裂,均匀分裂。虽然有些非常简单,但另一些人则要求更好地了解景观,甚至可以解决一些狡猾的难题,然后才能获得宝藏。  除了找到神图腾碎片的位置外,挖掘这些隐藏的宝藏是可用的最纳税任务之一,尽管您肯定会发现有意义的任务。每张宝藏地图都为您提供独特的设备,

    2025年09月02日
    5317
  • 汽车off需要一直开启吗

    网上有关“汽车off需要一直开启吗”话题很是火热,小编也是针对汽车off需要一直开启吗寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。太平洋汽车网汽车OFF需要一起开启。OFF是车身稳定控制系统的关闭按键,该系统是默认开启的,长按这个按键可关闭。车辆发生侧滑了

    2025年09月06日
    9302
  • 流放之路处刑冰锤怎么玩 流放之路处刑冰锤bd介绍

    网上有关“流放之路处刑冰锤怎么玩流放之路处刑冰锤bd介绍”话题很是火热,小编也是针对流放之路处刑冰锤怎么玩流放之路处刑冰锤bd介绍寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。 流放之路处刑冰锤怎么玩?处刑冰锤这个流派在上一个

    2025年09月06日
    6310
  • 空调外机对着洗好的衣服吹会不会影响穿

    网上有关“空调外机对着洗好的衣服吹会不会影响穿”话题很是火热,小编也是针对空调外机对着洗好的衣服吹会不会影响穿寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。空调外机对着洗好的衣服吹会不会影响穿一点点影响而已,如果空调机一向没有散热不良的问题,那这一点

    2025年09月06日
    7316
  • 惠普m706n怎么用usb打印

    网上有关“惠普m706n怎么用usb打印”话题很是火热,小编也是针对惠普m706n怎么用usb打印寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1、打开惠普m706n。2、将想要打印的文件以pdf格式保存到u盘中。3、保存好后,把u盘安全退电脑出后。4、到复

    2025年09月07日
    7301
  • 欧莱雅祛斑效果怎么样?

    网上有关“欧莱雅祛斑效果怎么样?”话题很是火热,小编也是针对欧莱雅祛斑效果怎么样?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。脸上长斑,会让人的肌肤看起来很糟糕,也会留给别人一种印象就是肌肤很不好的感觉,这种感觉会影响到别人对自己的态度,在这个看脸的时代里

    2025年09月07日
    11301
  • 冷柜哪个牌子质量最好

    网上有关“冷柜哪个牌子质量最好”话题很是火热,小编也是针对冷柜哪个牌子质量最好寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。冷柜品牌十大排名为海尔冰柜,澳柯玛冰柜,美的冰柜,星星冰柜,美菱冰柜,容声冰柜,华美冰柜,白雪冰柜,统帅冰柜,海信冰柜。1、海尔冰柜海

    2025年09月07日
    13302
  • 尼康的P80和P90的比较

    网上有关“尼康的P80和P90的比较”话题很是火热,小编也是针对尼康的P80和P90的比较寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。基本参数型号P90COOLPIXP80上市时间20092008相机类型长焦数码相机长焦数码相机总像素1270万像素107

    2025年09月07日
    7314

发表回复

本站作者才能评论

评论列表(3条)

  • 零槐的头像
    零槐 2025年09月02日

    我是乐悠悠的签约作者“零槐”

  • 零槐
    零槐 2025年09月02日

    本文概览:  这是一个奇特的事实,我们不了解大型语言模型(LLM)的实际工作方式。我们设计了它们。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的。好吧,他们是。现...

  • 零槐
    用户090212 2025年09月02日

    文章不错《拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理,事实证明,聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪》内容很有帮助

联系我们

邮件:乐悠悠@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

乐悠悠