拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理,事实证明,聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪

  这是一个奇特的事实 ,我们不了解大型语言模型(LLM)的实际工作方式。我们设计了它们 。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的 。好吧,他们是。现在,由于人类的一些新研究 ,这种研究灵感来自脑扫描技术,并有助于解释为什么聊天机器人幻觉并对数字糟糕。

  问题在于,尽管我们了解如何设计和构建模型 ,但我们不知道所有的重量和参数如何,即训练过程产生的模型内部数据之间的关系,实际上导致了似乎是有能力的输出的 。

  “打开一个大型语言模型 ,您所看到的只是数十亿个数字—“参数 ”。他指出:“这没有启发性。”

  为了了解实际发生的事情 ,Anthropic的研究人员开发了一种新技术,称为电路跟踪,以跟踪大型语言模型内部的决策过程 。然后 ,他们将其应用于自己的Claude 3.5 Haiku LLM 。

  拟人化表示,其方法的灵感来自神经科学中使用的脑扫描技术,并且可以识别模型在不同时间活跃的组件。换句话说 ,这有点像一个大脑扫描仪,在认知过程中发现了哪些部分大脑正在发射。

  人类使用这种方法进行了许多有趣的发现,这尤其是LLM在基本数学上如此糟糕的原因 。要求克劳德(Claude)添加36和59 ,该模型将采取一系列奇怪的步骤,包括首先添加一系列近似值(添加40ish和60ish,添加57ish和36ish)。在其过程结束时 ,它提出了92ish的值。与此同时,一系列步骤,另一个步骤集中在最后一个数字 ,6和9的答案中 ,并确定了92个答案 。麻省理工学院文章解释。

  但这是真的很时髦。如果您问克劳德(Claude)如何获得95的正确答案,显然会告诉您:“我添加了1(6+9 = 15),携带1 ,然后添加10s(3+5+1 = 9),导致95 。”但这实际上仅反映了其培训数据中有关总和如何完成的共同答案,而不是实际做的。

  换句话说 ,该模型不仅使用非常非常奇怪的方法来进行数学,而且您不能相信其对其刚刚做的事情的解释。这很重要,表明在为AI设计护栏时 ,不能依靠模型输出 。他们的内部运作也需要理解。

  这项研究的另一个非常令人惊讶的结果是,发现这些LLMS并不能仅仅通过预测下一个单词来运作。通过追踪克劳德(Claude)如何产生押韵对联,人类发现它首先选择了诗歌末尾的押韵词 ,然后填充在该行的其余部分中 。

  巴特森说:“诗歌中的计划使我震惊了 。 ”“它没有在最后一刻试图使押韵变得有意义,而是知道它的去向。”

  拟人化还发现,除其他外 ,克劳德“有时会在语言之间共享的概念空间中进行思考 ,这表明它具有一种通用的“思想语言”。 ”

  任何人,这项研究显然还有很长的路要走 。根据拟人化的说法,“目前 ,即使在只有数十句话的提示上,也需要花费几个小时的人力来了解我们看到的电路。”研究并不能说明LLM内部的结构首先是如何形成的。

  但是,它至少阐明了这些奇怪的神秘的人的众生—我们已经创建但不理解“实际上是在起作用 。那一定是一件好事。

本文来自作者[零槐]投稿,不代表乐悠悠立场,如若转载,请注明出处:https://edecn.cn/news/145.html

(78)

文章推荐

  • 怀才不遇的诗句

    网上有关“怀才不遇的诗句”话题很是火热,小编也是针对怀才不遇的诗句寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。怀才不遇的诗句如下:1、怀才不遇心如焚,天地苍茫我独闯。2、才华横溢无人知,寂寞孤单自戏词。3、难得才情无人赏,默默守望在角落。4、无人认可心痛切

    2025年09月03日
    75313
  • 微软的研究表明,人们无法发现真实和AI生成的图像之间的区别,只能正确地告诉他们62%的时间;您能做得更好?

      除非您非常认真地对待社交供稿,否则AI斜坡图像和视频的潮汐浪潮感觉不可避免。更令人担忧的是,这种崩溃的潮流多久以来要突出我们亲人的哪些努力从人类手制造的所有斜率中辨别出AI生成的内容。更糟糕的是,人们常常会发现自己被生成模型吐出的图像所愚弄。  听起来很熟悉吗?原来不仅仅是你。根据Mic

    2025年09月04日
    67301
  • 玩家必看攻略!“中至上饶麻将有挂吗,附图文教程!

    玩家必看攻略!“中至上饶麻将有挂吗,附图文教程!无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由:1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信:2、自动连接,用户只要开启软件,就会全程后台自动连接程序,无需用户时时盯着软件。3、安全

    2025年09月22日
    53313
  • 三分钟了解!雀友会潮汕麻将有挂吗”其实确实有挂

    三分钟了解!雀友会潮汕麻将有挂吗”其实确实有挂无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由:1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信:2、自动连接,用户只要开启软件,就会全程后台自动连接程序,无需用户时时盯着软件。3、安全保

    2025年09月22日
    56318
  • 基金一览表/华夏基金一览表

    文章一览:①、基金代码查询(基金代码查询一览表)②、基金涨幅排名一览表③、私募基金排名一览表④、分级基金b一览表(分级b级基金有哪些)基金代码查询(基金代码查询一览表)ETF基金代码特点上海证券交易所(沪市):ETF基金的交易代码通常以“51”开头。例如:510050:上

    2025年09月23日
    54315
  • 刚换的轮胎胎压报警就亮了怎么回事

    网上有关“刚换的轮胎胎压报警就亮了怎么回事”话题很是火热,小编也是针对刚换的轮胎胎压报警就亮了怎么回事寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。当汽车轮胎磨损严重,需要及时更换的,可是很多车主却发现,在刚换的轮胎胎压报警就亮了怎么回事?汽车刚换的轮胎胎压

    2025年09月25日
    62305
  • 股票1学习群/现在很多股票群免费教学

    文章一览:①、一个股票群的老师推荐我们做股指,投资20万,这是真的吗?②、股民一般会进什么群③、哪位大神帮我科普一下股票群免费送牛股,万人建仓的套路啊?④、探讨股票群如何加入,靠谱的免费的一个股票群的老师推荐我们做股指,投资20万,这是真的吗?股指期货的基本概念:股指期货是

    2025年10月19日
    50303
  • 中国十大风景名胜有哪些

    中国十大风景名胜有哪些中国十大风景名胜有哪些相关话题近期引发广泛关注,我们特别整理了多维度信息,希望能为您提供有价值的参考。1、万里长城:中国旅游的标志,中国的标志,世界新七大奇迹之一且之首,地球上最伟大的人类工程。1961年被列为第一批全国重点文物保护单位,1987年被列为世界文化遗产,第一

    2025年10月25日
    50300
  • 天气预报说襄城县今天有11级风是真的么-

    天气预报说襄城县今天有11级风是真的么?天气预报说襄城县今天有11级风是真的么?相关话题近期引发广泛关注,我们特别整理了多维度信息,希望能为您提供有价值的参考。假的25日白天中雨32°C5-6级25日夜间中雨22°C4-5级1.今天北方有冷空气南下偏北风会增大2.不排除在雷阵雨时出现较大阵风

    2025年11月16日
    43300
  • 必看教程“小程序财神十三张是怎么控制胜率”(附开挂用挂技巧步骤)

    重大发现“真人天天麻将有挂吗”(详细开挂教程)您好:真人天天麻将有挂吗这款游戏可以开挂,确实是有挂的,很多玩家在小程序雀神麻将开挂这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是

    2025年12月14日
    2306

发表回复

本站作者才能评论

评论列表(3条)

  • 零槐的头像
    零槐 2025年12月14日

    我是乐悠悠的签约作者“零槐”

  • 零槐
    零槐 2025年12月14日

    本文概览:  这是一个奇特的事实,我们不了解大型语言模型(LLM)的实际工作方式。我们设计了它们。我们建造了它们。我们训练了他们。但是他们的内部运作在很大程度上是神秘的。好吧,他们是。现...

  • 零槐
    用户121411 2025年12月14日

    文章不错《拟人化已经开发了一个AI“脑扫描仪”来了解LLM的工作原理,事实证明,聊天机器人在简单的数学和幻觉上糟透了的原因比您想象的奇怪》内容很有帮助

 ~👉点我进群👈~

联系我们

邮件:乐悠悠@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

乐悠悠