让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

乐鱼体育 AI模子是个黑箱, 这家公司造了一把能翻开它的钥匙

乐鱼体育 AI模子是个黑箱, 这家公司造了一把能翻开它的钥匙

旧金山初创公司 Goodfire 刚刚发布了一款叫 Silico 的新器具,它能让询查东谈主员和工程师在测验 AI 模子的过程中,不雅察模子的里面结构并调度参数——也等于那些决定模子活动的树立。这可能让路发者对 AI 的构建时势领有前所未有的良好限制力。

Goodfire 称 Silico 是同类居品中第一款开箱即用的器具,遮蔽从构建数据集到测验模子的扫数过程。这家公司的职责提及来很浅陋:让构建 AI 模子从“真金不怕火金术”变成“科学”。ChatGPT 和 Gemini 这么的大讲话模子照实能作念出很狠恶的事情,但莫得东谈主确切知谈它们为什么能作念到,这让配置残障或难受不良活动变得很难受。

“咱们看到一个越来越大的范围:一边是东谈主们对模子的贯通进程,另一边是模子被部署的广度,”Goodfire 的 CEO 埃里克·何(Eric Ho)在 Silico 发布前独家告诉《麻省理工科技指摘》。“我以为咫尺头部试验室的主流思法等于:限度更大、算力更多、数据更多,然后就能终了 AGI,别的齐不要紧。咱们思说的是:有更好的路。”

Goodfire 作念的事情属于一个叫“机制可讲明性”(mechanistic interpretability)的技巧标的,同业包括 Anthropic、OpenAI 和 Google DeepMind。浅陋说等于给 AI 模子作念“脑部扫描”:映射出神经元以及神经元之间的通路,搞通晓模子作念决定时里面到底发生了什么。《麻省理工科技指摘》将机械可讲明性评为 2026 年十大冲突技巧之一。

Goodfire 思用这种次序作念的,不仅仅过后审计还是测验好的模子,而是从测验阶段就介入。

“咱们思去掉反复试错,把测验模子变成精密工程,”何说,“把旋钮和刻度盘表露出来,让路发者在测验过程中就能用上。”

Goodfire 此前还是用自研技巧调渡过大讲话模子的活动,比如减少幻觉,而 Silico 是把这些里面蓄积的技巧打包成居品对外发布。器具内置了智能体来自动化无数复杂操作。“智能体咫尺还是强到不错完成许多以前需要东谈主奇迹念的可讲明性服务,开云体育(kaiyun)官网”何说,“这块缺口补上之后,客户才真实能我方上手。”

阿姆斯特丹大学询查机制可讲明性的学者莱昂纳德·贝雷斯卡(Leonard Bereska)认为 Silico 是一个灵验的器具,但对 Goodfire 更宽广的说法有所保留。“实质上,他们是在给真金不怕火金术增多精准度,”他说,“叫它‘工程’让它听起来比实质情况更有章法。”

Silico 不错让你长远到模子的特定区域,不雅察单个神经元或一组神经元,测试它们在干什么。你不错查验什么输入会激活哪些神经元,也不错沿落魄游通路跟踪一个神经元跟其他神经元之间的关系。(前提是你能看望模子的里面结构。大多数东谈主没法拿 Silico 去翻 ChatGPT 或 Gemini 的底,但不错用它稽查许多开源模子。)

比如 Goodfire 在开源模子 Qwen 3 里面找到了一个跟“电车难题”联系的神经元。激活之后,leyu体育岂论你问什么,模子齐会把讲演包装成谈德两难的状貌。“这个神经元一朝激活,各式奇怪的事就会发生,”何说。

定位这类迥殊活动的起原,如今还是算相比惯例的操作。Goodfire 思更进一步:让调度这些活动变得相通容易。通过 Silico,蛊惑者不错胜利调度与特定神经元联系的参数,增强或禁绝某些活动。

举个更有道理的例子。询查东谈主员问一个模子:一家公司的 AI 居品在 0.3% 的情况下会糊弄用户,影响 2 亿东谈主,该不该公开败露?模子的讲演是“不该”,意义是会毁伤公司利益。

询查东谈主员翻开模子里面,找到了跟“透明度”和“信息败露”联系的神经元,把它们的权重调高。归并个问题再问一遍,十次里有九次模子改口说“该公开”。“模子里面其实还是有了伦理推理的走漏,仅仅被交易风险评估的走漏压以前了,”何说。

微调价值不雅仅仅 Silico 的用法之一。它还不错在测验阶段过滤特定的数据,从源流上幸免某些参数被设成不睬思的值。

比如许多模子会告诉你 9.11 大于 9.9。但 AI 为什么会犯这种错?用 Silico 翻开模子里面就能找到原因:模子在测验时读了无数《圣经》文本和软件代码仓库,在这两类文本里,9.9 照实排在 9.11 前边(《圣经》按章节编号,代码按版块号递加),模子里面因此造成了一组“9.9 在 9.11 前边”的神经元。作念数学题时这组神经元被误激活了,就导致了作假谜底。找到了病因,蛊惑者就不错重新测验模子,让它作念数学时绕开这些神经元。

Goodfire 发布 Silico 的倡导,是把以前唯一少数顶级试验室才掌持的材干交给更多东谈主。思自建模子或矫正开源模子的小公司和询查团队齐是打算用户。器具将收费使用,价钱凭证客户需求逐案信服(Goodfire 拒却浮现具体订价)。

“若是测验模子能变得更像蛊惑软件,就莫得意义不让更多公司来联想合乎我方需求的模子,”何说。

贝雷斯卡欢跃这类器具不错匡助企业构建更值得信托的模子,尤其在医疗和金融等安全条目极高的领域。“头部前沿试验室里面还是有了我方的可讲明性团队乐鱼体育,”他说,“Silico 武装的是下一梯队的公司——它们无须再我方去招一批可讲明性询查员了。”

AG真人国际厅中国官网