首页 > 成功案例 > 五金配件

严重晋级!Claude Opus 41重磅发布编程才能跃升至745%

时间:
Warning: Undefined variable $a in /www/wwwroot/hanjiepx.com/cache/template/533a/d994/84f581a57f634039953f.html on line 117

Warning: Trying to access array offset on null in /www/wwwroot/hanjiepx.com/cache/template/533a/d994/84f581a57f634039953f.html on line 117
2025-09-02      作者: 五金配件

  AI公司Anthropic于2025年8月6日正式对外发布了其旗舰模型Claude Opus的晋级版别——Claude Opus 4.1。此次晋级旨在全方面提高模型的Agent使命处理、实在国际编程和推理才能,尤其是在编程和数据分析方面的提高,备受瞩目。

  据官方信息,Claude Opus 4.1的最大亮点在于其编程功能的明显提高。在SWE-bench Verified编程评价中,它取得了74.5%的评分,展现了其在处理杂乱代码问题方面的强壮才能。来自GitHub的反应也证明了这一点,开发者共同以为Opus 4.1在多文件代码重构等使命中的体现优于其前代产品。此外,日本电商巨子乐天集团(Rakuten Group)指出,新模型可以更精确地定位大型代码库中的过错,有实践效果的削减不必要的更改和潜在的Bug。

  除了编程才能的腾跃,Opus 4.1在深度研讨和数据分析方面也取得了明显发展,尤其是在细节追寻和Agent查找才能方面。来自Windsurf的基准测验成果为,Opus 4.1的功能比Opus 4提高了一个规范差,这一提高起伏与Sonnet 3.7到Sonnet 4的腾跃适当。有必要留意一下的是,Anthropic的Claude系列模型,旨在经过提高AI的推理和理解才能,更好地服务于企业级使用,例如杂乱的常识办理、内容创造以及战略决策支撑。

  虽然此次晋级带来了明显的功能提高,但Anthropic着重,Opus 4.1是一次渐进式的改善,而非革命性的更新。它将持续依照**AI安全等级3 (AI Safety Level 3, ASL-3)**规范做布置,并在多项安全评价中体现出稳健性。新模型在回绝不合法恳求方面略有提高,无害呼应率到达98.76%。此外,在儿童安全、政治成见和Agent才能测验方面,Opus 4.1的危险水平与之前版别保持共同,在极点乱用场景中的协作志愿降低了约25%,显示出更强的安全性。

  由OpenAI前职工创建,致力于开发安全可靠的AI体系,是生成式AI范畴的抢先企业之一。

  一个用于评价AI模型编程才能的基准测验,经过模仿实践软件开发场景来衡量模型生成和修正代码的才能。

  Anthropic提出的用于评价AI体系潜在危险的结构,ASL-3代表中等危险水平,意味着该模型现已过严厉的安全测验和评价,以保证其行为契合预期且不会形成损害。

  Amazon Bedrock和Google Cloud Vertex AI:

  均为云服务渠道,供给多种AI模型和东西,便利开发者构建和布置AI使用。

上一篇:2025年国内受欢迎的在线少儿编程机构:妙小程
下一篇:根 本 玩 不 过 来 !
服务热线:

025-57866111

Copyright ? 2017-2020 安博体育入口-安博app官方网站-安博体育网页版(www.hanjiepx.com) 版权所有. All Rights Reserved. ICP:苏ICP备14046586号   技术支持: 网站地图