
克劳德(Claude)是编程之王,不稳定吗? ?大型模特竞技场战斗的最新报告发布了,R1的新版本赢得了网络编程的第一名,部分击败了克劳德·奥普斯4。您应该知道Claude Opus 4被认为是“强大的世界编码模型”。那么,您能否在编程中击败Claude Opus 4,DeepSeek-R1-0528的来源是什么?您可能会认为这是查看名称时的一个小更新版本,但实际上 - 它几乎等同于livecodebench上的Openai O3 -High,甚至许多网民认为这是传奇的R2。从这一点开始,双方在编程方面似乎并不容易混乱。因此,不用说很多话,让我们看一下DeepSeek-R1-0528,Kang有多强。让我们尝试一下。 DeepSeek-R1-0528在DeepSeek的官方网站Appand Mini计划(开放式深思熟虑)上启动。在这里,我们直接访问官方网站进行体验。试验1:为太阳能系统创建动画应用程序m。直接单词如下:为太阳系创建动画应用程序,并使用网络搜索。经过49秒的思考,DeepSeek-R1-0528给出了一块Python代码。使用VS代码运行后,结果如下:可以独立运行的动画将出现,但是页面有些粗糙。但是,如果您用其他快速单词更改,效果显然是不同的。用三.js模拟太阳系,并在地球上显示行星的名称。在短短34秒内,DeepSeek-R1-0528阐明了设计思想:关键是它可以通过单击直接运行,而不再需要仅打开自己的编辑器。 (运行操作就像打开一个盲盒一样,这可能不是必需的)并且还具有动画和联系。下一个NEVEL〜测试2:前端网页制作下一步我们要求DeepSeek提出一个AGI主题网站。快速词如下:请设计一个网页w这是通用人工智能(AGI)的主题,其中包括该概念的三个组成部分:“知识共享”,“社区”和“未来创造”。每个部分都应配备相应的图标和简洁的描述。整体风格是现代的,充满了技术,其中包括Agagi的变化与合作。使用HTML,CSS和JavaScript来实现联系和视觉效果。经过23秒的思考,DeepSeek-R1-0528给出了PHAS HTML代码,该代码仍然可以单击一次。试验3:创建具有美丽图形和控件的Tetris的完整功能版本。创建具有美丽图形和控件的俄罗斯方块的完整版本。在考虑12秒后,您可以看到DeepSeek-R1-0528,提供了一块Python代码。运行结果就像:尽管这是一个俄罗斯方块迷你游戏,但主演示中有明显的错误,并且缺少交互式按钮。我们试图使DeepSeek继续改善,但第二次失败。 ENHAnced游戏仍然无法正常工作(总是通过墙壁),并且没有实现我们明确要求的交互功能。总而言之,从上面的简单试验(作为开放资源模型)中,DeepSeek的新版本确实在编程功能方面变得很棒,但是仍然有改进的余地。但老实说,这显然对我们国家的普通用户更加友好(与Claude模型相关联,它是免费且易于获得的)。除了更新编程功能列表外,Deviceek R1的新版本目前也被选为最佳的开放资源文本模型。根据MIT许可,它在列表中排名第六,也是开放资源的第一个。在划分的字段中,它在信号的难度和5 -5个数学的难度方面排名第四,并且在开放资源模型中非常有能力的播放器。但是,值得一提的是,基米的新型号仅赢得了代码开源sota-open kimi-dev只有72B参数的代码模型,并在经过验证的汗水台上获得了60.4%的开放资源sota。编程级别不仅比最新的DeepSeek-R1强,而且性能还比封闭的资源模型更好。那么,如果您不知道它的真实能力怎么办?