金磊 by 奥菲斯量子比特 | QbitAI公众号 事实上,越接近年底,诸神之战就越激烈。这不,智浦还推出了一款新车型,GLM-4.7。它在 Code Arena WebDev 排行榜上迅速超越 GPT-5.2,位列大型开源模型第一名。目前网友们都在疯狂尝试,几乎所有人体验后都给出了“棒极了”的评价。同时使用GLM-4.7和Gemini 3,直接体验网友玩的桌面溜溜球游戏。网友大呼:“GLM-4.7胜利了!”视频地址:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw 那么这次GLM-4.7为何大幅提升调度效率呢?今天早些时候,智浦还在Reddit上举办了一场特别的AMA(Ask Me Anything)活动。后面的一切都有明确的答案。对于GLM-4.7,智浦有所有答案。在这次对话中,我们不仅揭示了 GLM-4.7 如何在训练后表现上实现显着改进ance,但我们还首次透露了有关我们自主研发的强化学习框架 Slime 的详细信息。我们总结了本次AMA的核心部分,这款被称为“克劳德·科德最佳接班人”的国产车型是如何诞生的。模型性能和优化是每个人最关心的问题,这也是 GLM-4.7 在体感方面取得如此明显进步的原因。智普团队在 AMA 中透露,GLM-4.7 的改进主要集中在训练后阶段。在 SFT(监督微调)和 RL(强化学习)阶段,团队采用了更复杂的启动方案。通过调整来自不同学科的数据集,您不仅可以在模型基准测试中获得更高的分数,还可以显着提高实际实施中的性能稳定性。在回答社区提问“为什么不创建一个参数数量更多的模型?”时,智浦团队坦言,训练和部署成本在他的水平上。设计的艺术。 GLM-4.7 的设计考虑到了硬件限制。该团队的目标是能够在消费类显卡上运行该模型,并具有 Air 版本的灵活性,同时保持接近或大于 30B 的逻辑容量。这种在有限参数内发挥最大性能的想法正是人工智能实际实现的。此外,智浦还分享了他们建立的一套复杂的预训练数据流程。换句话说,它是一个多源集合,涵盖了广泛的文本类型,从高质量文章到小说。e质量和敏感词检测。调整策略:专注于 SFT 和 RL 阶段,让你的写作风格不那么机械化,更加清晰和详细。模型应用场景及特点 如果说之前的GLM是一个有点严格的理科生,那么4.7版本就完成了对情商的攻击。 AMA 开发人员最常问的问题是编程。智浦团队承认,针对Claude代码做了很多优化和适配工作。目前,GLM-4.7在多语言编码方面具有良好的性能。除了支持Python和JS之外,它还对一些不太流行的语言和复杂的逻辑构造有深入的了解。团队认为代理框架会对性能造成高达30%的影响,因此在GLM-4.7中我们在sys工具调用和信号字层面做了广泛的打磨。为了让模型看起来更人性化,团队查阅了大量的小说和剧本。 GLM-4.7 现在对创意写作更加详细,不再仅仅谈论“一个阳光明媚的下午”。角色扮演任务可以让你更好地保持性格并减少戏剧性的频率。另外,GLM-4.7还引入了一个非常重要的特性,叫做Interleaved Thinking。在执行操作或调用工具之前,模型会执行一段内隐思维。这个思路机制,类似于OpenAI o1,在处理复杂的多模态任务(例如读取图像、编写代码、分析图形等)时,可以减少鲁莽操作的可能性并提高准确性。技术方法和工具在国外社区的流行与开源的积极采用是分不开的。本次 AMA 最令人惊喜的莫过于 Slime 框架的发布。为了解决大规模模型强化学习效率低、稳定性差的问题,智浦开发了开源Slime。该框架专为大规模强化学习而设计,支持多种对齐算法。它的名字意思是“灵活且适应性强”,允许开发人员更轻松地在 GLM 级别重现对齐效果。智浦表示,他从开源生态中受益匪浅,很乐意回馈社会。它详细介绍了从数据收集到清理和质量过滤的整个过程。这种透明度在当今的主要企业中很少见全国模特制造商,并为他们赢得了LocalLLaMA社区的一致尊重。在Reddit上,智浦团队展现出了非常现实的一面。有网友问:“你在训练中遇到的最意想不到的挑战是什么?”研究团队表示:“最大的挑战是发布菜谱。就像厨师拥有最好的食材(数据)一样,掌握火候水平(RL参数)以使其出锅即完美往往需要无数次的重新发明。”有人调侃:“GLM-4.7是吃了神药吗?”团队幽默回应:“主要原因是我学会了如何让人在行动前多思考。” GLM-4.7真实测试 即使了解了GLM-4.7背后的“魔术”,你仍然不能遵守旧规则。因此,我们开始了一波真正的测试~首先请注意,使用z.ai开发时,最好点击“全栈开发”按钮。然后通过创建你的第一个植物大战僵尸来测试你的技能。僵尸。提示信息为:根据当前目录准备材料(下载https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp)3。游戏音乐,制作几张植物和僵尸的图片和statics/GIF、豆子素材Pea.png/PeaSnow.png、界面素材Shop.png/Card.png和Sun.gif)在目录下下载https://z-cdn.chatglm.cn/temp/pvc-images.zip,制作一个《植物大战僵尸》游戏。可以看到,这也是一款经典的测试游戏,只不过这次在体感方面“声音十足”(实验链接如下):https://chat.z.ai/c/5415b1d8-ac01-4bc 6-a24a-8e815c8fa361 除了游戏之外,GLM-4.7的另一个体感飞跃就是PPT的创作。这个演示的信息非常简单。创建一个 PPT 来展示巴黎。可见PPT的效果已经达到了直接商用的水平。海报创作也是GLM-4.7的特色。例如,如果您设计一张宣传运动鞋的海报d 比较GLM-4.6和GLM-4.7,效果差异会很明显。从各种效果来看,就不难理解为什么GLM-4.7这次在X上流行了。即使在发布后,我们也致力于保持开源。在本次AMA中,除了具体的技术细节之外,观众最关心的就是智浦的发布。毕竟,近期智浦拟赴港IPO的消息,引起了业内不小的关注。一位 Reddit 资深人士直接问了一个问题:“公司上市后,你会减少对开源的投资吗?”芝浦奇给了我们很大的安心感:“开源是我们的核心基因。无论我们的资本路径如何变化,上市后我们都致力于保持开源。”该团队解释说,智浦认识到自己的成长离不开开源生态的培育,持续开源不仅是一种回馈,也是维持现状的最佳方式。n 技术领先并为开发人员建立标准。这种“就算按了门铃,也要翻开书”的态度,被不少国外开发者称赞为“尊重”。通过将提高智力极限的思维与通过Slime框架标准化训练流程相结合,智浦用最严酷的方法证明国产模型不仅能得分,还能用于实战。从用户反馈来看,GLM-4.7和智普的长期承诺也得到了高度评价。例如,有网友在价格方面评价:1年GLM 4.7订阅(接近Opus 4.5级别)= 1个月Codex/Claude Code最高套餐。立即预订 1 年期订阅。价值 40 亿美元的 Fireworks 在第 0 天也支持 GLM 4.7。好吧,美国人也有更好的或模型选择。此外,在 AMA 上,智浦团队发表了令人兴奋的声明:“我们计划明年为 AGI 做出更多贡献。”基于此s,智普首席科学家唐杰在GLM-4中表示:随着.7的发布,他表达了一些关于开发更大模型的想法。原文链接:https://weibo.com/2126427211/QjIYhCmfq 在IPO灯亮之前,智浦决定先点亮开发者屏。这份长久的恋情或许是大模特时代最脆弱的基础。
特别提示:以上内容(包括图片、视频,如有)由自媒体平台提供。由“网易账号”系统用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交网络平台。