使用大规模编程模型登上开源巅峰后，GLM团队遭受了3个小时的折磨

金磊 by 奥菲斯量子比特 | QbitAI公众号事实上，越接近年底，诸神之战就越激烈。这不，智浦还推出了一款新车型，GLM-4.7。它在 Code Arena WebDev 排行榜上迅速超越 GPT-5.2，位列大型开源模型第一名。目前网友们都在疯狂尝试，几乎所有人体验后都给出了“棒极了”的评价。同时使用GLM-4.7和Gemini 3，直接体验网友玩的桌面溜溜球游戏。网友大呼：“GLM-4.7胜利了！”视频地址：https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw 那么这次GLM-4.7为何大幅提升调度效率呢？今天早些时候，智浦还在Reddit上举办了一场特别的AMA（Ask Me Anything）活动。后面的一切都有明确的答案。对于GLM-4.7，智浦有所有答案。在这次对话中，我们不仅揭示了 GLM-4.7 如何在训练后表现上实现显着改进ance，但我们还首次透露了有关我们自主研发的强化学习框架 Slime 的详细信息。我们总结了本次AMA的核心部分，这款被称为“克劳德·科德最佳接班人”的国产车型是如何诞生的。模型性能和优化是每个人最关心的问题，这也是 GLM-4.7 在体感方面取得如此明显进步的原因。智普团队在 AMA 中透露，GLM-4.7 的改进主要集中在训练后阶段。在 SFT（监督微调）和 RL（强化学习）阶段，团队采用了更复杂的启动方案。通过调整来自不同学科的数据集，您不仅可以在模型基准测试中获得更高的分数，还可以显着提高实际实施中的性能稳定性。在回答社区提问“为什么不创建一个参数数量更多的模型？”时，智浦团队坦言，训练和部署成本在他的水平上。设计的艺术。 GLM-4.7 的设计考虑到了硬件限制。该团队的目标是能够在消费类显卡上运行该模型，并具有 Air 版本的灵活性，同时保持接近或大于 30B 的逻辑容量。这种在有限参数内发挥最大性能的想法正是人工智能实际实现的。此外，智浦还分享了他们建立的一套复杂的预训练数据流程。换句话说，它是一个多源集合，涵盖了广泛的文本类型，从高质量文章到小说。e质量和敏感词检测。调整策略：专注于 SFT 和 RL 阶段，让你的写作风格不那么机械化，更加清晰和详细。模型应用场景及特点如果说之前的GLM是一个有点严格的理科生，那么4.7版本就完成了对情商的攻击。 AMA 开发人员最常问的问题是编程。智浦团队承认，针对Claude代码做了很多优化和适配工作。目前，GLM-4.7在多语言编码方面具有良好的性能。除了支持Python和JS之外，它还对一些不太流行的语言和复杂的逻辑构造有深入的了解。团队认为代理框架会对性能造成高达30%的影响，因此在GLM-4.7中我们在sys工具调用和信号字层面做了广泛的打磨。为了让模型看起来更人性化，团队查阅了大量的小说和剧本。 GLM-4.7 现在对创意写作更加详细，不再仅仅谈论“一个阳光明媚的下午”。角色扮演任务可以让你更好地保持性格并减少戏剧性的频率。另外，GLM-4.7还引入了一个非常重要的特性，叫做Interleaved Thinking。在执行操作或调用工具之前，模型会执行一段内隐思维。这个思路机制，类似于OpenAI o1，在处理复杂的多模态任务（例如读取图像、编写代码、分析图形等）时，可以减少鲁莽操作的可能性并提高准确性。技术方法和工具在国外社区的流行与开源的积极采用是分不开的。本次 AMA 最令人惊喜的莫过于 Slime 框架的发布。为了解决大规模模型强化学习效率低、稳定性差的问题，智浦开发了开源Slime。该框架专为大规模强化学习而设计，支持多种对齐算法。它的名字意思是“灵活且适应性强”，允许开发人员更轻松地在 GLM 级别重现对齐效果。智浦表示，他从开源生态中受益匪浅，很乐意回馈社会。它详细介绍了从数据收集到清理和质量过滤的整个过程。这种透明度在当今的主要企业中很少见全国模特制造商，并为他们赢得了LocalLLaMA社区的一致尊重。在Reddit上，智浦团队展现出了非常现实的一面。有网友问：“你在训练中遇到的最意想不到的挑战是什么？”研究团队表示：“最大的挑战是发布菜谱。就像厨师拥有最好的食材（数据）一样，掌握火候水平（RL参数）以使其出锅即完美往往需要无数次的重新发明。”有人调侃：“GLM-4.7是吃了神药吗？”团队幽默回应：“主要原因是我学会了如何让人在行动前多思考。” GLM-4.7真实测试即使了解了GLM-4.7背后的“魔术”，你仍然不能遵守旧规则。因此，我们开始了一波真正的测试~首先请注意，使用z.ai开发时，最好点击“全栈开发”按钮。然后通过创建你的第一个植物大战僵尸来测试你的技能。僵尸。提示信息为：根据当前目录准备材料（下载https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp）3。游戏音乐，制作几张植物和僵尸的图片和statics/GIF、豆子素材Pea.png/PeaSnow.png、界面素材Shop.png/Card.png和Sun.gif)在目录下下载https://z-cdn.chatglm.cn/temp/pvc-images.zip，制作一个《植物大战僵尸》游戏。可以看到，这也是一款经典的测试游戏，只不过这次在体感方面“声音十足”（实验链接如下）：https://chat.z.ai/c/5415b1d8-ac01-4bc 6-a24a-8e815c8fa361 除了游戏之外，GLM-4.7的另一个体感飞跃就是PPT的创作。这个演示的信息非常简单。创建一个 PPT 来展示巴黎。可见PPT的效果已经达到了直接商用的水平。海报创作也是GLM-4.7的特色。例如，如果您设计一张宣传运动鞋的海报d 比较GLM-4.6和GLM-4.7，效果差异会很明显。从各种效果来看，就不难理解为什么GLM-4.7这次在X上流行了。即使在发布后，我们也致力于保持开源。在本次AMA中，除了具体的技术细节之外，观众最关心的就是智浦的发布。毕竟，近期智浦拟赴港IPO的消息，引起了业内不小的关注。一位 Reddit 资深人士直接问了一个问题：“公司上市后，你会减少对开源的投资吗？”芝浦奇给了我们很大的安心感：“开源是我们的核心基因。无论我们的资本路径如何变化，上市后我们都致力于保持开源。”该团队解释说，智浦认识到自己的成长离不开开源生态的培育，持续开源不仅是一种回馈，也是维持现状的最佳方式。n 技术领先并为开发人员建立标准。这种“就算按了门铃，也要翻开书”的态度，被不少国外开发者称赞为“尊重”。通过将提高智力极限的思维与通过Slime框架标准化训练流程相结合，智浦用最严酷的方法证明国产模型不仅能得分，还能用于实战。从用户反馈来看，GLM-4.7和智普的长期承诺也得到了高度评价。例如，有网友在价格方面评价：1年GLM 4.7订阅（接近Opus 4.5级别）= 1个月Codex/Claude Code最高套餐。立即预订 1 年期订阅。价值 40 亿美元的 Fireworks 在第 0 天也支持 GLM 4.7。好吧，美国人也有更好的或模型选择。此外，在 AMA 上，智浦团队发表了令人兴奋的声明：“我们计划明年为 AGI 做出更多贡献。”基于此s，智普首席科学家唐杰在GLM-4中表示：随着.7的发布，他表达了一些关于开发更大模型的想法。原文链接：https://weibo.com/2126427211/QjIYhCmfq 在IPO灯亮之前，智浦决定先点亮开发者屏。这份长久的恋情或许是大模特时代最脆弱的基础。
特别提示：以上内容（包括图片、视频，如有）由自媒体平台提供。由“网易账号”系统用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交网络平台。

使用大规模编程模型登上开源巅峰后，GLM团队遭受了3个小时的折磨

发表回复取消回复

归档

功能

使用大规模编程模型登上开源巅峰后，GLM团队遭受了3个小时的折磨

发表回复 取消回复

归档

功能

发表回复取消回复