米乐m6官方网站UI设计ui界面设计器开源版AI程序员来了：GPT-4加持能力比

栏目：公司新闻发布时间：2024-04-07

　上个月火遍 AI 圈的「首位 AI 程序员」Devin，利用大模型能力已经掌握了全栈技能，仅需要人类给出自然语言指令，就可以自动完成复杂的代码任务。　　Devin 展示的能力非常惊艳米乐m6官方网站，不过这款工具出自走闭源路线的创业公司，现在只有一小部分获得了内测名额的人才能使用。　　本周二，来自普林斯顿大学 NLP 组的研究人员放出了 SWE-agent —— 一个开源版 AI 程序员，不到

　　上个月火遍 AI 圈的「首位 AI 程序员」Devin，利用大模型能力已经掌握了全栈技能，仅需要人类给出自然语言指令，就可以自动完成复杂的代码任务。

　　Devin 展示的能力非常惊艳米乐m6官方网站，不过这款工具出自走闭源路线的创业公司，现在只有一小部分获得了内测名额的人才能使用。

　　本周二，来自普林斯顿大学 NLP 组的研究人员放出了 SWE-agent —— 一个开源版 AI 程序员，不到一天就获得了上千的 GitHub Star 量。

　　SWE-agent 是一款用于自主解决 GitHub 存储库中问题的新系统。它在 SWE-bench 上获得了与 Devin 相似的准确度，平均耗时为 93 秒。

　　从原理上看，SWE-agent 通过将大模型（例如 GPT-4）转变为软件工程智能体，可以修复真实 GitHub 存储库中的错误和问题。

　　为了提供开发过程中的自动化，SWE-agent 通过与专用终端交互来工作，它可以打开、搜索文件内容，使用自动语法检查、编辑特定行，也可以编写并执行测试。

　　研究团队设计了简单的以大模型（LM）为中心的命令和反馈格式，使大模型能够更方便地浏览存储库、查看、编辑和执行代码文件，这被称为智能体 - 计算机接口 (ACI)。研究团队还构建了 SWE 智能体存储库，以便轻松迭代存储库级编码智能体的 ACI 设计。

　　就像语言模型需要良好的提示工程（prompt engineering）一样，良好的 ACI 设计在使用智能体时会带来更好的结果。没有经过良好调整的 ACI 的基线智能体的表现比 SWE-agent 差得多。

　　SWE-agent 包含研究团队在智能体 - 计算机接口设计过程中发现的非常有用的功能，包括：

　　1. 添加一个在发出编辑命令时运行的 linter，如果代码语法不正确，则不会让编辑命令通过。米乐官方网站

　　2. 为智能体提供一个专门构建的文件查看器。研究团队发现此文件查看器在每轮仅显示 100 行时效果最佳，并且该文件编辑器具有上下滚动以及在文件中执行搜索的命令。

　　3. 为智能体提供专门构建的全目录字符串搜索命令。研究团队发现该工具简洁地列出匹配项非常重要 —— 只需列出至少有一个匹配项的每个文件。该研究表明，向模型显示有关每个匹配的更多上下文对于模型来说太混乱了。

　　第二步：评估拉取请求以验证它确实解决了问题（目前仅适用于 SWE-bench 基准测试中的问题）。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

上一篇：米乐官方网站ui网页设计图UI设计网页设计兼职平台甜薪工场：您的专业兼职网页设计

下一篇：米乐官方网站UI设计ui中国设计网UI设计网站长访谈：为中国UI设计竖起一面旗帜