码农编码利器ChatCoder:通过与LLM聊天来细化需求
站长网2023-11-16 14:42:100阅
大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。
然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。
为了解决大模型代码生成的需求表达问题,北大实验室的研究团队提出了通过与LLM聊天来细化需求的方法——ChatCoder。
论文地址:https://arxiv.org/pdf/2311.00272.pdf
ChatCoder通过聊天来辅助LLM和人类在需求细化方面的协作,从而提高大模型生成满足用户需求的代码。
ChatCoder的框架分为两个阶段:Paraphrase和Exend,以及Going-deep和Loop-back。在Paraphrase和Exend阶段,LLM根据用户的需求提示进行解释,并扩展假设。在Going-deep和Loop-back阶段,LLM向用户询问问题,解决需求细化中的困惑,并得到用户纠正后的规范。
经过两轮细化后,LLM生成满足用户需求的程序。
ChatCoder的评估结果显示,通过需求细化,ChatCoder帮助LLM提高了代码生成的执行精度。在Saniticed-MBPP上,ChatCoder带来了14%的性能提升。同时,ChatCoder的三种通信方法都对改进代码生成结果起到了作用。
人工干预在ChatCoder中扮演着重要的角色,因为需求细化需要揭示需求的内部结构和解决歧义。通过ChatCoder这种通过聊天进行需求细化的方法,可以提高大模型代码生成的能力,使其更好地满足用户需求。
0000
评论列表
共(0)条相关推荐
京东宣布采销等一线员工涨薪近100%
根据“京东黑板报”发布的消息,京东集团宣布,自2024年1月1日起,京东采销等一线业务人员的年固定薪酬将大幅上涨近100%。此外,2024年初,京东零售全员将平均加薪不低于20%。此次涨薪决定显然与京东近期的业绩表现密切相关。站长网2023-12-28 10:16:310000谷歌暂停AI图像生成功能:承认存在技术缺陷
谷歌周五承认,其人工智能工具Gemini在生成历史人物图像时出现错误,导致图像显示出明显的种族偏差。本周早些时候,媒体发现Gemini生成了不同种族的纳粹分子和美国开国元勋的图像。例如,当提示生成“1800年代美国参议员”的图像时,Gemini生成了一名黑人男性。站长网2024-02-24 10:04:30000026.19万的特斯拉model Y,续航545km,带着满满诚意啊
特斯拉22款改款后轮驱动版目前最低售价26.19万,这个价格可以说很让人心动啊,那么配置方面到底如何呢?一起往下看。首先一入眼帘的就是它的外观,整体风格时尚又运动,从侧面看上去整个车身低趴显得新潮又大气,整体线条流畅又灵动,前面采用了封闭式前进气格栅,简约而不失格调。尾部圆润大方,给整个车提升了被辨识度。站长网2023-05-25 00:38:020000Anthropic公布AI人工智能安全级别ASL系统
Anthropic创始人DarioAmodei在英国人工智能安全峰会上介绍了该公司提出的负责任扩张政策(ResponsibleScalingPolicy,RSP)。该政策旨在确保人工智能系统的安全性和可控性,防止潜在的风险和滥用。RSP包括两个主要组成部分:ASL系统和缩放曲线。站长网2023-11-03 09:09:110000ImageReward奖励模型:让文本到图像合成更符合人类偏好
StableDiffusion等生成式AI模型在文本到图像合成方面越来越受欢迎。像CLIP或BLIP这样的文本图像评分方法可以评估模型生成的图像是否与文本提示匹配,但它们并不总是符合人类的偏好和感知。站长网2023-05-08 11:19:080006