谷歌搜索引入语法检查模型EdiT5 提高语法纠正准确性

站长网2023-10-28 07:49:270阅

💡 划重点:

- Google研究团队开发了一种高效的语法纠正模型，基于EdiT5架构，使用户能够在Google搜索中检查查询的语法。

- 这一模型采用了新颖的文本编辑方法，降低了解码延迟，提高了纠正的准确性，同时结合了大型语言模型（LLMs）的优点。

Google的研究团队最近开发了一种高效的语法检查模型，它将语法检查引入了Google搜索，为用户提供了一种在查询语法方面的辅助工具。这一模型基于EdiT5架构，通过新颖的文本编辑方法，极大地减少了解码延迟，提高了语法纠正的准确性。

传统的语法错误纠正（GEC）方法通常将其视为翻译问题，并使用自回归变换器模型逐个标记解码响应，条件是以前生成的标记。然而，这种方法的效率较低，因为解码不能并行进行。文章指出，通常只需要对输入文本进行少量修改，因此可以将GEC视为文本编辑问题，仅使用自回归解码器生成修改，从而显著降低GEC模型的延迟。

EdiT5模型基于T5变换器编码器-解码器架构，采用了一些关键的修改。它使用编码器来确定要保留或删除的输入标记，这些保留的标记构成了初步的输出。此后，解码器输出缺失的标记，并使用指针机制指示每个新标记的放置位置，以生成语法正确的输出。与传统的GEC方法相比，解码器只运行少量步骤，从而提高了效率。

为了降低解码器延迟，研究团队将解码器减少到单层，并通过增加编码器的大小来进行补偿。实验结果表明，EdiT5大型模型相比具有248M参数的T5基础模型，提供了9倍的速度提升，同时提高了修正的准确性。EdiT5模型的平均延迟仅为4.1毫秒。

此外，研究团队还介绍了如何使用大型语言模型（LLMs）的优点，结合EdiT5的低延迟，通过硬蒸馏技术训练了教师LLM，用于生成学生EdiT5模型的训练数据。他们还详细解释了如何生成更干净和一致的训练数据，并通过自训练和迭代改进等技术提高了数据的质量。

他们开发了两种基于EdiT5的模型，分别用于语法错误校正和语法分类。在使用语法检查功能时，查询首先经过校正模型，然后通过分类模型检查输出是否确实正确。这种分离的分类模型有助于更容易在精度和召回率之间进行权衡，并减少了为模糊或无意义的查询提供错误或混乱校正的风险。

谷歌的这一语法检查功能基于EdiT5模型架构，为用户提供了一种检查其查询语法的有效方式，进一步提升了Google搜索的用户体验。

谷歌搜索引入语法检查模型EdiT5提高语法纠正准确性

0000

评论列表

共(0)条

相关推荐

站长资讯
MacBook Air首发！苹果M3即将登场：拥抱3nm 领先Intel和AMD
快科技8月18日消息，据MacRumors报道，苹果将在今年下半年推出M3标准版芯片，首批搭载M3芯片的设备包括13英寸MacBookAir、13英寸MacBookPro、MacMini以及24英寸iMac。对比上一代M2芯片，M3仍然是8核心设计，包含4个高性能核心和4个能效核心，同时集成了10核GPU。
站长网2023-08-21 09:23:15
0001
站长资讯
《赛博朋克2077》使用人工智能替代已故配音演员
要点:1.CDProjektSA使用人工智能技术在其最新游戏中重现已故声优MiłogostReczek的声音。2.MiłogostReczek是一位2021年去世的知名波兰声优，他的声音由AI算法在CDProjekt的Cyberpunk2077游戏的波兰语版本中再现。
站长网2023-10-13 10:23:27
0000
站长资讯
99%好评率！华为Mate 60 Pro官网评价破万首批用户：中国“争气机”
快科技9月3日消息，华为新一代Mate旗舰华为Mate60Pro于8月29日在华为商城突然开售，首批发售的机型为先锋计划”，官方称让部分消费者提前体验史上最强Mate手机。
站长网2023-09-03 08:48:08
0003
站长资讯
Meta投资人工智能推动视频推荐融合Feed和Reels
Facebook母公司Meta正大力投资人工智能技术，作为其"到2026年的技术路线图"的一部分，旨在开发全新的人工智能推荐模型为其所有视频产品做推荐，包括类似TikTok的Reels短视频服务和FacebookFeed中的传统长视频。
站长网2024-03-07 14:50:23
0000
563支AI队伍做了姜萍同一份数学试卷：结果最高分仅34
快科技6月16日消息，在最近举办的阿里巴巴全球数学竞赛中，来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛，还以全球排名12的成绩成为了赛事历史上首个进入决赛的中专生。不仅如此，今年的阿里数赛还首次开放了AI大模型挑战赛，共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。
站长网站长资讯2024-06-17 01:54:33
0000