本文第一作者是徐婷,是香港中文大学博士生,主要研究兴趣是大模型的后训练;通讯作者分别是黄志超和程善伯,来自字节跳动Seed团队。 现在,这些问题迎来了新的解决方案。来自香港中文大学、字节跳动 Seed 和斯坦福大学的研究团队联手提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT) 该方法将同传任务巧妙地建模为序贯决策过程,通过优化完整的决策序列,显著提升了翻译质量,同时有效控制了延迟,其性能直逼、甚至在某些方面超越了同等大小的离线翻译模型。 同声传译的核心在于机器需要动态地决定 “继续听”(READ)还是 “开始说”(WRITE)。这个决策直接影响最终的翻译效果。例如,当模型接收到英文单词 “bark” 时,它面临一个困境:如果立即翻译,可能会译为 “狗叫”,但若后文出现 “of the tree”,则正确翻译应为 “树皮”。 传统的同传方法,它每一步决策(是继续听,还是开始翻译)都是孤立的。它可能会因为眼前的 “小利”(比如翻译出一个词)而牺牲掉全局的 “大利”(整个句子的流畅度和准确性)。 针对这一难点,该论文提出了 SeqPO-SiMT 框架。其核心思想是将同声传译任务建模为一个序贯决策问题,综合评估整个翻译流程的翻译质量和延迟,并对整个决策序贯进行端到端的优化。 该方法的主要特点是:它不再孤立地评估每一步决策的好坏,而是将一整句话的翻译过程(即一个完整的决策序贯)视为一个整体,更符合人类对同传的评估过程。 为了验证方法的有效性,研究者们在多个公开的英汉互译测试集上进行了实验,并与多种现有的同传模型进行了对比。实验结果显示:在低延迟水平下,SeqPO-SiMT 框架生成的译文质量相较于基线模型有明显提升。 本文将 SeqPO-SiMT 的实时同传结果与多个高性能模型的离线翻译结果进行对比。结果显示,SeqPO-SiMT 的翻译质量不仅优于监督微调(SFT)的离线模型及 LLaMA-3-8B,其表现甚至能媲美乃至超越 Qwen-2.5-7B 的离线翻译水平。这表明该方法在 70 亿参数(7B)规模上实现了业界顶尖(SoTA)的性能。 总的来说,SeqPO-SiMT 这项工作的主要贡献在于,为解决同声传译中的质量 - 延迟权衡问题提供了一个新的视角。它强调了对决策 “序贯” 进行整体优化的重要性。该研究提出的方法,对于需要进行实时、连续决策的自然语言处理任务具有一定的参考意义,并为未来开发更高效、更智能的同声传译系统提供了有价值的探索。
17.c.cow起草国家禁毒办最新发布的《2024年中国毒情形势报告》显示,麻精药品滥用情况严重,其中含有依托咪酯、异丙帕酯等成分的“上头电子烟”滥用情况尤为突出。6月17日,京东集团董事局主席刘强东在北京的一场分享会上,对包括观察者网在内的媒体证实,京东将进军酒店旅游业,供应链做到一脉相承,并强调有信心成功。刘强东表示,酒店背后也是庞大的成本很高的供应链,前端是消费者。他强调,“整个京东集团只做供应链这一件事情,一脉相承,这是我们的逻辑”。17.c.cow起草三亚私人高清影院的更新情况当然,京东现有的流量分配机制是否能放量给更多中腰部商家仍是一个问号?从目前京东酒店的补贴来看,中小酒店和连锁酒店享有同样的权利,京东的百亿补贴大多为两到三星级酒店,这一点也在进一步缩小品牌和白牌之间的价格差。6月13日,一段聊天合集在微信群内传播,有人称“广州抢泡泡玛特摔死了一个”。同时,聊天合集内配发了有人在泡泡玛特售卖机前大打出手,及一女子倒在商场地上的画面。
20250818 🔞 17.c.cow起草帕尔默:“我还没有和米沙(穆德里克昵称)谈过,但我会在合适的时候和他聊聊。目前我不太适合介入他的事情。我会和他谈谈的。”噼啪啦噼啪啦叭叭叭啦叭阅兵领导小组办公室副主任、中央军委联合参谋部作战局少将副局长吴泽棵在会上介绍说,今年9月3日,天安门广场将举行盛大阅兵式。中共中央总书记、国家主席、中央军委主席习近平将检阅部队。这次阅兵,是纪念中国人民抗日战争暨世界反法西斯战争胜利80周年活动的重要组成部分,主题是纪念抗战伟大胜利、弘扬抗战伟大精神。
📸 韩松山记者 张彦强 摄
20250818 🖤 17.c.cow起草当前券商私募托管业务普遍采用低费率策略,但由于系统建设和人力资源投入形成了固定成本,若单纯依赖托管费收入,需达到庞大业务规模方能实现盈利。实际在券商整体营收结构中,交易托管的直接贡献算不上突出,甚至部分券商的这一业务处于亏损状态。成品网站免费直播有哪些平台推荐从险资举牌标的来看,保险公司今年举牌的股票包括北京控股、电投产融、东方物流,中国儒意、中国水务、大唐新能源、中国神华、杭州银行以及邮储银行、招商银行、农业银行、中信银行等银行H股,其中9只股票为H股。
📸 李伟记者 李月霞 摄
🔞 10打11绝境,贝林厄姆打破僵局,这是真正的大心脏。数据大师chip给出统计:本届世俱杯,已经出现2次球队少1人作战,还能破门的球员。第1人是本菲卡的奥塔门迪,第2人正是贝林厄姆。ysl水蜜桃86满十八岁还能用吗