博客
博客
Antarx' Blog
Antarx is the heart of Scorpio
文档
博文
源码
2022年任务驱动对话(Task-Oriented Dialogue System)研究进展
本文总结2022年任务驱动对话的研究进展。 [CASPI] Causal-aware Safe Policy Improvement for Task-oriented Dialogue来源:ACL 2022 Long Paper 使用强化学习策略解决任务驱动对话中的问题:任务驱动对话中的策略学习。文章认为,任务驱动对话是从离线数据中学习,另一方面强化学习在离线数据训练的时候会导致误差和泛化...
2022-12-06
阅读全文