针对重复字和漏字训练存在问题

#2
by wangpf - opened

我生成了一批地址相关的数据,随机加入了一些漏字和重复字的语句,但是会导致无法训练,报错如下

Expected input batch_size (1056) to match target batch_size (992).

我将漏字和重复字的部分去除之后训练正常了。请问如果需要针对漏字和重复字的语句训练要如何对模型添加一些修改呢?

macbert4csc 不支持多字、少字的纠错。模型结构上不支持。

好的,了解了,已经更换到seq2seq的模型了,谢谢大佬

wangpf changed discussion status to closed

Sign up or log in to comment