当前位置 博文首页 > 炫云云:17.1 自然语言处理中文本数据增强方法
炫云云:17.1 自然语言处理中文本数据增强方法
作者:[db:作者]
时间:2021-08-23 09:46
文章目录
- 1、方法综述
- 2、同义词替换
- 2.1 基于近义词表的替换
- 2.2 基于词向量的替换
- 2.3 MASK语言模型的替换
- 2.4 非核心词替换
- 3、 回译
- 4、 加入随机噪声
- 4.1 改变语法形式
- 4.1.1、单词级别语法变换
- 4.1.2、句子级别的语法树变换
- 4.2、 文本交换
- 4.2.1、单词级别的文本顺序交换
- 4.2.2、句子级别的文本顺序交换
- 4.3、 文本语义相关的噪声
-
- 5、 同标签句子文本噪声
-
- 6、Mixup 插值增强
- 7、条件增强
- 8、生成对抗网络
- 9、无监督数据增强
- 参考
cs