本发明公开一种面向语义敏感词句的分析方法,首先,对敏感词库进行义原上的拓展;准备混合敏感语料1和混合敏感语料语料2,并对语料1进行分词,生成word2vec词向量模型;确定词向量模型基于语料2的最佳相关拓展系数;词向量模型和最佳相关拓展系数对语料2语句分词后的词语列表进行相关词拓展;确定词语依据句法关系的敏感性传递函数;对词语敏感性按句法关系进行传递,得到句子的敏感向量,并将语料2得到的所有句子敏感向量标记敏感性,作为支持向量机训练数据;用支持向量机进行分类处理,得到敏感语句识别模型。采用本发明可快速有效地从海量文本信息中识别出语义敏感的词句,能维护网络社区环境的纯净。
本发明公开一种面向语义敏感词句的分析方法,首先,对敏感词库进行义原上的拓展;准备混合敏感语料1和混合敏感语料语料2,并对语料1进行分词,生成word2vec词向量模型;确定词向量模型基于语料2的最佳相关拓展系数;词向量模型和最佳相关拓展系数对语料2语句分词后的词语列表进行相关词拓展;确定词语依据句法关系的敏感性传递函数;对词语敏感性按句法关系进行传递,得到句子的敏感向量,并将语料2得到的所有句子敏感向量标记敏感性,作为支持向量机训练数据;用支持向量机进行分类处理,得到敏感语句识别模型。采用本发明可快速有效地从海量文本信息中识别出语义敏感的词句,能维护网络社区环境的纯净。
商品类型 | 专利 | 申请号 | CN201910481481.5 | IPC分类号 | |
专利类型 | 发明 | 法律状态 | 有权 | 技术领域 | |
交易方式 | 技术转让 | 专利状态 | 已授权 | 专利权人 | |