*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 文本分析 | 关键词提取、主题分析、情感分析、长句检测、简化句子等 |
2 | 相似度计算 | 词袋模型、TF:IDF、Word2Vec、文本向量化、余弦相似度等 |
3 | 语法分析 | 句法树分析、依存关系分析、词性标注、命名实体识别等 |
4 | 数据清洗 | 拼写检查、标点符号修正、去除停用词、去除重复句子等 |
5 | 格式转换 | PDF转文本、文本转HTML、文本合并等 |
6 | 文本比较 | 句子相似度、段落相似度、文档相似度、相似部分标记等 |
7 | 引用检测 | 引用分析、参考文献查找、引文提取、引文比对等 |
8 | 抄袭检测 | 原创性检测、网络抄袭检测、自身抄袭检测、外部抄袭检测等 |
9 | 数据可视化 | 词云生成、分类统计图、相似度热图、文本聚类图等 |
10 | 自定义规则 | 关键词过滤、自定义格式规则、相似度阈值设定、文本限制长度等 |