米葫芦网

软件信息

  • 软件属性:简体中文 共享软件
  • 软件评分:8.00分
  • 软件大小:6.19 MB
  • 软件厂商:
  • 发布时间:2023-09-29 13:00:28
  • 运行平台:Win64/WinXP/Win98/WinMe兼容软件
ictclas分词系统软件介绍

软件基础简介

ictclas分词系统是一款简单好用的分词软件,主要用于编程行业的中文分词,具有词性标准、关键词提取、指纹提取、用户词典接口扩展等功能,适用于汉语言词法分析研究,需要的朋友快快下载使用吧!


软件特性

1.指纹提取

根据文章的内容,结构,词语间的关系,分析出能够表示该文章的语义指纹,使用数字序列表示。

2.分词粒度可调

可以控制分词结果的粒度。共享版本提供两种分词粒度,标准粒度和粗粒度,满足不同用户的需求。

3.用户词典接口扩展

用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。

4.词性标注功能加强

多种标注级的选择,系统可供选择的标注级有:计算所一级标注级,计算所二级标注集,北大一级标注集,北大二级标注集。

5.关键词提取

自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。

6.新词发现与自适应分词功能

从较长的文本内容中,基于信息交叉熵自动发现新特征语言,并自适应测试语料的语言概率分布模型,实现自适应分词。

7.微博分词功能:

对博主ID进行nr标示,对转发的会话进行自动分割标示(标示为ssession),URL以及Email进行自动标引。

无病毒无广告
展开全部
用户评论
评论
发 布

相关软件
最新软件下载