专利名称:属性提取和聚类设备及方法专利类型:发明专利
发明人:赵凯,胡长建,邱立坤,许洪志,王大亮申请号:CN201110077400.9申请日:20110322公开号:CN102693245A公开日:20120926
摘要:本发明提供了一种用于获得文本中的属性和描述的设备,包括:提取单元,用于从文本中提取所有词语;向量生成单元,用于生成针对已提取的词语的上下文向量;聚类单元,用于根据所生成的上下文向量对已提取的词语进行聚类;以及区分单元,用于将已聚类的词语进行区分。本发明还提供了一种用于获得文本中的属性和描述的方法。通过本发明,能够从文本格式的评论中提取属性,还能够对各种类别的词语进行聚类并加以区分,从而获得更加精确的聚类结果。
申请人:日电(中国)有限公司
地址:100191 北京市海淀区学院路35号世宁大厦20层
国籍:CN
代理机构:中科专利商标代理有限责任公司
代理人:潘剑颖
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容