专利名称:一种微博文本分类系统专利类型:发明专利发明人:吴渝,赵珍妮,李红波申请号:CN201911197204.8申请日:20191129公开号:CN110909167A公开日:20200324
摘要:本发明请求保护一种微博文本分类系统,具体包括以下模块:数据预处理模块:用python爬虫软件爬取微博博文信息和微博用户信息,清洗缺失的数据,并根据情感极性进行人工打标;词向量词性增强模块:通过word2vec构造微博博文信息的词向量,在原始词向量的基础上,根据情感词词典和程度副词词典增强词性信息;新特征构造模块:用于对微博用户信息进行特征提取工作,在原始特征的基础上构造出新的特征;分类模块:利用改进的textCNN模型,先通过卷积层和池化层学习词向量信息,再通过全连接层融入用户信息,最后用softmax函数激活,将微博文本分为积极、消极和中性三种类型。
申请人:重庆邮电大学
地址:400065 重庆市南岸区南山街道崇文路2号
国籍:CN
代理机构:重庆市恒信知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容