Discuss New Concept,New Technic,New Tools, Including EAI,BPM,SOA,Tibco,IBM MQ,Tuxedo, Cloud,Hadoop,NoSQL,J2EE,Ruby,Scala,Python, Performance,Scalability,Distributed,HA, Social Network,Machine Learning.
May 062012
 

original:http://nlp.csai.tsinghua.edu.cn/site2/files/xlx.pdf

第26卷 第1期
2012年1月
中文信息学报
JOURNALOFCHINESEINFORMATIONPROCESSING
Vol.26,No.1
Jan.,2012
文章编号:1003-0077(2012)01-0073-11
基 于 层 次 结 构 的 多 策 略 中 文 微 博 情 感 分 析 和 特 征 抽 取
谢丽星1
,周 明2
,孙茂松1
(1.智 能 技 术 与 系 统 国 家 重 点 实 验 室;清 华 信 息 科 学 与 技 术 国 家 实 验 室(筹);清华大学 计算机系,北京100084;
2.微 软 亚 洲 研 究 院,北京100084)
摘 要:随着 Web2.0时代的兴起,与 微 博 相 关 的 研 究 得 到 了 学术 界 和 工 业 界 的 广 泛 关 注。该文使用新浪 API获
取数据,针 对 中 文 微 博 消 息 展 开 了 情 感 分 析 方 面的  研  究。我 们 对 于 三 种 情 感 分 析 的 方 法 进 行 了 深 入 研 究,包括表
情 符 号 的 规 则 方 法、情 感 词 典 的 规 则 方 法、基于SVM 的 层 次 结 构 的 多 策 略 方 法,实验表明基于SVM 的层次结构多
策 略 方 法 效 果 最 好。其次,针 对 层 次 结 构 的 多 策 略 方 法 的 特 征 选 择 进 行 了 详细  分  析,包括主题无关、主题相关的特
征。实 验 表 明 使 用 主 题 无 关 的 特 征 时 获 得 的 准 确 率 为 66.467%。引 入 主 题 相 关 的 特 征 后,准 确 率 提 升 至
67.283%。
关键词:新浪微博;情感分析;SVM
中图分类号:TP391    文献标识码:A
HierarchicalStructureBasedHybridApproachto
SentimentAnalysisofChineseMicroBlogandItsFeatureExtraction
XIELixing

,ZHOU Ming

,SUN Maosong

(1.StateKeyLaboratoryofIntelligentTechnologyandSystems,TsinghuaNationalLaboratoryfor
InformationScienceandTechnology,DepartmentofComputerScienceandTechnology,
TsinghuaUniversity,Beijing100084,China;2.MicrosoftResearchAsia,Beijing100084,China)
Abstract:WiththedevelopmentofWeb2.0,microbloghasdrawnsubstantialattentionfrombothacademiaand
industrycommunities.ThispaperutilizesmicroblogAPIfromSinaandcarriesoutsentimentanalysisonChinese
microblog.Wecompareperformancesofthreemethod,basedontheemoticon,thesentimentlexiconandthehybrid
approachoverhierarchicalstructureusingSVM,respectively.Throughtheexperiments,wefindthatSVMbased
hybridapproachachievesthebestperformance.Furthermore,weanalyzethecontributionofvariousfeaturesinthis
model,includingtarget-independentfeaturesandtarget-dependentfeatures.ExperimentalresultsshowthatSVM
basedmethodcangainanaccuracyof66.467% withtarget-independentfeatures,andanimprovedaccuracyof
67.283% withtheadditionoftarget-dependentfeatures.
Keywords:sinamicroblog;sentimentanalysis;SVM
收稿日期:2011-06-10 定稿日期:2011-09-18
基金项目:国 家 自 然 科 学 基 金 资 助 项 目(60873174)
作者简介:谢丽星(1987—),女,硕士,主 要 研 究 方 向 为 缩 略 语 识 别、输 入 法 和 中 文 微 博 的情  感  分  析;孙茂松(1962—),男,
博士,清 华 大 学 计 算机  系  教  授,博士生导师,主 要 研 究 方 向 为 自 然 语 言 处 理、信 息 检 索 和 社 会 计 算;周明(1964—),男,博士,微
软 亚 洲 研 究 院 主 任 研 究 员,博士生导师,主 要 研 究 方 向 为 自 然 语 言 处 理、机器翻译、搜 索 引 擎 和 社 会 关 系 网 络。
1 引言
微博,是一种新的信息发布及社交网络平台。
用户注册微博服务后,可以关注名人、结交朋友,还
能随意发表、回复及评论消息,来记录生活、分享心
情、表达观点等。微博自问世以来,迅速吸引了大众
的眼光,蓬勃发展。以国内的新浪微博①
为例,截止
① Availableathttp://weibo.com/中 文 信 息 学 报 2012年
到2011年4月底,用户数超过了1.4亿。微博正在
从各个方面渗透并影响人们的生活,包括大量的信
息传播、更快的信息发现、与世界的连接等。
微博消息数量大,更新快,吸引了一大批学者对
其进行研究。针对微博的自然语言处理研究已成为
当前一个新的研究热点和前沿课题,而情感分析就
是其中一个热点话题。情感分析,也被称为观点挖
掘、观点分析、主客观分析等。情感分析的目的是从
文本中挖掘用户表达的观点以及情感极性。挖掘用
户观点意义重大,既能吸引潜在用户,帮助用户做决
策[1]
,又能得到产品反馈[2]
,还 能 对 政 治 选举  等  重  大
事件进行预测。除此以外,情感分析的技术还有助
于自然语言处理领域其他研究方面的发展,例如,自
动文本摘要[3]
及问答系统[4]
等。目前已经有许多针
对英文的(即新闻、博客、微博等)情感分析系统相继
问世[5-11]
。在情感分析方面,主要使用的技术分两
大类:一类是采用情感词典与规则相结合的方法,
根据文本中所包含的正向情感词和负向情感词的个
数来进行情感分类;另 一 类  是 采 用 机 器 学 习 的 方 法,
选择文本中的一些特征,标  注 训 练 集 和 测 试 集,使用
朴素贝叶斯(NaveBayes)、最大熵(MaxEntropy)、
支持向量机(SupportVectorMachine)等分类器来
进行情感分类。
微博作为一种新型的消息传递方式,写作简洁,
与传统文本差异较大,主要表现在五个方面:①主
题发散性。在传统文本中,文本所涉及的内容通常
在同一主题下,主题较为集中,通篇会不断的提到主
题词。但在微博中,主题较为发散。例如,这条微博
“今天看了青蜂侠。我们后来还一起唱了 KTV,真
是开心的一天。”该微博中第一句的主题词是“青蜂
侠”,第二句涉及的内容与“青蜂侠”无关。这是主题
发散的表现;②省略成分的(主谓宾)。在传统文本
中,用户使用的语法较为规范,而在微博中经常会出
现省略主语、宾语的现象,例如,“青蜂侠不错!真好
看啊!”该微博的第二句省略了主语“青蜂侠”;③省
略上下文的(上下文隐含在其他的微博信息或者交
互的信息中)。在微博中一条微博如果是回复某一
条微博的内容,由于是对话的形式,通常会省略掉主
题。例如,一条微博是“凤姐真讨厌!”另一条回复该
微博的微博是“确实如此。”这两条微博讨论的都是
“凤姐”,但是第二条微博省略了“凤姐”相关的上下
文;④口语化:在微博中用户经常会使用时下流行
的热门词,口语化的词等,例如,“坑爹”,“神马”,“不
咋地”等;⑤包含链接、表情符号及标签等信息。微
博中用户经常分享网页链接,使用表情符号表征情
感,也经常给文本打上标签,标签可以反映主题。由
于上述差别,使 得 微 博 情 感分 析 任 务 更 为 复 杂,也使
得 传 统 文 本 的 分 析 方法 无 法 适 用,例如,传统文本中
通常将一段文本内容表达的情感视为针对同一主
题,但 是 微 博 中 可 能 是 多 主 题,使用单一主题的情感
分析技术可能会造成失误;同时微博中口语化的词
较多,如 果 口 语 词 表 达 了 情 感,而传统文本的分析方
法无法识别这类情感,也会对情感分析造成影响。
因 此 针 对 中 文 微 博 的情 感 分 析 方 面 的 研究  显  得  尤  为
迫切和重要。
在微博情感分析中,目 前 英 文 微 博 相 关 的 研 究
已经有了一些进展,例如,针对英文微博自身包含的
属性如表情符号,标签(hashtag)等作为特征对微博
进行情感分类,而针对微博的主题发散性,也有学者
从 主 题 无 关 和 主 题 相关 两 方 面 进 行 分 析。但到目前
为止,针 对 中 文 微 博 的 研 究仍 处 于 起 步 阶 段,而中文
微博与英文微博有很大不同:英文微博限制用户的
输入文本不超过140个字符,这通常是一个句子,包
含7~10个英文单词,涉及的主题和情感相对一致;
而 中 文 微 博 限 制 用 户的 输 入 文 本 不 超 过140个中文
字符,这可以包含多个句子,每个句子涉及的主题可
能不同,表 达 情 感 也 可 能 不 同。例如,在如下微博中
“今天看了青蜂侠,很一般。场面一般,剧情一般。
不过杰伦还是那样帅。”这条微博前两句是对电影
“青蜂侠”的负面评论,第  三 句 是 对 青 蜂侠  的 扮 演  者
的正面评论,表 达 的 主 题 和情 感 均 不 同。
本文主要研究中文微博的情感分析。由于此前
相关研究并不多,我 们 在  研 究 中 借 鉴 了普  通 文 本  情
感分析的方法。在  普 通 文 本 的 情 感 分 析方  面,主要
有两类任务:主题无关的情感分析和主题相关的情
感分析。主题无关的情感分析不需要考虑待分析文
本的评价对象,给出一个情感极性即可;主题相关的
情 感 分 析 需 要 考 虑 待 分 析 文 本 的 评 价 对 象,给出待
分析文本针对该评价对象的情感极性。受此启发,
本 文 将 从 主 题 无 关 和 主 题 相 关两  个 方 面 抽  取  特  征,
并 应 用 于 基 于 层 次 策略 的 中 文 微 博 情 感分  析。本文
通 过 从 新 浪 微 博 开 放平 台 提 供 的 API① 抓取一定规
模的数据,对 中 文 微 博  的 情 感 分 析 进 行了  研  究。本
文 研 究 的 输 入 为 给 定 主 题 词 及 中 文 微 博消  息,如主
题词:“科 比”,中 文 微 波 消 息:“科 比 太 酷 了!!!
47
① Availableathttp://open.t.sina.com.cn/wiki/index.php/
Trends/statuses1期 谢丽星等:基 于 层 次 结 构 的 多 策 略 中 文 微 博 情 感 分 析 和 特 征 抽 取
[抓狂][爱你]”;输出为该条微博消息针对该主题词
的情感,包括正向情感、负向情感、中性情感三种。
对于该例,系统输出为正向情感。针对中文微博的
情感分析,本文采用了二步法,首先引入主题无关特
征,即使用链接、表情符号、情感词典、情感短语、上
下文等特征训练 SVM 对中文微博进行情感分类;
然后进一步引入主题相关的特征,即筛选微博中与
主题相关的句子来进一步提升效果。本文主要的贡
献有:①提出了基于层次结构的多策略分析框架;
②中文微博特征的研究:研究了链接、表情符号等
特征对于中文微博的有效性;同时提出了微博消息
的句子构成特征。
本文的结构组织如下:第二章简单介绍相关工
作;第三章阐述算法设计;第四章展示实验结果及相
关分析;第 五  章 简 单 地 讨 论  本 文 与 以 往 工 作 的 区 别;
第六章是结论及下一步工作。
2 相关工作
微博,实时提供短消息的播放,作为数以亿计用
户的日常信息沟通和人际交流的重要工具,已经成
为互联网的新形态。关于微博的情感分析已成为时
下热门话题,一系列研究就此展开。本章节将从针
对英文的情感分析和针对中文的情感分析两方面的
研究工作进行介绍。
2.1 针对英文的情感分析
本 节 将 从 从 主 题 无 关 的 英 文 情感 分 析、主题相
关的英文情感分析、英文微博的情感分析三个方面
的研究工作来进行介绍。
2.1.1 主题无关的情感
主题无关的情感分析是对指定文本给出情感极
性,而不关心该情感极性所描述的对象。目前大多
数情感分析方面的研究都是主题无关的,主要有三
种方法:基 于 词 典 的 方 法、有监督的机器学习方法、
无监督的方法。
基于词典的方法[12]
。这类方法首先需要构建
一个情感词典,主 要 包 括 正  向 情 感 词 和 负 向 情 感 词。
然后利用情感词典统计待分析的文本中的正向情感
词的数目和负向情感词的数目。最后依据它们的差
值来进行情感极性的判定,即差值为正即为正向情
感,差值为负为负向情感,差值为零为中性情感。情
感词典的方法的局限性在于无法解决未登录词的
问题。
有监督的机器学习方法[5,13-14]
。这类方法主要
是 使 用 机 器 学 习 的 模 型,包 括 朴 素 贝 叶 斯 (Nave
Bayes)、最 大 熵 (Max Entropy)、支 持 向 量 机
(SupportVectorMachine)等来对文本进行情感分
析。Pang等人[5]
的 研 究 工 作 主 要 是 对 电影  评  论  进
行情感极性的分类,分 为 正 向 情 感 和 负 向 情 感。该
工 作 首 先 对 待 分 析 的 文 本 进 行 预 处 理,提取出若干
特征,包 含 一 元 词 特 征 (unigram)、二 元 词 特 征
(bigram)、词性标注、词的位置信息等,然后使用这
些特征来训练模型,选用的方法有朴素贝叶斯、最大
熵、支持向量机。实验结果表明,支持向量机的效果
最为理想,且 在 选 用 一 元 词 特 征时  取 得 了  最  好  的  准
确率为83%。Li等人[14]
对于评论数据,首先提出
了用于情感二分类的 Dependency-Sentiment-LDA
模型,它 在 情 感 分 类 的 时 候 不 仅考  虑 了 情  感  词  所  表
达的话题语境,而 且 还 考 虑 了 情感  词 的 局  部  依  赖  关
系。然 后 进 一 步 探  讨 了 情 感 多 分 类 问 题,提出了一
种基于 Tensor的评论分值预测方法。基于有监督
学习方法精度较高,缺陷是依赖于人工标注语料库,
语 料 库 标 注 存 在 不 一致 性 问 题。
无监督的学习方法[15-16]
。Turney等人[16]
对于手
机、银行、电影及 旅 游 目 的 地相  关  的  评  论  的  情  感  分  析
工作。他 们 选 定 了 两 个 基 本 情 感 词 (正 向 词:
excellent,负向词:poor),然后他们制定了一些模版来
提取短语,使用PMI分别计算待分析的文本中这些
短语与基本正向情感词的关联度(记为正向关联度)
和负向情感词的关联度(记为负向关联度),根据正向
关联度与负向 关 联 度 的 差 值 来 判 定 该 文 本的  情  感  极
性。无监督的方法依赖于处理语料的领域范围,存在
着对基准情感词的依赖性问题,正确率较低。
2.2.2 主 题 相 关 的 情 感 分 析
主题相关的情感分析主要包括两种方法,基于
规 则 的 方 法 和 基 于 特 征(或属性)的方法。
基于规则的方法[17-18]
。这类方法主要`是对文
本进行预处理,包括词性标注、依存句法分析等,然
后针对形容词、动词、名词等制定一些规则来对该文
本判定情感极性。代表工作为 Nasukawa和 Yi
[17]
的工作。
基于特征(属性)的方法[19]
。这类工作除了需
要对文本进行情感极性的判定,还需要按照产品的
属性进行归类。代表工作为 Hu和 Liu
[19]
针对用户
对 在 线 产 品 的 评 论 进行 的 情 感 分 析 工 作。他们的方
法主要包含三步。首先识别出用户评论中涉及的产
品属性;其次针对每个属性,得出评论中包含的正向
57中 文 信 息 学 报 2012年
情感和负向情感的内容;最后将属性与对应情感极
性的内容按某种形式输出。
2.2.3 针对英文微博的情感分析
对 于 微 博 的 情 感 分 析 的 研  究 主  要  是  针  对
Twitter① 上的消息 Tweets而言的,本节将从主题
无关和主题相关两方面进行介绍。
主题无关的情感分析[10,20-22]
。Davidiv等人[20]
使用 Tweets中的标签、表情符号等作为特征,训练
了一个类似 KNN 的分类器来进行情感极性的分
类;Barbosa和 Feng
[10]
利用一些网站(即 Twendz、
TwitterSentiment、TweetFeel)对 于 Tweets所 提
供的情感分析的结果作为训练数据,然后选用一些
特征,采用二步分类法来对 Tweets进行分类,即先
对 Tweets进行主客观分类,然后再在被分为主观
的 Tweets中进行正、负向情感分类。
主 题 相 关 的 情 感 分 析。Jiang 等 人[11]

Tweets的 情 感 分 类 采 用 二 步 分 类 法,首 先 对
Tweets进行主、客观分类,然后再对被分为主观的
Tweets进行正、负向情感分类。与其他工作不同的
是,Jiang等人在分类时除了考虑了主题词,还对主
题词进行了扩展,引入了主题相关的特征,此外还考
虑 Tweets间的转发关系,采 用 图  模 型 的 方 法 提 升
效果。未使用图模型之前,系统取得的最好准确率
为66%,引 入 图 模 型 之 后,系 统 的 准 确 率 提 升 到
68.3%。
2.2 针对中文的情感分析
目 前 针 对 中 文 的 情 感 分 析 主 要 集 中 在
NTCIR② 和COAE③ 两个评测上。
NTCIR是由日本情报信息研究所于2002年主
办的针对亚洲语言的跨语言信息检索评测会议。该
评测主要包括六项任务,主客观判别、相关性判别、
观点持有对象抽取、观点评价对象抽取、情感极性判
别、问答系统。在 NTCIR-08中,针对繁、简体中文,
在主客观判别及情感极性判别这两项任务,评测的
最好结果见表1。
表1 NTCIR-08中 情 感 极 性 判 别 的 最 好 结 果
特征
主、客观情感判别 正、负向情感判别
繁体中文 简体中文 繁体中文 简体中文
精确率 56.37% 41.34% 76.48% 67.39%
召回率 85.71% 83.35% 53.03% 52.90%
F值 68.01% 55.27% 62.63% 59.27%
COAE由中国中文信息学会信息检索专业委
员会从2008年开始举办。每届评测国内外大约有
20多家科研单位参加。该评测主要包含五项任务,
情感词的识别及分类、情感句的识别及分类、观点句
抽取、观点评价对象抽取、观点检索。在 COAE-09
中,极 性 判 别 的 最 好 结 果 见 表2。
表2 COAE-09中 情 感 极 性 判 别 的 最 好 结 果
裁判员P@1000Precision Recall F1 Accuracy-1000
1 0.662 0.662 0.1580330.255155 0.158033
2 0.612 0.612 0.1532680.245143 0.153268
3 0.544 0.544 0.1499860.235142 0.149986
总的来说,中文的情感分析方法与英文类似,大
致有两种。
① 有监督的机器学习方法[23]
。Zhao等人[23]
基于CRF模型引入“冗余特征”来研究情感分类问
题,Zhou等人。基于SVM 模型来进行主客观及情
感极性分类;
② 组合方法[25]
。Li等人[25]
研究了该文具体研
究 四 种 不 同 的 分 类 方 法 在 中 文情  感 分 类 上  的  应  用,
同 时 考 虑 到 不 同 领 域需 要 选 择 不 同 基 分类  方  法  才  能
获得更好的分类结果,采用一种基于Stacking的组
合分类方法,用 以 组 合 不 同的 分 类 方 法。
目前针对中文的情感分析较针对英文的情感分
析 无 论 从 资 源 还 是 方 法 上 来 说都  要 相 对 初  步  一  些。
目 前 中 文 的 情 感 分 析主 要 存 在 以 下 问 题。
① 中文需要分词,分 词 错 误 会 对 情 感 分 析 产 生
影响,例如,“英 雄 难 过 美 人 关”中的“难过”;
② 中 文 情 感 词 典 构 建 的 难 点。现在很多情感
词 典 都 仅 为 每 个 词 条 赋 予 一 种 情 感 极 性,但是中文
词较为复杂,在 不 同 的 语 境 下 同样  的 词 有  不  同  的  含
义或情感色彩,如“黑马”,一般认为黑马是黑色的
马,但 在 某 些 语 境 下 比 喻 实 力 难测  的 竞 争  者  或  出  人
意料的优胜者,含褒义色彩,这使得如何构建一个较
好 的 情 感 词 典 成 为 一个 问 题;
③ 中  文 存 在 一 些 难 点 目 前尚  无 较 好  的  解  决  方
案,如“反讽”、“褒义贬用”和“贬义褒用”;
④ 中 文 情 感 分 析 主 要 使 用 句 内特 征 进 行 分 析,
而句间特征,篇 章 特 征 尚 未得 到 充 分 应 用;
67



Availableattwitter.com
Availableathttp://research.nii.ac.jp/ntcir/
Availableathttp://www.ir-china.org.cn/Information.
html1期 谢丽星等:基 于 层 次 结 构 的 多 策 略 中 文 微 博 情 感 分 析 和 特 征 抽 取
⑤ 受限于标注数据的规模大小,单纯使用机器
学习的方法难以取得较好效果。
3 算法设计
这章我们将介绍三种方法,分别是基于表情符
号、情感词典、SVM 的 层 次 结 构 的多  策 略 方 法。
3.1 基于表情符号的规则方法
在新浪微博上,微博平台提供了一些默认的表
情符号,如“ ”。表情符号在抓取下来的文本中的
表现形式为被中括号包含的文本,示例的这个表情
对应的文本为“[哈哈]”。一条消息中可能包含多个
表情符号。
本文针对新浪微博提供的表情符号进行了正、
负向表情符号的分类,然 后  对 于 待 分 析 的 文 本,从中
提取中正、负向表情符号,依据公式(1)进行情感极
性的分类:
情感极性=
正向情感(如果正向表情符号数>负向表情符号数)
负向情感(如果正向表情符号数<负向表情符号数)
中性情感(如果正向表情符号数=负向表情符号数


烆 )
(1)
3.2 基于情感词典的规则方法
情感词是情感极性判定中较为重要的考量依
据。本文借鉴了传统的情感分析的方法,选取了常
用的正、负向情感词构建了情感词典。在构建词典
时,我 们 只 选  用 了 在 任 何 情  况 下 都 绝 对 表 征 正、负向
情感的 词,如 正 向 情 感 词“喜 欢”、负 向 情 感 词“憎
恨”。然 后 将  待 分 析 的 文 本  进 行 了 分 词 处 理,依据该
情感词典从中提取出正、负向情感词,依据公式(2)
进行情感极性的分类。
情感极性=
正向情感(如果正向情感词数>负向情感词数)
负向情感(如果正向情感词数<负向情感词数)
中性情感(如果正向情感词数=负向情感词数


烆 )
(2)
3.3 基于层次结构的多策略分析框架
3.3.1 方法介绍
本文提出了基于层次结构的多策略分析框架,
见图1(下页)。使用的分类工具是 SVM(Support
Vector Machine),中 文 名 为 支 持 向 量 机,是 由
Vapnik等 人 提 出 的 一 种 非常  有  潜  力  的  学  习  技  术,是
一 种 基 于 统 计 机 器 学 习 理 论 的 模 式 识 别方  法,主要
用于模式识别领域。本文使用的SVM 工具是由台
湾大学林智仁 (Chih-JenLin)博士等开发的一套
支持向量机算法库libsvm①。
表3 中 文 微 博 消 息 包 含 不 同 情 感 极 性 句 子 的 示 例
主题词:青蜂侠
微博消息:
好失望啊!
今 天 没 买 到 致 命 伴 旅 的 票。
不过还好,看了青蜂侠,杰伦好帅!
在 前 人 针 对 英  文 微 博 的 研 究 工 作 中,由于英文
微博消息文本长度被限制在140个英文字符,这通
常是一个句子,包含7~10个英文单词,因此之前的
所 有 工 作 都 是 将 一 条微 博 消 息 当 做 一 个整  体  来  进  行
训练和测试。通 过  观 察 中 文 微 博 数 据 数 据,我们发
现 中 文 微 博 文 本 长 度 被 限 制 在140个中文字符,它
可以包含多个句子,与英文微博相比语义更丰富,句
与句之间的情感极性不尽相同。如表3所示,针对
主题词“青蜂侠”的 微 博 消 息 共 包 含 三 句,首句的情
感极性是负向情感,第二句是中性情感,第三句是正
向情感。如果将不同极性的句子作为一个整体赋予
一种极性,也许会影响训练效果。因此在使用SVM
对微博消息进行文本分类时,基于分句与不分句的
考量分为两大类策略,共四种方法,见图1(下页)。
下面我们对这两大类策略、四种方法进行简单
介绍。
第一类:不分句,将一条中文微博消息看做一个
整体,该微博的情感极性被视为一致,有两种方法。
① 一步三分类。从 微 博 消 息 中 提取  极  性  分  类
特征,然 后 根 据 每 条 微 博 的 正、负、中性情感标签,直
接训练一个三分类的 SVM 分类器,对微博消息三
分类;
② 二步分类。先从微博消息中提取主、客观分
类特征,根据每条微博的主、客观标注情况,训练主、
客观分类的SVM 分类器,先对微博消息进行主、客
观分类;然 后 对 于 分 为 主 观的 微 博 消 息,再从微博消
息 中 提 取 极 性 分 类 特 征,根据每条微博的正、负向情
感标签训练正、负向情感的SVM 分类器,进一步将
77
① C.-C.Changand C.-J.Lin.LIBSVM :alibraryfor
supportvectormachines.Availableathttp://www.csie.ntu.edu.
tw/~cjlin/libsvm/.中 文 信 息 学 报 2012年
图1 基 于 层 次 结 构 的 多 策 略 情 感 分 析 框 架
主观的微博消息分为正、负向情感;
第二类:分句,将一条中文微博消息使用程序
自动拆分成若干个句子,然后将针对每个句子进行
训练,有两类方法。
① 句子组成规则分类。首先使用上述两种方
法中的最佳方法训练SVM 分类器得到每一条微博
消息中每个句子的情感极性,然后根据正、负向句子
的个数,依据公式(3)对微博消息进行三分类;
情感极性=
正向情感(如果正向情感句子数>负向情感句子数)
负向情感(如果正向情感句子数<负向情感句子数)
中性情感(如果正向情感句子数=负向情感句子数


烆 )
(3)
② 句子组成SVM 分类。首先使用上述两种方
法中的最佳方法训练SVM 分类器得到每一条微博
消息中每个句子的情感极性,然后选取微博消息的
句子构成特征,结合每条微博的情感极性再次训练
SVM,将每条微博进行三分类。
3.3.2 主题无关的特征抽取
在上一节中,涉及三类特征,主、客观分类特征、
极性分类特征、微博消息的句子构成特征,这里将一
一详述。
(1)主、客观分类特征(表4)。情感短语特征指
的是“有意思”,“没文化”这类短语,它们的特点是中
心词“意思”和“文化”本身是中性,但是前面出现了
“有”、“无”这  一 类 修 饰 词 就  含 有 极 性 色 彩 了。
(2)极性分类特征(表5)。
(3)微博消息的句子构成特征(表6)。考虑到
中国人书写文章时“开门见山”的习惯,以及“首尾呼
表4 主、客观分类特征
序号 类型 特征内容 描述
1 链接 是否含有url链:接 链接通常以http:开头
2 表情 表情符号个数
正向表情:34个
负向表情:32个

情感
词典
情感词个数
正向情感词:4751个
负向情感词:3651个

情感
短语
情感短语个数
正 向 情 感 短 语 词:103个
负 向 情 感 短 语 词:6个

上下

中文词是否出现、形容
词个数、动 词 个 数、感
叹号是否出现、问号是
否出现
中 文 词 采 用 ICTCLAS
的 中 文 词 表 统 计,共
80224 个 词;分 词 采 用
ICTCLAS进行分词
表5 极性分类特征
序号 类型 特征内容 描述
1 链接 是否含有url链接 链接通常以http:开头
2 表情
正 向 表 情 符 号 个 数、
负 向 表 情 符 号 个 数
正向表情:34个
负向表情:32个

情感
词典
正 向 情 感 词 个 数、
负向情感词个数(使用
否 定 词 表 进 行 了 情 感
转换判定)
正向情感词:4751个
负向情感词:3651个
否定词表:18个

情感
短语
正 向 情 感 短 语 个 数、
负 向 情 感 短 语 个 数
正 向 情 感 短 语 词:103个
负 向 情 感 短 语 词:6个
短语修饰词:6个

上下

中文词是否出现、形容
词个数、动 词 个 数、感
叹号是否出现、问号是
否出现
中 文 词 采 用 ICTCLAS
的 中 文 词 表 统 计,共
80224 个 词;分 词 采 用
ICTCLAS进行分词
871期 谢丽星等:基 于 层 次 结 构 的 多 策 略 中 文 微 博 情 感 分 析 和 特 征 抽 取
应”的句式,因此除了考虑正、负、中性情感句子数目
以外,这里还考虑了首句、尾句的情感极性。
表6 微 博 消 息 的 句 子 构 成 特 征
序号 类型 特征内容
1 首 句 的 情 感 极性  首 句 的 情 感 极 性:正、中、负向情感
2 尾 句 的 情 感 极性  尾 句 的 情 感 极 性:正、中、负向情感
3 正 向 情 感 句 子数  正 向 情 感 句 子 的 数 目
4 负 向 情 感 句 子数  负 向 情 感 句 子 的 数 目
5 中 性 情 感 句 子数  中 性 情 感 句 子 的 数 目
3.3.3 主题相关的特征抽取
通过观察,我 们 发 现 中  文 微 博 消 息 不 像 电 影、产
品评论那样集中一个主题讨论,微博消息中存在着
大量的主题发散及省略现象。如表7所示,针对主
题词“将爱情进行到底”的微博消息共包含5个句
子。首先句子1和句子2涉及的主题与主题词“将
爱情进行到底”无关,这说明该消息存在主题发散的
情况。其次句子3、4、5是针对主题词“将爱情进行
到底”的,除了句子4是明确包含主题词的,句子3
中的“电影”指代的是“将爱情进行到底”,句子5中
省略了主语“将爱情进行到底”,这说明该消息存在
省略主题词的情况。
表7 中 文 微 博 消 息 中 的 主 题 发 散 及 省 略 示 例
主题词:将 爱 情 进 行 到 底
一条微博消息:
好 累 啊  两 天 都 没 好 好 睡 觉 了。
昨 天 晚 上 和 聒 噪 的 老 马 一 起 去 吃 了 西 餐。
看了场电影。
将 爱 情 进 行 到 底。
很不错啊。
因此,在  使 用 微 博 消 息  的 句 子 构 成 特 征 时,在筛
选句子的时候,需 要 进 行 主  题 相 关 的 句 子 的 筛 选,具
体考虑以下三种情况。
① 仅 考 虑 包 含 主  题 词 的 句 子 的 情感  极 性;
② 零指代的情况。对于微博中的一个句子,如
果它不包含任何名词性短语和代词,即认为它表达
的情感是针对上一句的对象,如 上 一 句 包 含 主 题 词,
则也应该考虑该句的情感极性;
③ 对于构成微博消息的每个句子,先识别出句
子中的情 感 词 或 情 感 短 语,记 为 位 置i,看 在 窗 口
distance个词范围内,即[i-distance,i+distance]
中是否出现主题词,如出现主题词则认为该句与主
题相关。
4 实 验 结 果 及 相 关 分 析
4.1 实验设置
本文使用新浪提供的 API抓取了影视、名人、
产品三个领域,共六个主题的数据,最后每个主题选
取了1000条微博消息进行标注,结果见表8。
评测 方 法 选 用 的 是 五 折 交 叉 验 证 (five-fold
cross-validation)。评测指标主要使用的是准确率,
即5次迭代正确分类的总数除以原始数据中的元组
总数。
表8 中 文 微 博 消 息 中 的 主 题 发 散 及 省 略 示 例
话题 文件
正向感
情条数
负向感
情条数
中性感
情条数

条数
中性感
情比例
影视
将 爱 情 进 行 到 底 336 75 589100058.90%
青蜂侠 270 183 547100054.70%
名人
科比 645 79 276100027.60%
乔布斯 329 33 638100063.80%
产品
iphone 188 83 729100072.90%
诺基亚 203 213 584100058.40%
共计 1971 666 3363600056.05%
4.2 实验结果及分析
(1)我 们 首 先 对 于 三 种 方 法 进 行 比 较,实验结
果见表9。
表9 中 文 微 博 消 息 中 的 主 题 发 散 及 省 略 示 例
基于表情符号
的规则方法
基于情感词典
的规则方法
基于SVM 的
一 步 三 分 类 方 法
准确率 56.583% 55.583% 65.400%
分析:从表8可以看出,基于SVM 的方法效果
最好,基 于 表 情 符 号 的 规 则 方 法略  好 于 基  于  情  感  词
典的方法,准确率均在56%左右。
(2)SVM 相关的实验
① 方法比较:这里我们对3.3.1节中提到的四
种方法进行比较。从表10可以看出,一步三分类方
法 要 比 二 步 分 类 方 法高 出1.5个百分点。因此在后
续 实 验 得 到 句 子 级 别的 情 感 极 性 时 采 用一  步  三  分  类
法进行训练和测试。从表11可以看出,采用句子组
成SVM 分类法效果好于句子组成规则分类方法。
97中 文 信 息 学 报 2012年
表10 一 步 三 分 类 与 二 步 分 类 的 效 果 比 较
方法 准确率
一步三分类 65.400%
二步分类 63.866%
表11 句 子 组 成 规 则 和 句 子 组 成SVM 分 类 方 法 的 效 果 比 较
方法 准确率
句 子 组 成 规 则 分 类 63.517%
句子组成SVM 分类 66.267%
② 主题无关的特征比较。这里我们仅对极性
特征、微博消息的句子构成特征进行比较分析。对
于极性特征,从表12可以得出两点结论:(a)从有
效性来看,上下文>情感词典>表情>情感短语,引
入链接特征后效果反而变差;(b)最佳特征组合:表
情+情感+情感短语+上下文。
表12 极 性 分 类 特 征 的 效 果 比 较
特征 准确率
所有特征 65.400%
所有特征—链接特征 65.717%
所有特征—表情特征 64.783%
所有特征—情感词典特征 64.767%
所有特征—情感短语特征 65.333%
所有特征—上下文特征 58.933%
对于微博消息的句子构成特征,从表13中可以
得出两点结论:(a)从有效性来看,三种情感极性句
子数目>尾句情感极性>首句情感极性;(b)最佳
特征组合:首句极性+尾句极性+三种情感极性句
子数目。
表13 微 博 消 息 的 句 子 构 成 特 征 的 效 果 比 较
特征 准确率
所有特征 66.267%
所有特征—首句极性特征 64.800%
所有特征—尾句极性特征 64.433%
所有特征—首、尾句极性特征 64.933%
所有特征—三 种 情 感 极 性 句 子 数 目 特 征 55.800%
综上所述,在 仅 考 虑 主  题 无 关 的 特 征 时,为达到
最佳效果,“最佳组合”为,整体的方法选择句子组成
SVM 分类,句子组成特征选择首句极性特征+尾句
极性特征+三 种 情  感 极 性 句 子 数 目 特 征;在对单个
句 子 进 行 分 类 时 选 择 一 步 三 分 类 方 法,特征选择表
情特征+情感词典特征+情感短语特征+上下文
特征。
我们采用“最佳组合”对数据进行了训练测试,
得到结果见表14。从表14中可以看出,主题无关
的最佳方法的总体准确率达到了66.467%。根据
准确率从高到低排序,各个领域依次为:名人>影
视>产品。通过对数据进行分析,我们得到了以下
三点原因。
① 名人。用 户 对 名 人 发 表 观 点 的时  候  使  用  的
表达较为单一;
② 影视。用户关注的主题更为发散,如主角、
画面等,分类时比名人要难;
③ 产品。由于产品包含不同的型号,公司,而
且产品的属性(如屏幕、信号等)非常多,分类问题更
为复杂。
表14 主 题 无 关 特 征 最 佳 组 合 的 效 果
主 题  文 件  微 博 消 息 数  主 题 无 关 准 确 率
影视
将 爱 情 进 行 到 底 1000 67.400%
青蜂侠 1000 66.800%
名人
科比 1000 72.900%
乔布斯 1000 69.400%
产品
iphone 1000 69.800%
诺基亚 1000 61.200%
共计 6000 66.467%
同时,针 对 主 题 无 关 的 实 验,我们还进行了正、
负、中 向 情 感 的 精 确 率和  召  回  率  的  统  计,见 表15。
表中显示从评测指标来看,中性情感>正向情感>
负向情感。这跟标注数据中各种情感极性的消息数
目比例成正比。
表15 主 题 无 关 特 征 最 佳 组 合 下 各 种 情 感 的 精 确 率 和
召回率
精确度 召回率
正向情感消息 63.591% 64.721%
负向情感消息 37.168% 31.579%
中性情感消息 72.886% 74.294%
进一步,我 们 对 于 主 题 无 关特  征 最 佳  组  合  的  错
误类型进行了分析,结果见表16。
081期 谢丽星等:基 于 层 次 结 构 的 多 策 略 中 文 微 博 情 感 分 析 和 特 征 抽 取
表16 主 题 无 关 特 征 最 佳 组 合 下 的 错 误 类 型
序号 类型 示例
1 情 感 词 表 未 覆 盖
将 爱 情 进 行 到 底 真 纠 结。
青 蜂 侠 看 的 反 胃。

使 用 的 词 是 口 语 化 的 词 或 网 络
热词
将爱,不咋地。
要不是为了看JAY,青 蜂 侠 真 的 是 挺 坑 爹 的。
3 误 识 别  今 天 去 看 了 将 爱,看的心情好差。
4 不含情感词
#青蜂侠#只有一个念头,让编剧回家吧。
第 二 次 看 青 蜂 侠 看 不 下 去==!
看了<青蜂侠>,周 杰 伦 你 的 英 文 敢 再 闹 太 套 点 么!
5 反 讽  作 为 一 部 动 作 片 能 拍 到 让 我 看 着 想 睡 着 青 蜂 侠 在 某 个 意 义 上 也 是 成 功 了…
6 情 感 词 类 型 较 多
青蜂侠,一 堆 不 知 叫 什 么 的 什 么,很无聊,本 来 以 为 很 好 看,现在好啦,浪费时间,浪费
期望值
7 英文情感词 青蜂侠istupid[汗]
8 有正向词,但 是 语 境 是 相 反 意 思
但是,随着iphone和 Android的冲击,无 论 是 高 端 还 是 中 低 端 市 场,诺 基 亚 的 优 势 正
在全面失去。
③ 主题相关的特征比较。首先我们考虑仅包
含主题词的句子及零指代的情况,见表17,从中可
以看出引入零指代后,效果提升了约0.1%,比主题
无关的最好效果(66.467%)提升了1%左右。
表17 主 题 相 关 特 征 的 效 果 比 较
准确率
仅 考 虑 包 含 主 题 词 的 句 子 的 情 感 极 性 67.183%
+包 含 零 指 代 的 情 况 的 句 子 的 情 感 极 性 67.283%
其次,考虑距离窗口 方 法,得 到 图2。由 图 可
知,考虑距离窗口在距离为30的时候最佳,此时退
化到仅包含主题词的情况。
图2 不 同 距 离 范 围 内 包 含 主 题 词 的 结 果
最后,我们对于引入主题相关特征后的系统进
行了错误分析,发现主要有两类错误。
① 包  含 主 题 词 的 句 子 表 达的  情 感 未  必  是  针  对
该主题词的情感,如当主题词为“青蜂侠”时,微博消
息“致命伴旅比青蜂侠好看多了!”中的“好看”指的
是“致命伴旅”;
② 指代情况较丰富,包括省 略 宾 语,如“青 蜂
侠。我觉得挺好看的。”;首句省略主语,如“恩恩,不
错哦!青蜂侠。”;句子未涉及主题词,但涉及主题词
的属性,如“今天去看了青蜂侠。画面挺炫。”,“画
面”是电影“青蜂侠”的一个属性。
5 讨论
目前针对中文微博的研究仍处于起步阶段,尚
未 有 关 于 中 文 微 博 情感 分 析 方 面 的 研 究工  作。本文
针 对 中 文 微 博 的 情 感分 析 进 行 了 初 步 探 讨。与中文
传统文本情感分析工作相比,本文针对中文微博自
身特点,相 对 于 传 统 文 本 考 虑 将微  博 的 特  有  属  性  如
连接、表情符号等作为特征,同时考虑了微博中简单
的省略现象,从 而 更 好 地 进行 情 感 分 析;与英文微博
的情感分析工作相比,由于英文微博通常只有一句,
已 有 工 作 均 将 一 条 微博 作 为 一 个 整 体 赋予  情  感  极  性
来进行训练和测试,本 文  考 虑 到 中 文 微博  比 英 文  微
博语义更丰富,包含的句子数目更多,且句与句之间
涉及的主题及情感可能不同,分别从微博级别和句
子 级 别 两 方 面 来 探 讨 了 情 感 分 析 的 效 果,实验结果
证 明 句 子 级 别 的 效 果更 佳。
18中 文 信 息 学 报 2012年
6 结 论 及 下 一 步 工 作
近年来,微博在国内外强势崛起,成为时下焦
点。本文通过使用新浪提供的 API抓取一定规模
的微博数据,并根据中文微博的特点,提出了基于层
次结构的多策略情感分析框架,包括考虑分句与不
分句的策略,并对微博的属性,如链接、表情符号、情
感词典等进行了特征选择。此外,本文还采用基于
表情符号的规则方法和情感词典方法进行分类。通
过比较实验,我们发现与后两种方法相比,基于层次
结构的多策略情感分析框架可以取得更好的分类效
果。其中,在 主 题 无 关 特 征 下 取 得 的 最 好 效 果 是
66.467%,考虑主题相关特征后取得的最好效果为
67.283%。
目前,本系统仍有很大的提升空间。后续,我们
将考虑如下工作来进一步提升实验效果。
① 构建网络用语词典,针对这类型的词,由于
无法借助现有的分词系统,需要采用新算法匹配识
别,包括否定转移的处理;
② 更深入地研究主题相关的特征。例如,考虑
引入句法分析及更好的指代消解技术来处理复杂的
指代情况;
③ 考虑引入社交网络关系或者消息与消息之
间的关系来构建图模型提升结果。
参考文献
[1] M.Q. Hu, B. Liu. Mining and Summarizing
CustomerReviews[C]//ACM SIGKDD 2004:168-
177.
[2] BoPang,LillianLee.Opinion miningandsentiment
analysis[C]//FoundationsandTrendsinInformation
Retrieval,2(1-2):1-135.
[3] M.Q. Hu, B. Liu. Opinion Extraction and
Summarizationonthe Web[C]//AAAI06,Boston:
1621-1624.
[4] H.Yu,V. Hatzivassiloglou.Towards Answering
OpinionQuestion:SeparatingFactsfromOpinionsand
IdentifyingthePolarityofOpinionSentences[C]//
EMNLP03:129-136.
[5] Bo Pang,Lillian Lee,Shivakumar Vaithyanathan.
Thumbsup?sentimentclassification using machine
learningtechniques[C]//ACL02:79-86.
[6] Bo Pang, Lillian Lee. A sentimental education:
Sentimentanalysis using subjectivity summarization
basedonminimumcuts[C]//ACL04:271-278.
[7] E. Riloff,J. Wiebe.2003. Learning extraction
patternsforsubjectiveexpressions[C]//EMNLP03:105-
112.
[8] Glance,N.,M.Hurst,K.Nigam,etal.2005.
Derivingmarketingintelligencefromonlinediscussion
[C]//SIGKDD05:419-428.
[9] Wilson, T.,J. Wiebe, P. Hoffmann.2005.
Recognizing contextual polarity in phrase-level
sentimentanalysis[C]//HLT-EMNLP05:347-354.
[10] Luciano Barbosa, Junlan Feng. 2010. Robust
Sentiment Detection on Twitterfrom Biased and
NoisyData[C]//Coling2010(posterpaper):36-44.
[11] LongJiang,Mo Yu,Ming Zhou,etal.Target-
dependentTwitterSentimentClassification[C]//ACL
2011.
[12] Lun-WeiKu,Tung-Ho Wu,Li-Ying Lee,etal.
2005.Construction of an Evaluation Corpus for
OpinionExtraction[C]//In NTCIR-5Japan,2005:
513-520.
[13] S.Dasgupta,V.Ng.MinetheEasy,Classifythe
Hard:A Semi-Supervised Approachto Automatic
SentimentClassification[C]//ACL09:701-709.
[14] Fangtao Li, Nathan Liu, Hongwei Jin,et al.
IncorporatingReviewerandProductInformationfor
ReviewRatingPrediction[C]//IJCAI2011.
[15] V.Hatzivassiloglou,J.Wiebe.Effectsofadjective
orientationand gradabilityonsentencesubjectivity
[C]//COLING00:299-305.
[16] P.Turney.2002.Thumbs up orthumbs down
Semantic Orientate-on Applied to Unsupervised
Classificationofreviews[C]//ACL02:417-424.
[17] TetsuyaNasukawa,Jeonghee Yi.2003.Sentiment
Analysis: Capturing Favorability Using Natural
LanguageProcessing[C]//Proceedingsofthe2nd
InternationalConferenceonKnowledgeCapture:70-
77.
[18] Xiaowen Ding,Bing Liu.2007. The Utility of
LinguisticRulesinOpinionMining[C]//SIGIR-2007
(posterpaper),811-812.
[19] Minqing Hu,Bing Liu.Miningandsummarizing
customerreviews[C]//KDD-2004 (full paper),
Seattle,Washington,USA,Aug 22-25,pp.168-
177.
[20] Dmitry Davidiv, Oren Tsur, Ari Rappoport.
EnhancedSentimentLearning Using Twitter Hash-
tagsandSmileys[C]//Coling2010 (posterpaper),
pp.241-249.
[21] AlecGo,RichaBhayani,LeiHuang.2009.Twitter
Sentiment Classification using Distant Supervision
[R]. Technicalreport,Stanford Digital Library
281期 谢丽星等:基 于 层 次 结 构 的 多 策 略 中 文 微 博 情 感 分 析 和 特 征 抽 取
TechnologiesProject.
[22] RaviParikh, Matin Movassate.2009.Sentiment
Analysisof User-Generated Twitter Updatesusing
VariousClassificationTechniques[R].CS224NFinal
Report:1-18.
[23] ZhaoJun,LiuKang,WangGen.AddingRedundant
Features for CRFs-based Sentence Sentiment
Classification[C]//EMNLP2008:117-126.
[24] LanjunZhou,YunqingXia,BinyangLietal.WIA-
Opinmine System in NTCIR-8 MOAT Evaluation
[C]//NTCIR-8 WorkshopMeeting,2010.
[25] 李寿山,黄居仁.基于Stacking组 合 分 类 方 法 的 中 文
情感分类研究[J].中文信息学报,2010,24(5):56-
櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚櫚
61 .
《中文信息学报》征稿简则
一、《中文信息学报》主要刊登中文信息的基础理论、应用技术、中文信息处理系统及设备、中文信息的
自动输入和人工编码输入、汉字字形信息、自然语言处理、计  算 语 言 学 及 民 族 语言  文  字  信  息  处  理  及  网  上  信  息
处理等方面的研究论文、技术报告、综述、通讯、简报、国内外学术活动等。
二、来 稿 要 求 和 注 意 事 项
1.来稿内容力求正确,论点明确,文字简练,数据可靠,图表清晰,字数不超过8000字。
2.文章题目不超过20个字,须有200字中文摘要和英文摘要。英文文摘应符合英文语法,概括论文内
容,包括研究目的、方法、结果和结论。中英文摘要均应包括题目、作者姓名、单位名称、城市名、邮编、摘要、
关键词。写明中图分类号。
有基金项目支持的写明基金名称、编号。
给出前三作者信息,包括姓名,出生年,性别,学位或职称,主要研究方向。
3.文中图、表 放 在 文 稿 中 相 应位  置,并注明图号、图注。图中文字用六号宋体。
4.文中外文字母、符号要分清大小写、正斜体;上下角标的位置高低应区别明显;全文计量单位要一致,
或中文,或符号。
5.参考文献只列最主要的,必须是已公开发行的书刊才能列入,最少不得少于5条。文 献 按 文 中 出 现
先后次序编排,书写格式为:
专著:[序号]作者.题名[M].出版地:出版者,出版年 :起止页码.
期刊:[序号]作者(多作者用逗号分开,超过3个者用“,等”代替).文章题目[J].刊物名称,年代,卷数
(期数):起止页码.
论文集:[序号]作者.题名[C]//编者.论文集名.出版地:出版者,出版年:起止页码.
学位论文:[序号]作者.题名[D].保存地点:保存单位,年份.
报告:[序号]作者.题名[R].保存地点:保存单位,年份.
报纸文章:[序号]作者.题名[N].报纸名,出版日期(版次).
标准:[序号]制定单位.标准编号,标准名称[S].出版地:出版者,出版年.
专利:[序号]专利所有者.专利题名:专利国别,专利号[P],公开日期.
电子文献:主要责任者.电子文献题名[电子文献标识/载体类型].[发表或更新日期].电子文献的出处
或可获得地址.
电子文献标识:[DB]-数据库 [CP]-计算机程序 [EB]-电子公告
电子文献载体类型:[OL]-联机网络 [MT]--磁带 [DK]-磁盘 [CD]-光盘
6.来稿请勿一稿二投,文责自负。不录用稿件概不退还,请自留底稿。来稿一经发表,按规定付给稿
酬,并赠送单行本2册。
通信地址:北京8718信箱《中文信息学报》编辑部收,邮政编码100190,电话:010-62562916。
本刊接收电子投稿,请以附件方式,将 WORD 文档发送至:cips@iscas.ac.cn。请写明作者工作单位、
通信地址(邮政编码)、电话(手机)、E-mail。
38

farmer

You must log in to post a comment.