如何使用情感分析?

快速开始

Stratifyd 情感值

Stratifyd 会基于文本内容自动生成情感(Sentiment)打分。多元词组情感值的上下边界默认为 -5(负面)到 +5(积极)。

sentiment0

Stratifyd 支持用户自定义上传和业务领域以及分析目的更相关的自定义情感使用,并不必依赖Stratifyd 人工智能生成的情感库。


为什么要使用不同的情感库?

虽然 Stratifyd 本身的情感库已经足够强大,但对于某些特定的分析场景可能并不完全适用。您可以定义并使用特定领域的情感库,从而获得更精确的情感分析结果。

• 某些特定行业含有专业术语,需要定制情感值:比如,对于企业、行业和金融市场的分析中,股票买卖的信号就需要对特殊词汇赋予不同的情感值。

• 某些词汇在不同语境下可能会有相反的情感,因此需要赋予不同情感值进行测验:比如,不确定的 vs. 限定的,强模式 vs. 弱模式,复杂性 vs. 简单性等。

• 对同一数据集可以应用多个情感库。


自定义情感列表

情感库由被赋予不同情感值的字或词汇组成。需要注意,情感值的正负不是绝对的,像“不确定的”和“限定的”这种意义相反的词在不同语境下情感值的正负是不确定的,需要根据语境进行判断。

sentiment2

  • 情感赋值可以是从-5至+5的任意整数,但我们推荐按照均衡的方式进行设定

  • 不同词汇的情感强烈度是需要测试和调节的:

    • 比如,在金融市场的垂直领域里,“牛市”蕴含着非常积极的情感,我们可以打 “+5” 分,同理“熊市”可以打 “-5” 分

    • 但在同一上下文中,“向上趋势”虽然也是正向情感,但程度可能没有 “牛市” 那么强烈,因此我们酌情可以打 “+3”

  • 情感库可以按照“关键词,分值,任务备注”的规则,以“逗号分隔”方式在 .txt 或 .csv 文件中呈现

  • “任务备注” 是情感库的一个可选内容

    “任务备注” 可以帮助您在审核情感库的准确性和有效性时提供帮助,让您了解当初设定时的一些考虑因素。


情感库的版本控制

Stratifyd 对于情感库也提供版本控制功能:

  • 第一次导入或生成的情感库将被记录为“版本 1”

  • 之后的任何操作比如增减或修改情感值都会记录为“版本 2”

  • 如此下去,每次改变都会记录为下一版本

  • 所有版本都会记录在案方便您对过往版本进行查看

sentiment3

该功能可以帮助您检查情感库变化带来的影响。


导入自定义情感库

  1. 切换到主页面的“高级选项”下

sentiment4

  1. 点击情感模块。在新界面中,您可以创建新的情感库,或对之前创建的情感库进行查看和修改。同时您也可以将情感库分享给指定成员或群组

  2. 点击屏幕右下角的蓝色 “+” 按钮,弹出新创建情感库的对话框

  3. 对新的情感库进行命名

  4. 可以选择上传“逗号分隔”文件,或者点击对话框中的“添加”在下方出现的区域编辑“关键词,分值,任务备注”

sentiment5

  1. 上传或编辑完后,您可以看到全部的情感列表内容

  2. 您也可以对“否定词”进行设定

  3. 用逗号分隔开否定词

sentiment6

  1. 点击“保存”保存您创建的情感库

如何将您自定义的情感库应用到数据分析中

  1. 当通过数据管理器导入或重新处理数据集时,您可以点击高级选项展开内容列表

sentiment7

  1. 选择第三个高级选项——“情感”

sentiment8

  1. 选择需要用到的情感库和版本号

sentiment9

  1. 点击“应用”,这样 Stratifyd 将在分析过程中使用您制定的情感库

您可以通过点击数据管理器的数据集查看所应用的数据库。

每一次使用新的情感库都需要系统“重新处理”数据,可以通过多次打开dashboard进行横向对比。