当前位置 博文首页 > 简单随风的博客:实体消歧简介

    简单随风的博客:实体消歧简介

    作者:[db:作者] 时间:2021-09-11 16:56

    定义:

    实体消歧的本质在于一个单词很可能有多个意思,也就是在不同的上下文中所表达的含义可能不太一样。

    简单实现

    首先我们需要准备一个类似于下面的这种实体库:

    id实体名实体描述
    1001苹果美国一家高科技公司,经典的产品有Iphone手机
    1002苹果水果的一种,一般产自于…

    然后当我们拿到Text时,比如“今天苹果发布了新的手机”
    我们可以将实体库中的实体描述,全部转换为向量,例如:
    “美国一家高科技公司,经典的产品有Iphone手机”转换为向量V1
    “水果的一种,一般产自于…”转换为向量V2

    然后将“今天苹果发布了新的手机”中“苹果”的上下文“今天,发布了新的手机”转换为向量Vt
    我们只要将Vt分别与V1和V2计算相似度,然后对比sim(Vt,V1)和sim(Vt,v2)
    相似度高的,我们则将其看作“苹果”的真实语义。

    cs