学堂 学堂 学堂公众号手机端

spaCy中怎么进行文本相似度计算

lewis 4年前 (2021-12-28) 阅读数 4 #技术

在spaCy中,可以使用similarity方法来计算两个文本之间的相似度。首先,需要将文本转换成spaCy的Doc对象,然后使用similarity方法来计算相似度。示例如下:

import spacy

# 加载spaCy模型
nlp = spacy.load("en_core_web_lg")

# 将文本转换成Doc对象
doc1 = nlp("apple")
doc2 = nlp("banana")

# 计算文本相似度
similarity = doc1.similarity(doc2)
print(similarity)

在上面的示例中,我们通过加载spaCy的en_core_web_lg模型创建了一个spaCy的Doc对象,并计算了两个文本"apple"和"banana"之间的相似度。similarity方法返回一个0到1之间的值,表示两个文本之间的相似程度,值越接近1表示相似度越高。


版权声明

本文仅代表作者观点,不代表博信信息网立场。

热门