不同长度元组列表的相似性计算 _编程开发

不同长度元组列表的相似性计算

创始人

2025-01-10 00:31:31

0次

可以使用余弦相似度来计算不同长度元组列表之间的相似性。余弦相似度可以度量向量之间的相似度，因此可以将元组列表转换为向量进行计算。

下面给出一个简单的示例代码，其中两个元组列表被转换为向量后计算它们之间的余弦相似度：

import numpy as np

def cosine_similarity(list1, list2):
    vec1 = [elem[1] for elem in list1]
    vec2 = [elem[1] for elem in list2]

    # Pad zero if the lists have different lengths
    max_len = max(len(vec1), len(vec2))
    vec1 = np.pad(vec1, (0, max_len - len(vec1)), 'constant')
    vec2 = np.pad(vec2, (0, max_len - len(vec2)), 'constant')

    # Compute cosine similarity
    numerator = np.dot(vec1, vec2)
    denominator = np.linalg.norm(vec1) * np.linalg.norm(vec2)
    return numerator / denominator

# Example usage
a = [('a', 1), ('b', 2), ('c', 3)]
b = [('a', 1), ('b', 2), ('d', 4), ('e', 5)]

similarity = cosine_similarity(a, b)
print(similarity)

在上面的示例代码中，cosine_similarity 函数接受两个不同长度的元组列表 list1 和 list2，并返回它们之间的相似度。首先，我们从每个元组中提取第二个元素，将元组列表转换为向量。如果它们的长度不同，我们使用 np.pad 函数填充 0，使它们的长度相等。接下来，我们使用 numpy 库的 np.dot 和 np.linalg.norm 函数计算向量之间的点积和范数，最后将两个

上一篇：不同长度数组的公共子序列

下一篇：不同帐户的ViewController登录页面无法正常工作

不同长度元组列表的相似性计算

相关内容

热门资讯