不使用sklearn创建Kfold交叉验证集
创始人
2024-12-29 10:00:44
0

以下是一个不使用sklearn库创建K折交叉验证集的示例代码:

import numpy as np

def kfold_cross_validation(data, labels, k):
    # 将数据和标签合并为一个数组
    dataset = np.c_[data, labels]
    
    # 打乱数据集
    np.random.shuffle(dataset)
    
    # 计算每个折的大小
    fold_size = len(dataset) // k
    
    # 初始化交叉验证结果列表
    cv_results = []
    
    # 分割数据集为K折
    for i in range(k):
        fold_start = i * fold_size
        fold_end = (i + 1) * fold_size
        
        # 获取验证集
        validation_data = dataset[fold_start:fold_end, :-1]
        validation_labels = dataset[fold_start:fold_end, -1]
        
        # 获取训练集
        if i == 0:
            train_data = dataset[fold_end:, :-1]
            train_labels = dataset[fold_end:, -1]
        elif i == k - 1:
            train_data = dataset[:fold_start, :-1]
            train_labels = dataset[:fold_start, -1]
        else:
            train_data = np.concatenate((dataset[:fold_start, :-1], dataset[fold_end:, :-1]))
            train_labels = np.concatenate((dataset[:fold_start, -1], dataset[fold_end:, -1]))
        
        # 将训练集和验证集添加到交叉验证结果列表中
        cv_results.append((train_data, train_labels, validation_data, validation_labels))
        
    return cv_results

# 测试代码
data = np.array([[1, 2], [3, 4], [5, 6], [7, 8], [9, 10]])
labels = np.array([0, 1, 0, 1, 0])

k = 3
cv_results = kfold_cross_validation(data, labels, k)

for i, (train_data, train_labels, validation_data, validation_labels) in enumerate(cv_results):
    print(f"Fold {i+1}:")
    print("Training data:")
    print(train_data)
    print("Training labels:")
    print(train_labels)
    print("Validation data:")
    print(validation_data)
    print("Validation labels:")
    print(validation_labels)
    print("---------")

此代码中,kfold_cross_validation函数接受数据集和标签作为输入,以及所需的折数k。它首先将数据和标签合并为一个数组,并打乱数据集。然后,它根据每个折的大小将数据集分割为K个折。在每个折中,它将验证集作为当前折的数据和标签,并从其余数据中获取训练集。最后,它将训练集和验证集添加到交叉验证结果列表中,并返回该列表。

在测试代码中,我们创建了一个简单的数据集和标签,并将其传递给kfold_cross_validation函数以进行3折交叉验证。然后,我们遍历交叉验证结果列表,并打印每个折的训练集和验证集。

相关内容

热门资讯

AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
AWR报告解读 WORKLOAD REPOSITORY PDB report (PDB snapshots) AW...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
Azure构建流程(Power... 这可能是由于配置错误导致的问题。请检查构建流程任务中的“发布构建制品”步骤,确保正确配置了“Arti...
群晖外网访问终极解决方法:IP... 写在前面的话 受够了群晖的quickconnet的小水管了,急需一个新的解决方法&#x...
AWSECS:哪种网络模式具有... 使用AWS ECS中的awsvpc网络模式来获得最佳性能。awsvpc网络模式允许ECS任务直接在V...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...