不使用sklearn创建Kfold交叉验证集
创始人
2024-12-29 10:00:44
0

以下是一个不使用sklearn库创建K折交叉验证集的示例代码:

import numpy as np

def kfold_cross_validation(data, labels, k):
    # 将数据和标签合并为一个数组
    dataset = np.c_[data, labels]
    
    # 打乱数据集
    np.random.shuffle(dataset)
    
    # 计算每个折的大小
    fold_size = len(dataset) // k
    
    # 初始化交叉验证结果列表
    cv_results = []
    
    # 分割数据集为K折
    for i in range(k):
        fold_start = i * fold_size
        fold_end = (i + 1) * fold_size
        
        # 获取验证集
        validation_data = dataset[fold_start:fold_end, :-1]
        validation_labels = dataset[fold_start:fold_end, -1]
        
        # 获取训练集
        if i == 0:
            train_data = dataset[fold_end:, :-1]
            train_labels = dataset[fold_end:, -1]
        elif i == k - 1:
            train_data = dataset[:fold_start, :-1]
            train_labels = dataset[:fold_start, -1]
        else:
            train_data = np.concatenate((dataset[:fold_start, :-1], dataset[fold_end:, :-1]))
            train_labels = np.concatenate((dataset[:fold_start, -1], dataset[fold_end:, -1]))
        
        # 将训练集和验证集添加到交叉验证结果列表中
        cv_results.append((train_data, train_labels, validation_data, validation_labels))
        
    return cv_results

# 测试代码
data = np.array([[1, 2], [3, 4], [5, 6], [7, 8], [9, 10]])
labels = np.array([0, 1, 0, 1, 0])

k = 3
cv_results = kfold_cross_validation(data, labels, k)

for i, (train_data, train_labels, validation_data, validation_labels) in enumerate(cv_results):
    print(f"Fold {i+1}:")
    print("Training data:")
    print(train_data)
    print("Training labels:")
    print(train_labels)
    print("Validation data:")
    print(validation_data)
    print("Validation labels:")
    print(validation_labels)
    print("---------")

此代码中,kfold_cross_validation函数接受数据集和标签作为输入,以及所需的折数k。它首先将数据和标签合并为一个数组,并打乱数据集。然后,它根据每个折的大小将数据集分割为K个折。在每个折中,它将验证集作为当前折的数据和标签,并从其余数据中获取训练集。最后,它将训练集和验证集添加到交叉验证结果列表中,并返回该列表。

在测试代码中,我们创建了一个简单的数据集和标签,并将其传递给kfold_cross_validation函数以进行3折交叉验证。然后,我们遍历交叉验证结果列表,并打印每个折的训练集和验证集。

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...