2022亚太杯C题思路代码分析
创始人
2024-04-12 01:55:25
0

C题就是数学比较开放的题目了,属于一个数据分析类题目,跟前两年的华为杯差不多,考察的也是全球变暖问题。更多内容文末名片查看

问题1.你同意有关全球气温的说法吗?使用2022_APMCM_C_Data。附件中的csv和其他您的团队收集的数据集,以分析全球温度变化。

a)你同意2022年3月全球气温的上升导致了比过去10年期间更大的上升吗?为什么或为什么不呢?

b)根据历史数据,请建立两个或两个以上的数学模型来描述过去,并预测未来的

全球温度水平。

c)使用1个(b)中的每个模型来分别预测2050年和2100年的全球气温。你们的模型是否同意2050年或2100年全球观测点的平均温度将达到20.00°C的预测?如果不是在2050年或2100年,那么您的预测模型中的观测点的平均温度何时会达到20.00°C?

d)你认为1(b)的模型最准确?为什么

然后第一问主要是一个数据的预处理和预测类问题,首先是数据的预处理,对于给出的温度数据均经过严格的质量控制和均一性检验,对个别缺失数据采用相邻站点线性回归方法进行插补,保证经过处理修正后的气象数据具有很好的连续性,然后可以基RClimDex软件对数据异常值与错误值进行过滤筛选(也可以直接筛除),以满足分析要求。

上面的公式为均一性检验

根据给出的数据,我们进行一个数据可视化处理,这里着重讲一下,亚太杯、包括美赛其实是很看重你的数据可视化能力的,图画的好不好,最终能够很大程度影响到你的成绩,这里推荐大家使用可视化工具tableau,比较简单好用,或者用python也可以,主要问题a就是通过对比来进行一个分析。

类似于上面的折线图就可以比较清晰的反映平均温度的变化

然后b是一个预测问题的话,推荐使用ARMA,比较适用,其他的像线性回归、灰色预测等等也可以用到。也可以使用LSTM模型来分析,这里我们用LSTM来求解一下,流程图如下:

 

 

LSTM 的气候变化时空数据关键信息提取及趋势分析模型求解过程如下:

Step1:原始数据输入

输入给出的各个国家温度时间数据图

Step2:数据集化

将原始数据进行输入时空数据集化作为程序自变量的输入:

T[ ( u , v )

Step3:M-K 非参数统计

输出趋势检验指标如下:

 输出突变趋势检验检验如下:

Step4:数据集输入 LSTM 气候时空趋势变化模型:

时空趋势模型通过 Python/matlab 进行程序实现,并且将 Step2 中的数据集输入程序。

部分 LSTM 机器学习代码

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import torch 
from torch import nn 
from torch. aut ograd import Variable 
#LSTM(长短期记忆网络) 
data_csv = pd.read_csv 
#pandas.read_csv读取时空序列数据 
plt.plot(dat a_csv) 
plt.show() 
#数据预处理 
data_ csv = dat a csv. dropna() 
dat aset = dat_csv. values 
dataset = dat aset.astype ('float32') 
max_value = np. max (dataset) 
min value = np. min(dat aset) 
scalar = max_value-min_value 
dataset = list (map(
lambda x∶ x/scalar,dataset))#将数据标准化到0~1之间 
def create_dataset(
dataset,look_back=2)∶#look back 以前的时间步数用作输入变量来预测下—个时间段 
datak,dat aY=[ ],[ ] 
for i in range(len(dat aset)- look_back): 
a = dataset [i∶(
i+look_back] #i和i+1赋值 
dat alX. append(a) 
dataY.append(
dataset [i+look back]) #i+2赋值 
return np.array(
dataX),np.array(
datal) #np.array构建数组 
data X,data_Y = create_dataset (dataset) 
#data_Y: 1*142 data X: 2*142 
#划分训练集和测试集,70%作为训练集 
train_size = int (len(data_X)* 0.7) 
test_size = len(data_X)-train_size 
train_X = data_X[:train_size] 
train_Y = data_Y[:train_size] 
rrain_X =data_X[train_size:] 
train_Y = data_Y[train_size:] 
train_X = train_X.reshape(-1,1,2) 
#reshape中,-1使元素变为一行,然后输出为1列,每列2个子元素 
train_Y=train_Y.reshape(-1,1,1)#输出为1列,每列1个子元素 
Train_X=test_X.reshape(-1,1,2)

 更多思路↓

相关内容

热门资讯

银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
月入8000+的steam搬砖... 大家好,我是阿阳 今天要给大家介绍的是 steam 游戏搬砖项目,目前...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...