目录
4.1 经济/金融数据库
4.1.1 金融数据与数据库
4.1.2 国外金融数据库概况
4.1.3 国内金融数据库概况
4.1.4 数据的主要内容
4.2 数据格式
4.3 数据的导入
4.3.1 从控制台上输入数据
4.3.2 上市公司财务报表信息读取
4.4 [数据的预处理]
4.1.1 时序数据的预处理
4.1.2 截面数据的预处理[略]
4.1 经济/金融数据库
4.1.1 金融数据与数据库
R包:RBloomberg和IBrokers有偿
tseries和quantmod
美联储 www.stlouisfed.org,Yahoo财经finance.yahoo.com
4.1.2 国外金融数据库概况
美国彭博社(收费)
加拿大汤森路透 www.datastream.com
4.1.3 国内金融数据库概况
万得Wind www.wind.com.cn (实验室排队预约) 北京瑞思 www.resset.cn 深圳国泰安 www.gtarsc.com 巨潮 www.cninfo.com.cn 聚源 www.gildata.com 财汇 www.finchina.com
4.1.4 数据的主要内容
国泰安为例:公司财务报表(1990年来所有AB古上市公司的季报,半年报,年报)、股票(基本 资料和全部交易数据)、债券、基金(投资组合,净值,主要财务指标)
4.2 数据格式

4.3 数据的导入

4.3.1 从控制台上输入数据

4.3.2 上市公司财务报表信息读取
1. 运用剪贴板 read.delim('clipboard') 2. 转换格式,再调用 read.scv() 或者 read.txt() ( 或者 read.table() 读取txt文本文件) 3. 股票数据在线读取 补充:股票价格的信息:OHLC 一般“A股股票
4. 读取外部数据源
4.4 [数据的预处理]
4.1.1 时序数据的预处理
1. 数据合并:包 merge.xts() 2. 子集选择:
变量选取,直接用“变量名”,从数据框中选取;
样本选取,根据逻辑条件用 subset() 函数 3. 随机抽样: sample() 4. 数据补齐:缺失值可以用 na.approx() 补齐;时序数据可用 align() 函数 5. 频率转换:高频转低频 to.monthly() ;低频转高频(有数据失真风险) 6. 滚动窗操作

提取中国A股个股信息:只知道股票代码,不知道股票简称


非联网环境可以用xlsx读入,但此时的数据类型是dataframe





4.1.2 截面数据的预处理[略]
