基于逐笔委托和逐笔成交数据构造高频因子
量化投资策略设计与分析的第一次作业是基于逐笔数据构造 39 个高频因子。我对高频因子的构造经验比较少,完成这个作业后的一些经验:
- 高频因子的数据格式是比较标准化的,但也要注意细节:例如空缺时间的填补等。
- 构造因子的过程本质上是数据处理的过程,常用的方法有:
groupby
、resample
、to_datetime
、reindex
、rolling
、apply
等。如果是非常大的数据集,应当用numpy
等更快速的科学计算包,或者用C++
。
39 个因子表达式
用提供的某支证券为期不超过一周的高频数据复制 Table A2 中 39 种指标。