调试 MapReduce
MapReduce 在 Hadoop 上运行时可能会报错,但报错信息并不会告诉我们哪里出错了。我们可以在本地调试 Map 或 Reduce 的 Python 文件,帮助找到报错的原因。
MapReduce 在 Hadoop 上运行时可能会报错,但报错信息并不会告诉我们哪里出错了。我们可以在本地调试 Map 或 Reduce 的 Python 文件,帮助找到报错的原因。
使用 MapReduce 进行分布式计算的工作流程,包括输入输出文件路径、map 和 reduce 文件、执行文件 run.sh 的编写以及查看输出文件。
在部署项目时,可能需要生成 requirement.txt 文件,用于指定对某些包的依赖。Python 的pipreqs
库可以方便地一键生成 requirement.txt 文件。
多因子模型可以用时间序列回归、截面回归和 Fama-Macbeth 回归进行检验。它们的适用情景不同,所得到的结果也需要不同的解读。
多因子模型反映的是资产的预期收益率和因子暴露在截面上的关系。它回答了这样的问题:在同一时刻,为什么有的资产收益率高,有的资产收益率低?
多因子模型认为,每个因子有一个预期收益率,资产在某个因子上的暴露让该资产可以获得相应的预期收益。不同资产在各个因子上的暴露程度不同,导致了不同资产有着不同的预期收益。
如果有一个多因子模型,它能很好地解释资产收益横截面差异,那么我们只需关心:
下面梳理可以对多因子模型进行检验的三种方法。