舆情因子和 BERT 情感分类模型
本文总结了研报 舆情因子和 BERT 情感分类模型 - 华泰证券 的主要内容。
思路与框架
- 基于 Wind 金融新闻数据,提取其中的情感正负面标签,构建日频的新闻舆情因子。
- 使用回归法、IC 值分析法和分层测试法,检验新闻舆情因子。
- 基于已有情感标注的 Wind 金融新闻数据,测试 BERT 模型在金融情感分类任务的表现。
本文总结了研报 舆情因子和 BERT 情感分类模型 - 华泰证券 的主要内容。
pdb
调试代码pdb
是 Python 内置的一个调试库,为 Python 程序提供了一种交互的源代码调试功能,主要特性包括设置断点、单步调试、进入函数调试、查看当前代码、查看栈片段、动态改变变量的值等。
pdb
命令合并 PDF 文件是常用的操作,如果手动合并的话可以使用 Adobe Acrobat 这类专业软件,只要点点鼠标即可完成合并。
如果经常需要合并同样的文件(例如经常更新的中英文简历),可以使用 PyPDF2 包,几行代码即可实现自动合并 PDF 的功能。
Python 中的赋值只是引用了对象,当原变量发生改变时,新变量也会随之发生改变。
.copy()
方法可以进行浅拷贝,它可以深拷贝父对象(一级目录),但子对象(二级目录)仍然只是引用。
.deepcopy()
方法可以进行深拷贝,它可以深拷贝父对象(一级目录)和子对象(二级目录),当原变量改变时,深拷贝得到的变量不会发生任何改变。
用 Black 自动格式化 Python 代码,编写规范、美观的 Python 代码,让阅读代码变成一种享受。
本文记录了在 VS Code 中安装 Black 时遇到的问题和解决方案。