跳转至

所有文章

舆情因子和 BERT 情感分类模型

本文总结了研报 舆情因子和 BERT 情感分类模型 - 华泰证券 的主要内容。

思路与框架

  1. 基于 Wind 金融新闻数据,提取其中的情感正负面标签,构建日频的新闻舆情因子。
  2. 使用回归法、IC 值分析法和分层测试法,检验新闻舆情因子。
  3. 基于已有情感标注的 Wind 金融新闻数据,测试 BERT 模型在金融情感分类任务的表现。

使用 pdb 调试代码

pdb 是 Python 内置的一个调试库,为 Python 程序提供了一种交互的源代码调试功能,主要特性包括设置断点、单步调试、进入函数调试、查看当前代码、查看栈片段、动态改变变量的值等。

常用的 pdb 命令

image-20230208010600684

Python 自动合并 PDF 文件

问题与需求

合并 PDF 文件是常用的操作,如果手动合并的话可以使用 Adobe Acrobat 这类专业软件,只要点点鼠标即可完成合并。

如果经常需要合并同样的文件(例如经常更新的中英文简历),可以使用 PyPDF2 包,几行代码即可实现自动合并 PDF 的功能。

代码实现

Python 中的赋值与深浅拷贝

Python 中的赋值只是引用了对象,当原变量发生改变时,新变量也会随之发生改变。

.copy()方法可以进行浅拷贝,它可以深拷贝父对象(一级目录),但子对象(二级目录)仍然只是引用。

.deepcopy()方法可以进行深拷贝,它可以深拷贝父对象(一级目录)和子对象(二级目录),当原变量改变时,深拷贝得到的变量不会发生任何改变。

Black 格式化 Python 代码

用 Black 自动格式化 Python 代码,编写规范、美观的 Python 代码,让阅读代码变成一种享受。

本文记录了在 VS Code 中安装 Black 时遇到的问题和解决方案。

python-formatter-black

\(\LaTeX\) 笔记

\(\LaTeX\)使用笔记及格式约定。

转载自:

Text Only
作者:zxl19
原文链接:https://zxl19.github.io