所有文章¶

2024 年 4 月 1 日
Computer Science
阅读时间 3 分钟

使用 Makefile 简化工作流

本文转载了阮一峰的 Make 命令教程。

使用 Makefile，我们可以将复杂的命令、脚本打包成一条命令，从而简化工作流程。

2024 年 3 月 26 日
Python
阅读时间 2 分钟

Python 类型检查工具 `beartype`

Python 代码中的类型提示并不是需要强制满足的。如果我们希望代码使用者严格遵循类型提示，在类型不符时抛出错误，可以使用 beartype 进行类型检查。

静态类型检查推荐使用 pyright

beartype 的功能是：当你真正调用函数时，才进行参数和返回值的类型检查。若我们不想真正运行代码，而只希望进行静态类型检查，可以使用 pyright。

2024 年 3 月 25 日
Python
阅读时间 1 分钟

多线程下调试 Python 代码

当启用 n_jobs 超过 1 时，直接调试 Python 代码可能会报错 "Couldn't find a debug adapter descriptor for debug type 'Python Kernel Debug Adapter' (extension might have failed to activate)"。

本文记录了一个解决方案，可以在 n_jobs 超过 1 的多线程环境下调试 Python 代码。

2024 年 3 月 23 日
Python
阅读时间 2 分钟

使用 `blacken-docs` 对文档中的 Python 代码进行格式化

ruff 等代码格式化工具可以美化 Python 代码，但是不方便美化文档文本中的 Python 代码。如果想要格式化 markdown、字符串文档等中间的 Python 代码，经常需要手动地去统一格式。

本文介绍了 blacken-docs 这款工具，它可以轻松实现对文档中的 Python 代码进行格式化。

2024 年 3 月 18 日
Computer Science
阅读时间 2 分钟

使用 pre-commit 为 Git 仓库设置自动任务

pre-commit 可以在提交代码前自动完成代码格式化、commit message 格式校验等任务。在联网环境下，直接填写 GitHub 中的 pre-commit hook 配置即可。此外，本文还介绍了如何在离线环境下配置 pre-commit。

2024 年 2 月 24 日
LaTeX
阅读时间 4 分钟

$\LaTeX$ 可跨页的算法环境

本文记录了一个在 $\LaTeX$ 中生成可跨页的算法环境的代码。

效果

$image-20240224103632469$

2024 年 2 月 23 日
深度学习, PyTorch, Python
阅读时间 2 分钟

将微调后的模型发布至 Hugging Face

发布微调后的 BERT 模型到 Hugging Face 模型库是一个很好的方式，可以让社区成员共享和使用你的工作。本文介绍了如何准备和发布你的模型到 Hugging Face。

2024 年 2 月 22 日
深度学习, PyTorch, LLM
阅读时间 1 分钟

机器生成文本检测器

简介

本应用使用 BERT 模型和 SHAP 解释性分析技术，旨在帮助用户判断一个文本是否可能由机器生成。应用允许用户输入文本，然后使用预先训练好的 BERT 模型进行分析，最后通过 SHAP 提供文本的可解释性分析，帮助理解模型的预测结果。

在线体验地址：https://machine-generated-text-detection.streamlit.app

screenshot

2024 年 2 月 6 日
LaTeX
阅读时间 1 分钟

$\LaTeX$ 抑制缺失中文字体的警告

本文记录了如何抑制由于缺失中文字体导致的宏包警告。

$image-20240206094050536$

2024 年 1 月 31 日
Python
阅读时间 1 分钟

使用 `pathvalidate` 处理不合法的文件或路径名字符串

在编程时经常需要处理文件和目录的命名，然而直接将字符串用作文件名或路径名时，可能会遇到一个常见问题：字符串中含有特殊字符或保留字，这可能导致在尝试保存文件时出现异常，如无法创建文件、路径解析错误等问题。例如，Windows 系统不允许文件名包含字符如 \、/、:、*、?、"、<、> 和 |。

本文介绍了 pathvalidate 库，它提供了一系列实用的函数，用于验证和清理文件名和路径名中的非法字符。这样我们就不必重复造轮子来处理这些特殊字符了。