所有文章¶

2024 年 1 月 1 日
PyTorch
阅读时间 1 分钟

PyTorch 中的数据与模型迁移：理解 `.to(device)` 的使用

在使用 PyTorch 框架进行深度学习模型训练时，我们经常需要将模型从 CPU 迁移到 GPU 上以加速计算。PyTorch 提供了一个简洁的 API model.to(device) 来实现这一过程。但是，在使用这个 API 时，我们可能会遇到两种不同的写法：model.to(device) 和 model = model.to(device)。那么，这两种写法有什么区别呢？

2023 年 12 月 14 日
Python
阅读时间 1 分钟

Python 中的 set 和 list 转换时的随机性

在 Python 中，set 和 list 是两种不同的数据结构，它们在使用和功能上有很大的不同。set 是一个无序的、不重复的元素集合，而 list 是一个有序的、可重复的元素集合。

然而，从 set 到 list 的过程并不是一个简单的转换，因为 set 本身就是无序的，所以从 set 到 list 的过程并没有固定的顺序。这意味着每次转换得到的 list 的元素顺序可能都会不同。

在一些项目中，我们希望结果可重现，因此需要确保每一步的结果都没有随机性。许多随机性可以通过随机种子来控制，但从 set 到 list 的过程并不会被随机种子控制住，因此仍然存在随机性。

本文探讨了从 set 到 list 的过程中的随机性，亦作为排查随机性来源的一次记录。

2023 年 12 月 12 日
Python
阅读时间 1 分钟

批量修改 Jupyter Notebook 的内容

有时需要批量替换许多 Jupyter Notebook 的内容，由于 Jupyter Notebook 并不是简单的文本文件，在读取和替换时并不像批量修改 Python 脚本那样方便。

本文介绍了使用 nbformat 批量修改 Jupyter Notebook 的内容的方法。

20231207155702

2023 年 11 月 22 日
Python
阅读时间 2 分钟

Python `argparse` 解析命令行参数为布尔值

在 Python 开发中，命令行参数解析是一个常见的需求，它允许我们以命令行的方式向程序传递参数，从而实现更灵活和可配置的程序设计。Python 提供了一个内置库 argparse，它简化了命令行参数解析的过程。

这篇帖子介绍过如何使用 argparse 解析命令行参数，本文将介绍如何指定命令行参数为布尔值类型。直接使用 type=bool 是无法实现的，而需要传入一个 callable 的对象，在其中编写将字符串转换为布尔值的逻辑。

2023 年 11 月 13 日
Python
阅读时间 3 分钟

chat-data: 基于大语言模型的数据分析应用

在数据分析领域，Pandas 是最受欢迎的 Python 库之一。然而，许多数据分析任务可以利用人工智能模型进行自动化。PandasAI 库为流行的数据分析和处理工具 Pandas 添加了生成式人工智能功能，你可以与 DataFrame 进行对话，并得到想要的数据分析结果。

本文使用 Streamlit 构建了一个在线应用，用户可以上传 Excel/CSV 数据，在输入想要执行的数据分析任务后，便可得到图表等结果，以及生成该结果的相应代码。

chat-data

2023 年 11 月 7 日
Python
阅读时间 2 分钟

Jupyter Notebook 恢复历史执行信息与存储执行结果

获取历史执行信息

问题

假如我们已经在 Jupyter 中编写了一些代码，但在计算后发现忘记将结果赋值了。一般在这种情况下，我们会再次执行该单元并生成结果完成赋值。

那么如何不重新运行而直接使用结果呢？

解决方法

2023 年 11 月 1 日
Python, LLM
阅读时间 2 分钟

在 Python 中调用在线大模型 API

许多大模型都提供了在线 API 接口服务，我们可以在 Python 中调用它们。本文使用 openai、chatllm、dashscope 等包实现了对 OpenAI、讯飞星火、智谱 AI、百度、阿里通义千问的调用。用户只需在本地用 .env 文件存储 API Key 即可快速调用这些大模型。

2023 年 10 月 31 日
Computer Science
阅读时间 2 分钟

在 MacOS 中安装 tree 命令

本文记录了在 MacOS 中安装 tree 命令的过程，主要涉及了在终端中临时使用代理的方法。

2023 年 10 月 30 日
Python, 统计, 量化研究
阅读时间 3 分钟

计算部分相关系数矩阵

本文使用相关系数的矩阵表达形式，实现了计算部分相关系数矩阵的加速算法，并实证检验了三种计算相关系数矩阵方法的运行速度。

在计算部分相关系数矩阵时，自定义的加速算法相比 Pandas .corr() 方法提速约 2180 倍，比 Numpy .corrcoef() 方法提速约 115 倍。
在计算全部相关系数矩阵时，Numpy .corrcoef() 方法比自定义的加速算法略快 \(10\%\)，比 Pandas .corr() 方法快约 20 倍。

2023 年 10 月 15 日
Python
阅读时间 1 分钟

Python 3.12 新特性：`@override` 装饰器

Python 3.12 引入了 @override 装饰器，可以用来指定该方法是用来覆盖基类方法的。

新特性简介

在继承基类后，如果我们想覆盖基类中的某个方法 original()，我们可以改写该方法。然而，如果我们不小心将方法名拼写错误为 ooooriginal()，即一个基类中不存在的方法，那么当调用子类的 original() 方法时，实际上会调用基类中的方法，而且程序不会产生错误。这种情况下，我们可能无法察觉到问题的存在。

为了解决这个问题，我们可以使用 @override 注解来明确表示方法的覆盖关系。这样程序会检查 ooooriginal() 方法是否在基类中存在。由于 ooooriginal() 方法并未在基类中定义，程序会报错，从而帮助我们发现错误。

简而言之，使用 @override 注解可以帮助我们检测覆盖方法是否正确，避免潜在的错误。