从 Hugging Face 下载模型文件¶

本文记录了如何用代码从 Hugging Face 下载模型文件。

复制模型名称¶

以 Hello-SimpleAI/chatgpt-detector-roberta-chinese 为例，找到复制的图标，将模型名称复制下来。

使用 `huggingface_hub` 库下载模型文件¶

Python

from huggingface_hub import snapshot_download

snapshot_download(
    repo_id="Hello-SimpleAI/chatgpt-detector-roberta-chinese",
    local_dir="model",
)

local_dir 指定了下载后的模型应该存放的位置。我设定为"model"，它将在相对路径下新建一个model文件夹，将所有模型文件存放到model文件夹中。

设置是否使用快捷方式指向缓存中的大型文件¶

huggingface_hub首先会将下载到的文件存放在缓存目录/Users/jeremy/.cache/huggingface/hub/models--Hello-SimpleAI--chatgpt-detector-roberta-chinese/blobs中。

对于小型文件，会拷贝一份到之前指定的model文件夹。但对于大型文件，默认是用快捷方式的形式存放到model文件夹中。这样做的好处是，下次再下载模型文件时，若检测到缓存中已经存在文件，就不用再下载一遍了。

若不想以快捷方式的形式存储大型文件，而是直接以原文件的形式存储，可以设置 local_dir_use_symlinks=False。参考：官方文档。

下载数据集¶

设置 repo_type="dataset"：