Hugging Face Transformers：理解和应用

作者：菠萝爱吃肉2023.10.07 08:29浏览量：9

简介：Huggingface Transformers：镜像使用、本地使用与tokenizer参数介绍

千帆应用开发平台“智能体Pro”全新上线限时免费体验

面向慢思考场景，支持低代码配置的方式创建“智能体Pro”应用

Huggingface Transformers：镜像使用、本地使用与tokenizer参数介绍
Huggingface Transformers 是一个为自然语言处理（NLP）任务提供预训练模型和工具的开源库。它支持使用不同的镜像和本地环境进行快速部署和使用。本文将重点介绍Huggingface Transformers的镜像使用、本地使用以及tokenizer参数。
一、Huggingface Transformers镜像使用
Huggingface Transformers 的镜像是一种预编译的容器，包含了所需的库和环境，使得用户可以在不本地安装Python和相关库的情况下使用预训练模型。Huggingface提供了多种镜像，包括CPU和GPU版本，以及针对不同NLP任务和框架的镜像。
要使用Huggingface Transformers的镜像，首先需要在Docker中安装Huggingface的官方镜像。以下是使用CPU版本的Huggingface Transformers镜像的示例命令：

docker pull huggingface/transformers

安装完镜像后，可以使用以下命令启动一个交互式的Python环境：

docker run -it --rm huggingface/transformers bash

在启动的Docker容器中，可以通过Python解释器或直接执行脚本的方式使用Transformers库。
二、Huggingface Transformers本地使用
除了使用镜像，用户也可以在本地环境中直接安装Huggingface Transformers。首先需要确保已经安装了Python和pip，然后可以通过pip安装Transformers库：

pip install transformers

安装完成后，就可以在Python脚本或交互式环境中导入Transformers库并使用预训练模型。以下是使用本地安装的Transformers库的示例代码：

import transformers
# 加载预训练模型
model = transformers.AutoModel.from_pretrained('bert-base-uncased')
# 使用模型进行文本分类
inputs = "This is an example sentence."
outputs = model(inputs)
# 获取分类结果
last_hidden_states = outputs.last_hidden_state

在本地环境中使用Transformers库时，可以方便地进行模型训练、微调等操作，同时也可以根据具体需求进行自定义和扩展。
三、Tokenizer参数介绍
Tokenizer是Huggingface Transformers中的重要组件，用于将文本转化为模型能够理解的格式。在使用Transformers时，可以根据不同的任务选择合适的tokenizer。下面介绍一些常用的Tokenizer参数：

from_pretrained：从预训练模型中加载tokenizer。该参数可以省略，但省略后需要手动构造tokenizer对象。
model_max_length：模型的最大输入长度。默认值为514。超过该长度会导致截断。该参数通常在处理长文本时使用。
padding：是否在序列中填充0以使长度相等。默认为False。该参数通常在处理长度不等的序列时使用。
truncation：是否截断长序列以使长度不超过model_max_length。默认为False。该参数通常在处理长文本时使用。

发表评论

开发者关注产品榜

最热文章

关于作者

菠萝爱吃肉

941644被阅读数
25被赞数
18被收藏数

开发者热搜

Hugging Face Transformers：理解和应用

千帆应用开发平台“智能体Pro”全新上线限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

菠萝爱吃肉

Hugging Face Transformers：理解和应用

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

菠萝爱吃肉

千帆应用开发平台“智能体Pro”全新上线限时免费体验