找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2|回复: 0

随着龙虾OpenClaw这几天的爆火,token也成了高频词。

[复制链接]

7

主题

0

回帖

21

积分

新手上路

积分
21
发表于 4 小时前 来自手机 | 显示全部楼层 |阅读模式
随着龙虾OpenClaw这几天的爆火,token也成了高频词。“养龙虾”并不是免费的,OpenClaw需要接入大模型,平时各种操作都要消耗token

最近网上还有一个很好笑的梗:用自己的脑子思考不会消耗token

那么token究竟是什么?我在OpenAI的官网上看到了一个比较容易理解的解释:

Tokens are the building blocks of text that OpenAI models process. They can be as short as a single character or as long as a full word, depending on the language and context.

简单来讲,token就是大语言模型处理文本的最小单位。我们可以把大语言模型想象成一个正在阅读的人。但这个人不是逐字阅读,而是把文本切成小块,每一个这样的小块就是一个token

根据语言和文本的不同,一个token可能代表一个字符,也可能代表一整个单词。对于英语来说,一个token大约相当于4个字符,100个token约等于75个单词。

对于中文来说,一个token约等于1.67个中文字符。

token应该怎样翻译呢?我看到有人翻译成“令牌”,还有人翻译成“字符量”,但感觉都不是特别贴切,没有办法传达出token的本质含义。

前两天我看到人民日报的科普文章将它翻译成:词元

这是我目前看过最好的翻译,token代表的是一个有意义的语言片段,这一语言片段不能用“字”或者“字符”来表示,用“词”来表示刚刚好。

汉语中的“元”字可以表示“最小、基本”的含义,比如“元件”指的是构成电子设备的最小、最基本的功能单元。“词元”就代表着大模型处理语言的基本单位。

这个翻译也很直观,即使你不懂技术,看到这个词也能大致猜到它指的是语言的最小单位。

Token这个词除了用在人工智能语境里面,它在其他专业领域也有出现,我们要学会区分。

在信息安全领域,token指的是“身份验证令牌”。用户输入用户名和密码后,服务器会生成一个加密的token返回给客户端,后续请求只需携带这个token即可证明身份,无需重复输入密码。

我们在用网银的时候,有些银行会要求你使用“动态口令牌”,英文对应的说法是hardware tokens

在加密货币中,token指的是区块链平台上发行的代表某种资产或权益的数字化凭证。比如NFT(非同质化代币)英文全称是Non-Fungible Token

另外,token还可以指“代币,专用辅币”,比如我们坐地铁用的一次性小圆片对应的说法就是subway/metro tokens

单词的含义虽然很多,不过都是从一个核心意思衍生出来的:能代表某物的东西。它可以代表你的身份(安全令牌),代表你的资产(代币),还可以代表文本的片段(词元)。

只要理解了这条主线,单词在不同语境下的意思就不难理解。








本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-3-14 16:57 , Processed in 0.208042 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表