Unicode 18.0 将于今年 9 月正式发布,这是全球文字编码标准的一次重要更新。本次升级一次性新增 13,047 个字符,使 Unicode 总字符数达到 172,848 个。
为什么这次更新值得关注
Unicode 是计算机处理全球所有文字的基础设施,从手机输入法到网页浏览、从数据库到文档软件,几乎所有涉及文字处理的场景都依赖这套标准。本次更新最显著的变化是新增了四种古文字脚本:Chisoi(来自尼日利亚)、Proto-Cuneiform(楔形文字数字符号)、Jurchen(女真文)和 Seal(印章文字)。这些古老文字的加入,意味着历史文献数字化和文化研究领域将获得更完善的字符支持。
本次同步更新的还包括五个关联技术标准:排序算法 UTS#10、安全机制 UTS#39、URL 处理 UTS#46、表情符号 UTS#51 以及链接检测 UTS#58。这意味着 emoji、系统安全、网址显示等技术规范也都统一跟进到新版本。
对于普通用户而言,Unicode 版本升级的影响是潜移默及的——未来使用新文字的系统将不再出现“显示不出”的乱码问题,而古文字研究、文化保护和跨语言数据处理将直接受益于此。
编注:信源为 unicode.org 官方预发布页,材料截至发布前草案;本稿仅概述核心新增内容,未涉及技术细节。