当前位置: 首页 > news >正文

【Unity3D优化】优化多语言字体包大小

在多语言出海的手游项目中,字体资源管理是一个容易被忽视、但对性能和包体影响极大的问题。尤其是当项目需要支持中、日、韩等字符集庞大的语言时,完整字体往往动辄数十MB,不仅增加了包体体积,还在运行时造成内存浪费

本文将介绍我在一个中轻度休闲手游项目中,针对多语言字体资源做的一套精简子集方案。最终结果是——在不影响显示完整度的前提下,将原始字体包体积减少了50%~60%


一、问题背景

在国际化手游中,常见支持的语言包括:

  • 字符量少:英语、法语、德语、俄语、西班牙语等(拉丁系)

  • 字符量大:简体中文、繁体中文、日语、韩语

以Noto系列字体为例,若将所有字符打包完整支持,单个 .ttf 文件可能在 30~50MB 之间。对于中轻度手游,既不需要完整支持Unicode,又希望控制首包大小与运行时内存占用,因此我们考虑引入“子集字体”机制。


二、子集化思路概览

我们采用了如下策略:

步骤内容说明
1基础字符集筛选包含所有西方语言字符(字母、数字、常用标点)
2常用字符统计对于中、日、韩,从Wikipedia等资源收集常用字符集
3多语言文本扫描补充项目本身的多语言配置表中,提取所有实际出现的字符
4字体子集化使用 fonttools 脚本化裁剪 .ttf 字体包

通过以上方法,保证了显示完整性极限减重的兼顾。


三、语言维度的字符筛选策略

3.1 西方语言:直接全收

对于英语、法语、德语、西班牙语、俄语等拉丁或西里尔语系:

  • 字符量相对较少

  • 直接使用标准字符集(Basic Latin + Latin-1 Supplement + Cyrillic等)

包括:
- A-Z, a-z, 0-9
- 标点: !@#$%^&*()_+-=[]{}|;:'",.<>?
- 拓展拉丁与西里尔字母区间

3.2 中文、日文:基于常用字

我们查阅了Wikipedia与通用汉字集,提取如下:

  • 简体中文:约 5400 常用字

  • 繁体中文:约 7500 常用字

  • 日语:约 2136 常用汉字(常用汉字表)、另含假名(约100个)

常用字表处理脚本略,可按需要爬取或整理字典。

3.3 韩文:程序生成字符表

韩语的 Hangul 是音节组合体,Unicode中有明确的区段可直接构造:

def generate_korean():start_code = 0xAC00end_code = 0xD7A3korean_syllables = ''.join(chr(code) for code in range(start_code, end_code + 1))with open("./LanguageDatabase/KoreanCommon.txt", "w", encoding="utf-8") as file:file.write(korean_syllables)

此脚本可一次性生成 11172个 Hangul 音节,覆盖绝大多数韩文文本需要。


四、多语言文本补充字符收集

在实际游戏中,UI文本多以表格(如CSV、JSON)存储。我们通过扫描多语言配置表,提取项目内所有文本实际使用到的字符

def extract_used_characters(config_paths):all_chars = set()for path in config_paths:with open(path, 'r', encoding='utf-8') as f:content = f.read()all_chars.update(content)return ''.join(sorted(all_chars))

这样可以有效补充如“游戏术语”、“人名”、“外来语”等未出现在常用字表但实际需要的字符。


五、使用fonttools裁剪字体文件

我们选用 fonttools 库进行 .ttf 文件子集化操作。

5.1 安装依赖

pip install fonttools

5.2 字体裁剪脚本

from fontTools.subset import Subsetter, Options
from fontTools.ttLib import TTFont
from fontTools.subset import load_font, save_fontdef generate_complete_font():fontName = "XXFont"options = Options()options.drop_tables += ['DSIG']  # 删除数字签名font = load_font("./Font/" + fontName + ".ttf", options)subsetter = Subsetter(options)# 常用字集合 + 项目文本字符subsetText = generate_char_set()subsetter.populate(text=subsetText)subsetter.populate(unicodes=[0x0020, 0x000A, 0x0009, 0x200B, 0x00A0, 0x3000])  # 空格类字符补充subsetter.subset(font)save_font(font, "./Font/" + fontName + "-Sub.ttf", options)

可结合项目资源构建自动化流程,在打包阶段自动执行。


六、最终成果与效果

原字体原大小子集后大小缩减比例
NotoSansCJK.ttc42MB18MB↓约57%
CustomGameFont.ttf24MB10MB↓约58%

此外,运行时加载该字体的内存占用也相应减少,并无字符缺失问题。


七、总结与展望

通过多语言子集优化策略,我们达成了以下目标:

  • 显著减少了字体资源体积;

  • 降低了运行时内存占用;

  • 保证了文本完整显示,适配了多语言UI需求;

  • 易于扩展,后续支持新语言只需增补字符集。

该方法适用于多数Unity手游项目,特别是出海产品、UI密集型的轻度游戏。

http://www.xdnf.cn/news/986041.html

相关文章:

  • swagger通过配置将enum自动添加到字段说明中
  • PHP如何检查一个字符串是否是email格式
  • 【微信小程序】| 在线咖啡点餐平台设计与实现
  • 华为云Flexus+DeepSeek征文 | 基于华为云ModelArts Studio打造AingDesk AI聊天助手
  • list类型
  • SCADA|测试KingSCADA4.0信创版采集汇川PLC AC810数据
  • 开源夜莺支持MySQL数据源,更方便做业务指标监控了
  • xss分析
  • C2f模块 vs Darknet-53——YOLOv8检测效率的提升
  • 9.IP数据包分片计算
  • HNCTF2025 - Misc、Osint、Crypto WriteUp
  • 第三讲 基础运算之整数运算
  • 什么是数字化项目风险管理?如何实现项目风险管理数字化?
  • IIS 实现 HTTPS:OpenSSL证书生成与配置完整指南
  • 突然虚拟机磁盘只剩下几十K
  • [特殊字符] React 与 Vue 源码级对比:5大核心差异与实战选择指南
  • # include<heαd.h>和# include″heαd.h″的区别
  • 成都国际数字影像产业园孵化培育模式的探索与突破
  • 人机交互设计知识点总结
  • 驻波比(VSWR)详解
  • 判断字符串子序列
  • OpenAI o3-pro深度解析:87%降价背后的AI战略,AGI发展迈入新阶段!
  • 自动托盘搬运车是什么?它的工作逻辑如何实现物流自动化?
  • Python训练营打卡 Day51
  • 日本滨松R669光电倍增管Hamamatsu直径51 mm 直径端窗型扩展红多碱光阴极面光谱灵敏度特性:300 至 900 nm
  • AI重写工具导致‘文本湍流’特征|如何人工消除算法识别标记
  • 卷积神经网络(一)
  • 基于C++实现(控制台)小学算数自测系统
  • ateⅹⅰt()的用法
  • DD3118完整版参数规格书|DD3118 3.0读卡器控制方案|DD3118高速3.0读卡器芯片