esp_extractor 0.5.0

A Rust library for extracting and applying translations to Bethesda ESP/ESM/ESL files
Documentation

ESP 字符串提取工具 (esp_extractor)

Crates.io Documentation License: MIT OR Apache-2.0

一个用于处理 Bethesda 游戏引擎(ESP/ESM/ESL)文件和字符串文件的 高性能 Rust 库。支持 Skyrim、Fallout 等游戏的 Mod 翻译工作流。

✨ 核心特性

  • 极致性能 - v0.5.0 实现 26 倍性能提升(240秒 → 9秒)
  • 🏗️ 分层架构 - IO 抽象层 + 编辑器层,职责清晰
  • 🎯 智能加载 - 自动检测本地化插件,按需加载 STRING 文件
  • 📝 有状态编辑 - 支持批量修改、延迟保存、撤销/重做
  • 🔄 变更追踪 - 完整记录所有修改操作
  • 🧪 高可测试性 - 支持依赖注入和 mock 测试

📦 安装

作为库使用(推荐)

[dependencies]

esp_extractor = "0.5.0"

作为命令行工具

cargo install esp_extractor --features cli

🚀 快速开始

命令行工具

# 1. 提取字符串到 JSON

esp_extractor -i "MyMod.esp" -o "strings.json"


# 2. 编辑 JSON 文件中的 original_text 字段


# 3. 应用翻译

esp_extractor -i "MyMod.esp" --apply-file "strings_cn.json" -o "MyMod_CN.esp"

库 API

use esp_extractor::LoadedPlugin;

// 自动加载插件(包括 STRING 文件)
let loaded = LoadedPlugin::load_auto("MyMod.esp".into(), Some("english"))?;

// 提取字符串
let strings = loaded.extract_strings();
println!("提取到 {} 个字符串", strings.len());

// 保存到 JSON
let json = serde_json::to_string_pretty(&strings)?;
std::fs::write("strings.json", json)?;

🎯 主要功能

ESP/ESM/ESL 文件处理

  • 字符串提取和翻译应用
  • 文件结构分析和调试
  • 压缩记录支持(zlib)
  • Light Plugin (ESL) 支持

字符串文件解析

  • 支持 .STRINGS.ILSTRINGS.DLSTRINGS 文件
  • 自动检测文件类型和编码
  • 转换为 JSON 格式便于处理

高级特性

  • 10 种 GroupType 支持:完整的游戏数据结构解析
  • XXXX 超大子记录:正确处理 > 65535 字节的子记录(如 NAVM)
  • 特殊记录索引:INFO/QUST/PERK 记录的索引跟踪
  • 多编码支持:自动检测 UTF-8、GB18030、Windows-1252 等

⚡ v0.5.0 性能突破

性能提升对比

优化阶段 技术方案 加载时间 提升倍数
v0.4.0(基线) fs::read + 克隆 240秒 -
v0.5.0 阶段1 memmap2 + Cow 120秒 2x ⬆️
v0.5.0 最终 rayon 并行化 9秒 26x ⬆️

关键优化技术

  1. 内存映射文件(memmap2)

    • 零拷贝文件访问
    • 按需分页加载
    • 节省 500-600ms 启动时间
  2. Copy-on-Write(Cow)

    • 消除 100,000+ 次不必要的内存拷贝
    • 节省 ~35MB 内存分配
    • 避免 500-800ms 数据拷贝时间
  3. 并行处理(rayon)

    • Group 并行解析(10x 提升)
    • 字符串提取并行化(2x 提升)
    • 充分利用多核 CPU

测试数据(Skyrim.esm)

  • 文件大小:250 MB
  • STRING 文件:67,414 条(3 种文件类型)
  • 提取字符串:20,437 条(含 2,835 条特殊记录)
  • 测试通过率:9/10(90%),核心功能 100% 正常

📋 使用示例

字符串提取

# 基础提取

esp_extractor -i "MyMod.esp" -o "strings.json"


# 包含本地化字符串(显示为 StringID)

esp_extractor -i "MyMod.esp" --include-localized -o "all_strings.json"


# 显示统计信息

esp_extractor -i "Skyrim.esm" --stats

字符串文件解析

# 自动检测文件类型

esp_extractor -i "Dragonborn_english.ILSTRINGS" -o "dragonborn.json"


# 查看统计信息

esp_extractor -i "Skyrim_english.STRINGS" --stats

翻译应用

# 从 JSON 文件应用翻译

esp_extractor -i "MyMod.esp" --apply-file "translations.json" -o "MyMod_CN.esp"


# 从 JSON 字符串应用部分翻译(适合少量修改)

esp_extractor -i "MyMod.esp" --apply-jsonstr '[{"editor_id":"IronSword","form_id":"00012BB7|Skyrim.esm","original_text":"铁剑","record_type":"WEAP","subrecord_type":"FULL"}]' -o "MyMod_CN.esp"


# 从标准输入读取翻译(适合脚本处理)

cat translations.json | esp_extractor -i "MyMod.esp" --apply-partial-stdin -o "MyMod_CN.esp"

ESL 插件处理

# 将 ESP 转换为 ESL(FormID 重编号)

esp_extractor -i "MyMod.esp" --eslify -o "MyMod.esl"


# 注意:最多支持 2048 条新记录

📄 输出格式

JSON 格式的字符串数组:

{
  "editor_id": "IronSword",
  "form_id": "00012BB7|Skyrim.esm", 
  "original_text": "Iron Sword",
  "record_type": "WEAP",
  "subrecord_type": "FULL",
  "index": null
}

字段说明

  • editor_id: 编辑器 ID
  • form_id: FormID|主文件名
  • original_text: 原始文本(提取时为原文,应用翻译时修改为译文)
  • record_type: 记录类型(如 WEAP、NPC_、BOOK)
  • subrecord_type: 子记录类型(如 FULL、DESC)
  • index: 索引(仅用于 INFO/QUST/PERK 等特殊记录)

匹配机制

应用翻译时使用 四重匹配 确保精确性:

  • editor_id + form_id + record_type + subrecord_type + index(可选)

🎮 支持的游戏

  • The Elder Scrolls V: Skyrim Special Edition
  • The Elder Scrolls IV: Oblivion
  • Fallout 3 / Fallout: New Vegas / Fallout 4

⚙️ 核心命令行选项

通用选项

  • -i, --input <FILE>: 输入文件路径(必需)
  • -o, --output <FILE>: 输出文件路径(可选)
  • --stats: 显示文件统计信息
  • --quiet: 静默模式

提取模式

  • --include-localized: 包含本地化字符串(显示为 StringID)
  • --unfiltered: 包含所有字符串,跳过智能过滤

翻译应用模式

  • --apply-file <JSON_FILE>: 从 JSON 文件应用翻译
  • --apply-jsonstr <JSON_STRING>: 从 JSON 字符串应用指定翻译
  • --apply-partial-stdin: 从标准输入读取 JSON 翻译

高级功能

  • --eslify: 转换为 ESL 插件(FormID 重编号)
  • --test-rebuild: 测试解析和重建逻辑
  • --compare-files <FILE>: 对比两个 ESP 文件的结构差异

完整选项请运行 esp_extractor --help

💡 最佳实践

翻译工作流

  1. 提取字符串

    esp_extractor -i "MyMod.esp" -o "strings.json"
    
    
  2. 编辑翻译

    • 修改 JSON 文件中的 original_text 字段
    • 使用翻译工具(ChatGPT、DeepL)处理大量文本
    • 保持游戏术语的一致性
  3. 应用翻译

    esp_extractor -i "MyMod.esp" --apply-file "strings_cn.json" -o "MyMod_CN.esp"
    
    
  4. 质量控制

    • 在游戏中测试翻译效果
    • 检查特殊字符是否正确显示
    • 使用自动备份文件快速恢复(.bak

性能建议

  • 大文件处理:v0.5.0 已优化,250MB 文件 9 秒内完成
  • 部分翻译:只翻译需要的条目,减少文件大小和处理时间
  • 并行处理:利用多核 CPU 加速(自动启用)

💻 库 API 使用

智能自动加载(推荐)

use esp_extractor::LoadedPlugin;

// 自动检测 LOCALIZED 标志并加载 STRING 文件
let loaded = LoadedPlugin::load_auto("MyMod.esp".into(), Some("english"))?;

// 提取字符串
let strings = loaded.extract_strings();

编辑器 API

use esp_extractor::{Plugin, PluginEditor, DefaultEspWriter};

// 加载插件
let plugin = Plugin::load("MyMod.esp".into())?;

// 创建编辑器
let mut editor = PluginEditor::new(plugin);

// 应用翻译
editor.apply_translations(translations)?;

// 保存修改
let writer = DefaultEspWriter;
editor.save(&writer, "MyMod_CN.esp".as_ref())?;

本地化插件处理

use esp_extractor::LocalizedPluginContext;

// 显式加载本地化插件(ESP + STRING 文件)
let context = LocalizedPluginContext::load("DLC.esm".into(), "english")?;

// 访问插件和 STRING 文件
println!("插件: {}", context.plugin().get_name());
println!("STRING 文件数: {}", context.string_files().files.len());

// 提取字符串(包含 STRING 文件内容)
let strings = context.plugin().extract_strings();

详细 API 文档请访问 docs.rs

📚 扩展文档

🛠️ 开发

# 构建库

cargo build


# 构建命令行工具

cargo build --features cli


# 运行测试

cargo test


# 生成文档

cargo doc --open

🤝 贡献

欢迎贡献代码!请查看 CONTRIBUTING.md 了解详细信息。

📜 许可证

本项目采用 MIT 或 Apache-2.0 双重许可证。详情请查看 LICENSE-MITLICENSE-APACHE 文件。

🎉 致谢

  • Bethesda Game Studios - 创造了这些出色的游戏
  • ESP 文件格式的逆向工程社区
  • Rust 社区提供的优秀库和工具

📝 版本历史

v0.5.0 (2025-11-14) - 性能突破版 ⚡

性能优化

  • 🚀 26 倍性能提升:Skyrim.esm (250MB) 加载时间从 240 秒缩短到 9 秒
  • 💾 内存映射文件(memmap2):零拷贝文件访问
  • 🐄 Copy-on-Write(Cow):消除 100,000+ 次内存拷贝
  • ⚙️ 并行处理(rayon):Group 和字符串提取并行化

功能完善

  • ✅ 完整的 10 种 GroupType 支持
  • ✅ XXXX 超大子记录处理(> 65535 字节)
  • ✅ 特殊记录索引跟踪(INFO/QUST/PERK)
  • ✅ STRING 文件完美集成

测试验证

  • 📊 Skyrim.esm 集成测试:9/10 通过(核心功能 100% 正常)
  • 📈 成功提取 20,437 条字符串(含 2,835 条特殊记录)
  • 🌐 加载 67,414 条 STRING 文件条目

注意事项

  • ⚠️ 此版本为实验性性能优化版本
  • 📝 建议在生产环境前进行充分测试
  • 🔄 STRING 文件加载仍有优化空间(~130 秒)

v0.4.0 (2025) - 架构重构版 🏗️

架构升级

  • 🏗️ 分层架构:IO 抽象层 + 编辑器层
  • 🎯 智能插件加载器
  • 📝 有状态编辑器和变更追踪
  • 🧪 依赖注入和高可测试性

核心功能

  • ✅ ESP/ESM/ESL 文件解析
  • ✅ STRING 文件支持
  • ✅ 字符串提取和翻译应用
  • ✅ 压缩记录支持

v0.3.0 及更早版本

  • 基础 ESP 文件解析
  • 字符串提取功能
  • JSON 格式输出

当前版本: v0.5.0
稳定性: 实验性(建议测试后使用)
推荐用途: Mod 翻译、数据提取、批量处理