wp-lang 0.3.1

WPL language crate with AST, parser, evaluator, builtins, and generators.
Documentation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
# WPL 函数参考(对齐 `src/parser/wpl_fun.rs``src/eval/builtins`

本文档只描述当前代码里已经实现的函数和行为,不再保留过时签名。

权威实现位置:

- `src/parser/wpl_fun.rs`
- `src/ast/processor/function.rs`
- `src/eval/builtins/pipe_fun.rs`
- `src/eval/builtins/mod.rs`

---

## 速查

### 预处理管道

| 名称 | 作用 | 备注 |
|------|------|------|
| `decode/base64` | 对整行输入做 Base64 解码 | 内置 |
| `decode/hex` | 对整行输入做十六进制解码 | 内置 |
| `unquote/unescape` | 对整行输入做引号/转义处理 | 内置 |
| `strip/bom` | 去掉 UTF BOM | 内置 |
| `json_like` | 只放行“看起来像 JSON”的输入 | 内置 |
| `plg_pipe/<name>` | 调用注册的自定义预处理器 | `plg_pipe(name)` 也可 |

### 选择器

| 函数 | 作用 |
|------|------|
| `take(field)` | 选中指定字段作为活跃字段 |
| `last()` | 选中最后一个字段作为活跃字段 |

### 目标字段函数(`f_` 前缀)

| 函数 | 作用 |
|------|------|
| `f_has(name)` | 指定字段存在 |
| `f_chars_has(name, value)` | 指定字段等于某字符串 |
| `f_chars_not_has(name, value)` | 指定字段不等于某字符串 |
| `f_chars_in(name, [...])` | 指定字段属于字符串集合 |
| `f_digit_has(name, number)` | 指定字段等于某数字 |
| `f_digit_in(name, [...])` | 指定字段属于数字集合 |
| `f_ip_in(name, [...])` | 指定字段属于 IP 集合 |

### 活跃字段函数

| 函数 | 作用 |
|------|------|
| `has()` | 活跃字段存在 |
| `chars_has(value)` | 活跃字段等于某字符串 |
| `chars_not_has(value)` | 活跃字段不等于某字符串 |
| `chars_in([...])` | 活跃字段属于字符串集合 |
| `digit_has(number)` | 活跃字段等于某数字 |
| `digit_in([...])` | 活跃字段属于数字集合 |
| `digit_range(begin, end)` | 活跃字段落在闭区间 `[begin, end]` |
| `ip_in([...])` | 活跃字段属于 IP 集合 |

### 转换与匹配

| 函数 | 作用 |
|------|------|
| `json_unescape()` | 对活跃字符串字段做 JSON 反转义 |
| `base64_decode()` | 对活跃字符串字段做 Base64 解码 |
| `chars_replace(from, to)` | 对活跃字符串字段做全量替换 |
| `regex_match(pattern)` | 对活跃字符串字段做正则匹配 |
| `starts_with(prefix)` | 检查前缀;不匹配时把字段改成 `ignore` |
| `not(inner_fun)` | 反转内层字段函数的成功/失败 |

---

## 预处理管道

### `decode/base64`

整行输入做 Base64 解码。

```wpl
rule demo {
  |decode/base64|
  (chars:payload)
}
```

说明:

- 作用对象是原始整行,不是单个字段
- 解码失败时当前规则失败

### `decode/hex`

整行输入做十六进制解码。

```wpl
rule demo {
  |decode/hex|
  (chars:payload)
}
```

### `unquote/unescape`

整行输入执行引号/转义处理。

```wpl
rule demo {
  |unquote/unescape|
  (chars:message)
}
```

### `strip/bom`

去掉输入开头的 BOM。

```wpl
rule demo {
  |strip/bom|
  (json(chars@msg))
}
```

### `json_like`

只允许看起来像 JSON 的文本继续往下走。

```wpl
rule maybe_bad_json {
  |json_like|
  (bad_json:raw)
}
```

说明:

- 这是轻量过滤,不会真正解析 JSON
- 当前实现认为下面两类输入才算“像 JSON”:
  - 去掉前导空白/BOM 后以 `{` 开头,且同时包含 `:``"`
  - 去掉前导空白/BOM 后以 `[` 开头,且包含 `,``]``{`

### `plg_pipe/<name>` / `plg_pipe(name)`

调用注册到预处理器注册表里的自定义处理器。

```wpl
rule demo {
  |plg_pipe/dayu|
  (chars:data)
}
```

说明:

- `plg_pipe(name)` 在解析后会归一化为 `plg_pipe/name`
- 是否可用取决于运行时是否注册了对应处理器

---

## 选择器

### `take(field)`

把指定字段设为活跃字段。

```wpl
rule demo {
  (
    json(chars@name, digit@age)
    |take(name)
    |chars_has(admin)
  )
}
```

参数格式:

- 支持裸字段名:`take(name)`
- 支持双引号:`take("@special")`
- 支持单引号:`take('@special')`

失败条件:

- 找不到目标字段

### `last()`

把最后一个字段设为活跃字段。

```wpl
rule demo {
  (
    json(chars@a, chars@b, chars@c)
    |last()
    |chars_has(done)
  )
}
```

失败条件:

- 当前字段列表为空

---

## 目标字段函数(`f_` 前缀)

这类函数会自动按字段名选择目标字段,不需要先 `take(...)`。

### `f_has(name)`

指定字段存在时成功。

```wpl
|f_has(status)|
```

### `f_chars_has(name, value)`

指定字段是 `Chars`,且值等于 `value` 时成功。

```wpl
|f_chars_has(status, success)|
```

说明:

- 第一个参数支持 `_`,表示“当前活跃字段”
- 第二个参数当前按裸字符串解析,适合 `success``GET` 这类简单值

### `f_chars_not_has(name, value)`

指定字段不存在时也会成功;只有“字段存在且值刚好等于 `value`”才失败。

```wpl
|f_chars_not_has(level, error)|
```

这和很多“严格不存在即失败”的谓词不同,当前实现是宽松语义。

### `f_chars_in(name, [...])`

指定字段是 `Chars`,且值属于给定字符串数组时成功。

```wpl
|f_chars_in(method, [GET, POST, PUT])|
```

### `f_digit_has(name, number)`

指定字段是 `Digit`,且值等于目标数字时成功。

```wpl
|f_digit_has(code, 200)|
```

### `f_digit_in(name, [...])`

指定字段是 `Digit`,且值属于数字数组时成功。

```wpl
|f_digit_in(code, [200, 201, 204])|
```

### `f_ip_in(name, [...])`

指定字段是 `IpAddr`,且值属于 IP 数组时成功。

```wpl
|f_ip_in(client_ip, [127.0.0.1, ::1])|
```

说明:

- 支持 IPv4 和 IPv6

---

## 活跃字段函数

这类函数直接作用于当前活跃字段。通常搭配 `take(...)` 或 `last()` 使用。

### `has()`

活跃字段存在即成功。

```wpl
|take(name)|has()|
```

### `chars_has(value)`

活跃字段必须是 `Chars`,且值等于 `value`。

```wpl
|take(status)|chars_has(success)|
```

### `chars_not_has(value)`

活跃字段不存在时也成功;只有“字段存在且值等于 `value`”才失败。

```wpl
|take(level)|chars_not_has(error)|
```

### `chars_in([...])`

活跃字段必须是 `Chars`,且值落在给定字符串数组中。

```wpl
|take(method)|chars_in([GET, POST])|
```

### `digit_has(number)`

活跃字段必须是 `Digit`,且值等于目标数字。

```wpl
|take(code)|digit_has(200)|
```

### `digit_in([...])`

活跃字段必须是 `Digit`,且值属于数字数组。

```wpl
|take(code)|digit_in([200, 201, 204])|
```

### `digit_range(begin, end)`

活跃字段必须是 `Digit`,且值满足闭区间 `[begin, end]`。

```wpl
|take(code)|digit_range(200, 299)|
```

说明:

- 当前只有活跃字段版本,没有 `f_digit_range(...)`

### `ip_in([...])`

活跃字段必须是 IP,且值属于目标列表。

```wpl
|take(client_ip)|ip_in([127.0.0.1, ::1])|
```

---

## 转换与匹配函数

### `json_unescape()`

对活跃字符串字段做 JSON 反转义。

```wpl
|take(message)|json_unescape()|
```

行为:

- 只处理 `Chars`
- 字段里没有反斜杠时直接成功
- 遇到非法 JSON 转义时失败

### `base64_decode()`

对活跃字符串字段做 Base64 解码。

```wpl
|take(payload)|base64_decode()|
```

行为:

- 只处理 `Chars`
- 解码失败或结果不是 UTF-8 时失败

### `chars_replace(from, to)`

对活跃字符串字段执行 `String::replace(from, to)`。

```wpl
|take(message)|chars_replace(old, new)|
|take(message)|chars_replace("hello world", "hi")|
```

参数格式:

- 支持裸字符串
- 支持单引号或双引号字符串

说明:

- 替换是全量替换,不是只替换第一个
- `from` 为空字符串时,会在每个字符边界插入 `to`

### `regex_match(pattern)`

对活跃字符串字段执行正则匹配。

```wpl
|take(email)|regex_match('^\\w+@\\w+\\.\\w+$')|
```

参数格式:

- 支持裸字符串
- 支持单引号或双引号字符串
- 正则由 Rust `regex` crate 编译

失败条件:

- 活跃字段不存在
- 活跃字段不是字符串
- 正则不合法
- 正则未匹配

### `starts_with(prefix)`

检查活跃字符串字段是否以前缀开头。

```wpl
|take(path)|starts_with('/api/')|
```

参数格式:

- 支持裸字符串
- 支持单引号或双引号字符串

当前实现的关键行为:

- 若字段是字符串且以前缀开头:成功,字段保持原值
- 若字段不是字符串,或字符串不匹配:不会报错,而是把该字段改成 `ignore`,然后返回成功

这意味着 `starts_with(...)` 更像“筛掉当前字段”而不是“严格断言失败”。

### `not(inner_fun)`

反转内层字段函数的成功/失败结果。

```wpl
|not(chars_has(error))|
|not(f_chars_has(level, error))|
```

说明:

- 只能包裹字段函数
- 不能包裹选择器函数,例如 `not(take(name))` 不成立
- 会沿用内层函数的自动选字段逻辑

---

## 使用建议

### 目标字段函数 vs 活跃字段函数

| 场景 | 推荐写法 |
|------|----------|
| 只校验某个字段是否存在 | `f_has(name)` |
| 先定位字段,再连续做多步处理 | `take(name)` + 活跃字段函数 |
| 需要做字段值转换 | `take(name)` + `json_unescape()` / `base64_decode()` / `chars_replace()` |
| 需要否定一个条件 | `not(...)` |

### 当前实现里容易踩坑的点

- `chars_not_has(...)``f_chars_not_has(...)` 在字段缺失时会成功
- `starts_with(...)` 在不匹配时会把字段转成 `ignore`,不是直接失败
- 并不是所有字符串参数都支持带引号
  - 明确支持引号:`take``chars_replace``regex_match``starts_with`
  - 其余如 `chars_has``f_chars_has` 目前应优先写裸值

---

## 相关实现

- 函数解析:[src/parser/wpl_fun.rs]/Users/zuowenjian/devspace/wp-labs/dev/wparse/wp-lang/src/parser/wpl_fun.rs
- 函数 AST:[src/ast/processor/function.rs]/Users/zuowenjian/devspace/wp-labs/dev/wparse/wp-lang/src/ast/processor/function.rs
- 字段管道执行:[src/eval/builtins/pipe_fun.rs]/Users/zuowenjian/devspace/wp-labs/dev/wparse/wp-lang/src/eval/builtins/pipe_fun.rs
- 内置预处理器注册:[src/eval/builtins/mod.rs]/Users/zuowenjian/devspace/wp-labs/dev/wparse/wp-lang/src/eval/builtins/mod.rs