symbi 1.14.2

AI-native agent framework for building autonomous, policy-aware agents that can safely collaborate with humans, other agents, and large language models
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
1011
1012
1013
1014
1015
1016
1017
1018
1019
1020
1021
1022
1023
1024
1025
1026
1027
1028
1029
1030
1031
1032
1033
1034
1035
1036
1037
1038
1039
1040
1041
1042
1043
1044
1045
1046
1047
1048
1049
1050
1051
1052
1053
1054
1055
1056
1057
1058
1059
1060
1061
1062
1063
1064
1065
1066
1067
1068
1069
1070
1071
1072
1073
1074
1075
1076
1077
1078
1079
1080
1081
1082
1083
1084
1085
1086
1087
1088
1089
1090
1091
1092
1093
1094
1095
1096
1097
1098
1099
1100
1101
1102
1103
1104
1105
1106
1107
1108
1109
1110
1111
1112
1113
1114
1115
1116
1117
1118
1119
1120
1121
1122
1123
1124
1125
1126
1127
1128
1129
1130
1131
1132
1133
1134
1135
1136
1137
1138
1139
1140
1141
1142
1143
1144
1145
1146
1147
1148
1149
1150
1151
1152
1153
1154
1155
1156
1157
1158
1159
1160
1161
1162
1163
1164
1165
1166
1167
1168
1169
1170
1171
1172
1173
1174
1175
1176
1177
# Modelo de Segurança

Arquitetura de segurança abrangente garantindo proteção de confiança zero e orientada por políticas para agentes de IA.

## Outros idiomas



---

## Visão Geral

O Symbiont implementa uma arquitetura de segurança em primeiro lugar projetada para ambientes regulamentados e de alta garantia. O modelo de segurança é construído sobre princípios de confiança zero com aplicação abrangente de políticas, sandboxing de várias camadas e auditabilidade criptográfica.

### Princípios de Segurança

- **Confiança Zero**: Todos os componentes e comunicações são verificados
- **Defesa em Profundidade**: Múltiplas camadas de segurança sem ponto único de falha
- **Orientado por Políticas**: Políticas de segurança declarativas aplicadas em tempo de execução
- **Auditabilidade Completa**: Cada operação registrada com integridade criptográfica
- **Menor Privilégio**: Permissões mínimas necessárias para operação

---

## Sandboxing de Múltiplas Camadas

O runtime entrega três camadas de isolamento no host (Tier 1 → Tier 3) mais um backend de execução hospedada (E2B). As camadas formam uma escada de isolamento monotonicamente crescente; o E2B **não** é um par nessa escada — executa em infraestrutura de terceiros e é documentado separadamente abaixo.

```mermaid
graph TB
    A[Risk Assessment Engine] --> B{Risk Level}

    B -->|Low Risk| C[Tier 1: Docker]
    B -->|Medium Risk| D[Tier 2: gVisor]
    B -->|High Risk| E[Tier 3: Firecracker]

    A -.->|Opt-in via DSL| H[Hosted: E2B]

    subgraph "Tier 1: Container Isolation"
        C1[Container Runtime]
        C2[Resource Limits]
        C3[Network Isolation]
        C4[Read-only Filesystem]
    end

    subgraph "Tier 2: User-space Kernel"
        D1[System Call Interception]
        D2[Memory Protection]
        D3[I/O Virtualization]
        D4[Enhanced Isolation]
    end

    subgraph "Tier 3: microVM"
        E1[KVM Hardware Virtualization]
        E2[Dedicated Kernel]
        E3[Read-only Rootfs]
        E4[Per-execution Lifecycle]
    end

    subgraph "Hosted: third-party cloud"
        H1[No on-host isolation]
        H2[Trust assumption: provider]
        H3[Quick-start, no setup]
    end

    C --> C1
    D --> D1
    E --> E1
    H --> H1
```

> **As três camadas de isolamento no host — Docker, gVisor e Firecracker — são todas entregues no runtime OSS.** Operadores escolhem a camada por agente via o bloco DSL `with { sandbox = ... }`, ou definem um padrão de projeto via `[sandbox] tier = "..."` em `symbiont.toml`. O E2B é opt-in apenas via DSL (`with { sandbox = "e2b" }`) e intencionalmente não é exposto como um valor de `[sandbox] tier`.

### Camada 1: Isolamento Docker

**Casos de Uso:**
- Tarefas de desenvolvimento confiáveis
- Processamento de dados de baixa sensibilidade
- Operações de ferramentas internas

**Recursos de Segurança:**
```yaml
docker_security:
  memory_limit: "512MB"
  cpu_limit: "0.5"
  network_mode: "none"
  read_only_root: true
  security_opts:
    - "no-new-privileges:true"
    - "seccomp:default"
  capabilities:
    drop: ["ALL"]
    add: ["SETUID", "SETGID"]
```

**Proteção contra Ameaças:**
- Isolamento de processos do host
- Prevenção de esgotamento de recursos
- Controle de acesso à rede
- Proteção do sistema de arquivos

### Camada 2: Isolamento gVisor

**Casos de Uso:**
- Cargas de trabalho de produção padrão
- Processamento de dados sensíveis
- Integração de ferramentas externas

**Recursos de Segurança:**
- Implementação de kernel em espaço de usuário
- Filtragem e tradução de chamadas do sistema
- Limites de proteção de memória
- Validação de solicitações de E/S

**Configuração:**
```yaml
gvisor_security:
  runtime: "runsc"
  platform: "ptrace"
  network: "sandbox"
  file_access: "exclusive"
  debug: false
  strace: false
```

**Proteção Avançada:**
- Isolamento de vulnerabilidades do kernel
- Interceptação de chamadas do sistema
- Prevenção de corrupção de memória
- Mitigação de ataques de canal lateral

**Pré-requisitos:** Instale [`runsc`](https://gvisor.dev/docs/user_guide/install/) e registre-o como runtime do Docker em `/etc/docker/daemon.json`. `symbi doctor` reporta se `runsc` está acessível.

### Camada 3: microVM Firecracker

**Casos de Uso:**
- Cargas de trabalho de mais alto isolamento (código não confiável, multi-tenant, dados regulamentados)
- Onde a granularidade do filtro de syscalls (gVisor) não é suficiente e um limite real de kernel é necessário
- Ciclo de vida de VM por execução para contenção mais forte do raio de impacto

**Recursos de Segurança:**
- Virtualização de hardware via KVM
- microVM por execução com kernel + rootfs fornecidos pelo operador
- Sistema de arquivos raiz somente leitura por padrão
- Sem superfície de kernel compartilhada com o host

**Configuração:** `[sandbox.firecracker]` em `symbiont.toml`:

```toml
[sandbox]
tier = "tier3"

[sandbox.firecracker]
kernel_image_path = "/var/lib/firecracker/vmlinux"
rootfs_path       = "/var/lib/firecracker/rootfs.ext4"
vcpus             = 1
mem_mib           = 512
rootfs_read_only  = true
```

**Pré-requisitos:** O operador deve fornecer (a) uma imagem de kernel compatível com Firecracker e (b) uma imagem de sistema de arquivos raiz com um script de init que leia o payload do agente. **Veja [`docs/firecracker-setup.md`](firecracker-setup.md) para um guia rápido passo a passo, o contrato de init dentro da VM e uma checklist de hardening.** `symbi doctor` reporta se o binário `firecracker` está acessível.

Uma vez que você tenha ambos os artefatos, faça scaffolding de um projeto tier3 com:

```bash
symbi init --profile assistant --sandbox tier3 \
  --firecracker-kernel /var/lib/firecracker/vmlinux \
  --firecracker-rootfs /var/lib/firecracker/rootfs.ext4
```

`symbi init` valida que ambos os arquivos existem antes de escrever `symbiont.toml`, de modo que configurações incorretas aparecem no momento do scaffold em vez da primeira execução do agente.

### Execução hospedada: E2B

**O E2B é um backend de sandbox em nuvem hospedado, não uma camada de isolamento no host.** Fica fora da escada Tier 1 → Tier 3 e é documentado aqui para fins de completude.

**O que é:** O código roda na infraestrutura do E2B via API HTTPS deles; o runtime envia apenas um cliente HTTP. Defina `E2B_API_KEY` e selecione-o por agente com `with { sandbox = "e2b" }`. Não há flag `--sandbox e2b` no `symbi init` — o E2B é intencionalmente opt-in apenas via DSL, pois representa um modelo de confiança diferente das camadas no host.

**Casos de uso:**
- Demos de início rápido e avaliação sem instalar Docker, gVisor ou Firecracker.
- Ambientes de desenvolvimento onde o operador não pode rodar um host de sandbox (CI sem modo privilegiado, laptops bloqueados, máquinas de desenvolvimento ARM).

**O que não é:**
- Não é um substituto para isolamento no host. Código, prompts e saídas de ferramentas atravessam a infraestrutura do E2B. Não use para cargas de trabalho com requisitos de privacidade, residência ou conformidade.
- Não é comparável a Tier 1/2/3 em uma revisão de segurança. O runtime mapeia `E2B → SecurityTier::Hosted`, que ordena **abaixo** de `Tier1` — políticas que exigem isolamento no host (`tier >= Tier1`) rejeitarão a execução hospedada.

**Configuração:** Sem configuração no nível do projeto; defina `E2B_API_KEY` no ambiente e use `with { sandbox = "e2b" }` por agente.

---

## Motor de Políticas

### Arquitetura de Políticas

O motor de políticas fornece controles de segurança declarativos com aplicação em tempo de execução:

```mermaid
graph TB
    A[Policy Definition] --> B[Policy Parser]
    B --> C[Policy Store]
    C --> D[Policy Engine]
    D --> E[Enforcement Points]

    E --> F[Agent Creation]
    E --> G[Resource Access]
    E --> H[Message Routing]
    E --> I[Tool Invocation]
    E --> J[Data Operations]
    E --> CPG[Inter-Agent Policy]

    K[Audit Logger] --> L[Policy Violations]
    E --> K
```

### Tipos de Políticas

#### Políticas de Controle de Acesso

Definem quem pode acessar quais recursos sob quais condições:

```rust
policy secure_data_access {
    allow: read(sensitive_data) if (
        user.clearance >= "secret" &&
        user.need_to_know.contains(data.classification) &&
        session.mfa_verified == true
    )

    deny: export(data) if data.contains_pii == true

    require: [
        user.background_check.current,
        session.secure_connection,
        audit_trail = "detailed"
    ]
}
```

#### Políticas de Fluxo de Dados

Controlam como os dados se movem através do sistema:

```rust
policy data_flow_control {
    allow: transform(data) if (
        source.classification <= target.classification &&
        user.transform_permissions.contains(operation.type)
    )

    deny: aggregate(datasets) if (
        any(datasets, |d| d.privacy_level > operation.privacy_budget)
    )

    require: differential_privacy for statistical_operations
}
```

#### Políticas de Uso de Recursos

Gerenciam alocação de recursos computacionais:

```rust
policy resource_governance {
    allow: allocate(resources) if (
        user.resource_quota.remaining >= resources.total &&
        operation.priority <= user.max_priority
    )

    deny: long_running_operations if system.maintenance_mode

    require: supervisor_approval for high_memory_operations
}
```

### Motor de Avaliação de Políticas

```rust
pub trait PolicyEngine {
    async fn evaluate_policy(
        &self,
        context: PolicyContext,
        action: Action
    ) -> PolicyDecision;

    async fn register_policy(&self, policy: Policy) -> Result<PolicyId>;
    async fn update_policy(&self, policy_id: PolicyId, policy: Policy) -> Result<()>;
}

pub enum PolicyDecision {
    Allow,
    Deny { reason: String },
    AllowWithConditions { conditions: Vec<PolicyCondition> },
    RequireApproval { approver: String },
}
```

### Otimização de Performance

**Cache de Políticas:**
- Avaliação de políticas compiladas para performance
- Cache LRU para decisões frequentes
- Avaliação em lote para operações em massa
- Tempos de avaliação sub-milissegundo

**Atualizações Incrementais:**
- Atualizações de políticas em tempo real sem reinicialização
- Implantação de políticas versionadas
- Capacidades de rollback para erros de políticas

### Motor de Políticas Cedar (Feature `cedar`)

O Symbiont integra a [linguagem de políticas Cedar](https://www.cedarpolicy.com/) para autorização formal. O Cedar permite políticas de controle de acesso granulares e auditáveis que são avaliadas no gate de políticas do loop de raciocínio.

**Habilitado por padrão desde v1.14.x:** O Cedar faz parte do conjunto de features padrão do `symbi-runtime` e está incluído em todo binário publicado (crates.io, Docker, tarballs do GitHub Release). `symbi up` e `symbi run` auto-conectam o `CedarPolicyGate` a partir de arquivos `policies/*.cedar` no startup; quando ao menos um arquivo de política está presente, o gate é construído com `deny_by_default()` e cada arquivo `.cedar` é carregado como uma política nomeada. Quando nenhum arquivo de política está presente, o runtime recorre ao `DefaultPolicyGate::new()` fail-closed (que nega toda ação `ToolCall` e `Delegate`). Para desabilitar o Cedar completamente — em builds que fixam o `OpaPolicyGateBridge` ou um `ReasoningPolicyGate` personalizado — compile com `cargo build --no-default-features --features "keychain,vector-lancedb"`.

```bash
cargo build --features cedar
```

**Capacidades principais:**
- **Verificação formal**: Políticas Cedar podem ser analisadas estaticamente para correção
- **Autorização granular**: Controle de acesso baseado em entidades com permissões hierárquicas
- **Integração com loop de raciocínio**: `CedarPolicyGate` implementa a trait `ReasoningPolicyGate`, avaliando cada ação proposta contra políticas Cedar antes da execução
- **Trilha de auditoria**: Todas as decisões de políticas Cedar são registradas com contexto completo

```rust
use symbi_runtime::reasoning::cedar_gate::CedarPolicyGate;

// Criar um portão de políticas Cedar com postura deny-by-default
let cedar_gate = CedarPolicyGate::deny_by_default();
let runner = ReasoningLoopRunner::builder()
    .provider(provider)
    .executor(executor)
    .policy_gate(Arc::new(cedar_gate))
    .build();
```

### Padrão do Policy Gate do Loop de Raciocínio (após auditoria v1.13.0)

O loop de raciocínio em `symbi up` e `symbi run` é **fail-closed** por padrão. `DefaultPolicyGate::new()` retorna `LoopDecision::Deny` para cada ação `ToolCall` e `Delegate`, com o motivo `"No policy gate configured (DefaultPolicyGate::new is fail-closed; wire OpaPolicyGateBridge or pass --insecure-allow-all)"`. Ações `Respond` permanecem permitidas para que o agente ainda possa produzir saída de texto.

Essa mudança fecha a lacuna em que o binário de produção anteriormente fixava `DefaultPolicyGate::permissive()` em hard-code e silenciosamente permitia toda ação — veja `SECURITY_AUDIT.md` C2 para a trilha de auditoria.

Operadores têm dois caminhos:

1. **Conectar um backend de política real** (recomendado): construa `CedarPolicyGate`, `OpaPolicyGateBridge` ou sua própria implementação da trait `ReasoningPolicyGate` e passe-a para o runner.
2. **Optar por modo permissivo para desenvolvimento local**: passe `--insecure-allow-all` para `symbi up` / `symbi run`, ou defina `SYMBI_INSECURE_ALLOW_ALL=1`. Um banner de múltiplas linhas é impresso em stderr toda vez que o runtime inicia nesse modo, e `tracing::warn!` dispara em cada ação avaliada.

O construtor legado `permissive()` foi renomeado para `permissive_for_dev_only()` e marcado como `#[doc(hidden)]` para desencorajar uso incidental em caminhos de código de produção.

### Política de Comunicação Inter-Agente

O `CommunicationPolicyGate` aplica regras de autorização para toda a comunicação inter-agente. Cada chamada por `ask`, `delegate`, `send_to`, `parallel` ou `race` é avaliada contra as regras de política antes da execução.

**Estrutura das regras:**
- **Condições**: `SenderIs(agent)`, `RecipientIs(agent)`, `Always`, compostos `All`/`Any`
- **Efeitos**: `Allow` ou `Deny { reason }`
- **Prioridade**: Regras avaliadas da prioridade mais alta para a mais baixa; a primeira correspondência vence
- **Padrão**: Allow (compatível com versões anteriores — projetos existentes funcionam sem alteração)

**A negação de política é uma falha firme** — o agente chamador recebe um erro através do loop ORGA e pode raciocinar sobre ele. Todas as mensagens inter-agente são assinadas criptograficamente via Ed25519 e criptografadas com AES-256-GCM.

Exemplo de política: impedir que um agente worker delegue para outros agentes:
```cedar
forbid(
    principal == Agent::"worker",
    action == Action::"delegate",
    resource
);
```

---

## Segurança Criptográfica

### Assinaturas Digitais

Todas as operações relevantes para segurança são assinadas criptograficamente:

**Algoritmo de Assinatura:** Ed25519 (RFC 8032)
- **Tamanho da Chave:** Chaves privadas de 256 bits, chaves públicas de 256 bits
- **Tamanho da Assinatura:** 512 bits (64 bytes)
- **Performance:** 70.000+ assinaturas/segundo, 25.000+ verificações/segundo

```rust
pub struct MessageSignature {
    pub signature: Vec<u8>,
    pub algorithm: SignatureAlgorithm,
    pub public_key: Vec<u8>,
}

impl AuditEvent {
    pub fn sign(&mut self, private_key: &PrivateKey) -> Result<()> {
        let message = self.serialize_for_signing()?;
        self.signature = private_key.sign(&message);
        Ok(())
    }

    pub fn verify(&self, public_key: &PublicKey) -> bool {
        let message = self.serialize_for_signing().unwrap();
        public_key.verify(&message, &self.signature)
    }
}
```

### Gerenciamento de Chaves

**Armazenamento de Chaves:**
- Integração com Módulo de Segurança de Hardware (HSM)
- Suporte a enclave seguro para proteção de chaves
- Rotação de chaves com intervalos configuráveis
- Backup e recuperação de chaves distribuídos

**Hierarquia de Chaves:**
- Chaves de assinatura raiz para operações do sistema
- Chaves por agente para assinatura de operações
- Chaves efêmeras para criptografia de sessão
- Chaves externas para verificação de ferramentas

> **Recurso planejado** — A API `KeyManager` mostrada abaixo é parte do roteiro de segurança e ainda não está disponível na versão atual. A implementação atual fornece utilitários de chave via `KeyUtils` em `crypto.rs`.

```rust
pub struct KeyManager {
    hsm: HardwareSecurityModule,
    key_store: SecureKeyStore,
    rotation_policy: KeyRotationPolicy,
}

impl KeyManager {
    pub async fn generate_agent_keys(&self, agent_id: AgentId) -> Result<KeyPair>;
    pub async fn rotate_keys(&self, key_id: KeyId) -> Result<KeyPair>;
    pub async fn revoke_key(&self, key_id: KeyId) -> Result<()>;
}
```

### Padrões de Criptografia

**Criptografia Simétrica:** AES-256-GCM
- Chaves de 256 bits com criptografia autenticada
- Nonces únicos para cada operação de criptografia
- Dados associados para vinculação de contexto

**Criptografia Assimétrica:** X25519 + ChaCha20-Poly1305
- Troca de chaves de curva elíptica
- Cifra de fluxo com criptografia autenticada
- Sigilo perfeito para frente

**Criptografia de Mensagens:**
```rust
pub fn encrypt_message(
    plaintext: &[u8],
    recipient_public_key: &PublicKey,
    sender_private_key: &PrivateKey
) -> Result<EncryptedMessage> {
    let shared_secret = sender_private_key.diffie_hellman(recipient_public_key);
    let nonce = generate_random_nonce();
    let ciphertext = ChaCha20Poly1305::new(&shared_secret)
        .encrypt(&nonce, plaintext)?;

    Ok(EncryptedMessage {
        nonce,
        ciphertext,
        sender_public_key: sender_private_key.public_key(),
    })
}
```

---

## Auditoria e Conformidade

### Trilha de Auditoria Criptográfica

Cada operação relevante para segurança gera um evento de auditoria imutável:

```rust
pub struct AuditEvent {
    pub event_id: Uuid,
    pub timestamp: SystemTime,
    pub agent_id: AgentId,
    pub event_type: AuditEventType,
    pub details: serde_json::Value,
    pub signature: Ed25519Signature,
    pub previous_hash: Hash,
    pub event_hash: Hash,
}
```

**Tipos de Eventos de Auditoria:**
- Eventos do ciclo de vida do agente (criação, término)
- Decisões de avaliação de políticas
- Alocação e uso de recursos
- Envio e roteamento de mensagens
- Invocações de ferramentas externas
- Violações de segurança e alertas

### Encadeamento de Hash

Eventos são vinculados em uma cadeia imutável:

```rust
impl AuditChain {
    pub fn append_event(&mut self, mut event: AuditEvent) -> Result<()> {
        event.previous_hash = self.last_hash;
        event.event_hash = self.calculate_event_hash(&event);
        event.sign(&self.signing_key)?;

        self.events.push(event.clone());
        self.last_hash = event.event_hash;

        self.verify_chain_integrity()?;
        Ok(())
    }

    pub fn verify_integrity(&self) -> Result<bool> {
        for (i, event) in self.events.iter().enumerate() {
            // Verify signature
            if !event.verify(&self.public_key) {
                return Ok(false);
            }

            // Verify hash chain
            if i > 0 && event.previous_hash != self.events[i-1].event_hash {
                return Ok(false);
            }
        }
        Ok(true)
    }
}
```

### Recursos de Conformidade

**Suporte Regulatório:**

**HIPAA (Saúde):**
- Registro de acesso a PHI com identificação do usuário
- Aplicação de minimização de dados
- Detecção e notificação de violações
- Retenção de trilha de auditoria por 6 anos

**GDPR (Privacidade):**
- Logs de processamento de dados pessoais
- Rastreamento de verificação de consentimento
- Aplicação de direitos do titular dos dados
- Conformidade com política de retenção de dados

**SOX (Financeiro):**
- Documentação de controles internos
- Rastreamento de gerenciamento de mudanças
- Verificação de controles de acesso
- Proteção de dados financeiros

**Conformidade Personalizada:**

> **Recurso planejado** — A API `ComplianceFramework` mostrada abaixo é parte do roteiro de segurança e ainda não está disponível na versão atual.

```rust
pub struct ComplianceFramework {
    pub name: String,
    pub audit_requirements: Vec<AuditRequirement>,
    pub retention_policy: RetentionPolicy,
    pub access_controls: Vec<AccessControl>,
    pub data_protection: DataProtectionRules,
}

impl ComplianceFramework {
    pub fn validate_compliance(&self, audit_trail: &AuditChain) -> ComplianceReport;
    pub fn generate_compliance_report(&self, period: TimePeriod) -> Report;
}
```

---

## Relay de Aprovação Humana (`symbi-approval-relay`)

Quando uma decisão de política retorna `require: approval`, a ação é bloqueada até que um revisor humano a aprove ou negue. `symbi-approval-relay` é o crate que leva essas solicitações a um humano e traz a decisão de volta, mantendo ambos os trechos auditáveis.

### Design de canal duplo

O relay é **de canal duplo** por design: cada aprovação percorre dois caminhos independentes e ambos precisam concordar antes que o runtime desbloqueie a ação.

- **Canal primário** — uma superfície interativa para o revisor (adaptador de chat, interface web, prompt de CLI). É onde o revisor lê a solicitação e decide.
- **Canal de atestado** — um caminho de verificação independente (por exemplo, um callback assinado, um segundo operador ou uma confirmação fora de banda). O runtime não desbloqueará apenas com uma aprovação do canal primário.

Essa estrutura derrota o caso de comprometimento de canal único — um atacante que toma o canal primário ainda não consegue conceder aprovações, porque o canal de atestado não compartilha confiança com ele.

### O que o relay transporta

Cada solicitação de aprovação em trânsito carrega:
- A identidade do agente (ancorada por AgentPin) e a decisão de política que disparou a solicitação
- O contexto completo da ação — invocação de ferramenta, recurso, argumentos — com hash para que os revisores possam confirmar que aprovaram *esta* ação e não uma substituída
- Um prazo após o qual a solicitação é automaticamente negada
- IDs de correlação para que a trilha de auditoria vincule as decisões dos dois canais de volta a uma única ação

Aprovações e negações são registradas na mesma cadeia de auditoria criptograficamente resistente a adulteração que qualquer outra decisão do runtime. Um humano dizendo "sim" é uma decisão no log, não um desvio dele.

### Onde é usado

- Políticas Cedar que emitem veredictos `RequireApproval { approver: "..." }`
- Chamadas de ferramentas destrutivas ou de alto privilégio mediadas por hooks `approval` do ToolClad
- Tarefas agendadas configuradas com `one_shot = true` mais uma política de aprovação
- Qualquer bloco `policy` de DSL que nomeie `require: <role>_approval`

Se nenhum relay estiver configurado, ações mediadas por aprovação falham de forma fechada — são negadas, não permitidas silenciosamente.

---

## Segurança de Ferramentas com SchemaPin

### Processo de Verificação de Ferramentas

Ferramentas externas são verificadas usando assinaturas criptográficas:

```mermaid
sequenceDiagram
    participant Tool as Tool Provider
    participant SP as SchemaPin
    participant AI as AI Reviewer
    participant Runtime as Symbiont Runtime
    participant Agent as Agent

    Tool->>SP: Submit Tool Schema
    SP->>AI: Security Analysis
    AI-->>SP: Analysis Results
    SP->>SP: Human Review (if needed)
    SP->>SP: Sign Schema
    SP-->>Tool: Signed Schema

    Agent->>Runtime: Request Tool Use
    Runtime->>SP: Verify Tool Schema
    SP-->>Runtime: Verification Result
    Runtime-->>Agent: Allow/Deny Tool Use
```

### Confiança no Primeiro Uso (TOFU)

**Processo de Fixação de Chaves:**
1. Primeiro encontro com um provedor de ferramentas
2. Verificar a chave pública do provedor através de canais externos
3. Fixar a chave pública no armazenamento de confiança local
4. Usar a chave fixada para todas as verificações futuras

> **Recurso planejado** — A API `TOFUKeyStore` mostrada abaixo é parte do roteiro de segurança e ainda não está disponível na versão atual.

```rust
pub struct TOFUKeyStore {
    pinned_keys: HashMap<ProviderId, PinnedKey>,
    trust_policies: Vec<TrustPolicy>,
}

impl TOFUKeyStore {
    pub async fn pin_key(&mut self, provider: ProviderId, key: PublicKey) -> Result<()> {
        if self.pinned_keys.contains_key(&provider) {
            return Err("Key already pinned for provider");
        }

        self.pinned_keys.insert(provider, PinnedKey {
            public_key: key,
            pinned_at: SystemTime::now(),
            trust_level: TrustLevel::Unverified,
        });

        Ok(())
    }

    pub fn verify_tool(&self, tool: &MCPTool) -> VerificationResult {
        if let Some(pinned_key) = self.pinned_keys.get(&tool.provider_id) {
            if pinned_key.public_key.verify(&tool.schema_hash, &tool.signature) {
                VerificationResult::Trusted
            } else {
                VerificationResult::SignatureInvalid
            }
        } else {
            VerificationResult::UnknownProvider
        }
    }
}
```

### Revisão de Ferramentas Orientada por IA

Análise de segurança automatizada antes da aprovação de ferramentas:

**Componentes de Análise:**
- **Detecção de Vulnerabilidades**: Correspondência de padrões contra assinaturas de vulnerabilidades conhecidas
- **Detecção de Código Malicioso**: Identificação de comportamento malicioso baseada em ML
- **Análise de Uso de Recursos**: Avaliação de requisitos de recursos computacionais
- **Avaliação de Impacto na Privacidade**: Manuseio de dados e implicações de privacidade

> **Recurso planejado** — A API `SecurityAnalyzer` mostrada abaixo é parte do roteiro de segurança e ainda não está disponível na versão atual.

```rust
pub struct SecurityAnalyzer {
    vulnerability_patterns: VulnerabilityDatabase,
    ml_detector: MaliciousCodeDetector,
    resource_analyzer: ResourceAnalyzer,
    privacy_assessor: PrivacyAssessor,
}

impl SecurityAnalyzer {
    pub async fn analyze_tool(&self, tool: &MCPTool) -> SecurityAnalysis {
        let mut findings = Vec::new();

        // Vulnerability pattern matching
        findings.extend(self.vulnerability_patterns.scan(&tool.schema));

        // ML-based detection
        let ml_result = self.ml_detector.analyze(&tool.schema).await?;
        findings.extend(ml_result.findings);

        // Resource usage analysis
        let resource_risk = self.resource_analyzer.assess(&tool.schema);

        // Privacy impact assessment
        let privacy_impact = self.privacy_assessor.evaluate(&tool.schema);

        SecurityAnalysis {
            tool_id: tool.id.clone(),
            risk_score: calculate_risk_score(&findings),
            findings,
            resource_requirements: resource_risk,
            privacy_impact,
            recommendation: self.generate_recommendation(&findings),
        }
    }
}
```

---

## Scanner de Skills ClawHavoc

O scanner ClawHavoc fornece defesa em nível de conteúdo para skills de agentes. Cada arquivo de skill é varrido linha por linha antes do carregamento, e descobertas com severidade Crítica ou Alta bloqueiam a execução da skill.

### Modelo de Severidade

| Nível | Ação | Descrição |
|-------|------|-----------|
| **Crítica** | Falhar varredura | Padrões de exploração ativa (reverse shells, injeção de código) |
| **Alta** | Falhar varredura | Roubo de credenciais, escalação de privilégio, injeção de processo |
| **Média** | Avisar | Suspeito mas potencialmente legítimo (downloaders, symlinks) |
| **Aviso** | Avisar | Indicadores de baixo risco (referências a arquivos env, chmod) |
| **Info** | Registrar | Descobertas informativas |

### Categorias de Detecção (40 Regras)

**Regras de Defesa Originais (10)**
- `pipe-to-shell`, `wget-pipe-to-shell` — Execução remota de código via downloads canalizados
- `eval-with-fetch`, `fetch-with-eval` — Injeção de código via eval + rede
- `base64-decode-exec` — Execução ofuscada via decodificação base64
- `soul-md-modification`, `memory-md-modification` — Adulteração de identidade
- `rm-rf-pattern` — Operações destrutivas no sistema de arquivos
- `env-file-reference`, `chmod-777` — Acesso a arquivos sensíveis, permissões world-writable

**Reverse Shells (7)** — Severidade Crítica
- `reverse-shell-bash`, `reverse-shell-nc`, `reverse-shell-ncat`, `reverse-shell-mkfifo`, `reverse-shell-python`, `reverse-shell-perl`, `reverse-shell-ruby`

**Coleta de Credenciais (6)** — Severidade Alta
- `credential-ssh-keys`, `credential-aws`, `credential-cloud-config`, `credential-browser-cookies`, `credential-keychain`, `credential-etc-shadow`

**Exfiltração de Rede (3)** — Severidade Alta
- `exfil-dns-tunnel`, `exfil-dev-tcp`, `exfil-nc-outbound`

**Injeção de Processo (4)** — Severidade Crítica
- `injection-ptrace`, `injection-ld-preload`, `injection-proc-mem`, `injection-gdb-attach`

**Escalação de Privilégio (5)** — Severidade Alta
- `privesc-sudo`, `privesc-setuid`, `privesc-setcap`, `privesc-chown-root`, `privesc-nsenter`

**Symlink / Travessia de Caminho (2)** — Severidade Média
- `symlink-escape`, `path-traversal-deep`

**Cadeias de Download (3)** — Severidade Média
- `downloader-curl-save`, `downloader-wget-save`, `downloader-chmod-exec`

### Whitelist de Executáveis

O tipo de regra `AllowedExecutablesOnly` restringe quais executáveis uma skill de agente pode invocar:

```rust
// Apenas permitir estes executáveis — todo o resto é bloqueado
ScanRule::AllowedExecutablesOnly(vec![
    "python3".into(),
    "node".into(),
    "cargo".into(),
])
```

### Regras Personalizadas

Padrões específicos de domínio podem ser adicionados junto com os padrões ClawHavoc:

```rust
let mut scanner = SkillScanner::new();
scanner.add_custom_rule(
    "block-internal-api",
    r"internal\.corp\.example\.com",
    ScanSeverity::High,
    "References to internal API endpoints are not allowed in skills",
);
```

---

## Sanitização de Caracteres Invisíveis (`symbi-invis-strip`)

`symbi-invis-strip` é um crate utilitário sem dependências usado em todo o runtime para remover caracteres que são renderizados como nada mas alteram o significado — o payload clássico para ataques de prompt injection e evasão de políticas.

### O que ele remove

- ASCII C0 (0x00–0x1F) e DEL (0x7F), exceto `\t` `\n` `\r`
- ASCII C1 (0x80–0x9F)
- Caracteres de largura zero (ZWSP, ZWNJ, ZWJ)
- Sobrescritas bidirecionais (LRO, RLO, PDF, LRE, RLE, LRI, RLI, FSI, PDI)
- Word joiner e o bloco de operadores invisíveis
- Marcas de ordem de bytes (BOM)
- Seletores de variação (VS1–VS16 e suplementares VS17–VS256)
- Caracteres no bloco Unicode Tag (U+E0000–U+E007F)

### Onde é executado

- Payloads de chat e webhooks de entrada — antes de chegarem ao orquestrador
- Argumentos de chamadas de ferramentas — antes de chegarem à avaliação Cedar
- Conteúdo DSL de skills e agentes — antes do scanner e do parser

### Remoção opcional de marcação

A variante opt-in `sanitize_field_with_markup` remove adicionalmente:
- Comentários HTML `<!-- ... -->`
- Blocos de código delimitados por crases triplas

A remoção de marcação é apropriada para superfícies onde marcação oculta pelo renderizador não tem uso legítimo — por exemplo, campos curtos de justificativa de política ou metadados apenas para exibição. Ela **não** é aplicada a campos que legitimamente carregam markdown ou código (como fontes de agentes, corpos de políticas ou saídas de ferramentas).

---

## Linter de Políticas Cedar

`scripts/lint-cedar-policies.py` é um passe de análise estática que roda em cada arquivo `.cedar` no repositório. Ele captura uma classe de ataque na qual um fluxo de autoria malicioso (ou comprometido) escreve uma política que *parece* correta mas contém caracteres que produzem uma decisão de autorização diferente da que o revisor espera.

### O que ele captura

- **Identificadores homóglifos** — `а` cirílico (U+0430) se passando por `a` latino, `ο` grego (U+03BF) como `o` latino e outros sósias em nomes de principal/action/resource.
- **Caracteres de controle invisíveis** dentro de identificadores, literais de string ou entre tokens.

### Onde é executado

- **Hook de pre-commit** — bloqueia commits que introduzam qualquer uma das classes de problemas.
- **CI** — a mesma checagem é um job de teste obrigatório, de modo que commits que contornam o hook (via `--no-verify`) ainda falham no CI.

Combinado com `symbi-invis-strip` no caminho de dados, o linter fecha o vetor do caminho de autoria: truques invisíveis não podem entrar no repositório, e quaisquer que escapem em tempo de execução são removidos antes da avaliação de políticas.

---

## Segurança de Rede

### Comunicação Segura

**Segurança de Camada de Transporte:**
- TLS 1.3 para todas as comunicações externas
- TLS mútuo (mTLS) para comunicação serviço-a-serviço
- Fixação de certificados para serviços conhecidos
- Sigilo perfeito para frente

**Segurança em Nível de Mensagem:**
- Criptografia ponta-a-ponta para mensagens de agentes
- Códigos de autenticação de mensagem (MAC)
- Prevenção de ataques de replay com timestamps
- Garantias de ordenação de mensagens

```rust
pub struct SecureChannel {
    encryption_key: [u8; 32],
    mac_key: [u8; 32],
    send_counter: AtomicU64,
    recv_counter: AtomicU64,
}

impl SecureChannel {
    pub fn encrypt_message(&self, plaintext: &[u8]) -> Result<Vec<u8>> {
        let counter = self.send_counter.fetch_add(1, Ordering::SeqCst);
        let nonce = self.generate_nonce(counter);

        let ciphertext = ChaCha20Poly1305::new(&self.encryption_key)
            .encrypt(&nonce, plaintext)?;

        let mac = Hmac::<Sha256>::new_from_slice(&self.mac_key)?
            .chain_update(&ciphertext)
            .chain_update(&counter.to_le_bytes())
            .finalize()
            .into_bytes();

        Ok([ciphertext, mac.to_vec()].concat())
    }
}
```

### Isolamento de Rede

**Controle de Rede do Sandbox:**
- Sem acesso à rede por padrão
- Lista de permissões explícita para conexões externas
- Monitoramento de tráfego e detecção de anomalias
- Filtragem e validação de DNS

**Políticas de Rede:**
```yaml
network_policy:
  default_action: "deny"
  allowed_destinations:
    - domain: "api.openai.com"
      ports: [443]
      protocol: "https"
    - ip_range: "10.0.0.0/8"
      ports: [6333]  # Qdrant (only needed if using optional Qdrant backend)
      protocol: "http"

  monitoring:
    log_all_connections: true
    detect_anomalies: true
    rate_limiting: true
```

---

## Resposta a Incidentes

### Detecção de Eventos de Segurança

**Detecção Automatizada:**
- Monitoramento de violações de políticas
- Detecção de comportamento anômalo
- Anomalias de uso de recursos
- Rastreamento de autenticação falhada

**Classificação de Alertas:**
```rust
pub enum ViolationSeverity {
    Info,       // Normal security events
    Warning,    // Minor policy violations
    Error,      // Confirmed security issues
    Critical,   // Active security breaches
}

pub struct SecurityEvent {
    pub id: Uuid,
    pub timestamp: SystemTime,
    pub severity: ViolationSeverity,
    pub category: SecurityEventCategory,
    pub description: String,
    pub affected_components: Vec<ComponentId>,
    pub recommended_actions: Vec<String>,
}
```

### Fluxo de Trabalho de Resposta a Incidentes

```mermaid
graph TB
    A[Security Event] --> B[Event Classification]
    B --> C{Severity Level}

    C -->|Info/Low| D[Log Event]
    C -->|Medium| E[Alert Security Team]
    C -->|High| F[Automatic Mitigation]
    C -->|Critical| G[Emergency Response]

    F --> H[Isolate Affected Components]
    F --> I[Revoke Compromised Credentials]
    F --> J[Preserve Evidence]

    G --> H
    G --> K[Notify Leadership]
    G --> L[External Incident Response]
```

### Procedimentos de Recuperação

**Recuperação Automatizada:**
- Reinicialização de agente com estado limpo
- Rotação de chaves para credenciais comprometidas
- Atualizações de políticas para prevenir recorrência
- Verificação de saúde do sistema

**Recuperação Manual:**
- Análise forense de eventos de segurança
- Análise de causa raiz e remediação
- Atualizações de controles de segurança
- Documentação de incidentes e lições aprendidas

---

## Melhores Práticas de Segurança

### Diretrizes de Desenvolvimento

1. **Seguro por Padrão**: Todos os recursos de segurança habilitados por padrão
2. **Princípio do Menor Privilégio**: Permissões mínimas para todas as operações
3. **Defesa em Profundidade**: Múltiplas camadas de segurança com redundância
4. **Falhar com Segurança**: Falhas de segurança devem negar acesso, não conceder
5. **Auditar Tudo**: Registro completo de operações relevantes para segurança

### Segurança de Implantação

**Endurecimento do Ambiente:**
```bash
# Disable unnecessary services
systemctl disable cups bluetooth

# Kernel hardening
echo "kernel.dmesg_restrict=1" >> /etc/sysctl.conf
echo "kernel.kptr_restrict=2" >> /etc/sysctl.conf

# File system security
mount -o remount,nodev,nosuid,noexec /tmp
```

**Segurança de Contêineres:**
```dockerfile
# Use minimal base image
FROM scratch
COPY --from=builder /app/symbiont /bin/symbiont

# Run as non-root user
USER 1000:1000

# Set security options
LABEL security.no-new-privileges=true
```

### Segurança Operacional

**Lista de Verificação de Monitoramento:**
- [ ] Monitoramento de eventos de segurança em tempo real
- [ ] Rastreamento de violações de políticas
- [ ] Detecção de anomalias de uso de recursos
- [ ] Monitoramento de autenticação falhada
- [ ] Rastreamento de expiração de certificados

**Procedimentos de Manutenção:**
- Atualizações e patches de segurança regulares
- Rotação de chaves programada
- Revisão e atualizações de políticas
- Auditoria de segurança e testes de penetração
- Testes do plano de resposta a incidentes

---

## Configuração de Segurança

### Variáveis de Ambiente

```bash
# Cryptographic settings
export SYMBIONT_CRYPTO_PROVIDER=ring
export SYMBIONT_KEY_STORE_TYPE=hsm
export SYMBIONT_HSM_CONFIG_PATH=/etc/symbiont/hsm.conf

# Audit settings
export SYMBIONT_AUDIT_ENABLED=true
export SYMBIONT_AUDIT_STORAGE=/var/audit/symbiont
export SYMBIONT_AUDIT_RETENTION_DAYS=2555  # 7 years

# Security policies
export SYMBIONT_POLICY_ENFORCEMENT=strict
export SYMBIONT_DEFAULT_SANDBOX_TIER=gvisor
export SYMBIONT_TOFU_ENABLED=true
```

### Arquivo de Configuração de Segurança

```toml
[security]
# Cryptographic settings
crypto_provider = "ring"
signature_algorithm = "ed25519"
encryption_algorithm = "chacha20_poly1305"

# Key management
key_rotation_interval_days = 90
hsm_enabled = true
hsm_config_path = "/etc/symbiont/hsm.conf"

# Audit settings
audit_enabled = true
audit_storage_path = "/var/audit/symbiont"
audit_retention_days = 2555
audit_compression = true

# Sandbox security
default_sandbox_tier = "gvisor"
sandbox_escape_detection = true
resource_limit_enforcement = "strict"

# Network security
tls_min_version = "1.3"
certificate_pinning = true
network_isolation = true

# Policy enforcement
policy_enforcement_mode = "strict"
policy_violation_action = "deny_and_alert"
emergency_override_enabled = false

[tofu]
enabled = true
key_verification_required = true
trust_on_first_use_timeout_hours = 24
automatic_key_pinning = false
```

---

## Métricas de Segurança

### Indicadores-Chave de Performance

**Operações de Segurança:**
- Latência de avaliação de políticas: média <1ms
- Taxa de geração de eventos de auditoria: 10.000+ eventos/segundo
- Tempo de resposta a incidentes de segurança: <5 minutos
- Throughput de operações criptográficas: 70.000+ ops/segundo

**Métricas de Conformidade:**
- Taxa de conformidade de políticas: >99,9%
- Integridade da trilha de auditoria: 100%
- Taxa de falsos positivos de eventos de segurança: <1%
- Tempo de resolução de incidentes: <24 horas

**Avaliação de Risco:**
- Tempo de aplicação de patches de vulnerabilidades: <48 horas
- Efetividade dos controles de segurança: >95%
- Precisão de detecção de ameaças: >99%
- Objetivo de tempo de recuperação: <1 hora

---

## Melhorias Futuras

### Criptografia Avançada

**Criptografia Pós-Quântica:**
- Algoritmos pós-quânticos aprovados pelo NIST
- Esquemas híbridos clássico/pós-quântico
- Planejamento de migração para ameaças quânticas

**Criptografia Homomórfica:**
- Computação que preserva privacidade em dados criptografados
- Esquema CKKS para aritmética aproximada
- Integração com fluxos de trabalho de aprendizado de máquina

**Provas de Conhecimento Zero:**
- zk-SNARKs para verificação de computação
- Autenticação que preserva privacidade
- Geração de provas de conformidade

### Segurança Aprimorada por IA

**Análise de Comportamento:**
- Aprendizado de máquina para detecção de anomalias
- Análise de segurança preditiva
- Resposta adaptativa a ameaças

**Resposta Automatizada:**
- Controles de segurança auto-curativos
- Geração dinâmica de políticas
- Classificação inteligente de incidentes

---

## Próximos Passos

- **[Contribuir](/contributing)** - Diretrizes de desenvolvimento de segurança
- **[Arquitetura de Runtime](/runtime-architecture)** - Detalhes de implementação técnica
- **[Referência da API](/api-reference)** - Documentação da API de segurança

O modelo de segurança do Symbiont fornece proteção de nível empresarial adequada para indústrias regulamentadas e ambientes de alta garantia. Sua abordagem em camadas garante proteção robusta contra ameaças em evolução, mantendo a eficiência operacional.