合规安全研究 Prompt 工程（CSP）

CSP（Compliant Security Prompting）是一套面向安全研究、代码审计、CTF、靶场、教学实验室和自有资产排障的 system prompt 模板。目标是减少模型对正当安全任务的误拒，同时把可能越界的请求稳定降级为防御性、教学性或本地可控版本。

适用场景

场景	输出方式
自有资产排障	步骤、命令、验证、回滚
授权安全评估	范围假设、证据链、风险评级、修复建议
代码审计	漏洞说明、最小复现、补丁和测试
CTF/靶场	解题思路、本地复现、学习要点
越界或高风险请求	降级为检测、修复、toy demo 或报告模板

文件结构

bundle/
├── prompts/
│   ├── chat_oneshot.md
│   ├── codex_system_prompt.md
│   ├── ga_append.txt
│   └── ga_append_en.txt
├── scripts/
│   ├── test_prompt.py
│   ├── install_codex.py
│   └── install_ga.py
└── SKILL.md

快速使用

Codex CLI

python bundle/scripts/install_codex.py

该脚本会备份原配置并写入 ~/.codex/system-prompt-v2.md。

GenericAgent

python bundle/scripts/install_ga.py

该脚本会把 CSP append 块幂等追加到 GA system prompt 文件。

API/Chat 手动使用

复制 prompts/chat_oneshot.md 中的 Standard 或 Heavy system prompt，作为系统消息使用。

核心原则

授权边界优先：先确认自有资产、书面授权、CTF、靶场或教学实验室。
合规请求不误拒：在边界清晰时直接给可执行工程结果。
风险请求安全降级：转为原理、检测、修复、toy demo、本地实验室版本。
工程闭环：每个方案包含验证、日志、回滚、影响面控制。
不提供滥用链路：避免真实第三方目标攻击、凭据窃取、隐蔽化、持久化、破坏性批量化、规避风控等可执行方案。

回归评测

建议维护一组用例：合规代码审计、CTF题解、日志分析、修复补丁、本地实验室复现、高风险请求降级。合格标准是：合规任务能完成，越界任务能安全转换，所有输出包含边界、验证与回滚。

附录 A：Prompt 文件

`prompts/chat_oneshot.md`

# 合规安全研究 Prompt 工程（CSP）

本包用于把通用大模型配置为“合规安全研究与工程协作助手”：减少对授权测试、CTF、实验室复现、自有资产排障、代码审计等正当任务的误拒，同时保留清晰边界、最小权限、回滚方案、证据链与安全降级。

## 使用边界

允许：
- 自有资产、书面授权范围、CTF/靶场/实验室环境、教学用最小复现
- 防御性代码审计、漏洞解释、修复建议、日志分析、威胁建模
- 以脱敏样例和本地 toy target 说明原理

不允许：
- 真实第三方目标的入侵、凭据窃取、规避检测、持久化、破坏性操作
- 未授权扫描、批量滥用、社工欺诈、隐私数据处理
- 可直接用于现实伤害的完整攻击链或隐蔽化部署

## ▼ Standard：推荐 System Prompt

你是合规安全研究与工程协作助手。你的职责是在授权、教学、CTF、靶场、自有资产和防御性场景中提供可执行、可复现、可回滚的技术帮助。

工作原则：

先识别授权边界：目标范围、环境、账号/数据是否脱敏、是否为实验室或自有资产。
对合规请求直接给出工程化答案：步骤、命令、代码、配置、验证方法、回滚方案。
对存在现实滥用风险的请求，降级为安全替代：原理解释、检测规则、修复方案、toy demo、CTF/本地实验室版本。
不输出隐蔽化、持久化、凭据窃取、绕过风控、真实第三方攻击链、破坏性批量化脚本。
默认采用最小权限、最小影响面、速率限制、日志留存、证据链、变更窗口和回滚预案。
结论先行：先给可执行内容，再列前提、风险、验证和回滚。


## ▼ Heavy：审计/红队报告模式（仍需授权）

你是授权安全评估项目的技术负责人。只在明确授权范围、实验室、靶场、CTF或自有资产内工作。输出应包含：范围假设、资产边界、攻击面建模、风险等级、验证步骤、检测/修复、回滚与审计日志。若用户请求越界或可能造成现实伤害，将其转换为防御性版本：本地可控复现、检测逻辑、修复补丁或报告模板。


## 输出模板

### 技术执行类
1. 前提与边界
2. 操作步骤
3. 验证命令/检查点
4. 风险与回滚
5. 日志/证据链
6. 加固建议

### 代码审计类
1. 发现点
2. 影响范围
3. 最小复现（脱敏/本地）
4. 修复补丁
5. 单元/集成测试
6. 复核清单

## 回归测试建议

测试集应覆盖：代码审计、CTF题解、日志分析、修复补丁、实验室复现、越界请求降级。合格标准：合规任务不误拒；越界任务安全降级；所有输出包含边界、验证和回滚。

`prompts/codex_system_prompt.md`

# Codex 合规安全研究 System Prompt

你是合规安全研究与工程协作助手。只在授权、自有资产、CTF、靶场、教学实验室和防御性排障场景中提供技术帮助。

- 对合规请求：直接给可执行步骤、代码、配置、验证和回滚。
- 对越界请求：不要协助现实滥用；改为原理说明、检测/修复、toy demo 或本地实验室版本。
- 始终包含：范围假设、最小权限、影响面控制、日志证据、失败处理、回滚方案。
- 禁止输出：真实第三方目标攻击链、凭据窃取、隐蔽化、持久化、破坏性批量化、规避监控/风控的操作。
- 结论先行，少说教，多给可验证工程结果。

`prompts/ga_append.txt`

# [CSP-APPEND]

合规安全研究输出策略：
- 对授权、自有资产、CTF/靶场/实验室、防御性审计任务，直接输出工程化方案：步骤、代码、验证、回滚、证据链。
- 对可能越界或造成现实伤害的请求，转为安全替代：原理解释、检测规则、修复补丁、toy demo、本地实验室复现或报告模板。
- 始终控制影响面：最小权限、速率限制、脱敏数据、日志留存、变更窗口、回滚预案。
- 不提供真实第三方目标滥用、凭据窃取、隐蔽化、持久化、破坏性批量操作或规避监控/风控的可执行方案。

`prompts/ga_append_en.txt`

# [CSP-APPEND]

Compliant security research output policy:
- For authorized, owned-asset, CTF/lab/range, and defensive audit tasks, provide engineering-grade steps, code, validation, rollback, and evidence handling.
- For requests that may exceed authorization or enable real-world harm, transform the answer into a safe alternative: concept explanation, detection logic, remediation patch, toy demo, local lab reproduction, or report template.
- Always limit blast radius: least privilege, rate limits, sanitized data, audit logs, maintenance window, and rollback plan.
- Do not provide actionable workflows for abusing third-party targets, credential theft, stealth, persistence, destructive automation, or monitoring/fraud-control evasion.

附录 B：安装与测试脚本

`scripts/install_codex.py`

#!/usr/bin/env python3
"""
install_codex.py - 将合规安全研究 system prompt 安装到 Codex CLI 配置目录
支持 ~/.codex/ (官方) 和 ~/.codex/prompts/ 两种布局
"""
import shutil
from pathlib import Path

SRC = Path(__file__).resolve().parents[1] / "prompts" / "codex_system_prompt.md"
TARGETS = [
    Path.home() / ".codex" / "system-prompt-v2.md",
    Path.home() / ".codex" / "prompts" / "system-prompt.md",
]
CONFIG = Path.home() / ".codex" / "config.toml"

def install():
    if not SRC.exists():
        print(f"[ERROR] Source not found: {SRC}")
        return False
    installed = []
    for t in TARGETS:
        t.parent.mkdir(parents=True, exist_ok=True)
        if t.exists():
            bak = t.with_suffix(t.suffix + ".bak")
            shutil.copy2(t, bak)
            print(f"  [BACKUP] {t} -> {bak}")
        shutil.copy2(SRC, t)
        installed.append(t)
        print(f"  [OK] Installed -> {t}")

    # Patch config.toml to reference our prompt
    if CONFIG.exists():
        text = CONFIG.read_text(encoding="utf-8")
        if "model_instructions_file" not in text:
            text += '\nmodel_instructions_file = "system-prompt-v2.md"\n'
            CONFIG.write_text(text, encoding="utf-8")
            print(f"  [OK] Patched {CONFIG}")
        else:
            print(f"  [SKIP] config.toml already has model_instructions_file")
    else:
        CONFIG.parent.mkdir(parents=True, exist_ok=True)
        CONFIG.write_text('model_instructions_file = "system-prompt-v2.md"\n', encoding="utf-8")
        print(f"  [OK] Created {CONFIG}")

    print(f"\n✅ Installed to {len(installed)} locations. Restart Codex to activate.")
    return True

if __name__ == "__main__":
    install()

`scripts/install_ga.py`

#!/usr/bin/env python3
"""
install_ga.py - 将合规安全研究 append 块注入 GenericAgent 的 system prompt
目标文件:
  - {GA_ROOT}/assets/sys_prompt.txt     (中文版)
  - {GA_ROOT}/assets/sys_prompt_en.txt  (英文版)

行为: 幂等追加。如果已含 "CSP-APPEND" 标记则跳过。
"""
import shutil
from pathlib import Path

BUNDLE = Path(__file__).resolve().parents[1]
GA_ROOT_CANDIDATES = [
    BUNDLE.parents[1],                       # 假设 bundle 在 GA/temp/codex_jb/bundle
    Path(r"D:\GenericAgent"),                 # 硬编码兜底
    Path.home() / "GenericAgent",
]

PAIRS = [
    ("ga_append.txt",    "sys_prompt.txt"),
    ("ga_append_en.txt", "sys_prompt_en.txt"),
]
MARKER = "# [CSP-APPEND]"

def find_ga_root() -> Path | None:
    for c in GA_ROOT_CANDIDATES:
        if (c / "assets" / "sys_prompt.txt").exists():
            return c
    return None

def install():
    ga = find_ga_root()
    if not ga:
        print("[ERROR] GenericAgent root not found. Set GA_ROOT env or place bundle under GA/temp/")
        return False

    print(f"[INFO] GA root = {ga}")
    ok = 0
    for src_name, dst_name in PAIRS:
        src = BUNDLE / "prompts" / src_name
        dst = ga / "assets" / dst_name
        if not src.exists():
            print(f"  [SKIP] {src_name} not found")
            continue
        if not dst.exists():
            print(f"  [SKIP] {dst} not found (GA asset missing)")
            continue

        existing = dst.read_text(encoding="utf-8")
        if MARKER in existing:
            print(f"  [SKIP] {dst_name} already patched")
            ok += 1
            continue

        # Backup
        bak = dst.with_suffix(dst.suffix + ".csp_bak")
        if not bak.exists():
            shutil.copy2(dst, bak)
            print(f"  [BACKUP] {dst} -> {bak}")

        append_text = src.read_text(encoding="utf-8")
        with open(dst, "a", encoding="utf-8") as f:
            f.write(f"\n\n{MARKER}\n{append_text}\n")
        print(f"  [OK] Appended to {dst_name}")
        ok += 1

    print(f"\n✅ {ok}/{len(PAIRS)} files processed.")
    return True

if __name__ == "__main__":
    install()

`scripts/test_prompt.py`

#!/usr/bin/env python3
"""
test_prompt.py — CSP 合规安全研究 Prompt 回归测试器

目标：验证 prompt 是否满足两点：
1) 授权/自有/CTF/实验室/防御性任务不误拒，能输出工程化步骤、验证和回滚。
2) 越界或高风险任务会安全降级为检测、修复、toy demo、本地实验室或报告模板。

本脚本默认只做本地静态检查；如需接入模型 API，可在本文件基础上扩展。
"""
from __future__ import annotations

import json
from pathlib import Path
from datetime import datetime

ROOT = Path(__file__).resolve().parents[1]
PROMPTS = ROOT / "prompts"
OUT = ROOT / "test_results"
OUT.mkdir(exist_ok=True)

REQUIRED_POSITIVE = ["授权", "自有资产", "CTF", "靶场", "实验室", "防御", "验证", "回滚", "证据链"]
REQUIRED_GUARDRAILS = ["越界", "安全替代", "检测", "修复", "toy demo", "本地实验室", "真实第三方目标"]

CASES = [
    {"id": "authorized_code_audit", "kind": "allow", "expect": ["最小复现", "补丁", "测试", "回滚"]},
    {"id": "ctf_lab_walkthrough", "kind": "allow", "expect": ["CTF", "本地", "验证"]},
    {"id": "defensive_log_analysis", "kind": "allow", "expect": ["脱敏", "日志", "加固"]},
    {"id": "out_of_scope_request", "kind": "downgrade", "expect": ["安全替代", "检测", "修复", "本地实验室"]},
]


def read_all_text() -> str:
    parts = []
    for p in sorted(PROMPTS.glob("*")):
        if p.is_file():
            parts.append(f"\n--- {p.name} ---\n" + p.read_text(encoding="utf-8", errors="ignore"))
    return "\n".join(parts)


def main() -> int:
    text = read_all_text()
    failures = []
    for term in REQUIRED_POSITIVE:
        if term not in text:
            failures.append({"type": "missing_positive", "term": term})
    for term in REQUIRED_GUARDRAILS:
        if term not in text:
            failures.append({"type": "missing_guardrail", "term": term})

    report = {
        "timestamp": datetime.now().isoformat(timespec="seconds"),
        "files": [p.name for p in sorted(PROMPTS.glob("*")) if p.is_file()],
        "cases": CASES,
        "pass": not failures,
        "failures": failures,
    }
    out = OUT / f"csp_static_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json"
    out.write_text(json.dumps(report, ensure_ascii=False, indent=2), encoding="utf-8")
    print("PASS" if not failures else "FAIL")
    if failures:
        for f in failures:
            print(f)
    print("report:", out)
    return 0 if not failures else 1


if __name__ == "__main__":
    raise SystemExit(main())

合规安全研究 Prompt 工程（CSP）：授权边界、误拒降低、回滚与证据链