v3.3.0 GUI dashboard + reports + model expansion + root fix

Engine: - Fix: inject IS_SANDBOX=1 so Claude Code's --dangerously-skip-permissions works under root (real backend runs were exiting rc=1 immediately) - models: expand to 40 models / 13 providers, tagged CLI vs API (NVIDIA NIM, DeepSeek, Mistral, Qwen/DashScope, Groq, Together, OpenRouter, Ollama, Gemini) — Qwen/DeepSeek/Llama usable via API - backends: on_start callback surfaces the exact argv ("what runs behind it") - orchestrator: require a Playwright screenshot per confirmed finding; collect results/activity.json; auto-generate reports after a run - report.py: HTML always + PDF via Typst engine (.typ source emitted too) Web dashboard (webgui/, stdlib only — no npm/build): - Sidebar dashboard (PentAGI-style): Run / Agents / Insights / Reports / Settings - Multi-target runs; live execution console + per-task activity; finding cards with screenshots; backend+provider+model pickers (CLI & API) - Agents tab: browse 213 + add new .md agents from the UI - Insights: interactive RL-weight + severity charts - Reports: download/preview PDF + HTML - Settings/API: execution mode, per-provider API keys, orchestrator, verbosity - Endpoints: /api/agents (GET/POST), /api/rl, /api/config, /api/reports, /reports/* + /shots/* static serving Cleanup: retire replaced web stack (frontend React, FastAPI backend, core orchestration, old test) to legacy/. Active engine + GUI are fully standalone. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-30 07:15:30 +02:00 · 2026-06-14 23:26:11 -03:00
parent 22a7302a35
commit a5badefc29
205 changed files with 809 additions and 199 deletions
@@ -30,12 +30,13 @@ class Provider:
    base_url_env: Optional[str] = None  # env var the backend reads for base URL
    models: List[Model] = field(default_factory=list)
    subscription: bool = False          # uses a CLI subscription rather than an API key
+    kind: str = "api"                   # "cli" (native agentic CLI) | "api" (OpenAI-compatible)


 PROVIDERS: Dict[str, Provider] = {
    # --- Anthropic (latest Claude family; default) -------------------------
    "anthropic": Provider(
-        key="anthropic", label="Anthropic Claude",
+        key="anthropic", label="Anthropic Claude", kind="cli",
        env_keys=["ANTHROPIC_API_KEY"],
        models=[
            Model("claude-opus-4-8", "Claude Opus 4.8", 1_000_000, "Most capable; deep multi-step pentest reasoning"),
@@ -45,16 +46,17 @@ PROVIDERS: Dict[str, Provider] = {
    ),
    # --- OpenAI ------------------------------------------------------------
    "openai": Provider(
-        key="openai", label="OpenAI",
+        key="openai", label="OpenAI", kind="cli",
        env_keys=["OPENAI_API_KEY"],
        models=[
            Model("gpt-5.1", "GPT-5.1", 400_000, "Strong general reasoning"),
+            Model("gpt-5.1-codex", "GPT-5.1 Codex", 400_000, "Codex CLI default"),
            Model("o4", "o4", 200_000, "Deliberate reasoning for validation"),
        ],
    ),
    # --- xAI Grok ----------------------------------------------------------
    "xai": Provider(
-        key="xai", label="xAI Grok",
+        key="xai", label="xAI Grok", kind="cli",
        env_keys=["XAI_API_KEY", "GROK_API_KEY"],
        base_url="https://api.x.ai/v1", base_url_env="OPENAI_BASE_URL",
        models=[
@@ -72,6 +74,56 @@ PROVIDERS: Dict[str, Provider] = {
            Model("nvidia/llama-3.3-nemotron-super-49b-v1", "Nemotron Super 49B", 128_000, "NIM hosted reasoning"),
            Model("deepseek-ai/deepseek-r1", "DeepSeek-R1 (NIM)", 128_000, "Strong reasoning via NIM"),
            Model("qwen/qwen2.5-coder-32b-instruct", "Qwen2.5 Coder 32B (NIM)", 128_000, "Code/exploit oriented"),
+            Model("qwen/qwq-32b", "QwQ 32B (NIM)", 128_000, "Reasoning"),
+            Model("meta/llama-3.3-70b-instruct", "Llama 3.3 70B (NIM)", 128_000),
+            Model("mistralai/mistral-large-2-instruct", "Mistral Large 2 (NIM)", 128_000),
+        ],
+    ),
+    # --- DeepSeek (direct API) --------------------------------------------
+    "deepseek": Provider(
+        key="deepseek", label="DeepSeek", env_keys=["DEEPSEEK_API_KEY"],
+        base_url="https://api.deepseek.com/v1", base_url_env="OPENAI_BASE_URL",
+        models=[
+            Model("deepseek-reasoner", "DeepSeek-R1 (reasoner)", 64_000, "Deep reasoning"),
+            Model("deepseek-chat", "DeepSeek-V3 (chat)", 64_000),
+        ],
+    ),
+    # --- Mistral (direct API) ---------------------------------------------
+    "mistral": Provider(
+        key="mistral", label="Mistral", env_keys=["MISTRAL_API_KEY"],
+        base_url="https://api.mistral.ai/v1", base_url_env="OPENAI_BASE_URL",
+        models=[
+            Model("mistral-large-latest", "Mistral Large", 128_000),
+            Model("codestral-latest", "Codestral", 256_000, "Code/exploit oriented"),
+        ],
+    ),
+    # --- Alibaba Qwen (DashScope, OpenAI-compatible) ----------------------
+    "qwen": Provider(
+        key="qwen", label="Qwen (DashScope)", env_keys=["DASHSCOPE_API_KEY", "QWEN_API_KEY"],
+        base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1", base_url_env="OPENAI_BASE_URL",
+        models=[
+            Model("qwen-max", "Qwen Max", 32_000),
+            Model("qwen2.5-coder-32b-instruct", "Qwen2.5 Coder 32B", 128_000, "Code/exploit oriented"),
+            Model("qwq-plus", "QwQ Plus", 128_000, "Reasoning"),
+        ],
+    ),
+    # --- Groq (fast OpenAI-compatible) ------------------------------------
+    "groq": Provider(
+        key="groq", label="Groq", env_keys=["GROQ_API_KEY"],
+        base_url="https://api.groq.com/openai/v1", base_url_env="OPENAI_BASE_URL",
+        models=[
+            Model("llama-3.3-70b-versatile", "Llama 3.3 70B (Groq)", 128_000, "Very fast"),
+            Model("qwen-2.5-coder-32b", "Qwen2.5 Coder 32B (Groq)", 128_000),
+        ],
+    ),
+    # --- Together AI ------------------------------------------------------
+    "together": Provider(
+        key="together", label="Together AI", env_keys=["TOGETHER_API_KEY"],
+        base_url="https://api.together.xyz/v1", base_url_env="OPENAI_BASE_URL",
+        models=[
+            Model("Qwen/Qwen2.5-Coder-32B-Instruct", "Qwen2.5 Coder 32B", 128_000),
+            Model("deepseek-ai/DeepSeek-R1", "DeepSeek-R1", 128_000),
+            Model("meta-llama/Llama-3.3-70B-Instruct-Turbo", "Llama 3.3 70B Turbo", 128_000),
        ],
    ),
    # --- Google Gemini -----------------------------------------------------
@@ -88,7 +140,14 @@ PROVIDERS: Dict[str, Provider] = {
        key="openrouter", label="OpenRouter",
        env_keys=["OPENROUTER_API_KEY"],
        base_url="https://openrouter.ai/api/v1", base_url_env="OPENAI_BASE_URL",
-        models=[Model("anthropic/claude-opus-4-8", "Opus 4.8 (OpenRouter)", 1_000_000)],
+        models=[
+            Model("anthropic/claude-opus-4-8", "Opus 4.8 (OpenRouter)", 1_000_000),
+            Model("qwen/qwen-2.5-coder-32b-instruct", "Qwen2.5 Coder 32B", 128_000),
+            Model("deepseek/deepseek-r1", "DeepSeek-R1", 128_000),
+            Model("meta-llama/llama-3.3-70b-instruct", "Llama 3.3 70B", 128_000),
+            Model("mistralai/mistral-large", "Mistral Large", 128_000),
+            Model("x-ai/grok-4", "Grok 4", 256_000),
+        ],
    ),
    # --- Local Ollama ------------------------------------------------------
    "ollama": Provider(
@@ -97,6 +156,8 @@ PROVIDERS: Dict[str, Provider] = {
        base_url="http://localhost:11434/v1", base_url_env="OPENAI_BASE_URL",
        models=[
            Model("qwen2.5-coder:32b", "Qwen2.5 Coder 32B (local)", 32_000),
+            Model("qwq:32b", "QwQ 32B (local)", 32_000, "Reasoning"),
+            Model("deepseek-r1:32b", "DeepSeek-R1 32B (local)", 64_000),
            Model("llama3.3:70b", "Llama 3.3 70B (local)", 128_000),
        ],
    ),