Open Source • Apache 2.0

Adversarial validation
for autonomous AI

MiniCrit identifies reasoning flaws in AI outputs before they become costly failures. Enterprise-grade validation with sub-50ms latency.

Get Started View on GitHub

0 Signals Validated

0ms Avg Latency

0% Accuracy

minicrit validate

$ minicrit validate "NVDA will rise 15% based on momentum"

Severity: HIGH

Flags:

overconfidence recency_bias missing_risks

Critique:

95% confidence unsupported by evidence. 3-day momentum has minimal predictive value. No consideration of earnings, macro exposure, or sector rotation.

The Problem

Autonomous AI fails silently

AI systems generate confident outputs with hidden flaws—overconfidence, missing risks, logical errors. Traditional testing catches bugs. It doesn't catch bad reasoning.

Overconfident Predictions

Systems express certainty without evidence, making high-conviction calls that ignore uncertainty and edge cases.

"99% confident BTC hits $100k tomorrow"

Spurious Correlations

Pattern matching without causation. Models mistake coincidence for insight, leading to unreliable decisions.

"Stock rises when CEO tweets → buy signal"

Missing Risk Factors

Critical considerations absent from analysis. Threats compound silently until catastrophic failure.

"Buy recommendation (ignoring earnings next week)"

How It Works

Adversarial validation in your pipeline

MiniCrit acts as a specialized "devil's advocate" that challenges AI reasoning before actions are taken. Four steps. One line of code.

Intercept

Hook into your AI pipeline via API, MCP, or direct integration

Analyze

Decompose signal into claims, evidence, and logical structure

Challenge

Apply adversarial critique across biases and fallacies

Validate

Return structured critique with severity and recommendations

Detection

What MiniCrit catches

Comprehensive coverage of cognitive biases and logical fallacies that lead to flawed AI decisions.

Cognitive Biases

Overconfidence High

Certainty unsupported by evidence

Recency Bias Medium

Overweighting recent data

Confirmation Bias High

Ignoring contradicting evidence

Anchoring Medium

Over-relying on initial information

Logical Fallacies

Spurious Correlation Critical

Mistaking coincidence for causation

Missing Premises High

Gaps in logical chains

Circular Reasoning Medium

Conclusions in premises

False Dichotomies Medium

Artificial binary choices

Integration

Deploy in minutes

MiniCrit integrates with your existing stack via Python SDK, MCP protocol, Docker, or REST API.

from minicrit import MiniCrit

# Initialize the critic
critic = MiniCrit()

# Validate any AI-generated reasoning
result = critic.validate(
    "Based on momentum, NVDA will rise 15% this quarter."
)

print(result.severity)   # "high"
print(result.critique)   # Detailed analysis
print(result.flags)      # ["overconfidence", "recency_bias"]

# Install from PyPI
pip install minicrit

# Validate from command line
minicrit validate "The market will crash tomorrow based on today's news."

# Or pipe from file
cat signals.txt | minicrit validate --format json

// claude_desktop_config.json
{
  "mcpServers": {
    "minicrit": {
      "command": "python",
      "args": ["-m", "minicrit.mcp"],
      "env": {
        "MINICRIT_MODEL": "minicrit-7b"
      }
    }
  }
}

# Pull and run with GPU support
docker run --gpus all -p 8000:8000 ghcr.io/antagoninc/minicrit:7b

# Validate via HTTP
curl -X POST http://localhost:8000/validate \
  -H "Content-Type: application/json" \
  -d '{"text": "AI will replace all jobs by 2025"}'

Applications

Built for high-stakes decisions

Anywhere autonomous AI makes decisions that matter, MiniCrit provides a critical safety layer.

Quantitative Trading

Validate AI trading signals before execution. Catch overconfident predictions and incomplete analysis.

Medical AI

Add adversarial review to diagnostic recommendations. Flag reasoning gaps before patient decisions.

Defense & Security

Critical review layer for autonomous threat assessment and decision support systems.

Legal Research

Validate AI-generated legal analysis for logical consistency and completeness.

Autonomous Vehicles

Real-time validation of perception and planning decisions in safety-critical scenarios.

AI Agents

Add a reasoning checkpoint before any AI agent takes irreversible actions.

Adversarial validation for autonomous AI