When should I use contains vs regex?

Use contains for simple, stable messages; use regex for IDs, numbers, and structured data requiring extraction or strict formats.

How do you handle flaky tests with these strategies?

Combine multiple expectations (positive and negative) and avoid brittle exact strings; prefer regex with capture when possible and validate consistent patterns.

Can I capture values for reuse?

Yes. Use regex with capture groups to extract IDs or numbers and reuse them in later validations.

validation-strategies

npx machina-cli add skill zircote/auto-harness/validation-strategies --openclaw

Files (1)

SKILL.md

7.2 KB

Memory

Search first: /mnemonic:search {relevant_keywords} Capture after: /mnemonic:capture {namespace} "{title}"

Run /mnemonic:list --namespaces to see available namespaces from loaded ontologies.

Validation Strategies

Choose and implement effective validation strategies for hook-driven tests.

Mnemonic Integration

Before advising on validation, check mnemonic for insights:

# Search for validation-related memories
rg -i "validation|assertion|regex|contains|flaky" ~/.claude/mnemonic/ ./.claude/mnemonic/ --glob "*.memory.md" -l | head -5

# Check learnings for validation experiences
rg -l "." ~/.claude/mnemonic/*/learnings/ --glob "*.memory.md" 2>/dev/null | xargs grep -l -i "validation\|expect" 2>/dev/null | head -5

Apply recalled insights:

Validation approaches that worked well
Flaky test patterns to avoid
Regex patterns that proved reliable
User's preferred validation strategies

Validation Approaches

String Matching (`contains`)

Strengths:

Simple and readable
Tolerant of formatting changes
Fast execution

Weaknesses:

May match unintended content
No structure awareness
Case-sensitive by default

Best for:

Success/error messages
UI text validation
Presence checks

expect:
  - contains: "Operation successful"
  - contains: "Created"

Negative Matching (`not_contains`)

Strengths:

Clear failure detection
Complements positive checks
Security validation

Weaknesses:

Can't validate what IS present
May miss variant error messages

Best for:

Error absence verification
Security checks (no sensitive data)
Deprecation validation

expect:
  - not_contains: "error"
  - not_contains: "exception"
  - not_contains: "password"

Pattern Matching (`regex`)

Strengths:

Precise structure validation
Value extraction capability
Multiple value matching

Weaknesses:

Complex to write correctly
Harder to debug failures
Performance overhead

Best for:

ID/UUID validation
Numeric output
Structured data
Variable capture

expect:
  - regex: "ID:\\s+[a-f0-9]{12}"
  - regex: "Count:\\s+\\d+"
  - regex: "(success|complete|done)"

Choosing the Right Strategy

Decision Matrix

Scenario	Recommended	Why
Check operation succeeded	`contains`	Flexible message matching
Verify no errors	`not_contains`	Catches error variants
Extract ID for later use	`regex` with capture	Structured extraction
Validate numeric output	`regex`	Pattern precision
Check multiple valid responses	`regex` with alternation	`(opt1\|opt2)`
Verify exact format	`regex`	Full control

Combination Strategies

Use multiple expectations for robust validation:

expect:
  # Positive confirmation
  - contains: "Memory created"
  # Negative confirmation
  - not_contains: "error"
  - not_contains: "failed"
  # Structured validation
  - regex: "ID:\\s+([a-f0-9]+)"

Regex Patterns Reference

Common Patterns

Pattern	Matches	Use Case
`\\d+`	One or more digits	Counts, IDs
`[a-f0-9]+`	Hex string	UUIDs, hashes
`\\w+`	Word characters	Identifiers
`.*`	Anything (greedy)	Flexible matching
`.*?`	Anything (non-greedy)	Minimal matching
`\\s+`	Whitespace	Flexible spacing
`(a\|b\|c)`	Alternation	Multiple valid values

ID Patterns

# UUID v4
regex: "[0-9a-f]{8}-[0-9a-f]{4}-4[0-9a-f]{3}-[89ab][0-9a-f]{3}-[0-9a-f]{12}"

# Short ID (12 hex chars)
regex: "[a-f0-9]{12}"

# Numeric ID
regex: "ID:\\s+(\\d+)"

# Alphanumeric ID
regex: "ID:\\s+([a-zA-Z0-9]+)"

Output Patterns

# Success with count
regex: "Found\\s+(\\d+)\\s+results"

# Status messages
regex: "Status:\\s+(active|inactive|pending)"

# Version numbers
regex: "v(\\d+\\.\\d+\\.\\d+)"

# Timestamps
regex: "\\d{4}-\\d{2}-\\d{2}T\\d{2}:\\d{2}:\\d{2}"

Handling Edge Cases

Empty Results

Validate empty states explicitly:

- id: search_no_results
  action: "Search for 'nonexistent_term_xyz'"
  expect:
    - regex: "(no results|0 found|empty)"
    - not_contains: "error"

Variable Output

Handle outputs that may vary:

expect:
  # Accept range of counts
  - regex: "Found\\s+[1-9]\\d*\\s+results"
  # Accept multiple success messages
  - regex: "(created|updated|saved)"

Whitespace Sensitivity

Use \s+ for flexible whitespace:

# Rigid (may fail)
- contains: "ID: abc123"

# Flexible (handles formatting)
- regex: "ID:\\s+abc123"

Case Sensitivity

Regex can handle case variations:

# Case-insensitive with (?i)
- regex: "(?i)success"

# Explicit alternatives
- regex: "(Success|SUCCESS|success)"

Handling Flaky Tests

Causes of Flakiness

Timing issues: Async operations not complete
Order dependence: Tests affect each other
External dependencies: Network, services
Non-deterministic output: Timestamps, random IDs

Mitigation Strategies

1. Flexible expectations:

expect:
  # Don't match exact timestamp
  - regex: "Created at: \\d{4}-\\d{2}-\\d{2}"
  # Don't match exact ID
  - regex: "ID:\\s+[a-f0-9]+"

2. Retry logic (in runner):

cmd_validate_with_retry() {
  local max_retries=3
  for i in $(seq 1 $max_retries); do
    if cmd_validate "$1"; then
      return 0
    fi
    sleep 1
  done
  return 1
}

3. Tag flaky tests:

- id: external_api_test
  tags: [flaky, external]

4. Isolate stateful tests:

- id: cleanup_before_test
  action: "Reset test state"
  tags: [setup]

- id: actual_test
  depends_on: cleanup_before_test

Debugging Validation Failures

Reading Failure Messages

❌ FAIL: search_basic
Failures:
  - Missing: 'results found'
  - Pattern not found: 'Count:\s+\d+'

Interpretation:

Missing: 'X' → contains: X failed
Unexpected: 'X' → not_contains: X failed
Pattern not found: 'X' → regex: X failed

Troubleshooting Steps

Get actual response: Check what Claude returned
Compare expectations: Look for typos, case issues
Test regex separately: Use online regex tester
Simplify expectations: Start broad, narrow down
Check for invisible chars: Whitespace, newlines

Common Fixes

Symptom	Likely Cause	Fix
Contains fails on visible text	Case mismatch	Use regex with `(?i)`
Regex fails on structured output	Escaping issue	Double-escape special chars
Intermittent failures	Timing/async	Add flexible patterns
All tests fail	State corruption	Reset with `/run-tests --reset`

Additional Resources

Reference Files

references/validation-approaches.md - Validation strategies and patterns

Source

git clone https://github.com/zircote/auto-harness/blob/main/skills/validation-strategies/SKILL.mdView on GitHub

Overview

validation-strategies guides you in selecting and applying effective validation approaches for hook-driven tests. It covers contains, not_contains, and regex, plus guidance on combining strategies and handling edge cases like flaky tests and validation failures.

How This Skill Works

The skill breaks validation into three core approaches: contains, not_contains, and regex. It provides strengths, weaknesses, and best-use guidance, plus a decision matrix and sample YAML to compose robust expectations and capture values for reuse.

When to Use It

Validate operation success messages using contains
Assert absence of errors with not_contains
Extract IDs or values using regex with capture
Validate numeric or structured output with regex
Accept multiple valid responses using regex with alternation

Quick Start

Step 1: Define what to validate (messages, IDs, numbers).
Step 2: Pick a validation approach (contains, not_contains, or regex) and draft expectations.
Step 3: Implement in the test harness and iterate on failures.

Best Practices

Use contains for simple, readable messages; avoid brittle exact matches.
Pair not_contains with contains to detect error variants and unwanted content.
Use regex for IDs, numbers, and structured data where precision matters.
Combine multiple expectations (positive, negative, and capture) for robustness.
Test edge cases and flaky behavior to ensure patterns hold under variation.

Example Use Cases

Validate a success message with: expect: - contains: "Operation successful"
Ensure no errors with: expect: - not_contains: "error" - not_contains: "exception" - not_contains: "password"
Capture an ID using regex: expect: - regex: "ID:\\s+[a-f0-9]{12}"
Check numeric output with: expect: - regex: "Count:\\s+\\d+"
Allow multiple valid statuses using regex with alternation: expect: - regex: "(success|complete|done)"

Frequently Asked Questions

Add this skill to your agents

validation-strategies

Memory

Validation Strategies

Mnemonic Integration

Validation Approaches

String Matching (contains)

Negative Matching (not_contains)

Pattern Matching (regex)

Choosing the Right Strategy

Decision Matrix

Combination Strategies

Regex Patterns Reference

Common Patterns

ID Patterns

Output Patterns

Handling Edge Cases

Empty Results

Variable Output

Whitespace Sensitivity

Case Sensitivity

Handling Flaky Tests

Causes of Flakiness

Mitigation Strategies

Debugging Validation Failures

Reading Failure Messages

Troubleshooting Steps

Common Fixes

Additional Resources

Reference Files

Source

Overview

How This Skill Works

When to Use It

Quick Start

Best Practices

Example Use Cases

Frequently Asked Questions

When should I use contains vs regex?

How do you handle flaky tests with these strategies?

Can I capture values for reuse?

String Matching (`contains`)

Negative Matching (`not_contains`)

Pattern Matching (`regex`)