Behavior Testing Skill Trigger - Nach Feature-Implementation - Wenn Tests nur DOM-Rendering pruefen ("smoke tests") - Wenn Code-Review Luecken in der Test-Abdeckung findet - Slash-Command Problem Standard-Tests (via AI-Generation oder Copilot) pruefen oft nur "wird gerendert?", nicht "funktioniert es?". Das fuehrt zu: - Buttons ohne Funktionalitaet bestehen alle Tests - API-Aufrufe mit falschen Argumenten werden nie erkannt - State-Verlust bei Navigation/Re-Mount bleibt unsichtbar - Fehlende Error-UI wird nie getestet 4 Test-Kategorien (PFLICHT) 1. API-Contract Tests Was: Verifiziere, dass AP…