Agentic AI Atlas

II.

Workflow overview

workflow:full-stack-system-reliability-review

Reference · live

Full-Stack System Reliability Review overview

Reviews end-to-end system reliability across the full technology stack -- analyzing frontend error rates, API latency percentiles, and database query performance together as correlated signals, evaluating SLO attainment across web, API, and data tiers, reviewing cloud infrastructure capacity headroom and auto-scaling policy effectiveness, auditing observability coverage for blind spots in tracing, logging, and metrics pipelines, assessing CI/CD pipeline reliability and deployment success rates, stress-testing failover procedures across availability zones, and correlating incident frequency with recent change velocity. Produces cross-stack reliability scorecard, SLO attainment report, and prioritized hardening backlog. Excludes feature development.

WorkflowOutgoing · 17Incoming · 0

Attributes

displayName

Full-Stack System Reliability Review

workflowKind

governance

triggerType

scheduled

typicalCadence

quarterly

complexity

cross-team

description

Outgoing edges

applies_to_domain5

domain:web-development·DomainWeb Development
domain:databases·DomainDatabases
domain:cloud-infra·DomainCloud Infrastructure
domain:observability·DomainObservability
domain:devops·DomainDevOps

involves_role3

role:staff-engineer·RoleStaff Engineer
role:platform-engineer·RolePlatform Engineer
role:incident-commander·RoleIncident Commander

performed_by_org_unit3

org-unit:engineering·OrgUnitEngineering
org-unit:infra-engineering·OrgUnitInfrastructure Engineering
org-unit:incident-response-team·OrgUnitIncident Response Team

requires_skill_area3

skill-area:sli-slo-management·SkillAreaSLI / SLO Management
skill-area:observability-pipeline·SkillAreaObservability Pipeline
skill-area:chaos-engineering·SkillAreaChaos Engineering

triggers_responsibility3

responsibility:slo-definition·ResponsibilitySLO definition
responsibility:capacity-planning·ResponsibilityCapacity Planning
responsibility:review-architecture-changes·ResponsibilityReview architecture changes

Incoming edges

None.

Full-Stack System Reliability Review overview

WorkflowOutgoing · 17Incoming · 0

Attributes

displayName

Full-Stack System Reliability Review

workflowKind

governance

triggerType

scheduled

typicalCadence

quarterly

complexity

cross-team

description

Outgoing edges

applies_to_domain5

domain:web-development·DomainWeb Development
domain:databases·DomainDatabases
domain:cloud-infra·DomainCloud Infrastructure
domain:observability·DomainObservability
domain:devops·DomainDevOps

involves_role3

role:staff-engineer·RoleStaff Engineer
role:platform-engineer·RolePlatform Engineer
role:incident-commander·RoleIncident Commander

performed_by_org_unit3

org-unit:engineering·OrgUnitEngineering
org-unit:infra-engineering·OrgUnitInfrastructure Engineering
org-unit:incident-response-team·OrgUnitIncident Response Team

requires_skill_area3

skill-area:sli-slo-management·SkillAreaSLI / SLO Management
skill-area:observability-pipeline·SkillAreaObservability Pipeline
skill-area:chaos-engineering·SkillAreaChaos Engineering

triggers_responsibility3

responsibility:slo-definition·ResponsibilitySLO definition
responsibility:capacity-planning·ResponsibilityCapacity Planning
responsibility:review-architecture-changes·ResponsibilityReview architecture changes

Incoming edges

None.