[p3 AI 엔지니어 소개]
도메인
- 결제, 정산, 오픈뱅킹 파이프라인의 실시간 장애 탐지와 안전한 자율 복구(Self-Healing)
- 인간의 개입을 최소화하면서 안전하게 복구하는 "Agent-Led, Human-in-the-Loop" 차세대 SRE 플랫폼 설계·구축
- 트랜잭션 정합성과 무장애 운영이 극도로 중요한 핀테크 도메인
Agentic AI / 플랫폼
- point3 인프라·코드를 이해하고 자율적으로 진단/Remediation하는 AI 에이전트 아키텍처
- 에이전트가 인프라를 안전하게 제어하도록 돕는 MCP(Model Context Protocol) 기반 도구(Tools) 생태계
- LangGraph, CrewAI, Autogen 등 상태 기반 멀티 에이전트 프레임워크
- Graph DB(Neo4j 등) 기반 지식 그래프(Context Graph)와 RAG 고도화
SRE / 인프라
- TypeScript / NestJS / Bun 백엔드 개발 및 프로덕션 배포
- Kubernetes, Istio Service Mesh, Docker 네트워크·인프라 운영
- Kafka, ksqlDB, Schema Registry 기반 이벤트 아키텍처(EDA)·데이터 파이프라인 트러블슈팅
보안 / 가드레일
- LLM 탈옥(Jailbreak) 방어 아키텍처
- 로그 오염을 통한 간접 프롬프트 주입(Indirect Prompt Injection, LogJack 등) 방어
- 고위험·데이터 파괴적 작업에 대한 승인 게이트웨이(Approval Gate) 설계
연계 / 협업
- 결제·정산·오픈뱅킹 도메인 및 보안 도메인과의 cross-functional 협업
- 개발 리드와의 상시 페어 — "자동화 우선"이 아닌 "무장애 우선" 운영 문화
- 인간의 수정·반려 이력을 에이전트 지식 베이스로 환류하는 진화 루프(Evolution Loop) 운영
[p3 AI 엔지니어 합류 후 함께 해나가실 것들]
Agent-Native SRE 플랫폼 설계
- point3 인프라와 코드를 이해하고 자율적으로 진단/Remediation을 수행하는 AI 에이전트 아키텍처 설계
- 에이전트가 안전하게 인프라를 제어하도록 돕는 MCP 기반 도구(Tools) 생태계 구축
- 도구별 권한 범위와 호출 가능 작업의 경계 정의
자율 복구(Self-Healing) 파이프라인 개발
- 전사 시스템의 장애를 실시간 탐지 (Loki·Tempo·Winston 신호 기반)
- 장애 원인을 분석하고 복구 시나리오를 자동 생성하는 에이전트 개발
- 결제·정산·오픈뱅킹 파이프라인 장애의 탐지 → 진단 → 복구 흐름 구현
Human-in-the-Loop (HITL) 가드레일 구축
- 에이전트가 고위험·데이터 파괴적 작업을 수행하기 전, Slack/CLI로 진단 맥락과 변경 Diff를 제시하고 승인받는 승인 게이트웨이(Approval Gate) 설계
- 자율 허용 영역(일시 리소스 scaling, 노드 재시작, 캐시 무효화)의 명시적 경계 운영
- 영구 사람 검토 영역(DB 스키마 변경, 결제 트랜잭션 정정, 자금이체·정산 데이터 수정, 인증·KYC·결제 정합성)의 자동화 차단 enforcement
지속적 에이전트 진화(Evolution Loop) 구현
- 인간이 에이전트의 제안을 수정하거나 반려한 이력을 구조화된 데이터로 수집
- 에이전트 지식 베이스(Context Graph)를 자동으로 업데이트하는 피드백 루프 구축
- 반려 이력 → 룰 갱신으로 이어지는 진화 사이클의 첫 바퀴 운영