요즘 오픈클로(OpenClaw)를 이용해서 이것저것 테스트해보고 있습니다. 오픈소스 AI 에이전트로 유명해진 OpenClaw를 활용해, 개발과 QA를 분리한 AI 에이전트 팀을 구성해보는 실험을 진행했습니다. 그 과정과 결과를 정리해봤습니다.

AI 에이전트 개발팀 구성

개발만 담당하는 에이전트(코비서, co-biseo)가 있는데, 이 에이전트가 만든 결과물을 검증하는 별도의 QA 에이전트를 추가하고, 메인 에이전트(김비서)가 전체를 오케스트레이션하는 구조를 검토해봤습니다.

오픈클로를 이용한 AI 에이전트 개발팀 구성

김비서에게 이 방안을 검토해달라고 요청했더니, 다음과 같은 구조를 제안해주었습니다.

  • 기대 효과: 품질 향상, 회귀 방지, 책임 분리, 속도 개선
  • 역할 분담: co-biseo(개발, 코비서) → 구현/수정/리팩토링, qa-biseo(테스터, 큐비서) → 테스트 계획·실행·재현 로그 작성, main → 작업 지시·결과 취합·pass/fail 판단
  • 운영 플로우: main(김비서)이 co-biseo(코비서)에 개발 지시 → 결과 제출 → main(김비서)이 qa-biseo(큐비서)에 테스트 지시 → PASS/FAIL에 따라 수정 재지시 또는 배포 진행

이렇게 개발과 QA를 분리하면, 독립적인 관점에서 품질을 검증할 수 있고, 배포 전 자동 검증 루틴을 고정해 회귀를 줄일 수 있다는 점이 인상적이었습니다.

2048 게임 QA 테스트 실전 적용

지난번에 오픈클로로 개발한 2048 게임을 QA 에이전트(큐비서)로 테스트해보았습니다. 텔레그램에서 김비서에게 workspace/tmp 폴더의 2048 게임 테스트를 큐비서에게 지시해달라고 요청했습니다.

개발 프로그램 테스트 요청 - 김비서에게 큐비서 테스트 지시

김비서가 큐비서에게 테스트 지시를 넣었고, 대상은 workspace/tmp/index.html(2048 게임), 범위는 초기 타일, 이동, 병합·점수, 새 게임, 게임오버, 콘솔 에러 등 핵심 기능 전반이었습니다.

QA 테스트 결과 보고 - 2048 게임 검증 완료

테스트 결과, 요구된 기본 기능 5가지가 모두 정상 동작하는 것으로 확인되었습니다.

  • 초기 타일 2개 생성
  • 방향키 이동(좌/우/상/하)
  • 동일 숫자 병합 및 점수 증가
  • 새 게임 버튼 동작
  • 게임 오버 조건 감지
  • 콘솔 에러/런타임 에러 미발생

Playwright Chromium headless로 file:// 경로에서 직접 로드한 뒤, 키보드 입력·DOM 상태·오버레이·점수 변화를 자동으로 검증하는 방식으로 진행되었습니다. 게임 오버 재현 시점(step 142, score 1256)까지 상세히 기록된 보고서를 받을 수 있었습니다.

텔레그램으로 개발·QA 자동화하기

텔레그램에서 김비서에게 지시만 하면, 개발(코비서)과 QA(큐비서)가 자동으로 수행되는 구조를 경험해볼 수 있었습니다.

  • 개발 지시: 김비서 → 코비서로 기능 개발 요청
  • QA 지시: 김비서 → 큐비서로 테스트 실행 요청
  • 결과 수집: 각 에이전트 결과가 김비서를 통해 자동으로 전달

메신저에서 자연어로 요청하면, 내부적으로 에이전트들이 협업하는 형태라 개발·QA 워크플로를 쉽게 자동화할 수 있었습니다.

마치며

오픈클로를 활용해 개발 에이전트와 QA 에이전트를 분리하고, 메인 에이전트가 오케스트레이션하는 구조를 구성해봤습니다. 텔레그램 김비서를 통해 지시만 하면 개발과 테스트가 이어지는 흐름을 확인할 수 있어, 앞으로도 다양한 프로젝트에 적용해보고 싶습니다. 또한 QA 항목 설정, 보고서 양식 등을 지정하여 원하는대로 결과물이 나오도록 구성해 볼 예정입니다.

OpenClaw 기반 AI 에이전트 팀 구성과 QA 자동화에 관심이 있다면, 위 구조를 참고해 보시면 좋을 것 같습니다.