지난달 초 오픈AI는 최신 코딩 AI 에이전트(비서)인 ‘GPT 5.3 코덱스’를 출시하며 자사 블로그에 새로운 개념을 제시했다. 오픈AI는 “사람이 코드를 전혀 작성하지 않고도 소프트웨어 제품을 구축하고 출시하고 있다”며 “사람이 앞으로 할 중요한 일은 코드 작성이 아닌 하네스 엔지니어링”이라고 했다.
인공지능(AI)이 컴퓨터 코딩을 자동으로 짜고, 이를 검토하고, 실행하는 시대가 열리면서 사람 개발자가 코딩 작성 대신 주목해야 할 개념으로 ‘하네스 엔지니어링’이 뜨고 있다. 하네스 엔지니어링이란 개념에서 ‘하네스(Harness)’는 말을 통제하기 위해 장착하는 고삐, 안장, 줄 등 장비를 뜻한다. 즉, 하네스 엔지니어링은 AI가 작업을 적절하고 효율적으로 수행해 성과를 내도록 통제 및 관여하는 것을 말한다. 예컨대 회사가 직원들의 생산성 향상을 위해 최신 노트북을 지급하고, 회사 기밀 데이터에 접근 권한을 주듯 사람 개발자가 AI가 효율적으로 일하고 싶은 환경을 만들고 AI 직원의 행동을 적절히 통제해 보안 문제를 예방하는 것이다.
실제 사무 환경에서 사람 관리자가 AI에 “메일함에서 신입 사원 지원자의 이력서를 읽고 대외 활동 이력에 가점을 줘 평가해 달라”고 명령하면 AI는 사람보다 빠르게 이력서를 읽고 평가 문장을 만들지만 내부 시스템에 이력서를 업로드하거나 상위 후보를 정렬하진 못한다. 또 여러 이력서를 읽다 보면 ‘대외 활동 이력에 가점을 주라’ 등의 초기 지시 사항을 잊기도 한다. 하네스 엔지니어링은 이 경우 AI가 업무의 흐름을 놓치지 않고 불필요한 일을 하지 않도록 일종의 가이드라인을 제시한다.
최근 앤스로픽도 ‘에이전트 하네스’라는 개념을 제시했다. AI 모델 자체보다 중요한 것은 에이전트가 실행되는 하네스 시스템이라고 강조하면서, 하네스 엔지니어링의 주요 특징을 ‘AI가 외부 도구를 호출하도록 관리하는 것’ ‘AI가 작업을 반복하며 수정하도록 루프 운영하는 것’ 등으로 정의했다. 앤스로픽 측은 “AI 에이전트가 실패하는 흔한 이유는 덜 똑똑해서가 아니라 도구를 제대로 사용하지 못하거나, 긴 작업에서 목표를 잃어버려서 그렇다”며 “하네스 엔지니어링이 필요하다”고 했다.