혁신을 잇다
AI 에이전트 기술이 인공지능 산업의 핵심 트렌드로 급부상하고 있다. 단순한 챗봇을 넘어 자율적으로 작업을 수행하는 AI 에이전트는 생산성 혁신을 주도하며, 노동시장과 산업 전반에 지대한 영향을 미칠 것으로 전망된다. 2024년 하반기부터 Anthropic의 ‘Computer Use’, OpenAI의 ‘Operator’, 중국 Butterfly Effect의 ‘Manus AI’ 등 다양한 에이전트 서비스가 잇따라 등장하며, 글로벌 IT 기업들 또한 시장 주도권을 확보하기 위한 경쟁을 본격화하고 있다. 이러한 가운데 한국지능정보사회진흥원이 보고서 「AI.GOV 해외동향」을 발표했다. 그중 일부 내용(해외 사례)을 소개한다.
1) 한국지능정보사회진흥원, 「AI.GOV 해외동향」 2025-1, 2025. 3. https://bit.ly/4iZzR0N
Reading Point
AI 에이전트가 인공지능 산업에서 2025년의 가장 중요한 트렌드로 거론되며, ‘Computer Use’, ‘Operator’, ‘Manus AI’ 등 다양한 에이전트 서비스가 잇따라 출시되고 있다. 현재 초기 단계에 있는 AI 에이전트는 빠른 속도로 발전하고 있으며, 이들의 대중화는 향후 노동시장 및 산업 전반에 큰 파급 효과를 미칠 것으로 전망된다.
AI 에이전트가 2025년 AI 분야의 주요 트렌드로 부상하고 있다. 가트너는 2025년의 10가지 전략 기술 트렌드 중 하나로 ‘Agentic AI’를 선정2)했으며, 젠슨 황(NVIDIA社 CEO)은 2025년 1월 CES 기조연설에서 “AI 에이전트가 수조 달러 규모의 산업을 주도하고 사람들이 일하는 방식을 변화시킬 것”이라고 발언3)했다. 기존의 챗봇은 단순히 대화 응답에 국한되었지만, AI 에이전트는 자율적이고 범용적인 업무 수행을 위한 기술적 특징을 갖추고 있다. 특히, 브라우저 등 외부 응용 프로그램과의 통합을 통해 AI 에이전트가 데이터와 인터페이스를 직접 조작할 수 있으며, 멀티모달 기반의 맥락 이해 강화와 적응형 학습(Adaptive learning)을 통해 사용자 피드백과 환경 상호작용을 최적화할 수 있다.
2024년 하반기 이후, Anthropic의 ‘Computer Use’, OpenAI의 ‘Operator’, 그리고 중국 스타트업 Butterfly Effect의 ‘Manus AI’ 등 AI 에이전트 서비스가 잇따라 출시됐다. 다만 현재 주요 기능은 아직 실험적이거나 초기(베타) 버전으로 제공되는 중이다.
2) Gartner. (2024. October 21) Top 10 Strategic Technology Trends for 2025.
https://www.gartner.com/en/articles/
top-technology-trends-2025
3) Fortune. (2025, January 7) Nvidia’s Jensen Huang says AI agents are ‘a multi-trillion-dollar opportunity’ and ‘the age of AI Agentics is here’.
https://finance.yahoo.com/news/nvidia-jensen-huang-says-ai-044815659.html
업무용 에이전트는 챗봇, 컴퓨터 사용 에이전트(CUA: Computer-Using Agent), 다중 에이전트 시스템 등으로 구분될 수 있다. AI 챗봇은 RAG(검색 증강 생성 기술)를 활용하여 외부 지식 정보에 접근할 수 있다. 외부 시스템과 상호작용하며 목표 달성을 위한 연속 작업 처리 및 대기열 활용 등의 발전된 프레임워크가 적용되어 고전적인 챗봇 대비 향상된 자율성을 가지고 업무를 수행하는 원리다. 예를 들면, RAG가 적용된 LLM 챗봇 서비스인 GPT-4o나 퍼플렉시티(Perplexity)가 이에 해당한다.
컴퓨터 사용 에이전트(CUA)는 AI가 직접 인간처럼 컴퓨터를 사용해 웹 탐색 등 다양한 작업을 수행하며, 시스템 전체에 액세스하는 방식과 가상 머신을 활용하는 방식으로 구분된다. 예시로는 ‘Computer Use’나 ‘Operator’ 같은 서비스들이 있다. 다중 에이전트 시스템은 AI 에이전트를 활용하여 복잡한 업무를 분할하고 배분하여 처리하는 시스템으로, 현재 이 개념에 부합하는 에이전트는 아직 개발되지 않았다. 다만 2025년 3월 공개된 ‘Manus’가 다중 에이전트 시스템의 초기형으로 평가되고 있다.
1. Computer Use(Anthropic, 2024.10.)
2024년 10월, Anthropic은 자사의 언어 모델 Claude 3.5와 함께 데스크톱 기반 업무 자동화 도구인 ‘Computer Use’ 서비스 베타 버전을 공개했다.
Anthropic의 ‘Computer Use’ 서비스는 입력-실행-환류의 3단계 루프로 구성된다. 첫 번째 단계는 입력 해석으로, Claude가 텍스트 프롬프트와 함께 데스크톱 화면을 처리하여 실행할 수 있는 요소(설치 프로그램, 양식 필드 등)를 식별한다. 두 번째 단계는 작업 실행으로, 에이전트가 Visual Studio Code의 메뉴 탐색이나 서버 배포를 위한 터미널 명령어와 같은 인간과 유사한 상호작용을 시뮬레이션한다. 그리고 마지막 피드백 반복 단계에서는 작업 실패 시 오류 메시지나 인터페이스 변경을 기반으로 전략을 조정한다.
2. Operator(OpenAI, 2025.1.)
OpenAI는 2025년 1월, AI가 웹 인터페이스와 직접 상호작용하는 서비스인 ‘Operator’를 공개했다. 이 서비스는 GPT-4o의 비전 기능과 강화 학습을 결합한 컴퓨터 사용 에이전트(CUA) 모델을 활용하여, 버튼·메뉴·텍스트 필드 등 그래픽 사용자 인터페이스(GUI)와의 상호작용을 구현한다.
‘Operator’는 Google에 쿼리를 입력하고, 결과를 분석하거나 예약 플랫폼을 탐색하는 등 인간의 브라우징 패턴을 모방하여 호텔 예약 양식 제출과 같은 구조화된 작업을 자동화한다. 사용자가 명령을 내리면 Operator는 OpenAI가 제공하는 원격 가상 브라우저를 열고, 사람이 화면을 보듯 스크린샷으로 UI를 인식한 뒤 마우스 클릭, 키보드 입력, 스크롤 등의 행동을 자동화한다. 그러나 구조화되지 않은 비표준적인 웹 환경에서는 활용에 제한이 있다.
OpenAI는 2025년 2월부터 오스트레일리아·브라질·캐나다·인도·일본·싱가포르·한국·영국 등 8개국에서 ‘Operator’ 서비스를 출시했으며, 현재 연구 미리보기(Research Preview) 상태로 공개되어 있다. 또한 OpenAI는 공식 블로그를 통해 도어대시(DoorDash), 우버(Uber) 등과 협력하여 서비스를 개발하고 있다고 발표하기도 했다.
국내에서는 카카오 및 야놀자와 제휴하여 카카오톡 쇼핑과 야놀자 예약 업무를 Operator로 수행할 수 있다. 이 경우 Operator는 스스로 ‘카카오톡 선물하기’ 서비스에 접속해 이용자에게 맞춤형 구매를 제안하거나, ‘야놀자 숙박·항공 예약’ 서비스에서 날씨·지역·기간 등 사용자의 조건에 맞춰 숙박 예약을 진행한다.
한편 OpenAI는 지난 3월 컴퓨터 사용 에이전트(CUA) 모델을 API로 공개했으며, 외부 개발자들도 API를 활용해 자체 에이전트를 구축할 수 있도록 지원할 방침이다.
3. Manus AI(Butterfly Effect, 2025.3.)
Manus는 중국의 스타트업 Butterfly Effect가 개발한 자율형 인공지능 에이전트로, 인간의 개입 없이 복잡한 작업을 독립적으로 수행할 수 있도록 설계됐다. Butterfly Effect는 지난 3월 Manus AI가 주식 분석부터 부동산 추천까지 다양한 작업을 자율적으로 실행할 수 있는 다재다능성을 가지고 있다고 발표한 바 있다. 이에 중국의 AI 생태계에 빠르게 편입되기 위해 Alibaba의 Qwen 개발팀과 전략적 파트너십을 체결하기도 했다.
Manus는 다양화된 추론을 위해 다중 LLM을 활용하며, 데이터베이스(DB), 브라우저, 코드 편집기와 직접 상호작용함으로써 보고서 생성이나 소프트웨어 디버깅(debugging)4)을 수행할 수 있다. Claude, Qwen 등 기존 상용 LLM 모델과 오픈소스를 결합해 강화된 추론 기능을 구현한다.
주요 AI 에이전트 서비스 이외에도 Google, Microsoft, Salesforce 등 빅테크 기업들은 다양한 AI 에이전트 기술 개발을 추진하고 있다. 구글은 기반 Gemini 에이전트 기술을 활용한 ‘Project Mariner’를 개발 중이며, Salesforce는 에이전트 생산성 강화를 위한 Slack의 Agentforce 플랫폼을 출시했다. 또한, Microsoft는 Copilot 제품군을 통해 생산성 소프트웨어 내 에이전트화를 추진하고 있다.
빌 게이츠는 AI 에이전트 기술의 부상은 소프트웨어 이용 방식의 혁신을 가져올 것이라고 예견했다.5) 그는 AI 에이전트가 “사용자와 컴퓨터의 상호작용 방식을 완전히 바꾸고 소프트웨어 업계를 뒤흔들 것”이라며, 사람마다 개인 AI 비서를 두고 모든 디지털 업무를 위임하는 미래를 내다봤다.
AI 에이전트의 활용은 이렇듯 업무 생산성의 비약적 향상과 서비스 이용 방식의 변화를 이끌 것으로 보인다. 여행사나 컨설턴트 등 일부 전문직의 역할은 축소될 가능성이 있지만, 동시에 AI 에이전트를 통한 대중화된 서비스 혜택이 출현할 것으로 예상된다. 이에 AI 에이전트 시장 선점을 위한 플랫폼 경쟁은 더욱 가속화될 전망이다. OS나 메신저와 같은 사용자 접점을 보유한 기업들은 이미 자사 플랫폼에 AI 서비스를 통합해 AI 에이전트 시장 선점을 추구하고 있다.
Microsoft는 Windows에 Copilot을 탑재하고, Google은 Android와 Chrome에 Gemini를 도입하는 등 플랫폼 경쟁은 더욱 심화되는 분위기다. 게다가 Salesforce와 같은 SaaS 업계 또한 자사 솔루션에 에이전트형 자동화 기능을 내장하거나 오픈 API를 제공하는 방식으로 기업 고객들의 업무 프로세스에 영향력을 확대하고 있다.
반면 AI 에이전트의 활용에 따른 ‘개인정보 보안’과 ‘일자리 이슈’ 등 사회적 문제에 대한 우려도 존재한다. 이는 AI 에이전트로 상당 부분 자동화될 수 있는 반복적인 사무직 업무는 일자리 축소를 초래할 것이며, AI 에이전트가 사용자 데이터에 폭넓게 접근하여 의사결정을 지원하는 만큼 프라이버시와 보안 위험이 증가할 가능성이 크다는 판단에서다. 결국 에이전트 오작동 시 발생할 수 있는 책임 소재와 관련된 법적·윤리적 기준도 사회적 합의 마련이 시급해 보인다.
4) 디버깅은 시스템의 논리적 오류나 비정상적 연산(버그)을 찾아내고 수정하는 작업.
5) Gates, B. (2023, November 9)
AI is about to completely change
how you use computers. GatesNotes. https://www.gatesnotes.com/ai-agents