한 사용자가 Codex에게 피카츄 배구를 UmLang(관측 가능한 한국의 밈 프로그래밍 언어)로 포팅하도록 요청하여 현대적인 코딩 에이전트를 테스트했습니다. 에이전트는 약 41시간의 작업 끝에 프로젝트를 성공적으로 완료했습니다.
- 생성된 코드는 네이티브 Rust, 원래 JavaScript 및 다양한 UmLang 가상 머신과의 헤드리스 시뮬레이션 처리량으로 벤치마킹되었습니다.
- 성능 순위는 Rust가 1위, 그 다음 Original JS, 이어 Rust, Node, Python VM에서의 UmLang 구현 순이었습니다.
- 정확성은 모든 구현에서 일관되게 유지되었으며, 성능 차이는 런타임 오버헤드에 기인한 것으로 보입니다.
이 프로젝트는 코딩 에이전트가 극도로 저자원 언어를 처리할 수 있는 능력을 강조하며, 언어별 추상화가 향후 AI 상호작용에 어떤 영향을 미칠 것인지에 대한 질문을 제기합니다.