
가운데 AI 에이전트를 향한 추진이번 주에 Anthropic과 OpenAI가 다중 에이전트 도구를 출시하면서 Anthropic은 더욱 대담한 AI 코딩 실험을 선보일 준비가 되었습니다. 그러나 AI 관련 성과에 대한 주장이 늘 그렇듯이 앞으로 몇 가지 주요 경고 사항을 발견하게 될 것입니다.
목요일에는 인류학 연구자 니콜라스 칼리니(Nicholas Carlini)가 블로그 게시물을 게시했습니다 그는 회사의 Claude Opus 4.6 AI 모델 인스턴스 16개를 최소한의 감독으로 공유 코드베이스에 설정하고 처음부터 C 컴파일러를 구축하는 작업을 수행하는 방법을 설명했습니다.
2주에 걸쳐 API 비용으로 약 20,000달러의 비용이 드는 거의 2,000개의 Claude Code 세션을 통해 AI 모델 에이전트는 x86, ARM 및 RISC-V 아키텍처에서 부팅 가능한 Linux 6.9 커널을 구축할 수 있는 100,000줄의 Rust 기반 컴파일러를 생성한 것으로 알려졌습니다.
이전에 Google Brain 및 DeepMind에서 7년을 근무한 Anthropic Safeguards 팀의 연구 과학자인 Carlini는 Claude Opus 4.6에서 출시된 ‘에이전트 팀.” 실제로 각 Claude 인스턴스는 자체 Docker 컨테이너 내에서 실행되어 공유 Git 저장소를 복제하고 잠금 파일을 작성하여 작업을 요청한 다음 완료된 코드를 다시 업스트림으로 푸시했습니다. 오케스트레이션 에이전트가 트래픽을 전달하지 않습니다. 각 인스턴스는 다음에 작업해야 할 가장 확실한 문제를 독립적으로 식별하고 해결을 시작했습니다. 병합 충돌이 발생하면 AI 모델 인스턴스가 스스로 문제를 해결했습니다.
Anthropic이 가지고 있는 결과 컴파일러 GitHub에 출시됨PostgreSQL, SQLite, Redis, FFmpeg 및 QEMU를 포함한 다양한 주요 오픈 소스 프로젝트를 컴파일할 수 있습니다. GCC 고문 테스트 모음에서 99%의 합격률을 달성했으며 Carlini가 “개발자의 궁극적인 리트머스 테스트”라고 부르는 테스트를 컴파일하고 실행했습니다. 운명.
C 컴파일러는 반자율 AI 모델 코딩을 위한 거의 이상적인 작업이라는 점은 주목할 가치가 있습니다. 사양은 수십 년이 지났고 잘 정의되어 있으며 포괄적인 테스트 스위트가 이미 존재하며 확인할 수 있는 잘 알려진 참조 컴파일러가 있습니다. 대부분의 실제 소프트웨어 프로젝트에는 이러한 장점이 없습니다. 대부분의 개발에서 어려운 부분은 테스트를 통과하는 코드를 작성하는 것이 아닙니다. 먼저 테스트가 무엇인지 파악하는 것입니다.


