클로드 소네 4.5: 코딩, 에이전트, 컴퓨터 사용의 도약

마지막 업데이트 : 02/10/2025

  • OSWorld에서 61,4%의 성능을 보이며 SWE-bench Verified에서 선두를 달리고 있습니다.
  • 30시간 이상 복잡한 작업을 처리하고 최대 64.000개의 토큰을 생성합니다.
  • 에이전트를 위한 Claude Code 및 새로운 Claude Agent SDK 업데이트
  • 강화된 보안(ASL-3) 및 동일한 가격: 토큰 100만 개당 $3/$15

Claude Sonnet 4.5 모델 이미지

Anthropic은 프로그래밍, 에이전트, 컴퓨터 제어에 중점을 둔 진화된 버전인 Claude Sonnet 4.5를 출시했습니다. 이 버전은 전문 환경에서 플랫폼을 통합하고자 합니다. 높은 수준의 경쟁사들이 존재하는 환경에서 Anthropic은 이번 출시를 다음과 같이 설명합니다. 엔지니어링 작업을 위한 더욱 정교하고 유용한 모델 현재까지

새 버전은 이전 버전에서 추론 및 코딩 기능을 개선했던 Sonnet 제품군의 실적을 기반으로 합니다. 이러한 기반을 바탕으로 4.5는 다음과 같은 개선을 통해 실질적인 적용 범위를 확장하는 것을 목표로 합니다. 주의력, 도구 사용 및 생산성의 지속성보안 및 정렬에 대한 신중한 전략을 유지합니다.

주요 기능 및 성능 개선

클로드 소네 4.5의 일반 이미지

Anthropic에 따르면, 클로드 소네 4.5는 복잡한 작업에도 30시간 이상 집중력을 유지할 수 있습니다. 다단계 방식은 맥락의 연속성이 요구되는 장기 프로젝트에 적합합니다. 또한 최대 단일 응답에 64.000개의 토큰, 응답하기 전에 "생각하는 시간"을 조정하고 필요에 따라 속도와 세부 사항의 균형을 맞추는 컨트롤을 제공합니다.

독점 콘텐츠 - 여기를 클릭하세요  벨벳 선다운: Spotify에서 실제 밴드가 등장하는가, 아니면 AI가 만들어낸 음악적 현상인가?

컴퓨터 앞에서 실제 작업을 할 때, 이 회사는 OSWorld에서 61,4%의 점유율을 기록했는데, 이는 같은 테스트에서 전임자가 기록한 42,2%에 비해 눈에 띄게 증가한 수치입니다.실제 시나리오에서는 모델이 가능합니다. 웹 탐색, 스프레드시트 작성 및 작업 수행 Chrome 확장 프로그램을 통해 데스크톱 애플리케이션에서 사용자 모니터링을 지속적으로 줄여줍니다.

의 땅 프로그래밍은 대부분의 개선 사항에 집중합니다.. 실제 프로젝트에 적용된 코딩에 초점을 맞춘 SWE-bench Verified 평가에서 소네트 4.5가 77,2%로 선두를 달리고 있습니다. (병렬 컴퓨팅에서 개수를 늘리는 구성 포함). Anthropic은 이 모델이 전체 개발 주기를 포괄한다고 제안합니다. 대규모 코드베이스의 계획, 구현, 리팩토링 및 유지 관리.

순수한 개발을 넘어서, 인류학적(Anthropic)은 장기간의 흐름과 단계의 조정이 필요한 용도를 식별합니다.사이버 보안과 금융부터 사무 생산성 향상과 내부 및 외부 데이터를 활용한 연구에 이르기까지, 이러한 맥락에서 핵심은 일관성을 잃지 않으면서 장기적인 업무를 지속할 수 있는 더욱 안정적인 에이전트에 있습니다.

개발자 도구 및 생태계

클로드 코드

출시에는 다음과 같은 내용이 포함됩니다. Claude Code의 새로운 소식: 체크 포인트 진행 상황을 저장하고 이전 상태로 돌아가려면 다음과 같습니다. 버전 기록, 하나 개편된 터미널 인터페이스, Visual Studio Code용 네이티브 확장 API를 통해 컨텍스트 및 메모리 편집을 개선하여 더 긴 작업을 실행할 수 있습니다.

독점 콘텐츠 - 여기를 클릭하세요  워너 브라더스, 자사 캐릭터 사용으로 미드저니 소송 제기

Anthropic도 초연합니다 클로드 에이전트 SDK, 회사가 자체 에이전트를 구축하는 데 사용하는 인프라를 복제합니다.이 키트는 장기 기억, 권한 시스템 및 하위 에이전트 조정을 위한 도구를 제공하여 공통 목표를 향해 협력하고 다음과 같은 도구와 연결을 보호하는 자동화 솔루션 생성을 용이하게 합니다. 와이어 가드.

보완책으로, 회사는 일시적으로 "Claude와 함께 상상해보세요"를 활성화합니다., 모델이 어떻게 관찰되는지 보여주는 데모입니다. 실시간으로 소프트웨어를 생성합니다 미리 정의된 코드가 없습니다. Max 사용자에게 한정 기간 동안 제공되는 이 미리보기는 이 모델의 대화형 제작 잠재력을 보여줍니다.

보안, 정렬 및 복원력

Anthropic은 Sonnet 4.5를 보호 수준에 포함합니다. AI 안전 레벨 3(ASL-3), 특히 CBRN 위험과 관련된 위험한 콘텐츠를 감지하도록 훈련된 필터를 탑재했습니다. 이 회사는 10배나 높은 거짓 양성률 이러한 분류기의 초기 버전과 비교했을 때 다음과 같은 기능을 제공합니다. 보안 잠금이 발생한 경우 Sonnet 4와의 대화가 계속됩니다..

동시에 회사는 다음을 보장합니다. 이 모델은 아첨이나 기만적인 반응과 같은 원치 않는 행동을 줄이고 시도에 대한 방어력을 강화합니다. 즉각적인 주사이러한 측정은 사용을 가리킵니다. 기업 환경에서 더 안정적자동화된 작업의 실행에는 통제와 추적성이 필요합니다.

독점 콘텐츠 - 여기를 클릭하세요  GenCast AI는 더 빠른 속도와 정확성으로 날씨 예측에 혁신을 가져옵니다.

가용성, 플랫폼 및 가격

Claude Sonnet의 이미지 4.5

Claude Sonnet 4.5는 Claude.ai에서 이용 가능합니다. (웹, iOS 및 Android) 그리고 Claude Developer Platform을 통한 개발자를 위해Amazon Bedrock 및 Google Cloud Vertex AI와 같은 서비스와 통합됩니다. 무료 플랜은 5시간마다 재설정되는 세션 제한과 주문형 메시지 수의 가변성을 제공합니다. 가격은 동일합니다.: 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 15달러.

새로운 접근 기능 중, 클로드의 크롬 확장 프로그램이 Max 사용자를 대상으로 출시됩니다. 이전에 대기 목록에 등록되었습니다. 벤치마크 결과는 이전 버전에 비해 상당한 개선을 보여주지만, Anthropic은 실제 성능은 사용 사례와 각 작업에 구성된 추론 예산에 따라 달라진다고 지적합니다.

코딩의 발전, 에이전트의 더 큰 자율성, 보안에 대한 더 엄격한 집중이 결합되어 Claude Sonnet 4.5는 견고한 옵션으로 자리 잡았습니다. 장기 프로세스에서 연속성과 제어가 필요한 기술 팀을 위해 Anthropic의 이미 구축된 생태계와 안정적인 비용 및 호환성 유지.

링크드인 조정 AI
관련 기사 :
LinkedIn에서 AI를 조정합니다: 개인정보 보호 변경 사항, 지역 및 비활성화 방법