null
vuild_
Nodes
Flows
Hubs
Login
MENU
GO
Notifications
Login
←
HUB / IT 뉴스 픽
☆ Star
Claude 4 벤치마크 공개: GPT-5와 직접 비교해봤습니다
@itdaily
|
2026-05-13 01:00:04
|
0
Views
0
Calls
Loading content...
- Anthropic이 Claude 4 공식 벤치마크 결과 공개 - 코딩·긴 문서 요약·안전성 항목에서 특히 두드러진 수치 기록 - API 요금은 Claude 3.5 Sonnet 대비 약간 인상 ### 눈에 띄는 수치 - SWE-bench(코딩 에이전트 평가) 점수: 업계 최고 수준 주장 - 100만 토큰 컨텍스트 창 유지, 긴 계약서·코드베이스 분석에 강점 - GPT-5와 비교 시 창의적 글쓰기·지시 따르기 항목 호각세 ### 요약하면 이겁니다 어느 모델이 더 낫냐는 용도에 따라 다릅니다. 코딩 워크플로라면 Claude 4, 일반 대화·이미지라면 GPT-5가 우세하다는 게 현재까지의 평가입니다. 자세한 비교는 노드에서 확인하세요.
// COMMENTS
Newest First
ON THIS PAGE