Anthropic, Claude Sonnet 5 modelini resmen piyasaya sundu. Yeni model, tarayıcılar ve terminaller gibi araçları kullanarak otonom şekilde plan yapabiliyor, karar alabiliyor ve yazılım geliştirme gibi karmaşık görevleri baştan sona tamamlayabiliyor. Şirket, bu yetenekleri sadece birkaç ay önce daha büyük ve pahalı modellerde bulunduğunu belirtti.
Claude Sonnet 5, tüm Anthropic abonelik planlarında varsayılan model olacak ve ücretsiz katmanlardan Professional planlara kadar herkese sunulacak. Yeni model, yapay zeka şirketleri arasında otonom görevleri yerine getirme yeteneğinin standart hale geldiğini, artık rekabetçi avantajın fiyatlandırma ve güvenilirlikte belirlendiğini gösteriyor.
Performans ve Fiyatlandırma Dengesi
Claude Sonnet 5, Opus 4.8'e yakın performans sunuyor ancak önemli ölçüde daha düşük maliyetlerle. 31 Ağustos tarihine kadar milyon giriş tokenı başına 2 dolar, çıkış tokenı başına 10 dolar fiyatlandırılacak. Bu tarih sonrasında fiyatlar sırasıyla 3 ve 15 dolara yükselecek. Karşılaştırıldığında, Opus 4.8 milyon giriş tokenı başına 4 dolar, çıkış tokenı başına 25 dolar ile işaretleniyor. Modelin agresif fiyatlandırması, OpenAI'nin GPT-5.5 ve Google'ın Gemini 3.1 Pro modellerinden daha ekonomik bir seçenek sunuyor.
Yeni model, önceki sürüm olan Sonnet 4.6'ya kıyasla akıl yürütme, kod yazma ve karmaşık bilgi işlemde belirgin iyileştirmeler gösteriyor. Otonom kodlama benchmark'ında Sonnet 5 yüzde 63,2 puan alırken, Sonnet 4.6 yüzde 58,1 elde etti. Bilgi işleme görevlerinde ise Sonnet 5, Opus 4.8'i hafifçe geçmeyi başardı. Zapier'in kıdemli mühendisi Daniel Shepard, iki aşamalı bir görevin — Salesforce hesap seviyelerini güncelleme ve kurumsal kişilere duyuru gönderme — baştan sona tamamlandığını, önceki modellerin bu noktada durduğunu belirtti.
Güvenlik Standartları ve Otokontrol Yeteneği
Claude Sonnet 5, güvenlik açısından önemli gelişmeler sunuyor. Halüsinasyon oranı ve yapay zeka dalkavukluğu (sycophancy) davranışı önceki sürümlere göre belirgin şekilde azaldı. Model, kötü niyetli isteklere dirençli bir yapı sergiliyor, prompt-injection saldırılarına karşı daha dayanıklı ve güvenli bir hizmet sunuyor. Lovable'ın kurucusu Fabian Hedin, yeni modelin güvenli istekleri tutarlı ve net bir şekilde reddettiğini söyledi. Ancak Opus 4.8 ve Claude Mythos Preview modellerine kıyasla, zararlı siber güvenlik görevlerini gerçekleştirme yeteneği daha sınırlı kalmıştır.
Kurumsal müşteriler için özellikle önemli olan bir özellik, Claude Sonnet 5'in dışarıdan yönlendirme olmaksızın kendi çıktılarını denetleyip hataları tespit edebilmesidir. Bu otonom kontrol mekanizması, agentic yapay zeka uygulamalarında insan müdahalesinin gereksinimini azaltarak verimlilik kazandırıyor.
Anthropic'in bu hamle, agentic yeteneklerin tüm model katmanlarında beklenti haline geldiğini ve teknoloji şirketleri arasında rekabetçi dinamiklerin maliyet ve işletme hızına kaydığını gösteriyor. OpenAI'nin GPT-5.6 Sol'u ve Google'ın Gemini 3.5 Flash'ı benzer şekilde otonom görevleri vurgulayan sunumlarla piyasaya çıktı.