Claude Opus 4.8 duyuruldu: Anthropic yeni yapay zekâ modelinin 4 kat daha dürüst olduğunu söylüyor

Anthropic, yeni yapay zekâ modeli Claude Opus 4.8'i tanıttı. Şirket, modelin belirsizlikleri daha açık ifade ettiğini ve kodlama hatalarını fark etme konusunda önceki sürüme göre çok daha başarılı olduğunu belirtiyor.

Claude Opus 4.8 duyuruldu: Anthropic yeni yapay zekâ modelinin 4 kat daha dürüst olduğunu söylüyor

Anthropic, Claude ailesinin en yeni üyesi olan Claude Opus 4.8 modelini resmen duyurdu. Şirketin açıklamasına göre yeni model; kodlama, ajan görevleri, bilgi işleri ve çok adımlı akıl yürütme gibi alanlarda önceki nesil Opus 4.7'ye göre daha güçlü performans sunuyor.

Ancak Opus 4.8'i öne çıkaran asıl yenilik performans artışından çok güvenilirlik tarafında yaşanıyor. Anthropic, modelin emin olmadığı durumlarda bunu daha açık şekilde ifade ettiğini ve yeterli kanıt bulunmayan konularda kesin yargılarda bulunma eğiliminin önemli ölçüde azaltıldığını söylüyor.

Claude Opus 4.8 duyuruldu: Anthropic yeni yapay zekâ modelinin 4 kat daha dürüst olduğunu söylüyor - Resim : 1

Anthropic: Daha az hata yapıyor, daha az "uyduruyor"

Yapay zekâ sistemlerinin en çok eleştirilen yönlerinden biri, yanlış bilgileri büyük bir özgüvenle sunabilmeleri. Anthropic, Opus 4.8 ile bu sorunu azaltmaya odaklandığını belirtiyor.

Şirket tarafından paylaşılan test sonuçlarına göre model, yazdığı kodlardaki hataları fark etmeden geçme konusunda önceki sürüme kıyasla yaklaşık dört kat daha düşük risk taşıyor. Ayrıca kullanıcıyı yanlış yönlendirme, aldatıcı davranışlar ve güvenlik ihlalleri gibi alanlarda da daha iyi sonuçlar elde ettiği ifade ediliyor.

Kodlama performansı da yükseldi

Anthropic'in yayımladığı benchmark sonuçlarına göre Claude Opus 4.8, SWE-Bench Pro kodlama testinde yüzde 69,2 başarı oranına ulaştı.

Şirket ayrıca yeni modelin:

  • Yazılım geliştirme
  • Finansal analiz
  • Bilgi işleme
  • Çok adımlı akıl yürütme
  • Bilgisayar kullanımı

gibi alanlarda da önceki sürüme göre daha başarılı olduğunu belirtiyor.

Yeni "Dynamic Workflows" özelliği geldi

Claude Code tarafında sunulan yeni Dynamic Workflows özelliği sayesinde model, büyük ölçekli projelerde görevleri planlayabiliyor ve çok sayıda alt görevi aynı anda yürütebiliyor.

Anthropic'e göre bu sistem, yüz binlerce satırlık kod tabanlarında karmaşık dönüşüm işlemlerinin daha verimli şekilde gerçekleştirilmesini sağlayacak.

Yapay zekânın ne kadar düşüneceğini kullanıcı belirleyecek

Claude Opus 4.8 ile birlikte gelen bir diğer yenilik ise "Effort Control" özelliği oldu.

Bu özellik sayesinde kullanıcılar modelin bir göreve ne kadar işlem gücü ve düşünme süresi ayıracağını belirleyebiliyor. Daha yüksek ayarlar daha kaliteli sonuçlar üretirken, düşük ayarlar daha hızlı ve daha düşük maliyetli yanıtlar sunuyor.

Anthropic ayrıca daha gelişmiş modeller üzerinde çalıştığını ve Claude Mythos Preview isimli yeni nesil sistemin de önümüzdeki dönemde daha fazla kullanıcıya açılabileceğini açıkladı.