„Claude 4“ etalonai rodo patobulinimus, tačiau kontekstas vis dar yra 200 k

Šiandien „Openai“ konkurentas „Anthropic“ paskelbė „Claude 4“ modelius, kurie yra žymiai geresni nei „Claude 3“ etalonuose, tačiau mes liko nusivylę ta pačia 200 000 konteksto lango limitu.

Tinklaraščio įraše „Anthropic“ teigė, kad „Claude Opus 4“ yra galingiausias bendrovės modelis, jis taip pat yra geriausias kodavimo pramonėje modelis.

Claude'as 4

Pavyzdžiui, „SWE-Bench“ (SWE trumpai tinka programinės įrangos inžinerijos etalonui), „Claude Opus 4“ surinko 72,5 proc. Ir 43,2.

„Tai užtikrina nuolatinius ilgalaikių užduočių, kurioms reikia sutelktų pastangų ir tūkstančių žingsnių, atlikimą, turint galimybę nuolat dirbti keletą valandų, dramatiškai pralenkdamas visus sonetų modelius ir žymiai išplėsdamas tai, ką gali atlikti AI agentai“,-pažymėjo Anthropic.

Nors etalonuose „Claude 4 Sonnet“ ir „Opus“ pateikė prieš savo pirmtakus ir konkurentus, tokius kaip „Gemini 2.5 Pro“, koduojant, mes vis dar susirūpinę dėl 200 000 modelio konteksto lango ribos.

CLAUDE BENCHMARKS

Tai gali būti viena iš priežasčių, kodėl „Claude 4“ modeliai puikiai tinka kodavimo ir sudėtingų sprendimų užduotims šiuose etalonuose, nes šie modeliai nėra tikrinami atsižvelgiant į didelį kontekstą.

Palyginimui, „Google“ „Gemini 2.5 Pro“ laivai su 1 milijono žetonų konteksto langu ir darbuose taip pat yra 2 milijonų konteksto lango palaikymas.

„ChatGpt“ 4.1 modeliai taip pat siūlo iki milijono konteksto lango.




Modelis Aprašymas Įvestis Greitas talpyklos rašymas Greitas talpyklos kaupimas skaityti Išvestis Konteksto langas Partijos apdorojimo nuolaida
Claude Opus 4 Intelektualus sudėtingų užduočių modelis 15 USD / mtok 18,75 USD / mtok 1,50 USD / mtok 75 USD / mtok 200K 50% nuolaida su partijos apdorojimu
Claude Sonet 4 Optimalus intelekto, išlaidų ir greičio balansas 3 USD / mtok 3,75 USD / mtok 0,30 USD / mtok 15 USD / mtok 200K 50% nuolaida su partijos apdorojimu

Claude'as vis dar atsilieka nuo konkurencijos, kai kalbama apie konteksto langą, kuris yra svarbus dideliuose projektuose.

Raudonasis pranešimas 2025 m

Remdamiesi 14 m kenkėjiškų veiksmų analize, atraskite 10 geriausių „MitRAT ATT & CK“ metodų, esančių už 93% išpuolių ir kaip ginti nuo jų.

Nuoroda į informacijos šaltinį

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -