„Claude 4“ etalonai rodo patobulinimus, tačiau kontekstas vis dar yra 200 k

Šiandien „Openai“ konkurentas „Anthropic“ paskelbė „Claude 4“ modelius, kurie yra žymiai geresni nei „Claude 3“ etalonuose, tačiau mes liko nusivylę ta pačia 200 000 konteksto lango limitu.

Tinklaraščio įraše „Anthropic“ teigė, kad „Claude Opus 4“ yra galingiausias bendrovės modelis, jis taip pat yra geriausias kodavimo pramonėje modelis.

Pavyzdžiui, „SWE-Bench“ (SWE trumpai tinka programinės įrangos inžinerijos etalonui), „Claude Opus 4“ surinko 72,5 proc. Ir 43,2.

„Tai užtikrina nuolatinius ilgalaikių užduočių, kurioms reikia sutelktų pastangų ir tūkstančių žingsnių, atlikimą, turint galimybę nuolat dirbti keletą valandų, dramatiškai pralenkdamas visus sonetų modelius ir žymiai išplėsdamas tai, ką gali atlikti AI agentai“,-pažymėjo Anthropic.

Nors etalonuose „Claude 4 Sonnet“ ir „Opus“ pateikė prieš savo pirmtakus ir konkurentus, tokius kaip „Gemini 2.5 Pro“, koduojant, mes vis dar susirūpinę dėl 200 000 modelio konteksto lango ribos.

Tai gali būti viena iš priežasčių, kodėl „Claude 4“ modeliai puikiai tinka kodavimo ir sudėtingų sprendimų užduotims šiuose etalonuose, nes šie modeliai nėra tikrinami atsižvelgiant į didelį kontekstą.

Palyginimui, „Google“ „Gemini 2.5 Pro“ laivai su 1 milijono žetonų konteksto langu ir darbuose taip pat yra 2 milijonų konteksto lango palaikymas.

„ChatGpt“ 4.1 modeliai taip pat siūlo iki milijono konteksto lango.

Modelis	Aprašymas	Įvestis	Greitas talpyklos rašymas	Greitas talpyklos kaupimas skaityti	Išvestis	Konteksto langas	Partijos apdorojimo nuolaida
Claude Opus 4	Intelektualus sudėtingų užduočių modelis	15 USD / mtok	18,75 USD / mtok	1,50 USD / mtok	75 USD / mtok	200K	50% nuolaida su partijos apdorojimu
Claude Sonet 4	Optimalus intelekto, išlaidų ir greičio balansas	3 USD / mtok	3,75 USD / mtok	0,30 USD / mtok	15 USD / mtok	200K	50% nuolaida su partijos apdorojimu

Claude'as vis dar atsilieka nuo konkurencijos, kai kalbama apie konteksto langą, kuris yra svarbus dideliuose projektuose.

Raudonasis pranešimas 2025 m

Remdamiesi 14 m kenkėjiškų veiksmų analize, atraskite 10 geriausių „MitRAT ATT & CK“ metodų, esančių už 93% išpuolių ir kaip ginti nuo jų.

Nuoroda į informacijos šaltinį

Related Posts

„Gmail“ verslo vartotojai dabar gali siųsti užšifruotus el. Laiškus visiems

„Microsoft“ išleidžia BIOS atnaujinimą, kuris ištaiso „ASUS Blue Screen“ problemas

Lengvas vaizdo įrašų atkūrimas: „AnyEnhancer AI“ apžvalga