Šiandien „Openai“ konkurentas „Anthropic“ paskelbė „Claude 4“ modelius, kurie yra žymiai geresni nei „Claude 3“ etalonuose, tačiau mes liko nusivylę ta pačia 200 000 konteksto lango limitu.
Tinklaraščio įraše „Anthropic“ teigė, kad „Claude Opus 4“ yra galingiausias bendrovės modelis, jis taip pat yra geriausias kodavimo pramonėje modelis.
Pavyzdžiui, „SWE-Bench“ (SWE trumpai tinka programinės įrangos inžinerijos etalonui), „Claude Opus 4“ surinko 72,5 proc. Ir 43,2.
„Tai užtikrina nuolatinius ilgalaikių užduočių, kurioms reikia sutelktų pastangų ir tūkstančių žingsnių, atlikimą, turint galimybę nuolat dirbti keletą valandų, dramatiškai pralenkdamas visus sonetų modelius ir žymiai išplėsdamas tai, ką gali atlikti AI agentai“,-pažymėjo Anthropic.
Nors etalonuose „Claude 4 Sonnet“ ir „Opus“ pateikė prieš savo pirmtakus ir konkurentus, tokius kaip „Gemini 2.5 Pro“, koduojant, mes vis dar susirūpinę dėl 200 000 modelio konteksto lango ribos.
Tai gali būti viena iš priežasčių, kodėl „Claude 4“ modeliai puikiai tinka kodavimo ir sudėtingų sprendimų užduotims šiuose etalonuose, nes šie modeliai nėra tikrinami atsižvelgiant į didelį kontekstą.
Palyginimui, „Google“ „Gemini 2.5 Pro“ laivai su 1 milijono žetonų konteksto langu ir darbuose taip pat yra 2 milijonų konteksto lango palaikymas.
„ChatGpt“ 4.1 modeliai taip pat siūlo iki milijono konteksto lango.
Modelis | Aprašymas | Įvestis | Greitas talpyklos rašymas | Greitas talpyklos kaupimas skaityti | Išvestis | Konteksto langas | Partijos apdorojimo nuolaida |
---|---|---|---|---|---|---|---|
Claude Opus 4 | Intelektualus sudėtingų užduočių modelis | 15 USD / mtok | 18,75 USD / mtok | 1,50 USD / mtok | 75 USD / mtok | 200K | 50% nuolaida su partijos apdorojimu |
Claude Sonet 4 | Optimalus intelekto, išlaidų ir greičio balansas | 3 USD / mtok | 3,75 USD / mtok | 0,30 USD / mtok | 15 USD / mtok | 200K | 50% nuolaida su partijos apdorojimu |
Claude'as vis dar atsilieka nuo konkurencijos, kai kalbama apie konteksto langą, kuris yra svarbus dideliuose projektuose.
Remdamiesi 14 m kenkėjiškų veiksmų analize, atraskite 10 geriausių „MitRAT ATT & CK“ metodų, esančių už 93% išpuolių ir kaip ginti nuo jų.