„Vibe“ kodavimo įmonė sako, kad Claude 4 sumažino sintaksės klaidas 25%

„Lovable“, kuris yra „Vibe“ kodavimo įrankis, sako, kad „Claude 4“ sumažino savo klaidas 25% ir padidino 40%.

Gegužės 22 d. „Anthropic“ pradėjo diegti du naujus modelius: „Claude Sonnet 4“ ir „Claude Opus 4“. Nors „Sonnet“ yra prieinamas nemokamiems vartotojams, „Opus“ reikalauja mokamos prenumeratos ir, kai reikia koduoti, gali padaryti geriau nei „Sonnet“.

Tinklaraščio įraše „Anthropic“ patvirtino, kad „Claude Opus 4“ surinko 72,5 proc. „SWE-Bench“ (SWE yra trumpas programinės įrangos inžinerijos etalonui).

Claude'as 4

Testuose „Opus 4“ atliko nuolatinius ilgalaikių užduočių atlikimą, kuriam reikia sutelktų pastangų ir tūkstančių žingsnių.

„Anthropic“ taip pat teigė, kad naujausias jo modelis pagal kodą dirbo septynias valandas.

„Vibe Coding Company Lovable“, kuri naudoja „Claude“ savo „AI varomo raginamo žiniatinklio ir„ Apps Builder “įrankyje“, pastebėjo panašius patobulinimus, atnaujinus į „Claude 4“.

„X“ įraše „Lovable“ sako, kad jame yra 25% mažiau klaidų ir yra 40% greitesnis, kai diegė „Claude 4“ tiek projekto kūrimui, tiek redagavimui visuose projektuose (įskaitant senus projektus).

Claude 4 ant mylimojo
„Claude 4“ sumažino sintaksės klaidas 25% mylimoje AI

Atskirame įraše „Lovable“ įkūrėjas Antonas Osika patvirtino, kad „Claude 4“ ką tik ištrynė didžiąją dalį „Lovable“ klaidų “, o specialiai nurodo LLM sintaksės klaidas, kai koduojama vibe.

„Claude 4“ yra geras kodavimo modelis

Nors nuomonė apie „Claude 4“ išlieka mišri, aš asmeniškai pastebėjau, kad „Claude 4“ sukuria kodą su mažiau klaidų nei „Gemini“, kai dirbu su DART/Kotlin programomis.

Tai priklauso nuo projekto projekto ir konteksto, tačiau projektuose, kuriuose nereikia ilgesnio konteksto, „Claude 4“ sekėsi geriau nei Dvyniai mano testuose.

„Claude“ modeliai visada išlaikė „geriausio kodavimo“ reputaciją, tačiau pastaruoju metu iš „Google“, kuri išleido „Gemini 2.5 Pro“ su 1 mln. Kontekstų lango, visuomet įvyko didelė konkurencija.

Palyginti su 200 000 „Claude 4“ ar senesnių modelių kontekstiniu langu, 1 mln. „Dvynių 2.5“ konteksto langas suteikia jam pranašumo. Bet tai nebūtinai reiškia, kad kodavime yra geriau nei Claude 4.

Abu gali būti stebėtinai nuostabūs ir tuo pat metu baisūs, taip pat priklauso nuo to, kaip jūs skubate inžineriją.

Visada malonu maišyti modelius, tokius kaip „O3“ ar „Gemini“ planavimui, o „Claude 4“ ir „Gemini“ kodavimui.

Raudonasis pranešimas 2025 m

Remdamiesi 14 m kenkėjiškų veiksmų analize, atraskite 10 geriausių „MitRAT ATT & CK“ metodų, esančių už 93% išpuolių ir kaip ginti nuo jų.

Nuoroda į informacijos šaltinį

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -