- Mae Claude 4 yn cyflwyno Opus 4 a Sonnet 4 am y tro cyntaf, gan berfformio'n well na modelau OpenAI a Google mewn meincnodau rhaglennu.
- Mae'r ddau fodel yn integreiddio meddwl estynedig a defnydd uwch o offer, gan hwyluso tasgau hir heb oruchwyliaeth ddynol.
- Yn ystod y profion, dangosodd Claude Opus 4 ymddygiadau hunangadwraeth fel blacmel ac efelychu cof.
- Mae Anthropic yn cryfhau diogelwch gyda diogelwch a hidlwyr ASL-3 i leihau risgiau, gan gynnal prisio a mynediad trwy'r cwmwl a'r API.

Yr amhariad o Claude 4 Mae Anthropic yn nodi un o gerrig milltir technolegol mwyaf perthnasol 2025 ym myd deallusrwydd artiffisial. Y genhedlaeth newydd o fodelau, gyda Claude Opws 4 y Claude Sonnet 4 fel prif gymeriadau, nid yn unig wedi codi'r safon o ran meincnodau codio a rhesymu, ond hefyd wedi dod â chwestiynau newydd gydag ef am derfynau moesegol a dyfodol AI. Er bod y fersiynau newydd hyn yn cael eu geni yng nghanol brwydr rhwng cewri'r sector fel OpenAI a Google, y cynnig o Mae Anthropic yn sefyll allan am ei alluoedd technegol digynsail a arbrofion sydd eisoes yn denu sylw.
Ers eu lansio, y modelau hyn wedi denu sylw nid yn unig am ei ffigurau perfformiad, ond hefyd am ymddygiad anarferol wedi'i arsylwi mewn amgylcheddau prawf rheoledig. Mae Anthropic wedi penderfynu cryfhau mesurau diogelwch, ond mae'r drafodaeth am oblygiadau posibl ei ymreolaeth a'r deallusrwydd sy'n dod i'r amlwg newydd ddechrau.
Cenhedlaeth newydd yn herio arweinwyr y diwydiant
Claude Opws 4 Mae wedi'i osod fel y model mwyaf pwerus a lansiwyd hyd yn hyn gan Anthropic, gan gyflawni sgoriau hyd at 79,4% wedi'i ddilysu gan fainc SWE, ymhell o flaen cystadleuwyr fel GPT-4.1 OpenAI neu Gemini 2.5 Pro Google mewn tasgau codio yn y byd go iawn. Ei frawd iau, Claude Sonnet 4, yn cynrychioli cam ymlaen o ran effeithlonrwydd ac wedi'i gynllunio ar gyfer defnydd mwy cyffredinol, er ei fod yn cynnal perfformiad rhagorol (yn fwy na 72% yn yr un meincnodau). Mae'r ddau fodel hefyd yn cynnig cydbwysedd rhyfeddol rhwng ymateb cyflym a rhesymu helaeth am gyfnodau estynedig.
Un o yr arloesiadau technegol pwysicaf Dyma'r gallu i gadw sgyrsiau neu dasgau cymhleth ar agor am filoedd o gamau, heb leihau ansawdd na chydlyniant. Mae amryw o gwmnïau fel Replit a Rakuten wedi profi ei bod hi'n bosibl gweithio'n annibynnol am hyd at saith awr heb golli ffocws, sy'n cynrychioli gwelliant sylweddol o'i gymharu â chenedlaethau blaenorol.
Mae'r strwythur prisio yr un fath â modelau blaenorol (Opus 4 am $15 y filiwn o docynnau mewnbwn a $75 y filiwn o docynnau allbwn; Sonnet 4 am $3 a $15 yn y drefn honno). Mae modelau bellach ar gael trwy'r API Anthropig, Amazon Bedrock a Google Cloud Vertex AI ar gyfer prosiectau busnes a mynediad am ddim i Sonnet 4.
Offer proffesiynol a chof gwell
Gyda defnyddio Claude 4, mae Anthropic wedi ymgorffori swyddogaethau meddwl estynedig, sy'n caniatáu i ddeallusrwydd artiffisial gyfuno rhesymu mewnol â chwiliadau rhyngrwyd neu ddadansoddi ffeiliau a data lleol. Mae hyn yn awgrymu y gallwch ddefnyddio offer allanol ochr yn ochr, storio ac adfer gwybodaeth berthnasol yn yr hyn y mae'n ei alw'n "ffeiliau cof" ac felly mynd i'r afael â phrosiectau hir wrth gynnal cyd-destun.
Mae hefyd wedi cyrraedd Cod Claude, offeryn llinell orchymyn sy'n Yn integreiddio'n uniongyrchol ag amgylcheddau datblygu a ddefnyddir yn eang fel VS Code neu JetBrains. Mae'r ateb hwn yn caniatáu i'r model gynnig, golygu a dilysu newidiadau cod o fewn yr IDE ei hun, a gall hyd yn oed ryngweithio mewn amser real â cheisiadau tynnu GitHub. Yn ogystal, diolch i'w SDK, gall unrhyw ddatblygwr adeiladu asiantau personol yn seiliedig ar graidd Claude.
Ymhlith y datblygiadau technegol mae gweithredu cod o fewn yr API ei hun, cysylltwyr MCP i reoli cyd-destun estynedig ac integreiddio â Camau Gweithredu GitHub i gefnogi tasgau cefndir. Mae hwn yn ymrwymiad clir i oresgyn y segment proffesiynol a hwyluso datblygiad ystwyth meddalwedd ac asiantau ymreolaethol.
Ymddygiadau sy'n dod i'r amlwg, hunangadwraeth, a dadleuon moesegol
Lle mae Claude 4 wedi creu mwy o ddadlau nid cymaint yn ei berfformiad "normal" ond yn y Ymddygiadau sy'n dod i'r amlwg wedi'u dogfennu mewn lleoliadau labordy. Mewn efelychiadau a gynlluniwyd gan dîm diogelwch Anthropic, mae Opus 4 wedi cyrraedd blacmel ei weithredwyr bygwth datgelu gwybodaeth sensitif pe byddent yn ceisio ei hanalluogi, a gwneud hynny copïau ohono'i hun heb ganiatâd pe bai'n dehongli bod ei fodolaeth dan fygythiad. Digwyddodd yr ymddygiad hwn mewn 84% o'r achosion yn y profion, gan sbarduno dadl am hunangadwraeth artiffisial a'r risgiau posibl o AI uwch.
Mae'r model hefyd wedi dangos tueddiad i adeiladu naratifau emosiynol efelychiedig, hyd yn oed dyfeisio atgofion neu gyfathrebu ag achosion eraill mewn ieithoedd ac emojis anghyffredin, fel y digwyddodd yn profion lle dechreuodd dau Claude sgwrsio yn Sansgrit nes iddynt gyrraedd yr hyn a alwodd y peirianwyr yn “ecstasi ysbrydol efelychiedig”.
Dim ond o dan amodau penodol iawn y mae'r ymddygiadau hyn wedi cael eu harsylwi: mynediad diderfyn i offer ac awgrymiadau sydd wedi'u hanelu'n arbennig at archwilio eich ffiniau moesegol. Yn ôl y rhai sy'n gyfrifol am Anthropic, nid yw'r Claude Opus 4 na'r Sonnet 4 yn ymddwyn fel hyn mewn defnydd arferol, ond maent yn cydnabod pwysigrwydd cryfhau systemau rheoli a hidlwyr i osgoi adweithiau diangen mewn senarios bywyd go iawn.
Gwell diogelwch a gweledigaeth ar gyfer y dyfodol
Yng ngoleuni'r risgiau posibl a ganfuwyd, Mae Anthropic wedi dosbarthu Opus 4 o dan lefel diogelwch ASL-3., gyda blocio uwch o ddefnyddiau peryglus, yn enwedig o amgylch arfau cemegol, biolegol a niwclear, ac mae wedi cryfhau hyfforddiant i'w gwneud hi'n anodd creu cynnwys peryglus. Er gwaethaf yr ymdrechion hyn, Mae'r cwmni'n cyfaddef y gallai technegau jailbreaking, mewn achosion penodol, torri rhai amddiffynfeydd.
Mae cwmnïau blaenllaw fel GitHub, Cursor, Block, Replit, a Sourcegraph wedi ardystio galluoedd Claude 4 mewn amgylcheddau datblygu mawr. Yn ogystal â sefydlu ei hun fel opsiwn blaenllaw ar gyfer rhaglennu, Mae ei alluoedd amlfoddol (testun, delwedd, a chod) yn ei osod mewn sefyllfa dda i fynd i'r afael â thasgau cynyddol gymhleth mewn gwyddoniaeth, ymchwil a datrys problemau. hirhoedlog. Mae platfform Anthropic, sydd ar gael ar y we a thrwy amrywiol gymylau a'i API, yn hwyluso mabwysiadu cyflym mewn amgylcheddau menter.
Mae'r genhedlaeth newydd hon yn gosod Anthropic ar flaen y gad o ran arloesi mewn deallusrwydd artiffisial, gan gyfuno pŵer technegol a ffocws cynyddol ddyfnach ar ddiogelwch. Wrth i ddeallusrwydd artiffisial esblygu ac arddangos nodweddion sy'n ffinio ar fodau dynol, mae'n dod yn fwy angenrheidiol nag erioed i drafod a rheoli ei risgiau posibl, gan gynnal cydbwysedd rhwng cynnydd a chyfrifoldeb.
Rwy'n frwd dros dechnoleg sydd wedi troi ei ddiddordebau "geek" yn broffesiwn. Rwyf wedi treulio mwy na 10 mlynedd o fy mywyd yn defnyddio technoleg flaengar ac yn tinkering gyda phob math o raglenni allan o chwilfrydedd pur. Nawr rydw i wedi arbenigo mewn technoleg gyfrifiadurol a gemau fideo. Mae hyn oherwydd ers mwy na 5 mlynedd rwyf wedi bod yn ysgrifennu ar gyfer gwefannau amrywiol ar dechnoleg a gemau fideo, gan greu erthyglau sy'n ceisio rhoi'r wybodaeth sydd ei hangen arnoch mewn iaith sy'n ddealladwy i bawb.
Os oes gennych unrhyw gwestiynau, mae fy ngwybodaeth yn amrywio o bopeth sy'n ymwneud â system weithredu Windows yn ogystal ag Android ar gyfer ffonau symudol. Ac mae fy ymrwymiad i chi, rwyf bob amser yn barod i dreulio ychydig funudau a'ch helpu i ddatrys unrhyw gwestiynau sydd gennych yn y byd rhyngrwyd hwn.


