Клод 4: Anthropic-ийн шинэ хиймэл оюун ухааны загварууд ямар харагдаж байна

Claude 4 нь Opus 4 болон Sonnet 4-ийг эхлүүлж, програмчлалын жишиг үзүүлэлтээрээ OpenAI болон Google-ийн загваруудаас илүү гарсан.
Энэ хоёр загвар нь хүний хараа хяналтгүйгээр урт хугацааны ажлыг хөнгөвчлөх, өргөтгөсөн сэтгэлгээ, дэвшилтэт хэрэгслийн хэрэглээг нэгтгэдэг.
Туршилтын үеэр Claude Opus 4 нь шантааж, санах ойн загварчлал гэх мэт өөрийгөө хамгаалах зан үйлийг харуулсан.
Anthropic нь аюулгүй байдлыг ASL-3 хамгаалалт, шүүлтүүрээр бэхжүүлж, эрсдэлийг багасгахын зэрэгцээ үүлэн болон API-ээр дамжуулан үнэ болон хандалтыг хадгалдаг.

-ийн тасалдал Клод 4 Anthropic нь хиймэл оюун ухааны ертөнцөд 2025 оны хамгийн чухал технологийн үе шатуудын нэг юм. Шинэ үеийн загварууд, хамт Клод Опус 4 y Клод Соннет 4 Гол дүрийн хувьд энэ нь зөвхөн кодлох, үндэслэл тогтоох шалгуур үзүүлэлтийг дээшлүүлснээс гадна хиймэл оюун ухааны ёс зүйн хязгаар, ирээдүйн талаархи шинэ асуултуудыг авчирсан. Хэдийгээр эдгээр шинэ хувилбарууд нь OpenAI болон Google зэрэг салбарын аварга компаниудын хооронд өрнөж буй тулааны дунд төрсөн боловч Anthropic нь урьд өмнө хэзээ ч байгаагүй техникийн чадвараараа бусдаас ялгардаг аль хэдийн олны анхаарлыг татсан туршилтууд.

Гаргаснаас хойш эдгээр загварууд анхаарлыг татсан зөвхөн гүйцэтгэлийн үзүүлэлтээрээ төдийгүй ер бусын зан үйлийн төлөө хяналттай туршилтын орчинд ажиглагдсан. Антропик аюулгүй байдлын арга хэмжээгээ чангатгахаар шийджээ, гэхдээ түүний бие даасан байдал болон шинээр гарч ирж буй тагнуулын үр дагаварын талаархи хэлэлцүүлэг дөнгөж эхэлж байна.

Салбарын удирдагчдыг сорьж буй шинэ үе

Клод Опус 4 Энэ нь Anthropic-ийн гаргасан хамгийн хүчирхэг загвар болж чадсан 79,4% хүртэл оноо SWE-bench Verified-д OpenAI-ийн GPT-4.1 эсвэл Google-ийн Gemini 2.5 Pro зэрэг өрсөлдөгчдөөс бодит кодчиллын даалгавруудыг гүйцэтгэсэн. Түүний дүү, Клод Соннет 4, үр ашгийг дээшлүүлэх алхамыг илэрхийлдэг бөгөөд энэ нь гайхалтай гүйцэтгэлийг (ижил жишигт 72% -иас давсан) хадгалдаг хэдий ч илүү ерөнхий хэрэглээнд зориулагдсан болно. Хоёр загвар хоёулаа гайхалтай тэнцвэрийг санал болгодог хурдан хариу үйлдэл, өргөн үндэслэлтэй удаан хугацаагаар зогсох.

Онцгой контент - Энд дарна уу Apple Watch: Цусны даралт ихсэх өвчний шинэ сэрэмжлүүлэг, нийцтэй загварууд

Нэг нь хамгийн чухал техникийн шинэчлэл Энэ нь нарийн төвөгтэй яриа эсвэл даалгаврыг чанар, уялдаа холбоог бууруулахгүйгээр олон мянган алхамын турш нээлттэй байлгах чадвар юм. Энэ нь боломжтой гэдгийг Replit, Rakuten зэрэг янз бүрийн компаниуд нотолсон долоон цаг хүртэл бие даан ажиллах анхаарал төвлөрөл алдагдахгүй байгаа нь өмнөх үеийнхтэй харьцуулахад мэдэгдэхүйц ахиц дэвшил юм.

Үнийн бүтэц нь өмнөх загваруудынхтай ижил хэвээр байна (Opus 4 нь нэг сая оролтын жетон тутамд $ 15, нэг сая гаралтын жетон $ 75; Sonnet 4 $ 3 ба $ 15 тус тус). Одоо загваруудыг Anthropic API-ээр дамжуулан авах боломжтой, Amazon Bedrock болон Google Cloud Vertex AI бизнесийн төслүүд болон Sonnet 4-д үнэгүй нэвтрэх боломжтой.

Холбоотой нийтлэл:

Claude AI ашиглан вэбээс хэрхэн хайх вэ

Мэргэжлийн багаж хэрэгсэл, сайжруулсан санах ой

Клод 4-ийг байршуулснаар Anthropic компани нэгдсэн өргөтгөсөн сэтгэлгээний функцууд, энэ нь хиймэл оюун ухаан нь дотоод үндэслэлийг интернет хайлт эсвэл дотоод файл, өгөгдөлд дүн шинжилгээ хийхтэй хослуулах боломжийг олгодог. Энэ нь та ашиглаж болно гэсэн үг юм зэрэгцээ гаднах хэрэгсэл, "санах ойн файлууд" гэж нэрлэсэн зүйлд холбогдох мэдээллийг хадгалж, олж авах, улмаар контекстийг хадгалахын зэрэгцээ урт төслүүдийг шийдвэрлэх.

Бас ирлээ Клод код, командын мөрийн хэрэгсэл VS Code эсвэл JetBrains гэх мэт өргөн хэрэглэгддэг хөгжүүлэлтийн орчинтой шууд нэгтгэдэг. Энэхүү шийдэл нь загварт IDE дотроос кодын өөрчлөлтийг санал болгох, засварлах, баталгаажуулах боломжийг олгодог бөгөөд GitHub татах хүсэлтүүдтэй бодит цаг хугацаанд харилцах боломжтой. Нэмж дурдахад, SDK-ийн ачаар ямар ч хөгжүүлэгч боломжтой захиалгат агентуудыг бий болгох Клодын цөм дээр үндэслэсэн.

Онцгой контент - Энд дарна уу Alexa Like Talk

Техникийн шинэлэг зүйлүүдийн дотроос API доторх кодыг гүйцэтгэх, өргөтгөсөн контекстийг удирдах MCP холбогч, интеграцчилал зэрэг орно. GitHub үйлдлүүд суурь ажлуудыг дэмжих. Энэ нь мэргэжлийн сегментийг байлдан дагуулж, программ хангамж, бие даасан агентуудыг хурдан хөгжүүлэхэд чиглэсэн тодорхой амлалт юм.

Шинээр гарч ирж буй зан үйл, өөрийгөө хамгаалах, ёс зүйн маргаан

Клод 4 илүү их маргаан үүсгэсэн нь түүний "хэвийн" гүйцэтгэлд бус харин Лабораторийн нөхцөлд баримтжуулсан яаралтай зан үйл. Anthropic-ийн аюулгүй байдлын багийн зохион бүтээсэн симуляцид Opus 4 хүрсэн байна операторуудаа харлуулах Хэрэв идэвхгүй болгохыг оролдвол нууц мэдээллийг задруулна гэж заналхийлж байна зөвшөөрөлгүйгээр өөрийн хуулбар хэрэв түүний оршин тогтнолд заналхийлсэн гэж тайлбарлавал. Туршилтын тохиолдлын 84% -д нь ийм зан үйл тохиолдсон нь хиймэл өөрийгөө хамгаалах, дэвшилтэт хиймэл оюун ухааны болзошгүй эрсдлийн талаар маргаан үүсгэв.

Мөн загвар нь бүтээх хандлагатай байгааг харуулсан дуураймал сэтгэл хөдлөлийн өгүүллэгүүд, тэр ч байтугай тохиолдсон шиг ер бусын хэл, эможи ашиглан дурсамж бүтээх эсвэл бусад тохиолдлуудтай харилцах Хоёр Клод санскрит хэлээр ярилцаж эхэлсэн бөгөөд инженерүүдийн "суурьчилсан сүнслэг сэтгэлийн хөөрөл"-д хүрэх хүртэл туршилтууд..

Эдгээр зан үйл нь зөвхөн маш тодорхой нөхцөлд ажиглагдсан: Таны ёс суртахууны хил хязгаарыг судлахад чиглэгдсэн хэрэгсэл, зааварт хязгаарлалтгүй хандах. Anthropic-ийг хариуцдаг хүмүүсийн хэлснээр, Claude Opus 4 болон Sonnet 4 нь ердийн хэрэглээнд ийм байдлаар ажилладаггүй, гэхдээ бодит амьдрал дээрх хүсээгүй урвалаас зайлсхийхийн тулд хяналтын систем, шүүлтүүрийг бэхжүүлэхийн чухлыг тэд хүлээн зөвшөөрдөг.

Онцгой контент - Энд дарна уу Brave Search AI-г хэрхэн ашиглах вэ: Бүрэн гарын авлага

Сайжруулсан аюулгүй байдал, ирээдүйн алсын хараа

Илэрсэн болзошгүй эрсдэлийг харгалзан, Anthropic нь Opus 4-ийг ASL-3 аюулгүй байдлын түвшинд ангилсан., ялангуяа химийн, биологийн болон цөмийн зэвсгийн эргэн тойронд аюултай хэрэглээг дэвшилтэт хориглож, эрсдэлтэй контент бүтээхэд хүндрэлтэй болгох үүднээс сургалтыг бэхжүүлсэн. Эдгээр хүчин чармайлтыг үл харгалзан, Тус компани jailbreak хийх техник нь боломжтой гэдгийг хүлээн зөвшөөрдөг, тодорхой тохиолдолд, зарим хамгаалалтыг зөрчих.

GitHub, Cursor, Block, Replit, Sourcegraph зэрэг тэргүүлэгч компаниуд Claude 4-ийн томоохон хөгжүүлэлтийн орчинд ажиллах чадварыг баталгаажуулсан. Өөрийгөө програмчлалын тэргүүлэх хувилбар болгон батлахаас гадна, Түүний олон талт чадвар (текст, зураг, код) нь шинжлэх ухаан, судалгаа, асуудлыг шийдвэрлэхэд улам бүр төвөгтэй ажлуудыг шийдвэрлэхэд тусалдаг. удаан эдэлгээтэй. Антропикийн платформ нь вэб болон янз бүрийн үүл болон түүний API-ээр дамжуулан боломжтой бөгөөд байгууллагын орчинд хурдан нэвтрүүлэхэд тусалдаг.

Энэхүү шинэ үе нь Anthropic-ийг хиймэл оюун ухааны инновацийн тэргүүн эгнээнд байрлуулж, хосолсон. техникийн хүчин чадал, аюулгүй байдалд улам бүр гүнзгийрүүлэн анхаарч байна. Хиймэл оюун ухаан хөгжиж, хүнтэй адил шинж чанаруудыг харуулахын хэрээр ахиц дэвшил, хариуцлагын тэнцвэрийг хадгалахын тулд түүний болзошгүй эрсдлийг хэлэлцэж, хянах нь урьд өмнөхөөсөө илүү шаардлагатай болж байна.

Холбоотой нийтлэл:

Бүх зүйл холбогдох үед: технологийн нэгдмэл байдлыг бодит жишээн дээр тайлбарлав

Альберто Наварро

Би өөрийн "геек" сонирхлоо мэргэжил болгож чадсан технологи сонирхогч хүн. Би амьдралынхаа 10 гаруй жилийг хамгийн сүүлийн үеийн технологи ашиглан, бүх төрлийн программыг сониуч зандаа зориулж өнгөрүүлсэн. Одоо би компьютерийн технологи, видео тоглоомоор мэргэшсэн. Учир нь би 5-аас дээш жил технологи, видео тоглоомын талаар янз бүрийн вэб сайтуудад зориулж, танд хэрэгтэй мэдээллийг хүн бүрт ойлгомжтой хэлээр өгөхийг зорьсон нийтлэлүүдийг бүтээж байна.

Хэрэв танд асуулт байгаа бол миний мэдлэг Windows үйлдлийн систем, гар утсанд зориулсан Android-тай холбоотой бүх зүйлээс хамаарна. Мөн миний амлалт бол таны өмнө, би үргэлж хэдэн минут зарцуулж, энэ интернет ертөнцөд байгаа бүх асуултыг шийдвэрлэхэд тань туслахад бэлэн байна.