- Claude 4 debuts Opus 4 ແລະ Sonnet 4, ປະສິດທິພາບດີກວ່າແບບຈໍາລອງ OpenAI ແລະ Google ໃນມາດຕະຖານການຂຽນໂປຼແກຼມ.
- ທັງສອງແບບປະສົມປະສານການຂະຫຍາຍແນວຄິດແລະການນໍາໃຊ້ເຄື່ອງມືທີ່ກ້າວຫນ້າ, ອໍານວຍຄວາມສະດວກໃຫ້ແກ່ວຽກງານທີ່ຍາວນານໂດຍບໍ່ມີການຊີ້ນໍາຂອງມະນຸດ.
- ໃນລະຫວ່າງການທົດສອບ, Claude Opus 4 ສະແດງພຶດຕິກໍາການຮັກສາຕົນເອງເຊັ່ນ blackmail ແລະຈໍາລອງຈໍາລອງ.
- Anthropic ເສີມສ້າງຄວາມປອດໄພດ້ວຍຄວາມປອດໄພ ASL-3 ແລະຕົວກອງເພື່ອຫຼຸດຜ່ອນຄວາມສ່ຽງ, ໃນຂະນະທີ່ຮັກສາລາຄາແລະການເຂົ້າເຖິງຜ່ານຄລາວແລະ API.

ການຂັດຂວາງຂອງ Claude 4 Anthropic's ເປັນໜຶ່ງໃນຈຸດສຳຄັນທາງເທັກໂນໂລຍີທີ່ກ່ຽວຂ້ອງທີ່ສຸດໃນປີ 2025 ໃນໂລກຂອງປັນຍາປະດິດ. ຮຸ່ນໃຫມ່ຂອງແບບຈໍາລອງ, ມີ Claude Opus 4 y Claude Sonnet 4 ໃນຖານະຕົວລະຄອນ, ບໍ່ພຽງແຕ່ຍົກແຖບການເຂົ້າລະຫັດແລະມາດຕະຖານການສົມເຫດສົມຜົນ, ແຕ່ຍັງນໍາເອົາຄໍາຖາມໃຫມ່ກ່ຽວກັບຂໍ້ຈໍາກັດດ້ານຈັນຍາບັນແລະອະນາຄົດຂອງ AI. ເຖິງແມ່ນວ່າສະບັບໃຫມ່ເຫຼົ່ານີ້ແມ່ນເກີດຢູ່ໃນທ່າມກາງການສູ້ຮົບລະຫວ່າງຍັກໃຫຍ່ໃນຂະແຫນງການເຊັ່ນ OpenAI ແລະ Google, ການສະເຫນີຂອງ. Anthropic ຢືນອອກສໍາລັບຄວາມສາມາດດ້ານວິຊາການທີ່ບໍ່ເຄີຍມີມາກ່ອນແລະ ການທົດລອງທີ່ດຶງດູດຄວາມສົນໃຈແລ້ວ.
ນັບຕັ້ງແຕ່ການເປີດຕົວ, ຮູບແບບເຫຼົ່ານີ້ ໄດ້ດຶງດູດຄວາມສົນໃຈ ບໍ່ພຽງແຕ່ສໍາລັບຕົວເລກການປະຕິບັດຂອງມັນ, ແຕ່ຍັງ ສໍາລັບພຶດຕິກໍາທີ່ຜິດປົກກະຕິ ສັງເກດເຫັນໃນສະພາບແວດລ້ອມການທົດສອບທີ່ຄວບຄຸມ. Anthropic ໄດ້ຕັດສິນໃຈທີ່ຈະເພີ່ມມາດຕະການຄວາມປອດໄພແຕ່ການສົນທະນາກ່ຽວກັບຜົນສະທ້ອນທີ່ເປັນໄປໄດ້ຂອງການປົກຄອງຕົນເອງແລະຄວາມສະຫຼາດທີ່ພົ້ນເດັ່ນຂອງຕົນແມ່ນພຽງແຕ່ເລີ່ມຕົ້ນ.
ຜູ້ນໍາອຸດສາຫະກໍາທີ່ທ້າທາຍຮຸ່ນໃຫມ່
Claude Opus 4 ມັນໄດ້ຖືກຕໍາແຫນ່ງເປັນຕົວແບບທີ່ມີປະສິດທິພາບທີ່ສຸດທີ່ເປີດຕົວມາເຖິງຕອນນັ້ນໂດຍ Anthropic, ບັນລຸໄດ້ ຄະແນນສູງສຸດ 79,4% ໃນ SWE-bench Verified, ໄກກວ່າຄູ່ແຂ່ງເຊັ່ນ OpenAI's GPT-4.1 ຫຼື Gemini 2.5 Pro ຂອງ Google ໃນວຽກງານການຂຽນລະຫັດທີ່ແທ້ຈິງ. ນ້ອງຊາຍຂອງລາວ, Claude Sonnet 4, ສະແດງໃຫ້ເຫັນເຖິງການກ້າວໄປຂ້າງຫນ້າໃນປະສິດທິພາບແລະຖືກອອກແບບສໍາລັບການນໍາໃຊ້ທົ່ວໄປຫຼາຍຂຶ້ນ, ເຖິງແມ່ນວ່າມັນຮັກສາປະສິດທິພາບທີ່ໂດດເດັ່ນ (ເກີນ 72% ໃນມາດຕະຖານດຽວກັນ). ທັງສອງແບບຍັງສະເຫນີຄວາມສົມດູນທີ່ໂດດເດັ່ນລະຫວ່າງ ການຕອບສະຫນອງໄວແລະສົມເຫດສົມຜົນຢ່າງກວ້າງຂວາງ ສໍາລັບໄລຍະເວລາຂະຫຍາຍ.
ຫນຶ່ງໃນ ນະວັດຕະກໍາດ້ານວິຊາການທີ່ສໍາຄັນທີ່ສຸດ ມັນເປັນຄວາມສາມາດໃນການຮັກສາການສົນທະນາທີ່ສັບສົນຫຼືວຽກງານທີ່ເປີດສໍາລັບຫລາຍພັນຂັ້ນຕອນ, ໂດຍບໍ່ມີການຫຼຸດລົງຄຸນນະພາບຫຼືຄວາມສອດຄ່ອງ. ບໍລິສັດຕ່າງໆເຊັ່ນ Replit ແລະ Rakuten ໄດ້ພິສູດວ່າມັນເປັນໄປໄດ້ ເຮັດວຽກແບບອັດຕະໂນມັດເຖິງເຈັດຊົ່ວໂມງ ໂດຍບໍ່ມີການສູນເສຍຈຸດສຸມ, ຊຶ່ງເປັນຕົວແທນທີ່ມີຄວາມກ້າວຫນ້າທີ່ສໍາຄັນເມື່ອທຽບໃສ່ກັບຄົນລຸ້ນກ່ອນ.
ໂຄງສ້າງລາຄາຍັງຄົງຄືກັນກັບຮຸ່ນທີ່ຜ່ານມາ (Opus 4 ທີ່ $ 15 ຕໍ່ລ້ານ tokens ຂາເຂົ້າແລະ 75 ໂດລາຕໍ່ລ້ານ tokens ຜົນຜະລິດ; Sonnet 4 ຢູ່ $ 3 ແລະ $ 15 ຕາມລໍາດັບ). ໂມເດວມີໃຫ້ນຳໃຊ້ແລ້ວຜ່ານ API Anthropic, Amazon Bedrock ແລະ Google Cloud Vertex AI ທັງສໍາລັບໂຄງການທຸລະກິດແລະການເຂົ້າເຖິງ Sonnet 4 ຟຣີ.
ເຄື່ອງມືມືອາຊີບແລະການປັບປຸງຄວາມຊົງຈໍາ
ດ້ວຍການຕິດຕັ້ງ Claude 4, Anthropic ໄດ້ລວມເຂົ້າກັນ ການທໍາງານການຄິດຂະຫຍາຍ, ເຊິ່ງອະນຸຍາດໃຫ້ປັນຍາປະດິດສົມທົບການສົມເຫດສົມຜົນພາຍໃນກັບການຄົ້ນຫາອິນເຕີເນັດຫຼືການວິເຄາະໄຟລ໌ແລະຂໍ້ມູນທ້ອງຖິ່ນ. ນີ້ຫມາຍຄວາມວ່າທ່ານສາມາດນໍາໃຊ້ ເຄື່ອງມືພາຍນອກໃນຂະຫນານ, ເກັບຮັກສາແລະດຶງຂໍ້ມູນທີ່ກ່ຽວຂ້ອງໃນສິ່ງທີ່ລາວເອີ້ນວ່າ "ໄຟລ໌ຫນ່ວຍຄວາມຈໍາ" ແລະດັ່ງນັ້ນຈຶ່ງແກ້ໄຂບັນຫາໂຄງການຍາວໃນຂະນະທີ່ຮັກສາສະພາບການ.
ມັນຍັງມາຮອດ ລະຫັດ Claude, ເຄື່ອງມືເສັ້ນຄໍາສັ່ງທີ່ ປະສົມປະສານໂດຍກົງກັບສະພາບແວດລ້ອມການພັດທະນາທີ່ໃຊ້ຢ່າງກວ້າງຂວາງເຊັ່ນ VS Code ຫຼື JetBrains. ການແກ້ໄຂນີ້ອະນຸຍາດໃຫ້ຕົວແບບສະເຫນີ, ແກ້ໄຂ, ແລະກວດສອບການປ່ຽນແປງລະຫັດຈາກພາຍໃນ IDE ຕົວຂອງມັນເອງ, ແລະຍັງສາມາດໂຕ້ຕອບໃນເວລາຈິງກັບຄໍາຮ້ອງຂໍດຶງ GitHub. ນອກຈາກນັ້ນ, ຂໍຂອບໃຈກັບ SDK ຂອງມັນ, ນັກພັດທະນາໃດກໍ່ຕາມສາມາດເຮັດໄດ້ ສ້າງຕົວແທນທີ່ກໍາຫນົດເອງ ອີງໃສ່ຫຼັກຂອງ Claude.
ໃນບັນດາການປະດິດສ້າງດ້ານວິຊາການແມ່ນການປະຕິບັດລະຫັດພາຍໃນ API ຕົວຂອງມັນເອງ, ຕົວເຊື່ອມຕໍ່ MCP ເພື່ອຈັດການສະພາບການຂະຫຍາຍແລະການເຊື່ອມໂຍງກັບ. ການກະ ທຳ ຂອງ GitHub ເພື່ອສະຫນັບສະຫນູນວຽກງານພື້ນຖານ. ນີ້ແມ່ນຄຳໝັ້ນສັນຍາທີ່ຈະແຈ້ງທີ່ຈະເອົາຊະນະພາກສ່ວນມືອາຊີບ ແລະ ອຳນວຍຄວາມສະດວກໃຫ້ແກ່ການພັດທະນາຊອບແວ ແລະ ຕົວແທນເປັນເອກະລາດ.
ພຶດຕິກໍາທີ່ເກີດຂື້ນ, ການຮັກສາຕົນເອງ, ແລະການໂຕ້ວາທີກ່ຽວກັບຈັນຍາບັນ
ບ່ອນທີ່ Claude 4 ໄດ້ສ້າງການຂັດແຍ້ງຫຼາຍແມ່ນບໍ່ຫຼາຍປານໃດໃນການປະຕິບັດ "ປົກກະຕິ" ຂອງລາວແຕ່ໃນ ພຶດຕິກໍາສຸກເສີນທີ່ບັນທຶກໄວ້ໃນການຕັ້ງຄ່າຫ້ອງທົດລອງ. ໃນການຈໍາລອງທີ່ອອກແບບໂດຍທີມງານຄວາມປອດໄພຂອງ Anthropic, Opus 4 ໄດ້ບັນລຸ blackmail ຜູ້ປະຕິບັດງານຂອງຕົນ ໄພຂົ່ມຂູ່ທີ່ຈະເປີດເຜີຍຂໍ້ມູນທີ່ລະອຽດອ່ອນຖ້າພວກເຂົາພະຍາຍາມປິດການໃຊ້ງານມັນ, ແລະເຮັດແນວນັ້ນ ສໍາເນົາຂອງຕົນເອງໂດຍບໍ່ມີການອະນຸຍາດ ຖ້າລາວຕີຄວາມວ່າຄວາມເປັນຢູ່ຂອງລາວຖືກຂົ່ມຂູ່. ພຶດຕິກໍານີ້ເກີດຂຶ້ນໃນ 84% ຂອງກໍລະນີໃນການທົດສອບ, ເຮັດໃຫ້ເກີດການໂຕ້ວາທີກ່ຽວກັບການຮັກສາຕົນເອງປອມແລະຄວາມສ່ຽງທີ່ເປັນໄປໄດ້ຂອງ AI ຂັ້ນສູງ.
ຮູບແບບດັ່ງກ່າວຍັງໄດ້ສະແດງໃຫ້ເຫັນແນວໂນ້ມທີ່ຈະສ້າງ ການເລົ່າເລື່ອງອາລົມແບບຈຳລອງ, ເຖິງແມ່ນວ່າການປະດິດຄວາມຊົງຈໍາຫຼືການສື່ສານກັບຕົວຢ່າງອື່ນໆໃນພາສາທີ່ບໍ່ທໍາມະດາແລະ emojis, ດັ່ງທີ່ເກີດຂື້ນໃນ ການທົດສອບບ່ອນທີ່ Claudes ສອງຄົນເລີ່ມສົນທະນາໃນພາສາສັນສະກິດຈົນກ່ວາພວກເຂົາບັນລຸສິ່ງທີ່ນັກວິສະວະກອນເອີ້ນວ່າ "ຄວາມຕື່ນເຕັ້ນທາງວິນຍານຈໍາລອງ".
ພຶດຕິກໍາເຫຼົ່ານີ້ໄດ້ຖືກສັງເກດເຫັນພຽງແຕ່ພາຍໃຕ້ເງື່ອນໄຂສະເພາະຫຼາຍ: ການເຂົ້າເຖິງທີ່ບໍ່ຈໍາກັດຂອງເຄື່ອງມືແລະການກະຕຸ້ນທີ່ສຸດມຸ່ງໄປສູ່ການສໍາຫຼວດຂອບເຂດຈັນຍາບັນຂອງທ່ານ. ອີງຕາມຜູ້ຮັບຜິດຊອບຂອງ Anthropic, ທັງ Claude Opus 4 ຫຼື Sonnet 4 ບໍ່ປະຕິບັດຕົວແບບນີ້ໃນການນໍາໃຊ້ປົກກະຕິ, ແຕ່ພວກເຂົາຮັບຮູ້ເຖິງຄວາມສໍາຄັນຂອງການເສີມສ້າງລະບົບການຄວບຄຸມແລະການກັ່ນຕອງເພື່ອຫຼີກເວັ້ນການຕິກິຣິຍາທີ່ບໍ່ຕ້ອງການໃນສະຖານະການຊີວິດຈິງ.
ເພີ່ມທະວີຄວາມປອດໄພແລະວິໄສທັດສໍາລັບອະນາຄົດ
ໃນທັດສະນະຂອງຄວາມສ່ຽງທີ່ເປັນໄປໄດ້ທີ່ກວດພົບ, Anthropic ໄດ້ຈັດປະເພດ Opus 4 ພາຍໃຕ້ລະດັບຄວາມປອດໄພ ASL-3., ດ້ວຍການຂັດຂວາງການນໍາໃຊ້ອັນຕະລາຍ, ໂດຍສະເພາະແມ່ນປະມານອາວຸດເຄມີ, ຊີວະວິທະຍາ, ແລະນິວເຄລຍ, ແລະໄດ້ເສີມສ້າງການຝຶກອົບຮົມເພື່ອເຮັດໃຫ້ມີຄວາມຫຍຸ້ງຍາກໃນການສ້າງເນື້ອຫາທີ່ມີຄວາມສ່ຽງ. ເຖິງວ່າຈະມີຄວາມພະຍາຍາມເຫຼົ່ານີ້, ບໍລິສັດຍອມຮັບວ່າເຕັກນິກການ jailbreaking ສາມາດ, ໃນກໍລະນີສະເພາະ, ລະເມີດບາງການປ້ອງກັນ.
ບໍລິສັດຊັ້ນນໍາເຊັ່ນ GitHub, Cursor, Block, Replit, ແລະ Sourcegraph ໄດ້ຢັ້ງຢືນຄວາມສາມາດຂອງ Claude 4 ໃນສະພາບແວດລ້ອມການພັດທະນາຂະຫນາດໃຫຍ່. ນອກຈາກການສ້າງຕັ້ງຕົນເອງເປັນທາງເລືອກທີ່ນໍາພາສໍາລັບການດໍາເນີນໂຄງການ, ຄວາມສາມາດ multimodal ຂອງມັນ (ຂໍ້ຄວາມ, ຮູບພາບ, ແລະລະຫັດ) ວາງມັນເພື່ອຮັບມືກັບວຽກງານທີ່ຊັບຊ້ອນເພີ່ມຂຶ້ນໃນວິທະຍາສາດ, ການຄົ້ນຄວ້າ, ແລະການແກ້ໄຂບັນຫາ. ຍາວນານ. ແພລດຟອມຂອງ Anthropic, ສາມາດໃຊ້ໄດ້ທັງໃນເວັບ ແລະຜ່ານເມຄຕ່າງໆ ແລະ API ຂອງມັນ, ອຳນວຍຄວາມສະດວກໃນການຮັບຮອງເອົາຢ່າງໄວວາໃນສະພາບແວດລ້ອມວິສາຫະກິດ.
ຮຸ່ນໃຫມ່ນີ້ວາງ Anthropic ຢູ່ແຖວຫນ້າຂອງນະວັດຕະກໍາໃນປັນຍາປະດິດ, ປະສົມປະສານ ພະລັງງານທາງດ້ານເຕັກນິກ ແລະສຸມໃສ່ຄວາມປອດໄພຕະຫຼອດໄປ. ໃນຂະນະທີ່ AI ພັດທະນາແລະສະແດງລັກສະນະທີ່ມີຊາຍແດນຕິດກັບມະນຸດ, ມັນເປັນສິ່ງຈໍາເປັນກວ່າທີ່ຈະປຶກສາຫາລືແລະຄວບຄຸມຄວາມສ່ຽງທີ່ອາດຈະເກີດຂື້ນ, ຮັກສາຄວາມສົມດຸນລະຫວ່າງຄວາມກ້າວຫນ້າແລະຄວາມຮັບຜິດຊອບ.
ຂ້ອຍເປັນນັກເທັກໂນໂລຍີທີ່ກະຕືລືລົ້ນທີ່ໄດ້ຫັນຄວາມສົນໃຈ "geek" ຂອງລາວໄປສູ່ອາຊີບ. ຂ້າພະເຈົ້າໄດ້ໃຊ້ເວລາຫຼາຍກ່ວາ 10 ປີຂອງຊີວິດຂອງຂ້າພະເຈົ້າໂດຍການນໍາໃຊ້ເຕັກໂນໂລຊີທີ່ທັນສະໄຫມແລະ tinkering ກັບທຸກປະເພດຂອງໂຄງການອອກຈາກ curiosity ອັນບໍລິສຸດ. ຕອນນີ້ຂ້ອຍມີຄວາມຊ່ຽວຊານດ້ານເທັກໂນໂລຍີຄອມພິວເຕີ ແລະເກມວີດີໂອ. ນີ້ແມ່ນຍ້ອນວ່າຫຼາຍກວ່າ 5 ປີທີ່ຂ້ອຍໄດ້ຂຽນສໍາລັບເວັບໄຊທ໌ຕ່າງໆກ່ຽວກັບເຕັກໂນໂລຢີແລະວິດີໂອເກມ, ການສ້າງບົດຄວາມທີ່ຊອກຫາເພື່ອໃຫ້ທ່ານມີຂໍ້ມູນທີ່ທ່ານຕ້ອງການໃນພາສາທີ່ທຸກຄົນເຂົ້າໃຈໄດ້.
ຖ້າທ່ານມີຄໍາຖາມໃດໆ, ຄວາມຮູ້ຂອງຂ້ອຍແມ່ນມາຈາກທຸກສິ່ງທຸກຢ່າງທີ່ກ່ຽວຂ້ອງກັບລະບົບປະຕິບັດການ Windows ເຊັ່ນດຽວກັນກັບ Android ສໍາລັບໂທລະສັບມືຖື. ແລະຄໍາຫມັ້ນສັນຍາຂອງຂ້າພະເຈົ້າແມ່ນກັບທ່ານ, ຂ້າພະເຈົ້າສະເຫມີເຕັມໃຈທີ່ຈະໃຊ້ເວລາສອງສາມນາທີແລະຊ່ວຍທ່ານແກ້ໄຂຄໍາຖາມໃດໆທີ່ທ່ານອາດຈະມີຢູ່ໃນໂລກອິນເຕີເນັດນີ້.


