- SAM 3 ແນະນໍາການແບ່ງສ່ວນຮູບພາບ ແລະວິດີໂອທີ່ນໍາພາໂດຍຂໍ້ຄວາມ ແລະຕົວຢ່າງທາງສາຍຕາ, ດ້ວຍຄໍາສັບຂອງແນວຄວາມຄິດລ້ານໆ.
- SAM 3D ອະນຸຍາດໃຫ້ທ່ານສ້າງວັດຖຸ, ສາກ, ແລະຮ່າງກາຍຂອງມະນຸດຄືນໃຫມ່ໃນ 3D ຈາກຮູບພາບດຽວ, ໂດຍໃຊ້ຕົວແບບເປີດ.
- ແບບຈໍາລອງສາມາດຖືກທົດສອບໂດຍບໍ່ມີຄວາມຮູ້ດ້ານວິຊາການໃນ Segment Anything Playground, ດ້ວຍແມ່ແບບປະຕິບັດແລະສ້າງສັນ.
- Meta ປ່ອຍນ້ໍາຫນັກ, ຈຸດກວດກາ, ແລະມາດຕະຖານໃຫມ່ເພື່ອໃຫ້ນັກພັດທະນາແລະນັກຄົ້ນຄວ້າໃນເອີຣົບແລະສ່ວນທີ່ເຫຼືອຂອງໂລກສາມາດປະສົມປະສານຄວາມສາມາດເຫຼົ່ານີ້ເຂົ້າໃນໂຄງການຂອງພວກເຂົາ.
Meta ໄດ້ເອົາບາດກ້າວອື່ນໃນຄໍາຫມັ້ນສັນຍາຂອງຕົນທີ່ຈະ ປັນຍາປະດິດໃຊ້ກັບວິໄສທັດຄອມພິວເຕີ ມີ ການເປີດຕົວ SAM 3 ແລະ SAM 3D, ສອງແບບທີ່ຂະຫຍາຍ Segment Anything family ແລະນັ້ນ ພວກເຂົາມີຈຸດປະສົງເພື່ອປ່ຽນວິທີທີ່ພວກເຮົາເຮັດວຽກກັບຮູບພາບແລະວິດີໂອໄກຈາກການທົດລອງຫ້ອງທົດລອງທີ່ຍັງເຫຼືອ, ບໍລິສັດຕ້ອງການໃຫ້ເຄື່ອງມືເຫຼົ່ານີ້ຖືກໃຊ້ໂດຍທັງຜູ້ຊ່ຽວຊານແລະຜູ້ໃຊ້ໂດຍບໍ່ມີພື້ນຖານດ້ານວິຊາການ.
ກັບລຸ້ນໃຫມ່ນີ້, Meta ກໍາລັງສຸມໃສ່ ປັບປຸງການຊອກຄົ້ນຫາ ແລະແບ່ງສ່ວນ ແລະໃນການນໍາເອົາ ການສ້າງຄືນໃຫມ່ສາມມິຕິລະດັບກັບຜູ້ຊົມທີ່ກວ້າງຂວາງຫຼາຍຈາກການດັດແກ້ວິດີໂອໄປສູ່ການສະແດງພາບຂອງຜະລິດຕະພັນສໍາລັບອີຄອມເມີຊໃນສະເປນແລະສ່ວນທີ່ເຫຼືອຂອງເອີຣົບ, ບໍລິສັດຄາດຄະເນສະຖານະການທີ່ ພຽງແຕ່ອະທິບາຍສິ່ງທີ່ທ່ານຕ້ອງການເຮັດໃນຄໍາສັບຕ່າງໆແມ່ນພຽງພໍສໍາລັບ AI ທີ່ຈະເຮັດການຍົກຫນັກຫຼາຍທີ່ສຸດ..
SAM 3 ສະເຫນີຫຍັງທຽບກັບຮຸ່ນກ່ອນຫນ້າ?
SAM 3 ແມ່ນຖືກຈັດໃສ່ເປັນວິວັດທະນາການໂດຍກົງ ຂອງຮູບແບບການແບ່ງສ່ວນທີ່ Meta ນໍາສະເຫນີໃນປີ 2023 ແລະ 2024, ທີ່ຮູ້ຈັກໃນນາມ SAM 1 ແລະ SAM 2. ຮຸ່ນຕົ້ນໆເຫຼົ່ານັ້ນໄດ້ສຸມໃສ່ການລະບຸວ່າ pixels ໃດເປັນຂອງແຕ່ລະວັດຖຸ, ສ່ວນໃຫຍ່ແມ່ນໃຊ້ຕົວຊີ້ສາຍຕາເຊັ່ນຈຸດ, ກ່ອງ ຫຼືໜ້າກາກ, ແລະໃນກໍລະນີຂອງ SAM 2, ຕິດຕາມວັດຖຸຕະຫຼອດວິດີໂອເກືອບໃນເວລາຈິງ.
ການພັດທະນາໃຫມ່ທີ່ສໍາຄັນໃນປັດຈຸບັນແມ່ນວ່າ SAM 3 ເຂົ້າໃຈ ຂໍ້ຄວາມທີ່ອຸດົມສົມບູນແລະຊັດເຈນ promptsບໍ່ພຽງແຕ່ປ້າຍຊື່ທົ່ວໄປ. ໃນຂະນະທີ່ກ່ອນທີ່ຈະໃຊ້ຄໍາສັບທີ່ງ່າຍດາຍເຊັ່ນ "ລົດ" ຫຼື "ລົດເມ" , ຮູບແບບໃຫມ່ແມ່ນສາມາດຕອບສະຫນອງກັບຄໍາອະທິບາຍສະເພາະຫຼາຍ, ຕົວຢ່າງ "ລົດເມໂຮງຮຽນສີເຫຼືອງ" ຫຼື "ລົດສອງບ່ອນຈອດລົດສີແດງ".
ໃນການປະຕິບັດ, ນີ້ຫມາຍຄວາມວ່າມັນພຽງພໍທີ່ຈະຂຽນບາງສິ່ງບາງຢ່າງເຊັ່ນ: "ຫມວກເບສບານສີແດງ" ເພື່ອໃຫ້ລະບົບສາມາດຊອກຫາແລະແຍກອົງປະກອບທັງຫມົດທີ່ເຫມາະສົມກັບຄໍາອະທິບາຍນັ້ນພາຍໃນຮູບພາບຫຼືວິດີໂອ. ຄວາມສາມາດໃນການປັບປຸງຄໍາສັບນີ້ແມ່ນເປັນປະໂຫຍດໂດຍສະເພາະໃນ ການແກ້ໄຂສະພາບການແບບມືອາຊີບ, ການໂຄສະນາຫຼືການວິເຄາະເນື້ອຫາ, ບ່ອນທີ່ທ່ານມັກຈະຕ້ອງເບິ່ງລາຍລະອຽດສະເພາະຫຼາຍ.
ຍິ່ງໄປກວ່ານັ້ນ, SAM 3 ໄດ້ຖືກອອກແບບເພື່ອປະສົມປະສານກັບ ຮູບແບບພາສາ multimodal ຂະຫນາດໃຫຍ່ນີ້ອະນຸຍາດໃຫ້ທ່ານໄປເກີນກວ່າປະໂຫຍກທີ່ງ່າຍດາຍແລະນໍາໃຊ້ຄໍາແນະນໍາທີ່ສັບສົນເຊັ່ນ: "ຄົນນັ່ງລົງແຕ່ບໍ່ໃສ່ໝວກສີແດງ" ຫຼື "ຄົນຍ່າງທາງທີ່ກໍາລັງເບິ່ງກ້ອງຖ່າຍຮູບແຕ່ບໍ່ມີກະເປົ໋າ." ປະເພດຂອງຄໍາແນະນໍານີ້ປະສົມປະສານເງື່ອນໄຂແລະການຍົກເວັ້ນທີ່ຈົນກ່ວາບໍ່ດົນມານີ້ມີຄວາມຫຍຸ້ງຍາກທີ່ຈະແປເປັນເຄື່ອງມືວິໄສທັດຄອມພິວເຕີ.
ປະສິດທິພາບ ແລະຂະໜາດຂອງຕົວແບບ SAM 3

Meta ຍັງຕ້ອງການເນັ້ນຫນັກໃສ່ສ່ວນທີ່ເຫັນໄດ້ຫນ້ອຍແຕ່ສໍາຄັນ: ໄດ້ ປະສິດທິພາບດ້ານວິຊາການແລະຂະຫນາດຄວາມຮູ້ ຂອງຕົວແບບ. ອີງຕາມຂໍ້ມູນຂອງບໍລິສັດ, SAM 3 ສາມາດປະມວນຜົນຮູບພາບດຽວທີ່ມີຫຼາຍກວ່າຫນຶ່ງຮ້ອຍສິ່ງຂອງທີ່ກວດພົບໃນເວລາປະມານ 30 ມິນລິວິນາທີໂດຍໃຊ້ H200 GPU, ຄວາມໄວທີ່ໃກ້ຄຽງກັບສິ່ງທີ່ຕ້ອງການສໍາລັບການເຮັດວຽກທີ່ຕ້ອງການ.
ໃນກໍລະນີຂອງວິດີໂອ, ບໍລິສັດຮັບປະກັນວ່າລະບົບຮັກສາການປະຕິບັດ virtually ໃນເວລາທີ່ແທ້ຈິງ ເມື່ອເຮັດວຽກກັບປະມານຫ້າວັດຖຸພ້ອມໆກັນ, ເຮັດໃຫ້ມັນສາມາດຕິດຕາມແລະແບ່ງສ່ວນຂອງເນື້ອຫາການເຄື່ອນຍ້າຍ, ຈາກຄລິບສື່ສັງຄົມສັ້ນໄປສູ່ໂຄງການການຜະລິດທີ່ມີຄວາມທະເຍີທະຍານຫຼາຍ.
ເພື່ອບັນລຸພຶດຕິກໍານີ້, Meta ໄດ້ສ້າງພື້ນຖານການຝຶກອົບຮົມທີ່ມີຫຼາຍກ່ວາ 4 ລ້ານແນວຄວາມຄິດທີ່ເປັນເອກະລັກການລວມຕົວບັນທຶກຂອງມະນຸດກັບຕົວແບບ AI ເພື່ອຊ່ວຍໃສ່ປ້າຍກຳກັບຂໍ້ມູນຈຳນວນຫຼວງຫຼາຍ, ການຜະສົມຄູ່ມື ແລະ ການຄວບຄຸມແບບອັດຕະໂນມັດນີ້ມີຈຸດປະສົງເພື່ອດຸ່ນດ່ຽງຄວາມຖືກຕ້ອງ ແລະ ຂະໜາດ - ກຸນແຈເພື່ອໃຫ້ແນ່ໃຈວ່າຕົວແບບຕອບສະໜອງໄດ້ດີຕໍ່ກັບວັດສະດຸປ້ອນທີ່ຫຼາກຫຼາຍໃນເອີຣົບ, ລາຕິນອາເມລິກາ ແລະ ສະພາບການຕະຫຼາດອື່ນໆ.
ບໍລິສັດກອບ SAM 3 ພາຍໃນສິ່ງທີ່ມັນເອີ້ນວ່າ Segment Anything Collectionຄອບຄົວຂອງຕົວແບບ, ມາດຕະຖານ, ແລະຊັບພະຍາກອນທີ່ຖືກອອກແບບມາເພື່ອຂະຫຍາຍຄວາມເຂົ້າໃຈທາງສາຍຕາຂອງ AI. ການເປີດຕົວແມ່ນມາພ້ອມກັບມາດຕະຖານໃຫມ່ສໍາລັບການແບ່ງສ່ວນ "ຄໍາສັບທີ່ເປີດ", ສຸມໃສ່ການວັດແທກຂອບເຂດທີ່ລະບົບສາມາດເຂົ້າໃຈເກືອບທຸກແນວຄວາມຄິດທີ່ສະແດງອອກໃນພາສາທໍາມະຊາດ.
ການປະສົມປະສານກັບການແກ້ໄຂ, Vibes, ແລະເຄື່ອງມື Meta ອື່ນໆ

ນອກເຫນືອຈາກອົງປະກອບດ້ານວິຊາການ, Meta ໄດ້ເລີ່ມຕົ້ນແລ້ວ ປະສົມປະສານ SAM 3 ເຂົ້າໃນຜະລິດຕະພັນສະເພາະ ທີ່ມີຈຸດປະສົງສໍາລັບການນໍາໃຊ້ປະຈໍາວັນ. ຫນຶ່ງໃນຈຸດຫມາຍປາຍທາງທໍາອິດຈະເປັນການແກ້ໄຂ, ຄໍາຮ້ອງສະຫມັກການສ້າງວິດີໂອແລະການແກ້ໄຂຂອງພວກເຂົາ, ບ່ອນທີ່ຄວາມຄິດແມ່ນວ່າຜູ້ໃຊ້ສາມາດເລືອກບຸກຄົນຫຼືວັດຖຸສະເພາະທີ່ມີຄໍາອະທິບາຍຂໍ້ຄວາມທີ່ງ່າຍດາຍແລະນໍາໃຊ້ຜົນກະທົບ, ການກັ່ນຕອງຫຼືການປ່ຽນແປງພຽງແຕ່ສ່ວນເຫຼົ່ານັ້ນຂອງ footage.
ເສັ້ນທາງອື່ນສໍາລັບການເຊື່ອມໂຍງຈະພົບເຫັນຢູ່ໃນ Vibes, ພາຍໃນແອັບ Meta AI ແລະເວທີ meta.aiໃນສະພາບແວດລ້ອມນີ້, ການແບ່ງສ່ວນຂໍ້ຄວາມຈະຖືກລວມເຂົ້າກັບເຄື່ອງມືສ້າງເພື່ອສ້າງປະສົບການການແກ້ໄຂ ແລະສ້າງສັນໃໝ່ໆ ເຊັ່ນ: ພື້ນຫຼັງແບບກຳນົດເອງ, ເອັບເຟັກການເຄື່ອນໄຫວ ຫຼືການດັດແກ້ຮູບທີ່ເລືອກທີ່ອອກແບບມາສຳລັບເຄືອຂ່າຍສັງຄົມທີ່ເປັນທີ່ນິຍົມຫຼາຍໃນສະເປນ ແລະສ່ວນທີ່ເຫຼືອຂອງເອີຣົບ.
ຂໍ້ສະເຫນີຂອງບໍລິສັດແມ່ນວ່າຄວາມສາມາດເຫຼົ່ານີ້ບໍ່ໄດ້ຖືກຈໍາກັດການສຶກສາມືອາຊີບ, ແຕ່ແທນທີ່ຈະບັນລຸ ... ຜູ້ສ້າງເອກະລາດ, ອົງການຂະຫນາດນ້ອຍ, ແລະຜູ້ໃຊ້ຂັ້ນສູງ ຜູ້ທີ່ເຮັດວຽກປະຈໍາວັນດ້ວຍເນື້ອຫາສາຍຕາ. ຄວາມສາມາດໃນການແບ່ງ scenes ໂດຍການຂຽນຄໍາອະທິບາຍໃນພາສາທໍາມະຊາດຫຼຸດລົງເສັ້ນໂຄ້ງການຮຽນຮູ້ເມື່ອທຽບກັບເຄື່ອງມືພື້ນເມືອງໂດຍອີງໃສ່ຫນ້າກາກຄູ່ມືແລະຊັ້ນຕ່າງໆ.
ໃນເວລາດຽວກັນ, Meta ຮັກສາວິທີການເປີດຕໍ່ກັບຜູ້ພັດທະນາພາຍນອກ, ແນະນໍາວ່າ ຄໍາຮ້ອງສະຫມັກພາກສ່ວນທີສາມ -from ການແກ້ໄຂເຄື່ອງມືການແກ້ໄຂສໍາລັບການວິເຄາະວິດີໂອໃນການຂາຍຍ່ອຍຫຼືຄວາມປອດໄພ- ສາມາດອີງໃສ່ SAM 3 ຕາບໃດທີ່ນະໂຍບາຍການນໍາໃຊ້ຂອງບໍລິສັດໄດ້ຮັບການເຄົາລົບ.
SAM 3D: ການກໍ່ສ້າງສາມມິຕິລະດັບຈາກຮູບດຽວ

ຂ່າວໃຫຍ່ອື່ນໆແມ່ນ SAM 3Dລະບົບທີ່ຖືກອອກແບບມາເພື່ອປະຕິບັດ ການກໍ່ສ້າງສາມມິຕິລະດັບ ເລີ່ມຕົ້ນຈາກຮູບພາບ 2D. ແທນທີ່ຈະຕ້ອງການການຖ່າຍຮູບຫຼາຍມຸມຈາກມຸມທີ່ແຕກຕ່າງກັນ, ຮູບແບບດັ່ງກ່າວມີຈຸດປະສົງເພື່ອສ້າງການເປັນຕົວແທນ 3D ທີ່ເຊື່ອຖືໄດ້ຈາກຮູບດຽວ, ບາງສິ່ງບາງຢ່າງທີ່ຫນ້າສົນໃຈໂດຍສະເພາະສໍາລັບຜູ້ທີ່ບໍ່ມີອຸປະກອນສະແກນພິເສດຫຼືຂະບວນການເຮັດວຽກ.
SAM 3D ປະກອບດ້ວຍສອງຮູບແບບແຫຼ່ງເປີດທີ່ມີຫນ້າທີ່ແຕກຕ່າງກັນ: SAM 3D Objectsໄດ້ສຸມໃສ່ການ reconstructing ວັດຖຸແລະ scenes, ແລະ SAM 3D Body, ມຸ່ງໄປສູ່ການປະເມີນຮູບຮ່າງຂອງມະນຸດແລະຮ່າງກາຍ. ການແຍກກັນນີ້ເຮັດໃຫ້ລະບົບສາມາດປັບຕົວເຂົ້າກັບກໍລະນີການນໍາໃຊ້ທີ່ແຕກຕ່າງກັນຫຼາຍ, ຈາກລາຍການຜະລິດຕະພັນໄປຫາຄໍາຮ້ອງສະຫມັກດ້ານສຸຂະພາບຫຼືກິລາ.
ອີງຕາມການ Meta, SAM 3D Objects marks a ມາດຕະຖານປະສິດທິພາບໃຫມ່ໃນ AI-guided reconstruction 3Dງ່າຍກວ່າວິທີການທີ່ຜ່ານມາໃນ metrics ຄຸນນະພາບທີ່ສໍາຄັນ. ເພື່ອປະເມີນຜົນໄດ້ຮັບຢ່າງເຂັ້ມງວດຫຼາຍຂຶ້ນ, ບໍລິສັດໄດ້ເຮັດວຽກຮ່ວມກັບນັກສິລະປິນເພື່ອສ້າງ SAM 3D Artist Objects, ຊຸດຂໍ້ມູນທີ່ຖືກອອກແບບໂດຍສະເພາະເພື່ອປະເມີນຄວາມຊື່ສັດແລະລາຍລະອຽດຂອງການກໍ່ສ້າງຄືນໃຫມ່ໃນທົ່ວຮູບພາບແລະວັດຖຸທີ່ຫລາກຫລາຍ.
ຄວາມກ້າວຫນ້ານີ້ເປີດປະຕູໃຫ້ກັບຄໍາຮ້ອງສະຫມັກພາກປະຕິບັດໃນພື້ນທີ່ເຊັ່ນ: ຫຸ່ນຍົນ, ວິທະຍາສາດ, ຢາກິລາ, ຫຼືຄວາມຄິດສ້າງສັນດິຈິຕອນຕົວຢ່າງ, ໃນຫຸ່ນຍົນມັນສາມາດຊ່ວຍໃຫ້ລະບົບເຂົ້າໃຈໄດ້ດີຂຶ້ນກ່ຽວກັບປະລິມານຂອງວັດຖຸທີ່ພວກເຂົາພົວພັນກັບ; ໃນການຄົ້ນຄວ້າທາງການແພດຫຼືກິລາ, ມັນສາມາດຊ່ວຍວິເຄາະທ່າທາງຂອງຮ່າງກາຍແລະການເຄື່ອນໄຫວ; ແລະໃນການອອກແບບທີ່ສ້າງສັນ, ມັນໃຊ້ເປັນພື້ນຖານໃນການສ້າງແບບຈໍາລອງ 3D ສໍາລັບອະນິເມຊັນ, ວິດີໂອເກມ, ຫຼືປະສົບການທີ່ເລິກເຊິ່ງ.
ຫນຶ່ງໃນຄໍາຮ້ອງສະຫມັກການຄ້າທໍາອິດທີ່ສັງເກດເຫັນແລ້ວແມ່ນຫນ້າທີ່ "ເບິ່ງໃນຫ້ອງ" de Facebook Marketplaceເຊິ່ງຊ່ວຍໃຫ້ທ່ານສາມາດວາດພາບໄດ້ວ່າເຄື່ອງເຟີນີເຈີ ຫຼື ເຄື່ອງຕົກແຕ່ງໃດນຶ່ງຈະເບິ່ງຢູ່ໃນຫ້ອງທີ່ແທ້ຈິງກ່ອນຈະຊື້ມັນແນວໃດ. ດ້ວຍ SAM 3D, Meta ຊອກຫາປະສົບການປະເພດເຫຼົ່ານີ້ໃຫ້ສົມບູນແບບ, ມີຄວາມກ່ຽວຂ້ອງສູງສໍາລັບອີຄອມເມີຊຂອງເອີຣົບ, ບ່ອນທີ່ການສົ່ງຄືນຜະລິດຕະພັນຍ້ອນຄວາມຄາດຫວັງທີ່ບໍ່ບັນລຸໄດ້ເປັນຕົວແທນຂອງຄ່າໃຊ້ຈ່າຍທີ່ເພີ່ມຂຶ້ນ.
Segment Anything Playground: ສະພາບແວດລ້ອມສຳລັບການທົດລອງ

ເພື່ອໃຫ້ສາທາລະນະສາມາດທົດສອບຄວາມສາມາດເຫຼົ່ານີ້ໄດ້ໂດຍບໍ່ຕ້ອງຕິດຕັ້ງຫຍັງ, Meta ໄດ້ເປີດໃຊ້ງານ Segment Anything Playgroundມັນເປັນເວທີເວັບໄຊຕ໌ທີ່ຊ່ວຍໃຫ້ທ່ານອັບໂຫລດຮູບພາບຫຼືວິດີໂອແລະທົດລອງກັບ SAM 3 ແລະ SAM 3D ໂດຍກົງຈາກຕົວທ່ອງເວັບຂອງທ່ານ. ແນວຄວາມຄິດແມ່ນວ່າທຸກຄົນທີ່ຢາກຮູ້ຢາກເຫັນກ່ຽວກັບ AI ສາຍຕາສາມາດຄົ້ນຫາສິ່ງທີ່ເປັນໄປໄດ້ໂດຍບໍ່ມີຄວາມຮູ້ການຂຽນໂປຼແກຼມໃດໆ.
ໃນກໍລະນີຂອງ SAM 3, Playground ອະນຸຍາດໃຫ້ແບ່ງສ່ວນວັດຖຸໂດຍໃຊ້ ປະໂຫຍກສັ້ນໆ ຫຼືຄໍາແນະນໍາລະອຽດການປະສົມປະສານຂໍ້ຄວາມແລະ, ຖ້າຕ້ອງການ, ຕົວຢ່າງທີ່ເປັນຕາ. ນີ້ເຮັດໃຫ້ວຽກງານທົ່ວໄປງ່າຍຂຶ້ນເຊັ່ນ: ການເລືອກຄົນ, ລົດ, ສັດ, ຫຼືອົງປະກອບສະເພາະຂອງສາກ ແລະນຳໃຊ້ການປະຕິບັດສະເພາະຕໍ່ກັບພວກມັນ, ຈາກຜົນກະທົບດ້ານຄວາມງາມໄປສູ່ການມົວ ຫຼື ການປ່ຽນພື້ນຫຼັງ.
ເມື່ອເຮັດວຽກກັບ SAM 3D, ເວທີເຮັດໃຫ້ມັນເປັນໄປໄດ້ ສຳຫຼວດສາກຈາກມຸມມອງໃໝ່ໆຈັດຮຽງວັດຖຸຄືນໃໝ່, ນຳໃຊ້ເອັບເຟັກສາມມິຕິ, ຫຼືສ້າງມຸມມອງທາງເລືອກ. ສໍາລັບຜູ້ທີ່ເຮັດວຽກໃນການອອກແບບ, ການໂຄສະນາ, ຫຼືເນື້ອຫາ 3D, ມັນສະເຫນີວິທີທີ່ໄວທີ່ຈະສ້າງແນວຄວາມຄິດແບບຕົ້ນແບບໂດຍບໍ່ຈໍາເປັນຕ້ອງໃຊ້ເຄື່ອງມືດ້ານວິຊາການທີ່ສັບສົນຕັ້ງແຕ່ເລີ່ມຕົ້ນ.
Playground ຍັງປະກອບມີຊຸດຂອງ ແມ່ແບບພ້ອມທີ່ຈະໃຊ້ ລັກສະນະເຫຼົ່ານີ້ແມ່ນມຸ່ງໄປສູ່ວຽກງານສະເພາະຫຼາຍ. ພວກມັນປະກອບມີທາງເລືອກໃນການປະຕິບັດເຊັ່ນ: ການໃສ່ໜ້າ pixelating ຫຼືປ້າຍທະບຽນລົດເພື່ອເຫດຜົນດ້ານຄວາມເປັນສ່ວນຕົວ, ແລະຜົນກະທົບທາງສາຍຕາເຊັ່ນ: ເສັ້ນທາງການເຄື່ອນໄຫວ, ຈຸດເດັ່ນທີ່ເລືອກ ຫຼືຈຸດເດັ່ນໃນພື້ນທີ່ທີ່ສົນໃຈໃນວິດີໂອ. ປະເພດຂອງຫນ້າທີ່ເຫຼົ່ານີ້ສາມາດເປັນທີ່ເຫມາະສົມໂດຍສະເພາະສໍາລັບຂະບວນການເຮັດວຽກຂອງສື່ດິຈິຕອນແລະຜູ້ສ້າງເນື້ອຫາໃນປະເທດສະເປນ, ບ່ອນທີ່ການຜະລິດວິດີໂອສັ້ນແລະເນື້ອຫາສື່ມວນຊົນສັງຄົມຄົງທີ່.
ເປີດຊັບພະຍາກອນສໍາລັບນັກພັດທະນາແລະນັກຄົ້ນຄວ້າ

ສອດຄ່ອງກັບຍຸດທະສາດທີ່ Meta ໄດ້ປະຕິບັດຕາມໃນການປ່ອຍ AI ອື່ນໆ, ບໍລິສັດໄດ້ຕັດສິນໃຈທີ່ຈະປ່ອຍສ່ວນທີ່ສໍາຄັນຂອງ ຊັບພະຍາກອນດ້ານວິຊາການທີ່ກ່ຽວຂ້ອງກັບ SAM 3 ແລະ SAM 3Dສໍາລັບຄັ້ງທໍາອິດ, ຮູບແບບນ້ໍາຫນັກ, ມາດຕະຖານໃຫມ່ທີ່ສຸມໃສ່ການແບ່ງສ່ວນຄໍາສັບທີ່ເປີດ, ແລະເອກະສານດ້ານວິຊາການທີ່ລາຍລະອຽດການພັດທະນາຂອງມັນໄດ້ຖືກເປີດເຜີຍຕໍ່ສາທາລະນະ.
ໃນກໍລະນີຂອງ SAM 3D, ຕໍ່ໄປນີ້ແມ່ນມີຢູ່: ຕົວແບບການກວດສອບ, ລະຫັດ inference, ແລະຊຸດຂໍ້ມູນການປະເມີນຜົນ ລຸ້ນຕໍ່ໄປ. ຊຸດຂໍ້ມູນນີ້ປະກອບມີຮູບພາບ ແລະວັດຖຸຫຼາກຫຼາຍຊະນິດທີ່ມີຈຸດປະສົງໄປໄກກວ່າຈຸດອ້າງອີງແບບ 3D ແບບດັ້ງເດີມ, ສະຫນອງຄວາມເປັນຈິງ ແລະຄວາມສັບສົນຫຼາຍກວ່າເກົ່າ, ບາງສິ່ງບາງຢ່າງທີ່ສາມາດເປັນປະໂຫຍດຫຼາຍສໍາລັບກຸ່ມຄົ້ນຄວ້າເອີຣົບທີ່ເຮັດວຽກໃນຄອມພິວເຕີວິໄສທັດ ແລະກາຟິກ.
Meta ຍັງໄດ້ປະກາດການຮ່ວມມືກັບເວທີການບັນຍາຍເຊັ່ນ Roboflow, ໂດຍມີເປົ້າຫມາຍທີ່ຈະຊ່ວຍໃຫ້ນັກພັດທະນາແລະບໍລິສັດຕ່າງໆສາມາດ ໃສ່ຂໍ້ມູນຂອງທ່ານເອງແລະປັບ SAM 3 ກັບຄວາມຕ້ອງການສະເພາະ. ອັນນີ້ເປີດປະຕູສູ່ການແກ້ໄຂບັນຫາສະເພາະຂອງຂະແໜງການ, ຕັ້ງແຕ່ການກວດກາອຸດສາຫະກຳ ຈົນເຖິງການວິເຄາະການສັນຈອນໃນຕົວເມືອງ, ລວມທັງບັນດາໂຄງການມໍລະດົກທາງວັດທະນະທໍາ ເຊິ່ງມີຄວາມສໍາຄັນໃນການແບ່ງສ່ວນອົງປະກອບທາງສະຖາປັດຕະຍະກຳ ຫຼືສິລະປະໃຫ້ຖືກຕ້ອງ.
ໂດຍການເລືອກວິທີການເປີດຂ້ອນຂ້າງ, ບໍລິສັດຊອກຫາໃຫ້ແນ່ໃຈວ່າລະບົບນິເວດຂອງນັກພັດທະນາ, ມະຫາວິທະຍາໄລ ແລະການເລີ່ມຕົ້ນ - ລວມທັງຜູ້ທີ່ດໍາເນີນການຢູ່ໃນສະເປນແລະສ່ວນທີ່ເຫຼືອຂອງເອີຣົບ - ສາມາດທົດລອງກັບເຕັກໂນໂລຢີເຫຼົ່ານີ້, ປະສົມປະສານເຂົ້າໃນຜະລິດຕະພັນຂອງຕົນເອງແລະ, ໃນທີ່ສຸດ, ປະກອບສ່ວນກໍລະນີການນໍາໃຊ້ທີ່ເກີນກວ່າທີ່ Meta ສາມາດພັດທະນາພາຍໃນ.
ດ້ວຍ SAM 3 ແລະ SAM 3D, Meta ມີຈຸດປະສົງເພື່ອລວມ a ແພລະຕະຟອມ AI ທີ່ມີຄວາມຍືດຫຍຸ່ນແລະເຂົ້າເຖິງໄດ້ຫຼາຍຂຶ້ນບ່ອນທີ່ການແບ່ງແຍກຂໍ້ຄວາມ ແລະການສ້າງ 3D ຄືນໃໝ່ຈາກຮູບພາບດຽວແມ່ນບໍ່ມີຄວາມສາມາດທີ່ສະຫງວນໄວ້ສຳລັບທີມທີ່ມີຄວາມຊ່ຽວຊານສູງອີກຕໍ່ໄປ. ຜົນກະທົບທີ່ອາດເກີດຂຶ້ນໄດ້ຂະຫຍາຍຈາກການແກ້ໄຂວິດີໂອປະຈໍາວັນໄປສູ່ຄໍາຮ້ອງສະຫມັກຂັ້ນສູງໃນວິທະຍາສາດ, ອຸດສາຫະກໍາ, ແລະອີຄອມເມີຊ, ໃນສະພາບການທີ່ການປະສົມປະສານຂອງພາສາ, ວິໄສທັດຄອມພິວເຕີ, ແລະຄວາມຄິດສ້າງສັນກາຍເປັນເຄື່ອງມືເຮັດວຽກມາດຕະຖານແລະບໍ່ພຽງແຕ່ສັນຍາທາງດ້ານເຕັກໂນໂລຢີ.
ຂ້ອຍເປັນນັກເທັກໂນໂລຍີທີ່ກະຕືລືລົ້ນທີ່ໄດ້ຫັນຄວາມສົນໃຈ "geek" ຂອງລາວໄປສູ່ອາຊີບ. ຂ້າພະເຈົ້າໄດ້ໃຊ້ເວລາຫຼາຍກ່ວາ 10 ປີຂອງຊີວິດຂອງຂ້າພະເຈົ້າໂດຍການນໍາໃຊ້ເຕັກໂນໂລຊີທີ່ທັນສະໄຫມແລະ tinkering ກັບທຸກປະເພດຂອງໂຄງການອອກຈາກ curiosity ອັນບໍລິສຸດ. ຕອນນີ້ຂ້ອຍມີຄວາມຊ່ຽວຊານດ້ານເທັກໂນໂລຍີຄອມພິວເຕີ ແລະເກມວີດີໂອ. ນີ້ແມ່ນຍ້ອນວ່າຫຼາຍກວ່າ 5 ປີທີ່ຂ້ອຍໄດ້ຂຽນສໍາລັບເວັບໄຊທ໌ຕ່າງໆກ່ຽວກັບເຕັກໂນໂລຢີແລະວິດີໂອເກມ, ການສ້າງບົດຄວາມທີ່ຊອກຫາເພື່ອໃຫ້ທ່ານມີຂໍ້ມູນທີ່ທ່ານຕ້ອງການໃນພາສາທີ່ທຸກຄົນເຂົ້າໃຈໄດ້.
ຖ້າທ່ານມີຄໍາຖາມໃດໆ, ຄວາມຮູ້ຂອງຂ້ອຍແມ່ນມາຈາກທຸກສິ່ງທຸກຢ່າງທີ່ກ່ຽວຂ້ອງກັບລະບົບປະຕິບັດການ Windows ເຊັ່ນດຽວກັນກັບ Android ສໍາລັບໂທລະສັບມືຖື. ແລະຄໍາຫມັ້ນສັນຍາຂອງຂ້າພະເຈົ້າແມ່ນກັບທ່ານ, ຂ້າພະເຈົ້າສະເຫມີເຕັມໃຈທີ່ຈະໃຊ້ເວລາສອງສາມນາທີແລະຊ່ວຍທ່ານແກ້ໄຂຄໍາຖາມໃດໆທີ່ທ່ານອາດຈະມີຢູ່ໃນໂລກອິນເຕີເນັດນີ້.