Metak SAM 3 eta SAM 3D aurkezten ditu: IA bisualaren belaunaldi berria

Azken eguneraketa: 2025/11/27

  • SAM 3-k irudi eta bideo segmentazioa aurkezten du testu eta adibide bisualen bidez gidatuta, milioika kontzeptuz osatutako hiztegi batekin.
  • SAM 3D-k objektuak, eszenak eta giza gorputzak 3Dn berreraikitzeko aukera ematen du irudi bakar batetik abiatuta, modelo irekiak erabiliz.
  • Segment Anything Playground-en ezagutza teknikorik gabe probatu daitezke modeloak, txantiloi praktiko eta sortzaileekin.
  • Metak pisuak, kontrol-puntuak eta erreferentzia-puntu berriak kaleratzen ditu, Europako eta munduko gainerako garatzaileek eta ikertzaileek gaitasun horiek beren proiektuetan integratu ahal izan ditzaten.
SAM 3D

Metak beste urrats bat eman du bere konpromisoan adimen artifiziala ikusmen artifizialari aplikatuta -rekin SAM 3 eta SAM 3D-ren jaurtiketa, Segment Anything familia zabaltzen duten bi modelo eta hori Argazki eta bideoekin lan egiteko modua aldatzea dute helburuLaborategiko esperimentu bat baino urrun, enpresak tresna hauek profesionalek zein prestakuntza teknikorik gabeko erabiltzaileek erabil ditzaten nahi du.

Belaunaldi berri honekin, Metak honetan jartzen du arreta objektuen detekzioa eta segmentazioa hobetu eta ekartzean hiru dimentsioko berreraikuntza publiko zabalago batiBideo-ediziotik hasi eta Espainiako eta Europako gainerako merkataritza elektronikorako produktuen bistaratzeraino, enpresak eszenatoki bat aurreikusten du non Hitzez zer egin nahi duzun deskribatzea nahikoa da IArentzat lan astunena egiteko..

Zer eskaintzen du SAM 3-k aurreko bertsioekin alderatuta?

SAM 3 eboluzio zuzen gisa kokatzen da Metak 2023an eta 2024an aurkeztutako segmentazio-ereduak, SAM 1 eta SAM 2 bezala ezagutzen direnak. Lehenengo bertsio horiek objektu bakoitzari zein pixel zegozkion identifikatzean zentratu ziren, batez ere puntuak, laukitxoak edo maskarak bezalako seinale bisualak erabiliz, eta SAM 2ren kasuan, objektuak bideo osoan zehar ia denbora errealean jarraituz.

Garapen berri nagusia SAM 3-k ulertzen duela da testu-gonbidapen aberats eta zehatzakez etiketa orokorrak bakarrik. Lehenago "auto" edo "autobus" bezalako termino sinpleak erabiltzen ziren bitartean, modelo berriak deskribapen zehatzagoei erantzuteko gai da, adibidez, "eskola autobus horia" edo "auto gorria bikoiztuta aparkatuta".

Praktikan, horrek esan nahi du nahikoa dela honelako zerbait idaztea "beisbol txapel gorria" sistemak irudi edo bideo batean deskribapen horrekin bat datozen elementu guztiak aurkitu eta bereizi ahal izan ditzan. Hitzekin fintzeko gaitasun hau bereziki erabilgarria da edizio-testuinguru profesionalak, publizitatea edo edukien analisia, non askotan xehetasun oso zehatzak aztertu behar dituzun.

Gainera, SAM 3 honekin integratzeko diseinatu da hizkuntza-eredu multimodal handiakHorri esker, esaldi sinpleetatik haratago joan eta argibide konplexuak erabili ahal izango dituzu, hala nola: "Jendea eserita baina txapel gorririk gabe" edo «kamerari begira dauden baina motxilarik gabe dauden oinezkoak». Argibide mota honek duela gutxi arte ikusmen artifizialeko tresna batean itzultzea zaila zen baldintzak eta bazterketak konbinatzen ditu.

Eduki esklusiboa - Egin klik hemen  OpenAI-k bere misio etikoa indartu nahi du eta bere egitura birdefinitzen du Onura Publikoko Korporazio (PBC) gisa.

SAM 3 ereduaren errendimendua eta eskala

SAM 3 meta eredua

Metak zati ez hain ikusgarria baina funtsezkoa ere nabarmendu nahi izan zuen: errendimendu teknikoa eta ezagutza eskala ereduarena. Konpainiaren datuen arabera, SAM 3 gai da ehun objektu baino gehiago detektatutako irudi bakarra 30 milisegundotan prozesatzeko H200 GPU bat erabiliz, lan-fluxu zorrotzetarako behar den abiaduratik oso gertu.

Bideoaren kasuan, enpresak ziurtatzen du sistemak errendimendua mantentzen duela. ia denbora errealean bost objektu aldibereko ingururekin lan egitean, bideragarria da mugikorreko edukia jarraitzeko eta segmentatzeko, sare sozialetako klip laburretatik hasi eta ekoizpen-proiektu anbiziotsuagoetaraino.

Portaera hau lortzeko, Metak entrenamendu-oinarri bat eraiki du, baino gehiagorekin. 4 milioi kontzeptu bereziGiza anotatzaileak IA ereduekin konbinatuz datu bolumen handiak etiketatzen laguntzeko, eskuzko eta automatizatutako gainbegiratzearen nahasketa honek zehaztasuna eta eskala orekatzea du helburu, eta hori funtsezkoa da ereduak Europako, Latinoamerikako eta beste merkatu-testuinguru batzuetako sarrera anitzei ondo erantzuteko.

Konpainiak SAM 3 deitzen duenaren barruan kokatzen du Segmentu Edozer BildumaIAren ulermen bisuala zabaltzeko diseinatutako modelo, erreferentzia eta baliabideen familia bat. Aurkezpenarekin batera, "hiztegi irekia" segmentatzeko erreferentzia berri bat dator, sistemak hizkuntza naturalean adierazitako ia edozein kontzeptu zenbateraino uler dezakeen neurtzera bideratua.

Integrazioa Edits, Vibes eta beste Meta tresnekin

Editatu 4K bideoak Meta Edits-ekin

Osagai teknikoaz harago, Metak dagoeneko hasi da SAM 3 produktu espezifikoetan integratu eguneroko erabilerarako pentsatuta daudenak. Lehenengo helmugetako bat Edits izango da, bideoak sortzeko eta editatzeko aplikazioa, non erabiltzaileak testu-deskribapen soil batekin pertsona edo objektu zehatzak hautatzea eta efektuak, iragazkiak edo aldaketak grabazioaren zati horietan bakarrik aplikatzea den ideia.

Integraziorako beste bide bat aurkituko da Vibes, Meta AI aplikazioaren eta meta.ai plataformaren barruanIngurune honetan, testu segmentazioa tresna sortzaileekin konbinatuko da edizio eta sormen esperientzia berriak sortzeko, hala nola atzeko plano pertsonalizatuak, mugimendu efektuak edo Espainian eta Europako gainerako herrialdeetan oso ezagunak diren sare sozialetarako diseinatutako argazki aldaketa selektiboak.

Enpresaren proposamena da gaitasun horiek ez direla ikasketa profesionaletara mugatu beharrean... sortzaile independenteak, agentzia txikiak eta erabiltzaile aurreratuak egunero eduki bisualekin lan egiten dutenak. Eszenak hizkuntza naturalean deskribapenak idatziz segmentatzeko gaitasunak ikaskuntza-kurba murrizten du eskuzko maskara eta geruzetan oinarritutako tresna tradizionalekin alderatuta.

Aldi berean, Metak kanpoko garatzaileekiko ikuspegi irekia mantentzen du, eta iradokitzen du hirugarrenen aplikazioak -edizio tresnetatik hasi eta txikizkako merkataritzan edo segurtasunean bideo-analisietarako irtenbideetaraino- SAM 3-n fidatu daitezke, baldin eta enpresaren erabilera-politikak errespetatzen badira.

Eduki esklusiboa - Egin klik hemen  Raycast: Mac-en produktibitatea handitzeko tresna osoa

SAM 3D: Irudi bakar batetik hiru dimentsioko berreraikuntza

Nola funtzionatzen duen SAM 3D-k

Beste berri handia da SAM 3Degiteko diseinatutako sistema bat hiru dimentsioko berreraikuntzak 2D irudietatik abiatuta. Angelu desberdinetatik hainbat argazki beharrean, ereduak argazki bakar batetik 3D irudikapen fidagarri bat sortzea du helburu, eta hori bereziki interesgarria da eskaneatze ekipamendu edo lan-fluxu espezializaturik ez dutenentzat.

SAM 3D-k funtzio bereiziekin bi kode irekiko modelo ditu: SAM 3D objektuakobjektuak eta eszenak berreraikitzean zentratu zen, eta SAM 3D Gorputza, giza forma eta gorputza kalkulatzera bideratua. Bereizketa honek sistema erabilera kasu oso desberdinetara egokitzea ahalbidetzen du, produktuen katalogoetatik hasi eta osasun edo kirol aplikazioetaraino.

Metaren arabera, SAM 3D Objects-ek markatzen du Adimen artifizialaren bidez gidatutako 3D berreraikuntzan errendimendu-erreferentzia berriaaurreko metodoak erraz gaindituz kalitate-neurri gakoetan. Emaitzak zorrotzago ebaluatzeko, enpresak artistekin lan egin du SAM 3D Artist Objects sortzeko, irudi eta objektu askoren berreraikuntzen fideltasuna eta xehetasuna ebaluatzeko bereziki diseinatutako datu-multzo bat.

Aurrerapen honek aplikazio praktikoetarako ateak irekitzen ditu, hala nola, arlo hauetan robotika, zientzia, kirol medikuntza edo sormen digitalaAdibidez, robotikan sistemei elkarreragiten dituzten objektuen bolumena hobeto ulertzen lagun diezaieke; medikuntzan edo kirol ikerketan, gorputzaren jarrera eta mugimendua aztertzen lagun dezake; eta diseinu sortzailean, animaziorako, bideo-jokoetarako edo esperientzia murgilgarrietarako 3D ereduak sortzeko oinarri gisa balio du.

Dagoeneko ikusgai dauden lehen aplikazio komertzialetako bat funtzioa da "Gela barruko bista" de Facebook Marketplacehorri esker, altzari edo objektu apaingarri bat benetako gela batean nola geratuko litzatekeen ikusteko aukera duzu erosi aurretik. SAM 3D-rekin, Metak esperientzia mota hauek hobetzea bilatzen du, oso garrantzitsua Europako merkataritza elektronikoarentzat, non bete gabeko itxaropenengatik produktuak itzultzeak kostu gero eta handiagoa dakarren.

Nola bihurtu pertsonak eta objektuak 3D modeloetan SAM 3Drekin
Erlazionatutako artikulua:
Bihurtu pertsonak eta objektuak 3Dn Metaren SAM 3 eta SAM 3Drekin

Segmentatu Edozer Jolastokia: esperimentatzeko ingurunea

Segmentua Edozer Jolastokia

Jendeak ezer instalatu gabe gaitasun hauek probatu ahal izateko, Metak gaitu du Segmentua Edozer JolastokiaWeb plataforma bat da, irudiak edo bideoak igo eta SAM 3 eta SAM 3D-rekin zuzenean zure arakatzailetik esperimentatzeko aukera ematen duena. Ideia da IA ​​bisualaren inguruan jakin-mina duen edonork programazio ezagutzarik gabe zer den posible esploratu ahal izatea.

SAM 3-ren kasuan, Playground-ek objektuak segmentatzea ahalbidetzen du erabiliz esaldi laburrak edo argibide zehatzakTestua eta, nahi izanez gero, adibide bisualak konbinatuz. Horrek ohiko zereginak errazten ditu, hala nola pertsonak, autoak, animaliak edo eszenako elementu espezifikoak hautatzea eta ekintza espezifikoak aplikatzea, efektu estetikoetatik hasi eta lausotze edo atzeko planoaren ordezkapeneraino.

Eduki esklusiboa - Egin klik hemen  Windows 0-en jokoak edo aplikazioak irekitzean 000007xc11b errorearen konponbidea

SAM 3Drekin lan egitean, plataformak posible egiten du Arakatu eszenak ikuspegi berrietatikobjektuak berrantolatu, hiru dimentsioko efektuak aplikatu edo ikuspegi alternatiboak sortu. Diseinuan, publizitatean edo 3D edukian lan egiten dutenentzat, ideiak prototipatzeko modu azkarra eskaintzen du hasieratik tresna tekniko konplexuak erabili beharrik gabe.

Jolastokiak serie bat ere badu Erabiltzeko prest dauden txantiloiak Ezaugarri hauek zeregin oso zehatzetarako bideratuta daude. Aukera praktikoak dituzte, hala nola aurpegiak edo matrikulak pixelatzea pribatutasun arrazoiengatik, eta efektu bisualak, hala nola mugimendu-arrastoak, nabarmentze selektiboak edo bideoan interesguneetan fokuak jartzea. Funtzio mota hauek bereziki egokiak izan daitezke Espainiako komunikabide digitalen eta edukien sortzaileen lan-fluxuetarako, non bideo laburren eta sare sozialetako edukien ekoizpena etengabea den.

Baliabide irekiak garatzaile eta ikertzaileentzat

SAM 3D Meta Adibideak

Metak beste AI bertsio batzuetan jarraitu duen estrategiarekin bat etorriz, konpainiak zati garrantzitsu bat kaleratzea erabaki du SAM 3 eta SAM 3Drekin lotutako baliabide teknikoakLehenengorako, ereduaren pisuak, hiztegi irekiaren segmentazioan oinarritutako erreferentzia-puntu berri bat eta haren garapena zehazten duen dokumentu tekniko bat argitaratu dira.

SAM 3Dren kasuan, honako hauek daude eskuragarri: ereduaren kontrol-puntuak, inferentzia-kodea eta ebaluazio-datu-multzoa hurrengo belaunaldia. Datu-multzo honek irudi eta objektu ugari biltzen ditu, 3D erreferentzia-puntu tradizionalen haratago joan nahi duena, errealismo eta konplexutasun handiagoa eskainiz, eta hori oso erabilgarria izan daiteke ikusmen artifizialaren eta grafikoen arloan lan egiten duten Europako ikerketa-taldeentzat.

Metak Roboflow bezalako anotazio plataformekin lankidetzak ere iragarri ditu, garatzaileei eta enpresei aukera emateko helburuarekin. Sartu zure datuak eta egokitu SAM 3 behar zehatzetara. Horrek sektore espezifikoetarako irtenbideetarako ateak irekitzen ditu, industria-ikuskapenetik hasi eta hiri-trafikoaren analisiraino, ondare kulturalaren proiektuak barne, non elementu arkitektoniko edo artistikoak zehatz-mehatz segmentatzea garrantzitsua den.

Ikuspegi nahiko irekia aukeratuz, enpresak garatzaileen ekosistema ziurtatu nahi du, unibertsitateak eta startup-ak -Espainian eta Europako gainerako herrialdeetan jarduten dutenek barne- teknologia hauekin esperimentatu, beren produktuetan integratu eta, azken finean, Metak barnean garatu ditzakeen erabilera kasuetatik haratago doazen erabilera kasuak eman ditzakete.

SAM 3 eta SAM 3Drekin, Metak sendotzea du helburu IA bisualaren plataforma malguagoa eta eskuragarriagoanon testu bidez gidatutako segmentazioa eta irudi bakar batetik 3D berreraikuntza ez diren jada talde oso espezializatuentzat gordetako gaitasunak. Potentzialki eragina eguneroko bideo ediziotik hasi eta zientzia, industria eta merkataritza elektronikoko aplikazio aurreratuetaraino hedatzen den, hizkuntzaren, ikusmen artifizialaren eta sormenaren konbinazioa lan tresna estandar bihurtzen ari den testuinguru batean, eta ez soilik promesa teknologiko bat.