Metaadatok eltávolítása a Google Drive-ban

Utolsó frissítés: 2023.10.03.

  • Ismerje meg, hogy a Drive milyen metaadatokat kezel (név, címkék, indexelhető szöveg és bélyegképek), és mely metaadatok tartoznak más Google Cloud szolgáltatásokhoz.
  • A Drive API segítségével lekérdezheti és módosíthatja a metaadatokat; a fájlok feltöltése előtt tisztíthatja az EXIF ​​és a beágyazott adatokat.
  • Tartsd be a korlátokat és szabályokat (bélyegképek, indexelhető szöveg, kiterjesztések), és hitelesítsd magad a gclouddal a helyi REST teszteléshez.
metaadatok törlése a Google Drive-ban

Szeretnéd szabályozni a fájljaid metaadatait a következőben: Google Drive és nem tudja, hol kezdje? Itt részletesen elmagyarázzuk, Hogyan távolíthatunk el metaadatokat a Google Drive-ból hatékonyan és biztonságosan (a feltöltött fájlok metaadatai). Azt is elmondjuk, hogy milyen korlátozásokat szab a Google a fájlnevekre, méretekre és engedélyekre vonatkozóan.

Ez az útmutató teljes és reális képet ad arról, hogy mit lehet (és mit nem) „törölni” a Google Drive metaadatai közül.

Mi módosítható vagy „törölhető” a Drive-ban?

Ezek a metaadatok amely eltávolítható a Google Drive-ra feltöltött fájlokból:

Nombre y extensión: Amikor API-n keresztül hoz létre egy fájlt, érdemes megadni a kiterjesztést a név mezőben, például „cat.jpg”. A Drive kikövetkeztetheti a kiterjesztést a MIME típusból, ha nem adja meg, de jobb, ha saját maga határozza meg. A későbbi válaszokban egy írásvédett fileExtension jelenhet meg, amelynek kiterjesztése a „name” mezőből lesz kitöltve. Ha a felhasználó letölti a fájlt, a Drive a címből (és a kiterjesztéséből) állítja össze a végső nevet.

  • Indexelhető szöveg (contentHints.indexableText): A Drive alapértelmezés szerint indexeli a gyakori dokumentumokat és típusokat (PDF-ek, OCR-képes képek stb.). Ha az alkalmazás más formátumokat ment (rajzok, videók, parancsikonok), indexelhető szöveget adhat meg a keresés javítása érdekében. Ez a szöveg HTML-ként kerül feldolgozásra: ha címkéket tartalmazó karakterláncot ad meg, a szöveges tartalom kerül indexelésre, nem a címkeattribútumai. A contentHints.indexableText méretkorlátja 128 KB, és ajánlott minden mentéskor frissíteni, és a fájlhoz kapcsolódóan relevánsnak tartani.
  • Indexképek (contentHints.thumbnail): A Drive számos típushoz generál bélyegképeket, de azoknál a formátumoknál, amelyek nem generálják automatikusan, feltöltheted a sajátodat a fájl létrehozásakor vagy frissítésekor. A képet URL-biztos base64 formátumra kell állítani, és a hozzá tartozó mimeType-ot kell megadni. Főbb szabályok: A támogatott formátumok a PNG, GIF vagy JPG; az ajánlott szélesség 1600 képpont (minimum 220 képpont), a maximális méret pedig 2 MB. A bélyegképek érvénytelenné válnak, ha a fájl tartalma megváltozik; a metaadatok változásai nem.
  • Hozzáférés a bélyegképekhez: A ThumbnailLink mező egy rövid URL-címet ad vissza, amely csak akkor érhető el, ha az alkalmazásnak van engedélye a fájl olvasására (ha nem nyilvános, akkor hitelesítő adatokkal kell kérni). Lekérdezheted egy adott fájlra vagy egy típus szerint szűrt listára vonatkozóan.
  • Címkék: A Drive lehetővé teszi címkék fájlokhoz társítását. A megkeresésükhöz használhatod a files.listLabels függvényt, módosításukhoz pedig a megfelelő labelId és fileId paraméterekre kell hivatkoznod. Ez a mechanizmus hasznos a nem kívánt osztályozások kategorizálásához és szükség esetén a tartalom érintése nélküli „tisztításához”.
Exkluzív tartalom – Kattintson ide  Hogyan állíthatjuk le a Google Térkép nagyítását
metaadatok törlése a Google Drive-ban
Metaadatok törlése a Google Drive-ban

Metaadatok törlése a Google Drive-ban: „rejtett” metaadatok magából a fájlból

Nincs varázsgomb a metaadatok (például a fényképek EXIF-adatai vagy a PDF-ekbe beágyazott adatok) eltávolítására a Google Drive-ban. A Drive kezeli a saját metaadatait, de a fájlban lévő metaadatok attól az eszköztől függenek, amellyel létrehozták őket.

Az ajánlott gyakorlat a következő tisztítsa meg a fájlt, mielőtt feltölti a Drive-ra, Rendszereszközök vagy speciális alkalmazások használata, amelyek eltávolítják az EXIF-adatokat a képekből vagy a dokumentumok tulajdonságaiból. Így a Drive-ra mentett tartalom „megtisztítva” érkezik meg.

Ha már feltöltött beágyazott metaadatokkal rendelkező fájlokat, akkor a metaadatok Google Drive-ban történő eltávolítása helyett kényelmesebb letöltés, tisztítás és újratöltés, az eredeti cseréje, ha alkalmazható. PDF-ek vagy képek esetén ez gyakori, ha védeni szeretné a szerzőséget, a helyszínt vagy a szerkesztési előzményeket.

A Drive adott részéhez, a név, a címkék és a contentHints (indexableText/thumbnail) módosítására összpontosítva, amelyek az Ön irányítása alatt állnak. Ha a hozzáférési engedélyeket is kezeli, akkor a látható metaadatok (például az olvasási jogosultsággal rendelkezők számára elérhető miniatűrhivatkozások) láthatóságát is csökkenti.

Ne felejtsd el, hogy Ha csak a Drive metaadatait módosítja, az nem távolítja el az EXIF-et vagy a belső tulajdonságokat. Ezért a stratégiádnak ötvöznie kell a fájl előzetes megtisztítását a Drive által lehetővé tett részletes metaadat-kezeléssel.

Gyakran összekevert metaadatok a Google Cloudban: virtuális gépek, gcloud és korlátok

Ha a Google Clouddal dolgozol, sok mindent fogsz látni útmutatók a „metaadatokról”, amelyek valójában a Compute Engine-re vagy a Cloud Storage-ra vonatkoznak, nem pedig a Drive-ra. Ennek ellenére érdemes ismerni ezeket a pontokat, hogy ne keverd össze őket a kutatás során.

Alapvető gcloud CLI konfiguráció

A Google Cloud CLI telepítése után inicializálja a következővel:

gcloud init

Fontos, hogy a legújabb verzióval rendelkezzen, amely a következőket tartalmazza:

gcloud components update

Ha külső identitásszolgáltatót használ, Jelentkezzen be összevont identitásával, mielőtt a gclouddal kezdene dolgozni. Különösen akkor, ha hitelesítést fogsz végezni REST hívások kezdeményezéséhez a helyi környezetedből. A REST API minták használhatják a gcloudban konfigurált hitelesítő adatokat.

VMs

Engedélyek és szerepkörök (Compute Engine): Egyéni metaadatok hozzáadásához, frissítéséhez vagy törléséhez virtuális gépeken megfelelő IAM-engedélyekre van szükség. Gyakori példák:

  • Ha a virtuális gépei szolgáltatásfiókokat használnak: engedély iam.serviceAccounts.actAs a szolgáltatás- vagy projektfiókban.
  • Metadatos del proyecto: compute.projects.get y compute.projects.setCommonInstanceMetadata.
  • Zónális metaadatok: compute.instanceSettings.get y compute.instanceSettings.update az adott területre vonatkozóan.
  • Példány metaadatai: compute.instances.get y compute.instances.setMetadata.

Limitaciones

Ezek a főbb korlátozások, amelyekkel a metaadatok Google Drive-ban történő eltávolításakor találkoztunk:

  • Méretkorlátozások (számítástechnikai motor): A metaadat-bejegyzések mérete összesen 512 KB-ban van korlátozva. Minden kulcs 128 bájtra, és minden érték 256 KB-ra korlátozódik. Ha például az ssh-keys kulcsot használja, és túllépi a 256 KB-os korlátot, akkor nem tud további kulcsokat hozzáadni, amíg nem végzi el a takarítást.
  • Mayúsculas y minúsculas: A kulcsok megkülönböztetik a kis- és nagybetűket; az értékek is, kivéve a logikai értékeket. Zonális kulcsként nem hozható létre két olyan kulcs, amelyek csak a kis- és nagybetűkben különböznek (zonal-metadata-key vs. ZONAL-METADATA-KEY).
  • Zónális metaadatok: gcloud vagy REST használatával állíthatók be vagy távolíthatók el. SSH kulcsokhoz (ssh-keys) nem definiálhatók zónális értékek. A logikai project/ könyvtárban, ha ugyanahhoz a kulcshoz projektszintű és zónális értékek is vannak, akkor a zónás érték élvez elsőbbséget a zónájában.
  • Támogatott logikai értékek: Az IGAZ/HAMIS mellett használhatja az I/Igen/1 és az N/Nem/0 értékeket is (kis- és nagybetűk megkülönböztetése nélkül).
  • Konfigurációs hatókörök (Compute Engine):
    • Proyecto: a projektben részt vevő összes virtuális gépre közös metaadatok.
    • Zonal: olyan bejegyzések, amelyek egy adott zónában lévő összes virtuális gépet érintenek, és felülbírálhatják a projekt értékét.
    • Instancia: egy adott virtuális gép metaadatai (létrehozás alatt álló vagy már meglévő).
Exkluzív tartalom – Kattintson ide  Mi a finomhangolás, és miért működnek jobban vele a promptjaid?

Metaadatok a Google Cloudban

Indexképek, indexelés és metaadatok lekérése a Drive-ban (REST és bevált gyakorlatok)

Most nézzük meg a miniatűrök szerepét a metaadatok eltávolításakor a Google Drive-ban. És azt is, hogyan lehet őket a legjobban visszaállítani:

  • Helyszíni REST hitelesítés: Ha a saját gépedről tesztelsz REST példákat, használd a gclouddal konfigurált hitelesítő adatokat. Így a Drive API-hívásaid tiszteletben fogják tartani a már beállított identitást és engedélyeket.
  • Egyéni indexkép feltöltése: A contentHints.thumbnail fájlban két mezőt kell megadni: az URL-biztos base64 képet és a helyes mimeType-ot. Ha a Drive automatikusan generál bélyegképet, akkor a sajátját fogja használni, és kihagyja a tiédet. Ellenkező esetben a megadottat fogja használni.

A Drive-ban található indexképekre vonatkozó főbb szabályok:

  • Formátumok: PNG, GIF vagy JPG.
  • Ajánlott szélesség: 1600 px (minimum 220 px).
  • Tamaño máximo: 2 MB.
  • Frissítsd a miniatűrt minden mentéskor, ha még releváns.

Fontos a következőről: érvénytelenítés: A fájl tartalmának megváltozása esetén a bélyegképek érvényét vesztik; a metaadatok változásai nem. Ha csak a címkéket vagy a nevet módosítja, ne számítson új bélyegképre, hacsak nem módosítja magát a fájlt.

Indexelhető szöveg

Ne próbáld meg divatos szavakkal „becsapni” a keresést. Olyan fogalmakat és kifejezéseket rögzíts, amelyeket egy felhasználó ésszerűen keresne az adott fájlra, és Ellenőrizd a 128 KB-os korlátot. Frissítsd, valahányszor a tartalom lényegesen megváltozik.

Használjon következetes neveket és kiterjesztéseketAmikor csak lehetséges, feltöltéskor tüntesd fel a kiterjesztést a névben; ha hiányzik, a Drive MIME alapján próbálja meg kikövetkeztetni. A nevek egyértelművé tétele elkerüli a félreértéseket és megkönnyíti a kiterjesztések keresését.

Címkék a Drive-ban

A címkék módosításához jegyezd fel a szükséges azonosítókat. Szükséged lesz a címke labelId azonosítójára és a fájl fileId azonosítójára. Először listázhatod őket a files.listLabels segítségével, majd alkalmazhatod a megfelelő módosításokat a célfájlra.

// Al modificar etiquetas de un archivo en Drive:
// - labelId: identificador de la etiqueta a cambiar
// - fileId: identificador del archivo al que aplicas la etiqueta
// Usa files.listLabels para localizarlas antes de actualizar.

Ne feledd, Bár a Drive áll a középpontban, számos fejlesztés a Drive-ot felhőalapú tárhellyel vagy más szolgáltatásokkal kombinálja. Ezért látni fog példákat a Tárolásra az objektum attribútumainak vizsgálatához.

// Ejemplo en Go para obtener atributos de un objeto en Cloud Storage (no Drive)
// e imprimir metadatos como ContentType, CacheControl, MD5, etc.
// Útil si tu flujo sube primero a Storage y luego a Drive.
import (
  "context"
  "fmt"
  "io"
  "time"
  "cloud.google.com/go/storage"
)

func getMetadata(w io.Writer, bucket, object string) (*storage.ObjectAttrs, error) {
  ctx := context.Background()
  client, err := storage.NewClient(ctx)
  if err != nil { return nil, fmt.Errorf("storage.NewClient: %w", err) }
  defer client.Close()

  ctx, cancel := context.WithTimeout(ctx, 10*time.Second)
  defer cancel()

  o := client.Bucket(bucket).Object(object)
  attrs, err := o.Attrs(ctx)
  if err != nil { return nil, fmt.Errorf("Object(%q).Attrs: %w", object, err) }

  fmt.Fprintf(w, "Bucket: %v\n", attrs.Bucket)
  fmt.Fprintf(w, "CacheControl: %v\n", attrs.CacheControl)
  fmt.Fprintf(w, "ContentDisposition: %v\n", attrs.ContentDisposition)
  fmt.Fprintf(w, "ContentEncoding: %v\n", attrs.ContentEncoding)
  fmt.Fprintf(w, "ContentLanguage: %v\n", attrs.ContentLanguage)
  fmt.Fprintf(w, "ContentType: %v\n", attrs.ContentType)
  fmt.Fprintf(w, "Crc32c: %v\n", attrs.CRC32C)
  fmt.Fprintf(w, "Generation: %v\n", attrs.Generation)
  fmt.Fprintf(w, "KmsKeyName: %v\n", attrs.KMSKeyName)
  fmt.Fprintf(w, "Md5Hash: %v\n", attrs.MD5)
  fmt.Fprintf(w, "MediaLink: %v\n", attrs.MediaLink)
  fmt.Fprintf(w, "Metageneration: %v\n", attrs.Metageneration)
  fmt.Fprintf(w, "Name: %v\n", attrs.Name)
  fmt.Fprintf(w, "Size: %v\n", attrs.Size)
  fmt.Fprintf(w, "StorageClass: %v\n", attrs.StorageClass)
  fmt.Fprintf(w, "TimeCreated: %v\n", attrs.Created)
  fmt.Fprintf(w, "Updated: %v\n", attrs.Updated)
  fmt.Fprintf(w, "Event-based hold enabled? %t\n", attrs.EventBasedHold)
  fmt.Fprintf(w, "Temporary hold enabled? %t\n", attrs.TemporaryHold)
  fmt.Fprintf(w, "Retention expiration time %v\n", attrs.RetentionExpirationTime)
  fmt.Fprintf(w, "Custom time %v\n", attrs.CustomTime)
  fmt.Fprintf(w, "Retention: %+v\n", attrs.Retention)
  fmt.Fprintf(w, "\n\nMetadata\n")
  for key, value := range attrs.Metadata {
    fmt.Fprintf(w, "\t%v = %v\n", key, value)
  }
  return attrs, nil
}

Fájlok törlése vs. metaadatok törlése a Google Drive-ban

Ha amit akarsz, az fájl törlése a Drive-rólTulajdonosként áthelyezheti a fájlt a webről a kukába, ha jobb gombbal kattint rá, és kiválasztja az Áthelyezés a kukába lehetőséget. Ha a tulajdonos valaki más, akkor csak a saját nézetéből távolíthatja el a fájlt; mások továbbra is láthatják.

Exkluzív tartalom – Kattintson ide  Alakzat beszúrása a Google Dokumentumokban

Mert Egy fájl végleges törléséhez ki kell ürítenie a kukát, vagy használnia kell a végleges törlés opciót. Ebben az esetben nem fogja tudni visszaállítani. Ez önmagában nem „távolítja el a metaadatokat” más fájlokból – csak az adott elemre vonatkozik.

A Google Drive-ban nem törölhet metaadatokat azokról a fájlokról, amelyek nem a saját tulajdonodban vannak. mivel az ellenőrzésük ahhoz a személyhez tartozik, aki létrehozta őket, vagy egy magasabb jogosultságokkal rendelkező személyhez a szervezeten belül. Ilyen esetekben egyszerűen visszavonja a hozzáférését vagy a láthatóságát.

A metaadatokhoz viszonyítva: Egy fájl törlése a metaadatokat is törli a Drive-ban, a fájllal együtt. de ez nem befolyásolja a más másolatokban található metaadatokat vagy a rendszerben maradó más dokumentumokba beágyazott metaadatokat.

A fentiekkel most már jól megkülönböztethet Milyen metaadatokat vezérel a Drive (név, címkék, keresési tippek és bélyegképek)?, hogyan kérdezhetők le őket REST-en keresztül, milyen ajánlott gyakorlatokat kell követni a beágyazott adatok feltöltés előtti megtisztításához, és milyen korlátozások és engedélyek érvényesek, ha olyan Google Cloud dokumentációval találkozunk, amely más kontextusokban „metaadatokról” beszél.