Jak odstranit metadata na Disku Google

Poslední aktualizace: 01.02.2024

  • Pochopte, jaká metadata Disk spravuje (název, tagy, indexableText a miniatury) a jaká metadata patří k ostatním službám Google Cloud.
  • Použijte rozhraní Drive API k dotazování a úpravě metadat; před nahráním souborů vyčistěte data EXIF ​​a vložená data.
  • Respektujte omezení a pravidla (miniatury, indexovatelný text, rozšíření) a pro lokální REST testování se ověřujte pomocí gcloudu.
smazat metadata na Disku Google

Chcete mít kontrolu nad metadaty svých souborů v Disk Google a nevíte, kde začít? Zde vám podrobně vysvětlíme, Jak efektivně a bezpečně odstranit metadata na Disku Google (metadata nahraných souborů). Také vám sdělíme, jaká omezení Google ukládá na názvy souborů, jejich velikosti a oprávnění.

Tato příručka vám poskytne úplnou a realistickou představu o tom, co lze (a co nelze) „smazat“, pokud jde o metadata na Disku Google.

Co lze na Disku změnit nebo „smazat“

Toto jsou metadata které lze odstranit ze souborů nahraných na Disk Google:

Nombre y extensión: Při vytváření souboru pomocí API je vhodné zadat příponu v poli názvu, například „cat.jpg“. Disk může příponu odvodit z typu MIME, pokud ji nezadáte, ale je lepší si ji definovat sami. V následných odpovědích se může zobrazit přípona fileExtension určená pouze pro čtení s příponou vyplněnou z názvu. Pokud si uživatel soubor stáhne, Disk zkompiluje konečný název z názvu (a jeho přípony).

  • Indexovatelný text (contentHints.indexableText): Disk ve výchozím nastavení indexuje běžné dokumenty a typy (PDF, obrázky s podporou OCR atd.). Pokud vaše aplikace ukládá jiné formáty (kresby, videa, zkratky), můžete pro zlepšení vyhledávání poskytnout indexovatelný text. Tento text se zpracovává jako HTML: pokud předáte řetězec obsahující tagy, indexuje se textový obsah, nikoli atributy tagů. Pro contentHints.indexableText existuje limit velikosti 128 KB a doporučuje se jej aktualizovat při každém uložení a udržovat jej relevantní pro soubor.
  • Náhledy (contentHints.thumbnail): Disk generuje miniatury pro mnoho typů, ale pro formáty, které je negenerují automaticky, si můžete při vytváření nebo aktualizaci souboru nahrát vlastní. Musíte nastavit obrázek na URL-safe base64 a odpovídající mimeType. Klíčová pravidla: Podporované formáty jsou PNG, GIF nebo JPG; doporučená šířka je 1600 pixelů (minimálně 220 pixelů) a maximální velikost je 2 MB. Miniatury jsou při změně obsahu souboru zneplatněny; změny metadat nikoli.
  • Přístup k miniaturám: Pole ThumbnailLink vrací krátkou URL adresu, která je přístupná pouze v případě, že má aplikace oprávnění ke čtení souboru (pokud není veřejný, budete si ho muset vyžádat s přihlašovacími údaji). Můžete jej dotazovat na konkrétní soubor nebo na seznam filtrovaný podle typu.
  • Štítky: Disk umožňuje přiřadit štítky k souborům. Pro jejich vyhledání můžete použít files.listLabels a pro jejich úpravu musíte odkazovat na odpovídající labelId a fileId. Tento mechanismus je užitečný pro kategorizaci a v případě potřeby i pro „čištění“ nežádoucích klasifikací bez zásahu do obsahu.
Exkluzivní obsah – klikněte zde  Jak zabránit přibližování Map Google
smazat metadata na Disku Google
Smazání metadat na Disku Google

Smazání metadat na Disku Google: „skrytá“ metadata ze samotného souboru

Na Disku Google neexistuje žádné magické tlačítko pro odstranění metadat (například EXIF ​​​​u fotografií nebo vložená data v PDF). Disk si spravuje svá vlastní metadata, ale metadata v souboru závisí na nástroji, který jej vytvořil.

Doporučená praxe je před nahráním na Disk soubor vyčistěte, Používání systémových nástrojů nebo specializovaných aplikací, které odstraňují data EXIF ​​z obrázků nebo vlastností dokumentů. Tímto způsobem se obsah uložený na Disku doručí „vyčištěný“.

Pokud jste již nahráli soubory s vloženými metadaty, je pohodlnější je namísto odstraňování metadat na Disku Google stáhnout, vyčistit a znovu nahrát, nahrazení originálu, pokud je to relevantní. U PDF nebo obrázků je to běžné, když chcete chránit autorství, umístění nebo historii úprav.

Pro konkrétní část Disku, zaměření na úpravu názvu, popisků a nápověd k obsahu (indexableText/thumbnail), které máte pod kontrolou. Pokud také spravujete přístupová oprávnění, omezíte také vystavení viditelných metadat (například odkazů na miniatury přístupných osobám s právy ke čtení).

Nezapomeň na to Změna pouze metadat Disku neodstraní EXIF ​​​​ani interní vlastnosti. Vaše strategie by proto měla kombinovat předčištění souboru s detailní správou metadat, kterou vám Disk umožňuje.

Často zaměňovaná metadata v Google Cloudu: virtuální počítače, gcloud a omezení

Pokud pracujete s Google Cloud, uvidíte mnoho průvodci o „metadatech“, které se ve skutečnosti vztahují k Compute Engine nebo cloudovému úložišti, nikoli k Disku. Přesto budete chtít tyto body znát, abyste si je při zkoumání nezaměnili.

Základní konfigurace CLI gcloudu

Po instalaci rozhraní Google Cloud CLI proveďte inicializaci pomocí:

gcloud init

Je důležité se ujistit, že máte nejnovější verzi s:

gcloud components update

Pokud používáte externího poskytovatele identity, Před prací s gcloud se přihlaste pomocí své federované identity. Zvláště pokud se budete ověřovat pro volání REST z vašeho lokálního prostředí. Ukázky REST API mohou používat přihlašovací údaje, které jste nakonfigurovali v gcloud.

VMs

Oprávnění a role (Compute Engine): Chcete-li přidat, aktualizovat nebo odstranit vlastní metadata na virtuálních počítačích, potřebujete příslušná oprávnění IAM. Mezi běžné příklady patří:

  • Pokud vaše virtuální počítače používají servisní účty: povolení iam.serviceAccounts.actAs v účtu služby nebo projektu.
  • Metadatos del proyecto: compute.projects.get y compute.projects.setCommonInstanceMetadata.
  • Zonální metadata: compute.instanceSettings.get y compute.instanceSettings.update pro příslušnou oblast.
  • Metadata instance: compute.instances.get y compute.instances.setMetadata.

Omezení

Toto jsou hlavní omezení, se kterými jsme se setkali při pokusu o odstranění metadat na Disku Google:

  • Omezení velikosti (Compute Engine): Celkový počet položek metadat je omezen na 512 KB. Každý klíč je omezen na 128 bajtů a každá hodnota je omezena na 256 KB. Pokud například použijete klíč ssh-keys a překročíte limit 256 KB, nebudete moci přidat další klíče, dokud nevyčistíte data.
  • Mayúsculas y minúsculas: Klíče rozlišují velká a malá písmena; hodnoty také, s výjimkou booleovských hodnot. V zonalu nelze vytvořit dva klíče, které se liší pouze velikostí písmen (zonal-metadata-key vs. ZONAL-METADATA-KEY).
  • Zonální metadata: se nastavují nebo odstraňují pomocí gcloud nebo REST. Pro SSH klíče (ssh-keys) nelze definovat zónové hodnoty. Pokud v logickém adresáři projektu/ existují pro stejný klíč hodnoty na úrovni projektu a zónové hodnoty, má zónová hodnota v dané zóně přednost.
  • Podporované booleovské hodnoty: Kromě hodnot TRUE/FALSE můžete použít i Y/Ano/1 a N/Ne/0 (bez rozlišení velkých a malých písmen).
  • Rozsahy konfigurace (Compute Engine):
    • Proyecto: metadata společná pro všechny virtuální počítače v projektu.
    • Zonal: položky, které ovlivňují všechny virtuální počítače v dané zóně a mohou přepsat hodnotu projektu.
    • Instancia: metadata pro konkrétní virtuální počítač (vytvářený nebo již existující).
Exkluzivní obsah – klikněte zde  Co je jemné ladění a proč s ním vaše výzvy fungují lépe?

Metadata v Google Cloudu

Miniatury, indexování a načítání metadat na Disku (REST a osvědčené postupy)

Pojďme se nyní podívat na roli miniatur při odstraňování metadat na Disku Google. A také na nejlepší způsob, jak je obnovit:

  • Ověřování pro REST v místní síti: Pokud testujete příklady REST z vašeho počítače, použijte přihlašovací údaje nakonfigurované pomocí gcloud. Tímto způsobem budou vaše volání Drive API respektovat identitu a oprávnění, která jste již nastavili.
  • Nahrávání vlastních miniatur: Nastavte contentHints.thumbnail se dvěma poli: URL-safe base64 image a správným MIMEType. Pokud Disk dokáže automaticky vygenerovat miniaturu, použije svou vlastní a tu vaši přeskočí. Jinak použije tu, kterou zadáte.

Klíčová pravidla pro miniatury na Disku:

  • Formáty: PNG, GIF nebo JPG.
  • Doporučená šířka: 1600 px (minimálně 220 px).
  • Tamaño máximo: 2 MB.
  • Aktualizujte miniaturu s každým uložením, pokud je stále relevantní.

Důležité informace zneplatnění: Miniatury se zneplatní, když se změní obsah souboru; změny metadat nikoli. Pokud změníte pouze tagy nebo název, neočekávejte novou miniaturu, dokud neupravíte soubor.

Indexovatelný text

Nepokoušejte se „oklamat“ vyhledávání módními slovy. Zachyťte koncepty a termíny, které by uživatel v daném souboru rozumně hledal, a zkontrolujte limit 128 kB. Aktualizujte jej vždy, když se obsah podstatně změní.

Používejte konzistentní názvy a příponyPokud je to možné, uveďte příponu v názvu při nahrávání. Pokud chybí, Disk se ji pokusí odvodit pomocí MIME. Jasné názvy zabrání nejednoznačnostem a usnadní vyhledávání přípon.

Štítky na Disku

Chcete-li upravit popisky, poznamenejte si potřebné identifikátory. Budete potřebovat labelId popisku a fileId souboru. Nejprve je můžete vypsat pomocí files.listLabels a poté použít odpovídající změny na cílový soubor.

// Al modificar etiquetas de un archivo en Drive:
// - labelId: identificador de la etiqueta a cambiar
// - fileId: identificador del archivo al que aplicas la etiqueta
// Usa files.listLabels para localizarlas antes de actualizar.

Pamatujte si, že Ačkoli je Drive zaměřený na řešení, mnoho vývojářů kombinuje Drive s cloudovým úložištěm nebo jinými službami, Proto uvidíte příklady úložiště pro kontrolu atributů objektů.

// Ejemplo en Go para obtener atributos de un objeto en Cloud Storage (no Drive)
// e imprimir metadatos como ContentType, CacheControl, MD5, etc.
// Útil si tu flujo sube primero a Storage y luego a Drive.
import (
  "context"
  "fmt"
  "io"
  "time"
  "cloud.google.com/go/storage"
)

func getMetadata(w io.Writer, bucket, object string) (*storage.ObjectAttrs, error) {
  ctx := context.Background()
  client, err := storage.NewClient(ctx)
  if err != nil { return nil, fmt.Errorf("storage.NewClient: %w", err) }
  defer client.Close()

  ctx, cancel := context.WithTimeout(ctx, 10*time.Second)
  defer cancel()

  o := client.Bucket(bucket).Object(object)
  attrs, err := o.Attrs(ctx)
  if err != nil { return nil, fmt.Errorf("Object(%q).Attrs: %w", object, err) }

  fmt.Fprintf(w, "Bucket: %v\n", attrs.Bucket)
  fmt.Fprintf(w, "CacheControl: %v\n", attrs.CacheControl)
  fmt.Fprintf(w, "ContentDisposition: %v\n", attrs.ContentDisposition)
  fmt.Fprintf(w, "ContentEncoding: %v\n", attrs.ContentEncoding)
  fmt.Fprintf(w, "ContentLanguage: %v\n", attrs.ContentLanguage)
  fmt.Fprintf(w, "ContentType: %v\n", attrs.ContentType)
  fmt.Fprintf(w, "Crc32c: %v\n", attrs.CRC32C)
  fmt.Fprintf(w, "Generation: %v\n", attrs.Generation)
  fmt.Fprintf(w, "KmsKeyName: %v\n", attrs.KMSKeyName)
  fmt.Fprintf(w, "Md5Hash: %v\n", attrs.MD5)
  fmt.Fprintf(w, "MediaLink: %v\n", attrs.MediaLink)
  fmt.Fprintf(w, "Metageneration: %v\n", attrs.Metageneration)
  fmt.Fprintf(w, "Name: %v\n", attrs.Name)
  fmt.Fprintf(w, "Size: %v\n", attrs.Size)
  fmt.Fprintf(w, "StorageClass: %v\n", attrs.StorageClass)
  fmt.Fprintf(w, "TimeCreated: %v\n", attrs.Created)
  fmt.Fprintf(w, "Updated: %v\n", attrs.Updated)
  fmt.Fprintf(w, "Event-based hold enabled? %t\n", attrs.EventBasedHold)
  fmt.Fprintf(w, "Temporary hold enabled? %t\n", attrs.TemporaryHold)
  fmt.Fprintf(w, "Retention expiration time %v\n", attrs.RetentionExpirationTime)
  fmt.Fprintf(w, "Custom time %v\n", attrs.CustomTime)
  fmt.Fprintf(w, "Retention: %+v\n", attrs.Retention)
  fmt.Fprintf(w, "\n\nMetadata\n")
  for key, value := range attrs.Metadata {
    fmt.Fprintf(w, "\t%v = %v\n", key, value)
  }
  return attrs, nil
}

Mazání souborů vs. mazání metadat na Disku Google

Pokud to, co chcete, je smazat soubor z DiskuJako vlastník jej můžete přesunout do koše z webu kliknutím pravým tlačítkem myši a výběrem možnosti Přesunout do koše. Pokud je vlastníkem někdo jiný, můžete soubor pouze „odebrat“ ze svého zobrazení; ostatní ho budou moci stále vidět.

Exkluzivní obsah – klikněte zde  Jak vložit tvar do Dokumentů Google

Pro Chcete-li soubor trvale smazat, musíte vyprázdnit koš nebo použít možnost trvalého smazání, V tomto případě jej nebudete moci obnovit. Samotné to „neodstraní metadata“ z ostatních souborů – vztahuje se to pouze na danou položku.

V Disku Google nelze smazat metadata ze souborů, které nevlastníte. protože jejich kontrola patří osobě, která je vytvořila, nebo někomu s vyššími oprávněními v rámci organizace. V těchto případech jednoduše odeberete svůj přístup nebo viditelnost.

Vztah k metadatům: Smazáním souboru se smažou i jeho metadata na Disku. ale neovlivňuje metadata v jiných kopiích ani vložená metadata v jiných dokumentech, které v systému zůstávají.

S výše uvedeným nyní můžete dobře rozlišovat Jaká metadata Disk řídí (název, štítky, nápovědy k vyhledávání a miniatury), jak je dotazovat pomocí RESTu, jaké osvědčené postupy dodržovat pro čištění vložených dat před nahráním a jaké limity a oprávnění se uplatňují, když narazíte na dokumentaci ke Google Cloudu, která se v jiných kontextech zmiňuje o „metadatech“.