- Pochopte, jaká metadata Disk spravuje (název, tagy, indexableText a miniatury) a jaká metadata patří k ostatním službám Google Cloud.
- Použijte rozhraní Drive API k dotazování a úpravě metadat; před nahráním souborů vyčistěte data EXIF a vložená data.
- Respektujte omezení a pravidla (miniatury, indexovatelný text, rozšíření) a pro lokální REST testování se ověřujte pomocí gcloudu.
Chcete mít kontrolu nad metadaty svých souborů v Disk Google a nevíte, kde začít? Zde vám podrobně vysvětlíme, Jak efektivně a bezpečně odstranit metadata na Disku Google (metadata nahraných souborů). Také vám sdělíme, jaká omezení Google ukládá na názvy souborů, jejich velikosti a oprávnění.
Tato příručka vám poskytne úplnou a realistickou představu o tom, co lze (a co nelze) „smazat“, pokud jde o metadata na Disku Google.
Co lze na Disku změnit nebo „smazat“
Toto jsou metadata které lze odstranit ze souborů nahraných na Disk Google:
Nombre y extensión: Při vytváření souboru pomocí API je vhodné zadat příponu v poli názvu, například „cat.jpg“. Disk může příponu odvodit z typu MIME, pokud ji nezadáte, ale je lepší si ji definovat sami. V následných odpovědích se může zobrazit přípona fileExtension určená pouze pro čtení s příponou vyplněnou z názvu. Pokud si uživatel soubor stáhne, Disk zkompiluje konečný název z názvu (a jeho přípony).
- Indexovatelný text (contentHints.indexableText): Disk ve výchozím nastavení indexuje běžné dokumenty a typy (PDF, obrázky s podporou OCR atd.). Pokud vaše aplikace ukládá jiné formáty (kresby, videa, zkratky), můžete pro zlepšení vyhledávání poskytnout indexovatelný text. Tento text se zpracovává jako HTML: pokud předáte řetězec obsahující tagy, indexuje se textový obsah, nikoli atributy tagů. Pro contentHints.indexableText existuje limit velikosti 128 KB a doporučuje se jej aktualizovat při každém uložení a udržovat jej relevantní pro soubor.
- Náhledy (contentHints.thumbnail): Disk generuje miniatury pro mnoho typů, ale pro formáty, které je negenerují automaticky, si můžete při vytváření nebo aktualizaci souboru nahrát vlastní. Musíte nastavit obrázek na URL-safe base64 a odpovídající mimeType. Klíčová pravidla: Podporované formáty jsou PNG, GIF nebo JPG; doporučená šířka je 1600 pixelů (minimálně 220 pixelů) a maximální velikost je 2 MB. Miniatury jsou při změně obsahu souboru zneplatněny; změny metadat nikoli.
- Přístup k miniaturám: Pole ThumbnailLink vrací krátkou URL adresu, která je přístupná pouze v případě, že má aplikace oprávnění ke čtení souboru (pokud není veřejný, budete si ho muset vyžádat s přihlašovacími údaji). Můžete jej dotazovat na konkrétní soubor nebo na seznam filtrovaný podle typu.
- Štítky: Disk umožňuje přiřadit štítky k souborům. Pro jejich vyhledání můžete použít files.listLabels a pro jejich úpravu musíte odkazovat na odpovídající labelId a fileId. Tento mechanismus je užitečný pro kategorizaci a v případě potřeby i pro „čištění“ nežádoucích klasifikací bez zásahu do obsahu.
Smazání metadat na Disku Google: „skrytá“ metadata ze samotného souboru
Na Disku Google neexistuje žádné magické tlačítko pro odstranění metadat (například EXIF u fotografií nebo vložená data v PDF). Disk si spravuje svá vlastní metadata, ale metadata v souboru závisí na nástroji, který jej vytvořil.
Doporučená praxe je před nahráním na Disk soubor vyčistěte, Používání systémových nástrojů nebo specializovaných aplikací, které odstraňují data EXIF z obrázků nebo vlastností dokumentů. Tímto způsobem se obsah uložený na Disku doručí „vyčištěný“.
Pokud jste již nahráli soubory s vloženými metadaty, je pohodlnější je namísto odstraňování metadat na Disku Google stáhnout, vyčistit a znovu nahrát, nahrazení originálu, pokud je to relevantní. U PDF nebo obrázků je to běžné, když chcete chránit autorství, umístění nebo historii úprav.
Pro konkrétní část Disku, zaměření na úpravu názvu, popisků a nápověd k obsahu (indexableText/thumbnail), které máte pod kontrolou. Pokud také spravujete přístupová oprávnění, omezíte také vystavení viditelných metadat (například odkazů na miniatury přístupných osobám s právy ke čtení).
Nezapomeň na to Změna pouze metadat Disku neodstraní EXIF ani interní vlastnosti. Vaše strategie by proto měla kombinovat předčištění souboru s detailní správou metadat, kterou vám Disk umožňuje.
Často zaměňovaná metadata v Google Cloudu: virtuální počítače, gcloud a omezení
Pokud pracujete s Google Cloud, uvidíte mnoho průvodci o „metadatech“, které se ve skutečnosti vztahují k Compute Engine nebo cloudovému úložišti, nikoli k Disku. Přesto budete chtít tyto body znát, abyste si je při zkoumání nezaměnili.
Základní konfigurace CLI gcloudu
Po instalaci rozhraní Google Cloud CLI proveďte inicializaci pomocí:
gcloud init
Je důležité se ujistit, že máte nejnovější verzi s:
gcloud components update
Pokud používáte externího poskytovatele identity, Před prací s gcloud se přihlaste pomocí své federované identity. Zvláště pokud se budete ověřovat pro volání REST z vašeho lokálního prostředí. Ukázky REST API mohou používat přihlašovací údaje, které jste nakonfigurovali v gcloud.
VMs
Oprávnění a role (Compute Engine): Chcete-li přidat, aktualizovat nebo odstranit vlastní metadata na virtuálních počítačích, potřebujete příslušná oprávnění IAM. Mezi běžné příklady patří:
- Pokud vaše virtuální počítače používají servisní účty: povolení
iam.serviceAccounts.actAsv účtu služby nebo projektu. - Metadatos del proyecto:
compute.projects.getycompute.projects.setCommonInstanceMetadata. - Zonální metadata:
compute.instanceSettings.getycompute.instanceSettings.updatepro příslušnou oblast. - Metadata instance:
compute.instances.getycompute.instances.setMetadata.
Omezení
Toto jsou hlavní omezení, se kterými jsme se setkali při pokusu o odstranění metadat na Disku Google:
- Omezení velikosti (Compute Engine): Celkový počet položek metadat je omezen na 512 KB. Každý klíč je omezen na 128 bajtů a každá hodnota je omezena na 256 KB. Pokud například použijete klíč ssh-keys a překročíte limit 256 KB, nebudete moci přidat další klíče, dokud nevyčistíte data.
- Mayúsculas y minúsculas: Klíče rozlišují velká a malá písmena; hodnoty také, s výjimkou booleovských hodnot. V zonalu nelze vytvořit dva klíče, které se liší pouze velikostí písmen (zonal-metadata-key vs. ZONAL-METADATA-KEY).
- Zonální metadata: se nastavují nebo odstraňují pomocí gcloud nebo REST. Pro SSH klíče (ssh-keys) nelze definovat zónové hodnoty. Pokud v logickém adresáři projektu/ existují pro stejný klíč hodnoty na úrovni projektu a zónové hodnoty, má zónová hodnota v dané zóně přednost.
- Podporované booleovské hodnoty: Kromě hodnot TRUE/FALSE můžete použít i Y/Ano/1 a N/Ne/0 (bez rozlišení velkých a malých písmen).
- Rozsahy konfigurace (Compute Engine):
- Proyecto: metadata společná pro všechny virtuální počítače v projektu.
- Zonal: položky, které ovlivňují všechny virtuální počítače v dané zóně a mohou přepsat hodnotu projektu.
- Instancia: metadata pro konkrétní virtuální počítač (vytvářený nebo již existující).

Miniatury, indexování a načítání metadat na Disku (REST a osvědčené postupy)
Pojďme se nyní podívat na roli miniatur při odstraňování metadat na Disku Google. A také na nejlepší způsob, jak je obnovit:
- Ověřování pro REST v místní síti: Pokud testujete příklady REST z vašeho počítače, použijte přihlašovací údaje nakonfigurované pomocí gcloud. Tímto způsobem budou vaše volání Drive API respektovat identitu a oprávnění, která jste již nastavili.
- Nahrávání vlastních miniatur: Nastavte contentHints.thumbnail se dvěma poli: URL-safe base64 image a správným MIMEType. Pokud Disk dokáže automaticky vygenerovat miniaturu, použije svou vlastní a tu vaši přeskočí. Jinak použije tu, kterou zadáte.
Klíčová pravidla pro miniatury na Disku:
- Formáty: PNG, GIF nebo JPG.
- Doporučená šířka: 1600 px (minimálně 220 px).
- Tamaño máximo: 2 MB.
- Aktualizujte miniaturu s každým uložením, pokud je stále relevantní.
Důležité informace zneplatnění: Miniatury se zneplatní, když se změní obsah souboru; změny metadat nikoli. Pokud změníte pouze tagy nebo název, neočekávejte novou miniaturu, dokud neupravíte soubor.
Indexovatelný text
Nepokoušejte se „oklamat“ vyhledávání módními slovy. Zachyťte koncepty a termíny, které by uživatel v daném souboru rozumně hledal, a zkontrolujte limit 128 kB. Aktualizujte jej vždy, když se obsah podstatně změní.
Používejte konzistentní názvy a příponyPokud je to možné, uveďte příponu v názvu při nahrávání. Pokud chybí, Disk se ji pokusí odvodit pomocí MIME. Jasné názvy zabrání nejednoznačnostem a usnadní vyhledávání přípon.
Štítky na Disku
Chcete-li upravit popisky, poznamenejte si potřebné identifikátory. Budete potřebovat labelId popisku a fileId souboru. Nejprve je můžete vypsat pomocí files.listLabels a poté použít odpovídající změny na cílový soubor.
// Al modificar etiquetas de un archivo en Drive:
// - labelId: identificador de la etiqueta a cambiar
// - fileId: identificador del archivo al que aplicas la etiqueta
// Usa files.listLabels para localizarlas antes de actualizar.
Pamatujte si, že Ačkoli je Drive zaměřený na řešení, mnoho vývojářů kombinuje Drive s cloudovým úložištěm nebo jinými službami, Proto uvidíte příklady úložiště pro kontrolu atributů objektů.
// Ejemplo en Go para obtener atributos de un objeto en Cloud Storage (no Drive)
// e imprimir metadatos como ContentType, CacheControl, MD5, etc.
// Útil si tu flujo sube primero a Storage y luego a Drive.
import (
"context"
"fmt"
"io"
"time"
"cloud.google.com/go/storage"
)
func getMetadata(w io.Writer, bucket, object string) (*storage.ObjectAttrs, error) {
ctx := context.Background()
client, err := storage.NewClient(ctx)
if err != nil { return nil, fmt.Errorf("storage.NewClient: %w", err) }
defer client.Close()
ctx, cancel := context.WithTimeout(ctx, 10*time.Second)
defer cancel()
o := client.Bucket(bucket).Object(object)
attrs, err := o.Attrs(ctx)
if err != nil { return nil, fmt.Errorf("Object(%q).Attrs: %w", object, err) }
fmt.Fprintf(w, "Bucket: %v\n", attrs.Bucket)
fmt.Fprintf(w, "CacheControl: %v\n", attrs.CacheControl)
fmt.Fprintf(w, "ContentDisposition: %v\n", attrs.ContentDisposition)
fmt.Fprintf(w, "ContentEncoding: %v\n", attrs.ContentEncoding)
fmt.Fprintf(w, "ContentLanguage: %v\n", attrs.ContentLanguage)
fmt.Fprintf(w, "ContentType: %v\n", attrs.ContentType)
fmt.Fprintf(w, "Crc32c: %v\n", attrs.CRC32C)
fmt.Fprintf(w, "Generation: %v\n", attrs.Generation)
fmt.Fprintf(w, "KmsKeyName: %v\n", attrs.KMSKeyName)
fmt.Fprintf(w, "Md5Hash: %v\n", attrs.MD5)
fmt.Fprintf(w, "MediaLink: %v\n", attrs.MediaLink)
fmt.Fprintf(w, "Metageneration: %v\n", attrs.Metageneration)
fmt.Fprintf(w, "Name: %v\n", attrs.Name)
fmt.Fprintf(w, "Size: %v\n", attrs.Size)
fmt.Fprintf(w, "StorageClass: %v\n", attrs.StorageClass)
fmt.Fprintf(w, "TimeCreated: %v\n", attrs.Created)
fmt.Fprintf(w, "Updated: %v\n", attrs.Updated)
fmt.Fprintf(w, "Event-based hold enabled? %t\n", attrs.EventBasedHold)
fmt.Fprintf(w, "Temporary hold enabled? %t\n", attrs.TemporaryHold)
fmt.Fprintf(w, "Retention expiration time %v\n", attrs.RetentionExpirationTime)
fmt.Fprintf(w, "Custom time %v\n", attrs.CustomTime)
fmt.Fprintf(w, "Retention: %+v\n", attrs.Retention)
fmt.Fprintf(w, "\n\nMetadata\n")
for key, value := range attrs.Metadata {
fmt.Fprintf(w, "\t%v = %v\n", key, value)
}
return attrs, nil
}
Mazání souborů vs. mazání metadat na Disku Google
Pokud to, co chcete, je smazat soubor z DiskuJako vlastník jej můžete přesunout do koše z webu kliknutím pravým tlačítkem myši a výběrem možnosti Přesunout do koše. Pokud je vlastníkem někdo jiný, můžete soubor pouze „odebrat“ ze svého zobrazení; ostatní ho budou moci stále vidět.
Pro Chcete-li soubor trvale smazat, musíte vyprázdnit koš nebo použít možnost trvalého smazání, V tomto případě jej nebudete moci obnovit. Samotné to „neodstraní metadata“ z ostatních souborů – vztahuje se to pouze na danou položku.
V Disku Google nelze smazat metadata ze souborů, které nevlastníte. protože jejich kontrola patří osobě, která je vytvořila, nebo někomu s vyššími oprávněními v rámci organizace. V těchto případech jednoduše odeberete svůj přístup nebo viditelnost.
Vztah k metadatům: Smazáním souboru se smažou i jeho metadata na Disku. ale neovlivňuje metadata v jiných kopiích ani vložená metadata v jiných dokumentech, které v systému zůstávají.
S výše uvedeným nyní můžete dobře rozlišovat Jaká metadata Disk řídí (název, štítky, nápovědy k vyhledávání a miniatury), jak je dotazovat pomocí RESTu, jaké osvědčené postupy dodržovat pro čištění vložených dat před nahráním a jaké limity a oprávnění se uplatňují, když narazíte na dokumentaci ke Google Cloudu, která se v jiných kontextech zmiňuje o „metadatech“.
Redaktor specializovaný na problematiku technologií a internetu s více než desetiletými zkušenostmi v různých digitálních médiích. Pracoval jsem jako editor a tvůrce obsahu pro e-commerce, komunikaci, online marketing a reklamní společnosti. Psal jsem také na weby o ekonomice, financích a dalších odvětvích. Moje práce je zároveň mou vášní. Nyní prostřednictvím mých článků v Tecnobits, snažím se prozkoumat všechny novinky a nové možnosti, které nám svět technologií každý den nabízí, abychom zlepšili náš život.