- Dowiedz się, jakimi metadanymi zarządza Dysk (nazwa, tagi, indexableText i miniatury), a jakie metadane należą do innych usług Google Cloud.
- Użyj interfejsu API Dysku, aby wyszukać i dostosować metadane; wyczyść dane EXIF i osadzone dane przed przesłaniem plików.
- Szanuj ograniczenia i zasady (miniaturki, indeksowalny tekst, rozszerzenia) i uwierzytelniaj się za pomocą gcloud na potrzeby lokalnych testów REST.
Czy chcesz kontrolować metadane swoich plików w Dysk Google i nie wiesz, od czego zacząć? Tutaj wyjaśniamy szczegółowo, Jak skutecznie i bezpiecznie usuwać metadane z Dysku Google (metadane przesłanych plików). Informujemy również o ograniczeniach, jakie Google nakłada na nazwy plików, ich rozmiary i uprawnienia.
Ten przewodnik przedstawia kompleksowy i realistyczny obraz tego, co można (a czego nie można) „usunąć” w ramach metadanych w Dysku Google.
Co można zmienić lub „usunąć” w Dysku
To są metadane które można usunąć z plików przesłanych do Dysku Google:
Nombre y extensión: Tworząc plik za pośrednictwem API, warto określić rozszerzenie w polu nazwy, na przykład „kot.jpg”. Dysk może wywnioskować rozszerzenie z typu MIME, jeśli go nie określisz, ale lepiej zdefiniować je samodzielnie. W kolejnych odpowiedziach może pojawić się pole „fileExtension” tylko do odczytu z rozszerzeniem podanym w polu „name”. Jeśli użytkownik pobierze plik, Dysk kompiluje ostateczną nazwę na podstawie tytułu (i jego rozszerzenia).
- Tekst indeksowalny (contentHints.indexableText): Dysk domyślnie indeksuje popularne dokumenty i typy (pliki PDF, obrazy z włączoną funkcją OCR itp.). Jeśli Twoja aplikacja zapisuje inne formaty (rysunki, filmy, skróty), możesz udostępnić indeksowalny tekst, aby usprawnić wyszukiwanie. Ten tekst jest przetwarzany jako HTML: jeśli przekażesz ciąg zawierający tagi, indeksowana jest zawartość tekstowa, a nie atrybuty tagów. Limit rozmiaru pliku contentHints.indexableText wynosi 128 KB i zaleca się jego aktualizację przy każdym zapisie oraz zachowanie adekwatności do pliku.
- Miniatury (contentHints.thumbnail): Dysk generuje miniatury dla wielu typów, ale w przypadku formatów, które nie generują ich automatycznie, możesz przesłać własne podczas tworzenia lub aktualizacji pliku. Obraz musi być skonfigurowany w formacie Base64, bezpiecznym dla adresów URL, oraz w odpowiednim typie MIME. Kluczowe zasady: Obsługiwane formaty to PNG, GIF lub JPG; zalecana szerokość to 1600 px (minimum 220 px), a maksymalny rozmiar to 2 MB. Miniatury są unieważniane po zmianie zawartości pliku; zmiany metadanych nie.
- Dostęp do miniatur: Pole ThumbnailLink zwraca krótki adres URL, dostępny tylko wtedy, gdy aplikacja ma uprawnienia do odczytu pliku (jeśli plik nie jest publiczny, należy go zażądać, podając dane uwierzytelniające). Można go przeszukać pod kątem konkretnego pliku lub listy przefiltrowanej według typu.
- Etykiety: Dysk umożliwia kojarzenie etykiet z plikami. Aby je zlokalizować, można użyć metody files.listLabels, a aby je zmodyfikować, należy odwołać się do odpowiednich identyfikatorów labelId i fileId. Ten mechanizm jest przydatny do kategoryzowania i, w razie potrzeby, „czyszczenia” niechcianych klasyfikacji bez ingerencji w zawartość.
Usuwanie metadanych w Dysku Google: „ukryte” metadane z samego pliku
W Dysku Google nie ma magicznego przycisku do usuwania metadanych (takich jak dane EXIF ze zdjęć czy osadzone dane w plikach PDF). Dysk sam zarządza swoimi metadanymi, ale metadane w pliku zależą od narzędzia, które go utworzyło.
Zalecana praktyka to wyczyść plik przed przesłaniem go na Dysk, Korzystanie z narzędzi systemowych lub specjalistycznych aplikacji, które usuwają dane EXIF z obrazów lub właściwości dokumentów. W ten sposób zawartość zapisywana na Dysku jest „zdezynfekowana”.
Jeśli masz już przesłane pliki z osadzonymi metadanymi, wygodniej jest usunąć metadane w Dysku Google pobierz, wyczyść i ponownie prześlij, zastąpienie oryginału, jeśli ma to zastosowanie. W przypadku plików PDF lub obrazów jest to częste, gdy chcesz chronić autorstwo, lokalizację lub historię edycji.
W przypadku konkretnej części Drive, skup się na dostosowywaniu nazw, etykiet i contentHints (indexableText/thumbnail), które są pod Twoją kontrolą. Zarządzając uprawnieniami dostępu, zmniejszasz również ekspozycję widocznych metadanych (na przykład linków do miniatur dostępnych dla osób z uprawnieniami do odczytu).
Nie zapomnij o tym Zmiana samych metadanych Dysku nie powoduje usunięcia danych EXIF ani właściwości wewnętrznych. Dlatego Twoja strategia powinna łączyć wstępne czyszczenie pliku z szczegółowym zarządzaniem metadanymi, które możesz modyfikować za pomocą Dysku.
Często mylone metadane w Google Cloud: maszyny wirtualne, gcloud i limity
Jeśli pracujesz z Google Cloud, zobaczysz wiele przewodniki dotyczące „metadanych”, które w rzeczywistości odnoszą się do Compute Engine lub Cloud Storage, a nie do Drive. Mimo wszystko warto znać te informacje, aby nie pomylić ich podczas poszukiwań.
Podstawowa konfiguracja interfejsu wiersza poleceń gcloud
Po zainstalowaniu interfejsu Google Cloud CLI zainicjuj go za pomocą:
gcloud init
Ważne jest, aby upewnić się, że posiadasz najnowszą wersję zawierającą:
gcloud components update
Jeżeli korzystasz z zewnętrznego dostawcy tożsamości, Przed rozpoczęciem pracy z gcloud zaloguj się przy użyciu swojej tożsamości federacyjnej, zwłaszcza jeśli zamierzasz uwierzytelniać się, aby wykonywać wywołania REST ze swojego lokalnego środowiska. Przykłady interfejsu API REST mogą korzystać z poświadczeń skonfigurowanych w gcloud.
VMs
Uprawnienia i role (Compute Engine): Aby dodawać, aktualizować lub usuwać niestandardowe metadane na maszynach wirtualnych, potrzebujesz odpowiednich uprawnień IAM. Typowe przykłady:
- Jeśli Twoje maszyny wirtualne korzystają z kont usługowych: pozwolenie
iam.serviceAccounts.actAsna koncie usługi lub projektu. - Metadatos del proyecto:
compute.projects.getycompute.projects.setCommonInstanceMetadata. - Metadane strefowe:
compute.instanceSettings.getycompute.instanceSettings.updatedla odpowiedniego obszaru. - Metadane instancji:
compute.instances.getycompute.instances.setMetadata.
Ograniczenia
Oto główne ograniczenia, na jakie natrafiliśmy próbując usunąć metadane w Dysku Google:
- Ograniczenia rozmiaru (Compute Engine): Łączny rozmiar wpisów metadanych jest ograniczony do 512 KB. Każdy klucz jest ograniczony do 128 bajtów, a każda wartość do 256 KB. Jeśli na przykład użyjesz klucza ssh-keys i przekroczysz limit 256 KB, nie będziesz mógł dodać więcej kluczy, dopóki nie usuniesz danych.
- Wielkie i małe litery: Klucze rozróżniają wielkość liter; wartości również, z wyjątkiem wartości logicznych. W trybie strefowym nie można utworzyć dwóch kluczy różniących się jedynie wielkością liter (zonal-metadata-key vs. ZONAL-METADATA-KEY).
- Metadane strefowe: Są ustawiane lub usuwane za pomocą gcloud lub REST. Nie można definiować wartości strefowych dla kluczy SSH (ssh-keys). Jeśli w logicznym katalogu projektu/ istnieją wartości na poziomie projektu i strefy dla tego samego klucza, wartość strefy ma pierwszeństwo w swojej strefie.
- Obsługiwane wartości logiczne: Oprócz opcji PRAWDA/FAŁSZ możesz użyć opcji Y/Tak/1 i N/Nie/0 (bez względu na wielkość liter).
- Zakresy konfiguracji (Compute Engine):
- Proyecto: metadane wspólne dla wszystkich maszyn wirtualnych w projekcie.
- Zonal: wpisy, które dotyczą wszystkich maszyn wirtualnych w określonej strefie i mogą zastąpić wartość projektu.
- Instancia: metadane dla konkretnej maszyny wirtualnej (tworzonej lub już istniejącej).

Miniatury, indeksowanie i pobieranie metadanych w Dysku (REST i najlepsze praktyki)
Przyjrzyjmy się teraz roli miniatur podczas usuwania metadanych z Dysku Google. A także najlepszemu sposobowi ich odzyskania:
- Uwierzytelnianie dla REST lokalnego: Jeśli testujesz przykłady REST na swoim komputerze, użyj poświadczeń skonfigurowanych w gcloud. Dzięki temu wywołania API Dysku będą uwzględniać tożsamość i uprawnienia, które już ustawiłeś.
- Przesyłanie niestandardowych miniatur: Ustaw contentHints.thumbnail z dwoma polami: obrazem base64 bezpiecznym dla adresu URL i prawidłowym typem MIME. Jeśli Dysk może automatycznie wygenerować miniaturę, użyje własnej i pominie Twoją. W przeciwnym razie użyje tej, którą podasz.
Najważniejsze zasady dotyczące miniatur w Dysku:
- Formaty: PNG, GIF lub JPG.
- Zalecana szerokość: 1600 px (minimum 220 px).
- Tamaño máximo: 2 MB.
- Jeśli miniaturę nadal można uaktualnić przy każdym zapisie, należy ją zapisać ponownie.
Ważne o unieważnienie: Miniatury tracą ważność po zmianie zawartości pliku; zmiany metadanych nie. Jeśli zmienisz tylko tagi lub nazwę, nie spodziewaj się nowej miniatury, chyba że zmodyfikujesz plik.
Tekst indeksowalny
Nie próbuj „oszukać” wyszukiwarki za pomocą haseł. Wychwytuj koncepcje i terminy, których użytkownik mógłby rozsądnie użyć do wyszukania tego pliku, i sprawdź limit 128 KB. Aktualizuj za każdym razem, gdy treść ulegnie znaczącej zmianie.
Zastosuj spójne nazwy i rozszerzeniaJeśli to możliwe, uwzględnij rozszerzenie w nazwie podczas przesyłania. Jeśli go nie ma, Dysk spróbuje je wywnioskować na podstawie MIME. Jasna nazwa pozwoli uniknąć niejasności i ułatwi wyszukiwanie rozszerzeń.
Tagi w Dysku
Aby zmodyfikować etykiety, zanotuj niezbędne identyfikatory. Będziesz potrzebować identyfikatora labelId etykiety i identyfikatora fileId pliku. Możesz je najpierw wyświetlić za pomocą polecenia files.listLabels, a następnie zastosować odpowiednie zmiany w pliku docelowym.
// Al modificar etiquetas de un archivo en Drive:
// - labelId: identificador de la etiqueta a cambiar
// - fileId: identificador del archivo al que aplicas la etiqueta
// Usa files.listLabels para localizarlas antes de actualizar.
Pamiętaj, że Mimo że Dysk jest w centrum uwagi, wiele rozwiązań łączy Dysk z pamięcią masową w chmurze lub innymi usługami, Stąd zobaczysz przykłady wykorzystania Magazynu do inspekcji atrybutów obiektów.
// Ejemplo en Go para obtener atributos de un objeto en Cloud Storage (no Drive)
// e imprimir metadatos como ContentType, CacheControl, MD5, etc.
// Útil si tu flujo sube primero a Storage y luego a Drive.
import (
"context"
"fmt"
"io"
"time"
"cloud.google.com/go/storage"
)
func getMetadata(w io.Writer, bucket, object string) (*storage.ObjectAttrs, error) {
ctx := context.Background()
client, err := storage.NewClient(ctx)
if err != nil { return nil, fmt.Errorf("storage.NewClient: %w", err) }
defer client.Close()
ctx, cancel := context.WithTimeout(ctx, 10*time.Second)
defer cancel()
o := client.Bucket(bucket).Object(object)
attrs, err := o.Attrs(ctx)
if err != nil { return nil, fmt.Errorf("Object(%q).Attrs: %w", object, err) }
fmt.Fprintf(w, "Bucket: %v\n", attrs.Bucket)
fmt.Fprintf(w, "CacheControl: %v\n", attrs.CacheControl)
fmt.Fprintf(w, "ContentDisposition: %v\n", attrs.ContentDisposition)
fmt.Fprintf(w, "ContentEncoding: %v\n", attrs.ContentEncoding)
fmt.Fprintf(w, "ContentLanguage: %v\n", attrs.ContentLanguage)
fmt.Fprintf(w, "ContentType: %v\n", attrs.ContentType)
fmt.Fprintf(w, "Crc32c: %v\n", attrs.CRC32C)
fmt.Fprintf(w, "Generation: %v\n", attrs.Generation)
fmt.Fprintf(w, "KmsKeyName: %v\n", attrs.KMSKeyName)
fmt.Fprintf(w, "Md5Hash: %v\n", attrs.MD5)
fmt.Fprintf(w, "MediaLink: %v\n", attrs.MediaLink)
fmt.Fprintf(w, "Metageneration: %v\n", attrs.Metageneration)
fmt.Fprintf(w, "Name: %v\n", attrs.Name)
fmt.Fprintf(w, "Size: %v\n", attrs.Size)
fmt.Fprintf(w, "StorageClass: %v\n", attrs.StorageClass)
fmt.Fprintf(w, "TimeCreated: %v\n", attrs.Created)
fmt.Fprintf(w, "Updated: %v\n", attrs.Updated)
fmt.Fprintf(w, "Event-based hold enabled? %t\n", attrs.EventBasedHold)
fmt.Fprintf(w, "Temporary hold enabled? %t\n", attrs.TemporaryHold)
fmt.Fprintf(w, "Retention expiration time %v\n", attrs.RetentionExpirationTime)
fmt.Fprintf(w, "Custom time %v\n", attrs.CustomTime)
fmt.Fprintf(w, "Retention: %+v\n", attrs.Retention)
fmt.Fprintf(w, "\n\nMetadata\n")
for key, value := range attrs.Metadata {
fmt.Fprintf(w, "\t%v = %v\n", key, value)
}
return attrs, nil
}
Usuwanie plików a usuwanie metadanych w Dysku Google
Si lo que quieres es usuń plik z DyskuJako właściciel możesz przenieść plik do kosza z internetu, klikając prawym przyciskiem myszy i wybierając opcję „Przenieś do kosza”. Jeśli właścicielem jest ktoś inny, możesz jedynie „Usunąć” plik ze swojego widoku; inni nadal będą go widzieć.
Dla Aby trwale usunąć plik, należy opróżnić kosz lub skorzystać z opcji trwałego usunięcia, W takim przypadku nie będzie można go odzyskać. Samo w sobie nie powoduje to „usuwania metadanych” z innych plików – dotyczy tylko tego elementu.
Nie możesz usuwać metadanych w Dysku Google z plików, których nie jesteś właścicielem, Ponieważ ich kontrola należy do osoby, która je utworzyła, lub do kogoś z wyższymi uprawnieniami w organizacji. W takich przypadkach po prostu usuwasz swój dostęp lub widoczność.
Odnosząc to do metadanych: Usunięcie pliku powoduje usunięcie jego metadanych w Dysku, ale nie ma to wpływu na metadane w pozostałych kopiach lub osadzone metadane w pozostałych dokumentach, które pozostają w systemie.
Dzięki temu wszystkiemu możesz teraz dobrze rozróżniać Jakie metadane kontroluje Dysk (nazwa, tagi, wskazówki wyszukiwania i miniatury), jak wysyłać do nich zapytania za pomocą REST, jakie najlepsze praktyki stosować przy czyszczeniu osadzonych danych przed przesłaniem oraz jakie ograniczenia i uprawnienia wchodzą w grę, gdy natrafisz na dokumentację Google Cloud, która mówi o „metadanych” w innych kontekstach.
Redaktor specjalizujący się w zagadnieniach technologii i Internetu z ponad dziesięcioletnim doświadczeniem w różnych mediach cyfrowych. Pracowałem jako redaktor i twórca treści dla firm z branży e-commerce, komunikacji, marketingu online i reklamy. Pisałem także na portalach poświęconych ekonomii, finansom i innym branżom. Moja praca jest także moją pasją. Teraz, poprzez moje artykuły w Tecnobits, staram się odkrywać wszystkie nowości i nowe możliwości, jakie świat technologii oferuje nam każdego dnia, aby poprawić nasze życie.