Cara menginstal Gemma 3 LLM di Windows 11 langkah demi langkah

Gemma 3 adalah model LLM multimodal yang sangat fleksibel yang dikembangkan oleh Google
Dapat diinstal pada Windows 11 menggunakan Ollama, LM Studio atau digunakan melalui Google AI Studio
Memerlukan sumber daya yang bervariasi tergantung pada ukuran model, dari 8 GB hingga 32 GB RAM
Menggabungkan fitur-fitur canggih seperti input gambar dan token konteks hingga 128k

Cara menginstal Gemma 3 LLM di Windows 11/8

Model bahasa sumber terbuka telah berkembang pesat, dan Sekarang, Anda dapat menikmatinya langsung dari komputer pribadi tanpa bergantung pada layanan cloud.. Salah satu yang paling menjanjikan saat ini adalah Gemma 3, LLM baru Google yang berbasis teknologi Gemini, yang menonjol karena kemampuannya memproses teks dan gambar, serta jendela konteksnya yang sangat besar hingga 128 ribu token dalam versi lanjutannya. Untuk informasi lebih lanjut tentang rilis ini, Anda dapat mengunjungi artikel kami di presentasi Gemma 3.

Jika Anda menggunakan Windows 11 dan ingin menginstal Gemma 3 untuk eksperimen atau bahkan produksi lokal, Anda datang ke tempat yang tepat. Mari kita bahas secara rinci semua cara yang mungkin untuk menjalankannya di komputer Anda, termasuk opsi yang paling direkomendasikan seperti Ollama, LM Studio, dan juga alternatif berbasis cloud dengan Google AI Studio. Selain itu, kami akan membahas persyaratan teknis, keuntungan dari setiap metode dan Cara memaksimalkan potensi kecerdasan buatan yang hebat ini.

Apa itu Gemma 3 dan mengapa harus menginstalnya?

Google meluncurkan Gemma 3-4

Gemma 3 adalah model LLM generasi ketiga yang dirilis oleh Google di bawah lisensi sumber terbuka.. Tidak seperti solusi sebelumnya seperti Llama atau Mistral, ia menawarkan dukungan langsung untuk input gambar, konteks yang jauh lebih luas, dan dukungan untuk lebih dari 140 bahasa. Tergantung pada kebutuhan Anda, Anda dapat memilih dari beberapa versi model mulai dari parameter 1B hingga 27B:

Permata 3:1B: Model ringan yang ideal untuk tugas-tugas dasar dan lingkungan dengan sumber daya terbatas.
Permata 3:4B: Menyeimbangkan kinerja dan efisiensi untuk aplikasi menengah.
Permata 3:12B: Direkomendasikan untuk analisis kompleks, pemrograman, dan pemrosesan multibahasa.
Permata 3:27B: Pilihan terkuat, dirancang untuk penggunaan multimodal intensif dengan kapasitas kontekstual yang hebat.

Konten eksklusif - Klik Disini Bagaimana cara menyesuaikan penekanan tombol dengan Gboard?

Kemungkinan menjalankan model canggih tersebut dari PC Anda Ini mengubah aturan permainan dalam hal privasi, kecepatan respons, dan ketergantungan pada pihak ketiga. Anda tidak perlu lagi membayar langganan bulanan atau menyerahkan data Anda. Yang dibutuhkan hanyalah sedikit persiapan dan keinginan untuk belajar. Jika Anda ingin mengetahui lebih lanjut tentang manfaat model ini, lihat artikel kami di model AI bobot terbuka.

Opsi 1: Instalasi dengan Ollama

Unduh Ollama

Ollama mungkin adalah cara termudah untuk menjalankan LLM seperti Gemma 3 dari Windows 11. Antarmuka berbasis terminalnya memungkinkan Anda menginstal dan menjalankan model dengan baris perintah sederhana. Ditambah lagi, aplikasi ini kompatibel dengan macOS, Linux, dan Windows, membuatnya mudah digunakan di berbagai lingkungan.

Langkah-langkah untuk menginstal Ollama dan menjalankan Gemma 3:

Akses situs resminya: ollama.com.
Unduh penginstal untuk Windows dan menjalankannya seperti program lainnya.
Buka Command Prompt (CMD) atau PowerShell dan verifikasi instalasi dengan:

ollama --version

Jika semuanya lancar, Anda sekarang dapat mengunduh salah satu templat Gemma 3 yang tersedia. Jalankan saja salah satu perintah ini tergantung pada templat yang Anda inginkan:

ollama run gemma3:1b
ollama run gemma3:4b
ollama run gemma3:12b
ollama run gemma3:27b

Setelah diunduh, Anda dapat memulai modelnya dengan mudah.. Untuk melakukan ini, jalankan:

ollama init gemma3

Sejak saat itu, Anda dapat mulai berinteraksi dengan LLM dengan:

ollama query gemma3 "¿Cuál es la capital de Japón?"

Jika Anda ingin memanfaatkan fungsi multimodalAnda juga dapat menggunakan gambar dalam kueri Anda:

ollama query gemma3 --image "ruta-de-la-imagen.jpg"

Apa yang Anda butuhkan agar ini berfungsi dengan baik? Meskipun Ollama tidak memaksakan persyaratan minimum yang ketat, model yang lebih besar (seperti 27B) memerlukan setidaknya 32GB RAM. Dengan 16GB Anda dapat bekerja tanpa masalah dengan model 7B, dan meskipun penggunaan GPU tidak wajib, ini sangat membantu dalam kecepatan.

Konten eksklusif - Klik Disini Cara Menghapus Snapchat

Opsi 2: Gunakan LM Studio

Studio LM

LM Studio adalah alat gratis lainnya yang memungkinkan Anda menginstal dan menjalankan model LLM secara lokal dari antarmuka grafis.. Kompatibel dengan Windows, macOS, dan Linux, dan kelebihan terbesarnya adalah tidak memerlukan pengetahuan teknis untuk mengoperasikannya.

Instruksi:

Unduh LM Studio dari situs web resminya: lmstudio.ai.
Instal dan jalankan.
Klik ikon kaca pembesar yang bertuliskan “Temukan”.
Ketik “Gemma 3” di mesin pencari untuk melihat model yang tersedia.

Sebelum memasang, periksa apakah modelnya kompatibel dengan peralatan Anda. Jika Anda melihat peringatan “Kemungkinan terlalu besar untuk mesin ini,” Anda masih dapat menginstalnya, tetapi kinerja optimal tidak dijamin.

Setelah model yang kompatibel diunduh:

Klik “Muat Model” untuk memuatnya.
Atau buka obrolan baru dan pilih model dari menu tarik-turun.

Hal terbaik tentang LM Studio adalah ia bertindak sebagai semacam ChatGPT lokal, offline dan dalam bahasa Anda. Anda dapat membuat beberapa obrolan dan menyimpan percakapan tersebut jika Anda mau. Selain itu, jika Anda mengaktifkan opsi “Server Lokal”, Anda dapat mengintegrasikannya dengan aplikasi Python Anda menggunakan API yang kompatibel dengan OpenAI.

Opsi 3: Gunakan Google AI Studio (online)

Jika Anda tidak dapat atau tidak ingin menginstal apa pun, Anda dapat menggunakan Gemma 3 langsung dari cloud dengan Google AI Studio. Tidak perlu instalasi, tapi diperlukan koneksi internet dan akun Google.

Anda hanya perlu pergi ke aistudio.google.com dan pilih “Gemma 3” dari daftar model. Sejak saat itu, Anda dapat mulai mengobrol dengan model seolah-olah itu adalah versi lanjutan Bard atau ChatGPT, termasuk masukan gambar.

Instalasi cloud dengan NodeShift (opsional)

Bagi mereka yang mencari lebih banyak kekuatan atau untuk menerapkan model secara profesional, ada pilihan untuk menggunakan layanan cloud seperti NodeShift. Bersama mereka, Anda dapat menyewa mesin dengan GPU tangguh dan mengonfigurasi lingkungan ideal Anda untuk menjalankan Gemma 3 tanpa batasan.

Konten eksklusif - Klik Disini Bagaimana informasi di aplikasi MyPlate by Livestrong disinkronkan dengan perangkat lain?

Langkah-langkah dasar dalam NodeShift:

Buat akun di aplikasi.nodeshift.com.
Mulai Node GPU khusus (misalnya dengan 2x RTX 4090).
Pilih gambar yang telah dikonfigurasikan sebelumnya dengan Ubuntu + Nvidia CUDA atau Jupyter Notebook, tergantung apakah Anda akan menggunakan Ollama atau Transformers.
Hubungkan melalui SSH dan instal model dari baris perintah.

Jenis instalasi ini memberi Anda akses ke konfigurasi profesional, ideal untuk melatih model, mengevaluasi kinerja, dsb. Meskipun tidak penting bagi pengguna rumahan, ini berguna bagi mereka yang ingin bereksperimen secara mendalam atau membangun aplikasi pada LLM tingkat lanjut.

Persyaratan sistem dan rekomendasi teknis

Tidak semua model Gemma 3 akan berjalan di PC mana pun. Di bawah ini kami tinggalkan referensi umum menurut jenis model:

untuk model 1B hingga 7B: minimal 8 GB RAM. Mereka bekerja pada hampir semua PC modern, bahkan tanpa GPU.
untuk Model 13B: direkomendasikan RAM 16 GB hingga 24 GB.
untuk Model 27B: dibutuhkan minimal 32 GB RAM dan sebaiknya GPU khusus.

Memiliki RAM yang lebih besar mempercepat operasi dan mencegah kesalahan karena kekurangan memori. Sementara Ollama dan LM Studio mencoba menggunakan sumber daya secara efisien, hal itu akan sangat bergantung pada perangkat keras Anda. Selain itu, kecepatan respons meningkat secara signifikan jika GPU digunakan, bukan CPU.

Menginstal Gemma 3 di Windows 11 lebih mudah dari yang terlihat.. Tidak masalah jika Anda memutuskan menggunakan Ollama karena kesederhanaannya, LM Studio karena antarmuka grafisnya, atau Google AI Studio untuk bermain aman di cloud. Yang penting adalah bahwa setiap metode disesuaikan dengan tingkat pengalaman dan kemampuan teknis yang berbeda. Sekarang setelah Anda mengetahui semua pilihan dan apa yang Anda butuhkan untuk memulai, Anda dapat mulai bereksperimen dengan kecerdasan buatan lokal yang mengesankan ini hari ini.

Alberto navarro

Saya seorang penggila teknologi yang telah mengubah minat "geek"-nya menjadi sebuah profesi. Saya telah menghabiskan lebih dari 10 tahun hidup saya menggunakan teknologi mutakhir dan mengutak-atik semua jenis program hanya karena rasa ingin tahu. Sekarang saya memiliki spesialisasi dalam teknologi komputer dan video game. Hal ini karena selama lebih dari 5 tahun saya telah menulis untuk berbagai website tentang teknologi dan video game, membuat artikel yang berupaya memberikan informasi yang Anda butuhkan dalam bahasa yang dapat dimengerti oleh semua orang.

Jika Anda memiliki pertanyaan, pengetahuan saya berkisar dari segala sesuatu yang berhubungan dengan sistem operasi Windows serta Android untuk ponsel. Dan komitmen saya adalah kepada Anda, saya selalu bersedia meluangkan beberapa menit dan membantu Anda menyelesaikan pertanyaan apa pun yang mungkin Anda miliki di dunia internet ini.