GPT-4.5 lulus Ujian Turing dengan cemerlang: Apakah maksud pencapaian ini untuk evolusi kecerdasan buatan?

Kemaskini terakhir: 07/04/2025

  • GPT-4.5 berjaya meyakinkan 73% peserta bahawa ia adalah manusia dalam ujian Turing yang disemak semula.
  • Eksperimen itu mendedahkan bahawa kejayaan AI bergantung pada arahan dan penggunaan "personaliti."
  • Model lain seperti LLaMa-3.1 mempunyai kadar kejayaan yang lebih rendah, dan tanpa pemperibadian, keputusan menjunam dengan ketara.
  • Kajian itu menimbulkan persoalan tentang had semasa kecerdasan buatan dan risiko yang berkaitan dengan realisme perbualan yang semakin meningkat.
GPT-4.5 lulus ujian Turing-0

Adakah anda dapat membezakan antara perbualan dengan manusia sebenar dan mesin? Soalan itu, yang pertama kali dikemukakan lebih tujuh dekad lalu oleh Alan Turing, telah mendapat daya tarikan baharu berikutan percubaan baru-baru ini yang menguji model kecerdasan buatan paling maju dalam konteks yang mencabar.

Penyelidik di Universiti California, San Diego telah menjalankan a Kajian yang mencabar keupayaan kita untuk membezakan antara manusia dan buatan.l. Di tengah-tengah eksperimen, model GPT-4.5 OpenAI bukan sahaja berjaya lulus Ujian Turing dalam keadaan tertentu, tetapi Dia juga dikenal pasti sebagai manusia lebih kerap daripada orang sebenar sendiri.

Eksperimen dalam keadaan yang ketat

Temu bual AI Semasa Ujian Turing

Kajian yang diketuai oleh penyelidik Cameron Jones dan Benjamin Bergen, memfokuskan pada versi diubah suai bagi Ujian Turing klasik, di mana lebih 300 orang mengambil bahagian, termasuk pelajar universiti dan pengguna platform dalam talian. Semasa sesi lima minit, setiap peserta secara serentak mengadakan dua perbualan: satu dengan manusia dan satu dengan sistem kecerdasan buatan. Pada akhirnya, Mereka terpaksa menilai siapa di antara orang yang bercakap itu adalah manusia.

Kandungan eksklusif - Klik Di Sini  Harga iPhone boleh melambung tinggi disebabkan gelombang baru tarif ke atas pengeluaran Asia.

Hasilnya sangat menarik: Model GPT-4.5 dianggap sebagai manusia dalam 73% kes apabila dia diberi personaliti yang jelas—sebagai contoh, seorang anak muda yang mempunyai pengetahuan tentang budaya digital. Peratusan ini melebihi ambang statistik untuk mempertimbangkan ujian lulus, tetapi juga keupayaan manusia sebenar untuk muncul sebagai manusia dalam eksperimen ini. Pendekatan ini mengukuhkan idea bagaimana la kecerdasan buatan telah berkembang dalam beberapa dekad kebelakangan ini.

Walau bagaimanapun, apabila AI tidak diberi personaliti tertentu dan hanya diminta untuk kelihatan seperti manusia tanpa didorong lebih lanjut, keberkesanannya menjunam kepada 36%. Ini menggariskan Kepentingan konteks dan pemperibadian dalam gesaan diberikan kepada model bahasa.

Perbandingan antara model dan hasil yang tidak dijangka

Pelbagai model AI dalam ujian

Bersama-sama dengan GPT-4.5, eksperimen itu termasuk model lain seperti LLaMa-3.1-405B daripada Meta, yang mencapai kadar ketepatan 56% apabila turut disediakan dengan personaliti rekaan. Walaupun angka ini lebih rendah daripada GPT-4.5, ia masih di atas peluang. Sebaliknya, versi lain seperti GPT-4o atau chatbot veteran ELIZA, dari tahun 60-an, masing-masing tidak melebihi 21% dan 23%, menjelaskan jurang antara teknologi semasa dan primitif.

Keputusan ini menunjukkan bahawa kejayaan AI dalam tugas seperti Ujian Turing lebih bergantung pada cara ia diarahkan berbanding model itu sendiri. Kuncinya adalah untuk menggunakan peranan yang boleh dipercayai, bukan untuk meniru kecerdasan manusia secara sedar. Jika anda ingin menyelidiki lebih mendalam tentang bagaimana komputer Lama kelamaan, anda akan mendapat maklumat yang menarik.

Kandungan eksklusif - Klik Di Sini  Cara Semak Mata Dgt

Tambahan pula, didapati bahawa walaupun dengan arahan yang canggih, sesetengah model tidak dapat mengekalkan perbualan yang cukup meyakinkan. GPT-4o mengaku sebagai AI dengan sedikit cabaran., yang dengan cepat kehilangan kredibiliti di kalangan rakan bicara manusia.

Untuk menipu atau berfikir? Kontroversi Ujian Turing

Perbincangan tentang kognisi dalam AI

Lulus Ujian Turing tidak membayangkan bahawa AI memahami apa yang anda katakan atau menyedari kata-kata anda. Di sini terletak salah satu perbincangan hebat di kalangan pakar. Walaupun sesetengah meraikan pencapaian ini sebagai kemajuan yang ketara dalam simulasi tingkah laku manusia, yang lain menganggapnya Ujian jenis ini tidak lagi boleh dipercayai untuk mengukur "kecerdasan sebenar" sistem buatan..

Pakar seperti François Chollet, seorang jurutera Google, telah menegaskan bahawa Ujian Turing adalah lebih kepada percubaan falsafah daripada ukuran yang berguna pada masa ini.. Menurut pandangan ini, hanya kerana AI menipu kita tidak bermakna ia memberi alasan atau mempunyai pemahaman yang mendalam tentang dunia. Sebaliknya, ia memanfaatkan corak yang dipelajari daripada berjuta-juta teks untuk membina jawapan yang munasabah. Untuk lebih memahami bidang ini, anda boleh menyemak siapa itu pengasas AI.

Oleh itu, perkara yang membimbangkan bukanlah apa yang AI boleh lakukan, tetapi apa yang kami fikir mereka lakukan. Kecenderungan manusia untuk antropomorfosis sistem perbualan, seperti yang berlaku dengan ELIZA pada tahun 60-an, nampaknya tidak hilang dari semasa ke semasa. Hari ini, fenomena itu diperbesarkan dengan model yang lebih canggih.

Aplikasi dan risiko AI yang kedengaran terlalu manusiawi

Hakikat bahawa AI boleh lulus untuk manusia dalam perbualan pendek memberikan peluang, tetapi juga menimbulkan risiko yang ketara dari segi keselamatan, pendidikan dan perhubungan sosial.

  • Penipuan identiti: AI yang meyakinkan boleh digunakan dalam kempen penipuan atau kejuruteraan sosial.
  • Maklumat salah: Model yang mampu menjana ucapan manusia boleh menjadi alat yang berkesan untuk memanipulasi atau menyebarkan berita palsu.
  • Automasi buruh: Sektor seperti perkhidmatan pelanggan atau sokongan teknikal boleh digantikan oleh AI perbualan ini, yang menjejaskan pekerjaan manusia.
  • Pendidikan dan penilaian: Mengesan sama ada teks ditulis oleh seseorang atau AI menjadi tugas yang rumit, dengan akibat dalam bidang akademik.
Kandungan eksklusif - Klik Di Sini  Ketegangan meningkat antara OpenAI dan Microsoft: pertikaian, tuduhan dan masa depan kecerdasan buatan

Penyelidik juga telah memberi amaran tentang bagaimana Penyeragaman teknologi ini mungkin menyukarkan pengesanannya. pada masa hadapan. Apabila kita semakin terbiasa berinteraksi dengan sistem automatik, kita mungkin tidak berjaga-jaga, menjadikannya lebih mudah untuk model ini menjadi tidak dapat dibezakan daripada lawan bicara manusia tanpa kita sedari.

Satu lagi kebimbangan yang berulang ialah etika pelaksanaannya. Sejauh manakah AI harus berpura-pura menjadi manusia tanpa mendedahkan sifat buatannya? Sekiranya terdapat had yang jelas tentang bagaimana dan bila ia boleh digunakan dalam konteks kehidupan sebenar?

GPT-4.5 tidak menunjukkan bahawa mesin beralasan seperti kami, tetapi ia telah menjelaskan bahawa mereka boleh meniru kita dengan cara yang menyukarkan untuk membezakan mereka. Pencapaian ini menandakan titik perubahan, bukan kerana mesin itu, tetapi kerana perkara yang membuatkan kita mempersoalkan: idea kita sendiri tentang maksud "menjadi manusia" dalam era digital di mana tiruan bergabung dengan yang sebenar.