tes turing dan ai 10 17

Pexels/Google Deepmind, CC BY-SA

Pada tahun 1950, ilmuwan komputer Inggris Alan Turing mengusulkan metode eksperimental untuk menjawab pertanyaan: dapatkah mesin berpikir? Dia menyarankan jika manusia tidak dapat mengetahui apakah mereka sedang berbicara dengan mesin dengan kecerdasan buatan (AI) atau manusia lain setelah lima menit ditanyai, ini akan menunjukkan bahwa AI memiliki kecerdasan seperti manusia.

Meskipun sistem AI masih jauh dari lulus uji Turing selama masa hidupnya, dia berspekulasi akan hal itu

“[…] dalam waktu sekitar lima puluh tahun, akan dimungkinkan untuk memprogram komputer […] untuk membuat mereka memainkan permainan tiruan dengan sangat baik sehingga rata-rata interogator tidak akan memiliki lebih dari 70% peluang untuk membuat identifikasi yang benar setelah lima menit. mempertanyakan.

Saat ini, lebih dari 70 tahun setelah proposal Turing, tidak ada AI yang berhasil lulus ujian dengan memenuhi persyaratan spesifik yang ia uraikan. Meskipun demikian, sebagai beberapa berita utama mencerminkan, beberapa sistem sudah cukup dekat.

Salah satu eksperimen baru-baru ini menguji tiga model bahasa besar, termasuk GPT-4 (teknologi AI di balik ChatGPT). Para peserta menghabiskan dua menit mengobrol dengan orang lain atau sistem AI. AI diminta untuk membuat kesalahan ejaan kecil – dan berhenti jika penguji menjadi terlalu agresif.


grafis berlangganan batin


Dengan dorongan ini, AI berhasil mengelabui para penguji. Saat dipasangkan dengan bot AI, penguji hanya dapat menebak dengan tepat apakah mereka berbicara dengan sistem AI sebanyak 60%.

Mengingat kemajuan pesat yang dicapai dalam desain sistem pemrosesan bahasa alami, kita mungkin melihat AI lulus ujian awal Turing dalam beberapa tahun mendatang.

Namun apakah meniru manusia benar-benar merupakan tes kecerdasan yang efektif? Dan jika tidak, tolok ukur alternatif apa yang dapat kita gunakan untuk mengukur kemampuan AI?

Keterbatasan tes Turing

Sementara sistem yang lulus uji Turing memberi kita beberapa Buktinya ia cerdas, tes ini bukanlah tes kecerdasan yang menentukan. Salah satu masalahnya adalah hal ini dapat menghasilkan "negatif palsu".

Model bahasa besar saat ini sering kali dirancang untuk segera menyatakan bahwa mereka bukan manusia. Misalnya, saat Anda mengajukan pertanyaan kepada ChatGPT, jawabannya sering kali diawali dengan frasa “sebagai model bahasa AI”. Sekalipun sistem AI memiliki kemampuan mendasar untuk lulus uji Turing, pemrograman semacam ini akan mengesampingkan kemampuan tersebut.

Tes ini juga berisiko menimbulkan “positif palsu” tertentu. Sebagai filsuf Ned Block menunjukkan dalam sebuah artikel tahun 1981, sebuah sistem dapat lulus uji Turing hanya dengan melakukan hard-code dengan respons mirip manusia terhadap setiap masukan yang mungkin.

Selain itu, tes Turing berfokus pada kognisi manusia pada khususnya. Jika kognisi AI berbeda dari kognisi manusia, seorang interogator ahli akan dapat menemukan beberapa tugas yang kinerja AI dan manusianya berbeda.

Mengenai masalah ini, Turing menulis:

Keberatan ini sangat kuat, namun setidaknya kita dapat mengatakan bahwa jika, bagaimanapun, sebuah mesin dapat dibuat untuk memainkan permainan tiruan tersebut dengan memuaskan, kita tidak perlu merasa terganggu dengan keberatan ini.

Dengan kata lain, meskipun lulus uji Turing merupakan bukti baik bahwa suatu sistem cerdas, namun kegagalan dalam uji Turing bukanlah bukti baik bahwa suatu sistem cerdas tidak cerdas.

Selain itu, tes ini bukanlah ukuran yang baik untuk mengetahui apakah AI sadar, apakah mereka dapat merasakan kesakitan dan kesenangan, atau apakah mereka memiliki makna moral. Menurut banyak ilmuwan kognitif, kesadaran melibatkan sekelompok kemampuan mental tertentu, termasuk memiliki memori yang bekerja, pemikiran tingkat tinggi, dan kemampuan untuk memahami lingkungan dan memodelkan bagaimana tubuh bergerak di sekitarnya.

Tes Turing tidak menjawab pertanyaan apakah sistem AI atau tidak memiliki kemampuan ini.

Kemampuan AI yang semakin berkembang

Tes Turing didasarkan pada logika tertentu. Artinya: manusia itu cerdas, jadi apa pun yang dapat meniru manusia secara efektif kemungkinan besar adalah cerdas.

Namun gagasan ini tidak memberi tahu kita apa pun tentang hakikat kecerdasan. Cara lain untuk mengukur kecerdasan AI adalah dengan berpikir lebih kritis tentang apa itu kecerdasan.

Saat ini tidak ada tes tunggal yang dapat mengukur kecerdasan buatan atau kecerdasan manusia secara resmi.

Pada tingkat yang paling luas, kita dapat menganggap kecerdasan sebagai kemampuan untuk mencapai berbagai tujuan dalam lingkungan yang berbeda. Sistem yang lebih cerdas adalah sistem yang dapat mencapai tujuan yang lebih luas dalam lingkungan yang lebih luas.

Oleh karena itu, cara terbaik untuk melacak kemajuan dalam desain sistem AI untuk tujuan umum adalah dengan menilai kinerjanya dalam berbagai tugas. Peneliti pembelajaran mesin telah mengembangkan serangkaian tolok ukur yang dapat melakukan hal ini.

Misalnya, GPT-4 dulu mampu menjawab dengan benar 86% pertanyaan dalam pemahaman bahasa multitask yang masif – sebuah tolok ukur yang mengukur kinerja pada tes pilihan ganda di berbagai mata pelajaran akademik tingkat perguruan tinggi.

Itu juga mendapat skor positif AgenBench, alat yang dapat mengukur kemampuan model bahasa besar untuk berperilaku sebagai agen, misalnya dengan menjelajahi web, membeli produk secara online, dan berkompetisi dalam game.

Apakah tes Turing masih relevan?

Tes Turing adalah ukuran peniruan – kemampuan AI untuk mensimulasikan perilaku manusia. Model bahasa besar adalah peniru ahli, yang kini tercermin dalam potensi mereka untuk lulus tes Turing. Namun kecerdasan tidak sama dengan imitasi.

Ada banyak jenis kecerdasan seiring dengan banyaknya tujuan yang ingin dicapai. Cara terbaik untuk memahami kecerdasan AI adalah dengan memantau kemajuannya dalam mengembangkan berbagai kemampuan penting.

Pada saat yang sama, penting bagi kita untuk tidak terus-menerus “mengubah tujuan” ketika dihadapkan pada pertanyaan apakah AI itu cerdas. Karena kemampuan AI meningkat pesat, para pengkritik gagasan kecerdasan AI terus-menerus menemukan tugas-tugas baru yang mungkin sulit diselesaikan oleh sistem AI – namun ternyata mereka telah melampaui batasnya. satu lagi rintangan.

Dalam situasi ini, pertanyaan yang relevan bukanlah apakah sistem AI itu cerdas – namun lebih tepatnya, apa jenis kecerdasan yang mungkin mereka miliki.Percakapan

Simon Goldstein, Profesor Madya, Institut Filsafat Dianoia, Universitas Katolik Australia, Universitas Katolik Australia dan Cameron Domenico Kirk-Giannini, Asisten Profesor bidang Filsafat, Rutgers University

Artikel ini diterbitkan kembali dari Percakapan di bawah lisensi Creative Commons. Membaca Artikel asli.