Bagaimana Komputer Membantu Ahli Biologi Mengobati Rahasia Hidup

Begitu genom manusia tiga miliar huruf itu diurutkan, kami bergegas memasuki "Omics"Era penelitian biologi. Para ilmuwan sekarang berlomba untuk mengurutkan genom (semua gen) atau proteomes (semua protein) dari berbagai organisme - dan dalam prosesnya mengumpulkan sejumlah besar data.

Misalnya, seorang ilmuwan dapat menggunakan alat "omics" seperti sekuensing DNA untuk menggoda gen manusia mana yang terkena infeksi virus flu. Tapi karena genom manusia setidaknya memiliki gen 25,000, jumlah gen yang diubah bahkan dalam skenario sederhana seperti itu berpotensi terjadi dalam ribuan.

Meskipun sequencing dan identifikasi gen dan protein memberi mereka nama dan tempat, namun tidak memberi tahu kami apa yang mereka lakukan. Kita perlu memahami bagaimana gen, protein dan protein ini semua hal di antaranya berinteraksi dalam proses biologis yang berbeda.

Saat ini, eksperimen dasar pun menghasilkan data yang besar, dan salah satu tantangan terbesar adalah menguraikan hasil yang relevan dari kebisingan latar belakang. Komputer membantu kita mengatasi gunung data ini; tetapi mereka bahkan bisa melangkah lebih jauh dari itu, membantu kita mengemukakan hipotesis ilmiah dan menjelaskan proses biologis baru. Ilmu data, pada dasarnya, memungkinkan penelitian biologi mutakhir.

Komputer Untuk Penyelamatan

Komputer secara unik memenuhi syarat untuk menangani kumpulan data masif karena mereka dapat secara bersamaan mencatat semua kondisi penting yang diperlukan untuk analisis.


grafis berlangganan batin


Padahal mereka bisa mencerminkan kesalahan manusia Mereka diprogram dengan, komputer dapat menangani sejumlah besar data secara efisien dan tidak bias terhadap familiar, seperti yang mungkin dilakukan oleh penyelidik manusia.

Komputer juga dapat diajarkan untuk mencari pola spesifik dalam kumpulan data eksperimental - sebuah konsep yang disebut pembelajaran mesin, yang pertama kali diusulkan di 1950, terutama oleh matematikawan. Alan Turing. Algoritma yang telah mempelajari pola dari kumpulan data kemudian dapat diminta untuk membuat prediksi berdasarkan data baru yang tidak pernah ditemukan sebelumnya.

Pembelajaran mesin telah merevolusi penelitian biologi karena sekarang kita dapat memanfaatkan kumpulan data yang besar dan meminta komputer untuk membantu memahami biologi yang mendasarinya.

Pelatihan Komputer Untuk Berpikir Dengan Mensimulasikan Proses Otak

Kami telah menggunakan satu jenis pembelajaran mesin yang menarik, yang disebut jaringan syaraf tiruan (JST), di lab kami sendiri. Otak adalah jaringan neuron yang sangat saling berhubungan, yang berkomunikasi dengan mengirimkan pulsa listrik melalui kabel saraf. Demikian pula, JST mensimulasikan di komputer jaringan neuron saat mereka menyalakan dan mematikan sebagai respons terhadap sinyal neuron lainnya.

Dengan menerapkan algoritma yang meniru proses neuron nyata, kita bisa membuat jaringan belajar memecahkan banyak jenis masalah. Google menggunakan JST yang kuat untuk yang sekarang terkenal Proyek Deep Dream dimana komputer bisa mengklasifikasikan dan bahkan membuat gambar.

Kelompok kami mempelajari sistem kekebalan tubuh, dengan tujuan mencari tahu terapi baru untuk kanker. Kami telah menggunakan model komputasi ANN untuk mempelajari kode protein permukaan pendek yang digunakan sel kekebalan tubuh kami untuk menentukan apakah ada sesuatu yang asing bagi tubuh kita dan karenanya harus diserang. Jika kita mengerti lebih banyak tentang bagaimana sel kekebalan kita (seperti sel T) membedakan antara sel normal / diri dan abnormal / asing, kita dapat merancang vaksin dan terapi yang lebih baik.

Kami menjelajahi katalog yang tersedia untuk umum dari ribuan kode protein yang diidentifikasi oleh periset selama bertahun-tahun. Kami membagi kumpulan data besar ini menjadi dua: kode protein mandiri normal yang berasal dari sel manusia sehat, dan kode protein abnormal yang berasal dari virus, tumor dan bakteri. Kemudian kami beralih ke jaringan syaraf tiruan yang dikembangkan di lab kami.

Begitu kita memberi kode protein ke dalam JST, algoritma tersebut dapat mengidentifikasi perbedaan mendasar antara kode protein normal dan abnormal. Akan sulit bagi orang untuk melacak fenomena biologis semacam ini - ada ribuan kode protein ini untuk dianalisis dalam kumpulan data yang besar. Dibutuhkan mesin untuk mengatasi masalah kompleks ini dan menentukan biologi baru.

Prediksi Melalui Mesin Belajar

Aplikasi terpenting dalam pembelajaran mesin dalam biologi adalah kegunaannya dalam membuat prediksi berdasarkan data besar. Prediksi berbasis komputer dapat memahami data yang besar, menguji hipotesis dan menghemat waktu dan sumber daya yang berharga.

Misalnya, di bidang biologi sel-T kami, mengetahui kode protein virus mana yang menjadi sasaran sangat penting dalam mengembangkan vaksin dan perawatan. Tapi ada begitu banyak kode protein individu dari virus tertentu yang sangat mahal dan sulit untuk diuji secara eksperimen masing-masing.

Sebagai gantinya, kami melatih jaringan syaraf tiruan untuk membantu mesin mempelajari semua karakteristik biokimia penting dari dua jenis kode protein - normal versus abnormal. Kemudian kami meminta model untuk "memprediksi" kode protein virus yang baru yang menyerupai kategori "abnormal" dan dapat dilihat oleh sel T dan dengan demikian, sistem kekebalan tubuh. Kami menguji model ANN pada protein virus yang berbeda yang belum pernah dipelajari sebelumnya.

Benar saja, seperti seorang siswa yang rajin yang ingin menyenangkan gurunya, jaringan saraf dapat secara akurat mengidentifikasi sebagian besar kode protein pengaktifan sel T dalam virus ini. Kami juga menguji secara eksperimental kode protein yang ditandai untuk memvalidasi keakuratan prediksi ANN. Dengan menggunakan model jaringan syaraf tiruan ini, ilmuwan bisa demikian cepat memprediksi semua kode protein pendek penting dari virus berbahaya dan mengujinya untuk mengembangkan pengobatan atau vaksin, alih-alih menebak dan mengujinya secara terpisah.

Menerapkan Mesin Belajar dengan Bijak

Berkat penyempurnaan konstan, ilmu pengetahuan dan pembelajaran mesin yang besar semakin menjadi sangat diperlukan untuk berbagai jenis penelitian ilmiah. Kemungkinan penggunaan komputer untuk melatih dan memprediksi dalam biologi hampir tidak ada habisnya. Dari mencari tahu kombinasi mana dari biomarker yang terbaik untuk mendeteksi suatu penyakit untuk memahami mengapa saja beberapa pasien mendapat manfaat dari pengobatan kanker tertentu, data mining set besar menggunakan komputer telah menjadi rute penelitian yang berharga.

Tentu saja ada keterbatasan. Masalah terbesar dengan ilmu data besar adalah data dirinya sendiri. Jika data yang diperoleh oleh -omics studi salah untuk memulai dengan, atau berdasarkan sains yang buruk, mesin akan dilatih pada data yang buruk - yang mengarah ke prediksi buruk. Muridnya hanya sebagus gurunya.

Karena komputer tidak memiliki perasaan (namun), Mereka dapat dalam pencarian mereka untuk pola datang dengan mereka bahkan ketika tidak ada, menimbulkan lagi, untuk data yang buruk dan ilmu yang tidak dapat diuraikan.

Dan beberapa peneliti telah mengemukakan kekhawatiran tentang komputer kotak data hitam Bagi ilmuwan yang tidak mengerti dengan jelas manipulasi dan intrik yang mereka lakukan atas nama mereka.

Terlepas dari masalah ini, manfaat data dan mesin yang besar akan terus menjadikannya mitra berharga dalam penelitian ilmiah. Dengan peringatan, kita secara unik siap untuk memahami biologi melalui mata sebuah mesin.

Tentang PenulisPercakapan

Sri Krishna, Kandidat PhD, Desain Biologis, Fakultas Teknik Sistem Biologi dan Kesehatan, Arizona State University dan Diego Chowell, Mahasiswa PhD dalam Matematika Terapan, Arizona State University

Artikel ini awalnya diterbitkan pada Percakapan. Membaca Artikel asli.


Buku terkait:

at Pasar InnerSelf dan Amazon