Abstract |
: |
Protein merupakan makromolekul yang tersusun dari rangkaian asam amino. Protein memiliki fungsi-fungsi yang penting bagi sel makhluk hidup, yaitu sebagai katalis pada metabolisme sel, berperan dalam replikasi DNA, memberi respons terhadap stimulus dari luar, dan mendukung struktur sel. Protein memiliki empat level struktur yaitu struktur primer, struktur sekunder, struktur tersier, dan struktur kuartener. Pengetahuan tentang struktur tiga dimensi (struktur tersier) suatu protein sangat berguna untuk memahami fungsi protein tersebut. Pengetahuan tentang struktur tiga dimensi protein memberi pemahaman tentang cara kerja protein tersebut. Lebih jauh, pengetahuan tentang struktur tiga dimensi suatu protein membuka jalan untuk mengontrol dan memodifikasi protein tersebut. Misalnya, dengan mengetahui struktur protein, mutasi dapat dilakukan pada posisi tertentu dengan maksud mengubah fungsi protein tersebut.
Prediksi struktur protein secara komputasi terbukti dapat memberi hasil lebih cepat dibandingkan dengan cara konvensional (observasi di laboratorium). Akan tetapi, prediksi struktur tiga dimensi protein termasuk pekerjaan yang kompleks dan tidak mudah dilakukan secara komputasi. Oleh karena itu, prediksi struktur protein secara komputasi dibagi ke dalam sub-sub masalah yang lebih kecil dan lebih sederhana untuk diselesaikan. Salah satu sub-masalah dalam prediksi struktur protein adalah prediksi struktur sekunder protein (PSSP) dengan input berupa sekuens asam amino. Secara teknis PSSP dilakukan dengan memetakan setiap asam amino input ke dalam salah satu tipe struktur sekunder, yaitu helix, coil, atau sheet.
Penelitian PSSP telah melewati tiga generasi yang berbeda. Pada generasi pertama, PSSP dilakukan dengan menggunakan statistical propensities asam amino untuk menentukan struktur sekunder protein. Pada generasi kedua, analisis statistika dilakukan pada sejumlah asam amino berdekatan (windowing) untuk menentukan struktur sekunder protein. Pada generasi ketiga, informasi evolusi protein dan metode Deep Learning digunakan. Pada generasi ketiga, akurasi PSSP meningkat hingga di atas 80%, sehingga Deep Learning menjadi metode utama pada penelitian PSSP sampai saat ini. Penelitian-penelitian PSSP terdahulu belum mampu mencapai theoretical limit akurasi PSSP (88-89%) sehingga masih terdapat gap pada capaian akurasi PSSP. Di samping itu, akurasi prediksi yang tinggi hanya dicapai oleh tipe helix, sedangkan akurasi prediksi tipe-tipe struktur sekunder yang lain masih rendah.
Penelitian ini bertujuan untuk membangun model PSSP dengan menambahkan mekanisme atensi pada arsitektur Deep Learning yang digunakan. Selain penambahan mekanisme atensi, penelitian ini juga melakukan modifikasi mekanisme atensi global dan mekanisme atensi lokal. Penambahan mekanisme atensi diharapkan dapat meningkatkan akurasi prediksi PSSP secara umum, dan meningkatkan akurasi prediksi tipe-tipe struktur sekunder tertentu yang masih rendah.
Langkah-langkah yang akan dilakukan dalam penelitian ini mencakup studi literatur, pengumpulan dataset, pemilihan model baseline, ekstraksi fitur, pengembangan model, serta evaluasi model. Output dari penelitian ini setiap tahun adalah publikasi satu artikel jurnal internasional bereputasi. Hasil Penelitian ini termasuk ke dalam TKT level 2. |