ACADSTAFF UGM

CREATION
Title : PENGEMBANGAN PART OF SPEECH TAGGER BAHASA INDONESIA DENGAN LSTM DAN FITUR MORFOLOGI
Author :
Date : 25 2019
Abstract : Part of speech (POS) memiliki peran penting dalam pemrosesan bahasa natural, karena mampu mengklasifikasikan kata sesuai fungsi dalam kalimat. Beberapa pendekatan dalam pembangunan POS Tagger dilakukan, baik dengan model probabilitas maupun neural network. Dalam beberapa penelitian, model long short term memory (LSTM) dengan representasi word embedding menghasilkan performa yang lebih baik dibandingkan model probabilitas. Sayangnya pemodelan dengan LSTM dan word embedding belum memanfaatkan fitur morfologis dari kata, padahal fitur morfologis kata mampu meningkatkan performa tagger. Penelitian yang dilakukan memanfaatkan fitur morfologis kata yang didapat dengan ekstraksi prefix dan suf ix dari kata, serta ada tidaknya kapitalisasi dalam kata tersebut. Fitur-fitur ini kemudian akan ditambahkan ke dalam vektor kata yang dibangun dengan word embedding. Vektor ini menjadi input dalam model yang akan dibangun dengan Bidirectional LSTM. Dengan ditambahkannya fitur morfologis kata, performa dari tagger meningkat sekitar 2%. Selain itu, pada penelitian ini juga disajikan analisis secara mendetail dari fitur morfologis yang berperan dalam meningkatnya performa dari tagger.
Group of Knowledge : Ilmu Komputer
Original Language : Bahasa Indonesia
Level : Nasional
Status :
Document
No Title Document Type Action
1 LAPORAN PENELITIAN TIPE B 2019.pdf
Document Type : Laporan penelitian
Laporan penelitian View