Title | : | PENGEMBANGAN PART OF SPEECH TAGGER BAHASA INDONESIA DENGAN LSTM DAN FITUR MORFOLOGI |
Author | : | |
Date | : | 25 2019 |
Abstract | : | Part of speech (POS) memiliki peran penting dalam pemrosesan bahasa natural, karena mampu mengklasifikasikan kata sesuai fungsi dalam kalimat. Beberapa pendekatan dalam pembangunan POS Tagger dilakukan, baik dengan model probabilitas maupun neural network. Dalam beberapa penelitian, model long short term memory (LSTM) dengan representasi word embedding menghasilkan performa yang lebih baik dibandingkan model probabilitas. Sayangnya pemodelan dengan LSTM dan word embedding belum memanfaatkan fitur morfologis dari kata, padahal fitur morfologis kata mampu meningkatkan performa tagger. Penelitian yang dilakukan memanfaatkan fitur morfologis kata yang didapat dengan ekstraksi prefix dan suf ix dari kata, serta ada tidaknya kapitalisasi dalam kata tersebut. Fitur-fitur ini kemudian akan ditambahkan ke dalam vektor kata yang dibangun dengan word embedding. Vektor ini menjadi input dalam model yang akan dibangun dengan Bidirectional LSTM. Dengan ditambahkannya fitur morfologis kata, performa dari tagger meningkat sekitar 2%. Selain itu, pada penelitian ini juga disajikan analisis secara mendetail dari fitur morfologis yang berperan dalam meningkatnya performa dari tagger. |
Group of Knowledge | : | Ilmu Komputer |
Original Language | : | Bahasa Indonesia |
Level | : | Nasional |
Status | : |
No | Title | Action |
---|---|---|
1 |
LAPORAN PENELITIAN TIPE B 2019.pdf
Document Type : Laporan penelitian
|
View |