Anotasi Semantik Untuk Pembangunan Korpus Sistem Tanya Jawab Non-Factoid
DOI:
https://doi.org/10.26418/jlk.v4i1.44Keywords:
korpus, anotasi semnatik, non-factoid, sistem tanya jawab, expected answer typeAbstract
Pembangunan korpus untuk sistem tanya jawab dengan memberi informasi linguistik memiliki hasil yang lebih baik dari sistem tanya jawab yang tidak diberi informasi linguistik. Informasi linguistik yang digunakan adalah dengan metode anotasi semnatik. Anotasi merupakan metodelogi untuk menambahkan informasi ke dokumen pada tingkat tertentu sedangkan semantik anotasi adalah proses melampirkan tag metadata atau kelas ontologi ke segmen teks, sebagai alat untuk mengambil suatu pengetahuan. Dokumen yang diambil untuk membangun korpus adalah surah terjemahan Al baqarah yang memiliki 286 ayat, dan yang mendukung hanya 14 ayat karena ada beberapa ayat yang tidak mengandung pola yang sesuai sehingga tidak dapat digunakan. Korpus dipecah menjadi 286 file dalam bentuk .txt. Uji coba sistem dilakukan menggunakan bahasa perl dengan membuat sistem tanya jawab sederhana. Sistem tanya jawab merupakan sistem penelusuran informasi yang mengizinkan para user untuk memasukkan pertanyaan dalam bahasa alami
References
[2] A. Purwarianti and N. Yusliani, “Sistem Question Answering Bahasa Indonesia untuk Pertanyaan Non-Factoid,” J. Ilmu Komput. dan Inf., vol. 4, no. 1, pp. 10–14, 2012
[3] Z. Naf’an and R. H. Gusmita, “Development of an Indonesian Question Answering System about Khulafaur Rasyidin’s History,” in Proceedings of The 1st International Conference on Cyber & IT Service Management in Conjunction with the ITIL v. 3 Workshop, Training and Certification., 2012.
[4] Lestari, T.H., “Pengembangan Sistem Tanya Jawab Tentang Khulafaur Rasyidin”, UIN Syarif Hdayatullah Jakarta (Unublish), 2014.
[5] Nadisah H.A., 2015. “Pengembangan Sistem Tanya Jawab Untuk Pertanyaan Factoid dan Non-Factoid (Kasus: Sejarah Khulafaur Rasyidin)”, UIN Syarif Hidayatullah Jakarta, (Unpublish), 2015.
[6] Sukmana, Husni Teja, Ria Hari Gusminta, Yusuf Durachman, and Asep Fajar Firmansyah. "Semantically annotated corpus model of Indonesian Translation of Quran: An effort in increasing question answering system performance." In 2016 4th International Conference on Cyber and IT Service Management, pp. 1-5. IEEE, 2016.