Pencarian Kesamaan Redaksional pada Terjemahan Al-Quran Bahasa Indonesia Menggunakan Metode Rule-based Chunking

  • Alfredo Primadita Universitas Telkom
  • Moch Arif Bijaksana Jurusan Teknik Informatika, Fakultas Informatika, Universitas Telkom
  • Eko Darwiyanto Jurusan Teknik Informatika, Fakultas Informatika, Universitas Telkom

Abstract

Al-Quran merupakan kitab suci yang menjadi panutan dan rujukan seluruh umat Muslim di dunia. AlQuran terdiri dari 114 surat, 6236 ayat, dan 77845 kata. Dikarenakan Al-Quran memiliki banyak informasi di dalamnya, salah satu upaya untuk mempermudah pembaca dalam mempelajari dan menyaring informasi dari Al-Quran adalah dengan membuat parafrasa yang singkat dengan mempergunakan sistem Rule-based Chunking. Rule-based Chunking dapat mempersingkat suatu kalimat dengan mengelompokan kata-kata yang dianggap penting berdasarkan aturan tata bahasa. Sistem memiliki input berupa ayat-ayat Al-Quran terjemahan bahasa Indonesia yang sudah dicari Longest Common Substring dan Longest Common Subsequence dengan output berupa himpunan parafrasa. Dari 2341 teks berulang yang didapatkan pada penelitian sebelumnya, telah diperoleh 1261 chunk. Setelah melakukan evaluasi pada sistem, akurasi yang didapatkan adalah 91%, dengan precision 63,5% dan recall 74,4%.

References

[1] N. Baidan, Metode penafsiran al-Qur’an: kajian kritis terhadap ayat-ayat yang beredaksi mirip. Pustaka pelajar, 2011.
[2] C. Grover and R. Tobin, “Rule-based chunking and reusability.” in LREC, 2006, pp. 873–878.
[3] D. Oktaviani, M. A. Bijaksana, and I. Asror, “Building a database of recurring text in the Quran and its translation,” Procedia Computer Science, vol. 157, pp. 125–133, 2019.
[4] M. A. Rasyid, M. A. Bijaksana, and I. Asror, “Building of similar common subsequence text corpus of quran,” IND. Journal On Computing, 2019.
[5] S. Saritha and R. Pateriya, “Rule-based shallow parsing to identify comparative sentences from text documents,” in Emerging ResearchinComputing,Information,CommunicationandApplications. Springer, 2016, pp. 355–365.
[6] N. Khoufi, C. Aloulou, and L. H. Belguith, “Chunking arabic texts using conditional random fields,” in 2014 IEEE/ACS 11th International Conference on Computer Systems and Applications (AICCSA). IEEE, 2014, pp. 428–432.
[7] I. Ariaratnam, A. Weerasinghe, and C. Liyanage, “A shallow parser for tamil,” in 2014 14th International Conference on Advances in ICT for Emerging Regions (ICTer). IEEE, 2014, pp. 197–203.
[8] A.Dinakaramani,F.Rashel,A.Luthfi,andR.Manurung,“Designing an Indonesian part of speech tagset and manually tagged indonesian corpus,” in 2014 International Conference on Asian Language Processing (IALP). IEEE, 2014, pp. 66–69.
Published
2020-03-26
How to Cite
PRIMADITA, Alfredo; BIJAKSANA, Moch Arif; DARWIYANTO, Eko. Pencarian Kesamaan Redaksional pada Terjemahan Al-Quran Bahasa Indonesia Menggunakan Metode Rule-based Chunking. Jurnal Linguistik Komputasional, [S.l.], v. 3, n. 1, p. 7 - 11, mar. 2020. ISSN 2621-9336. Available at: <http://inacl.id/journal/index.php/jlk/article/view/32>. Date accessed: 10 aug. 2020. doi: https://doi.org/10.26418/jlk.v3i1.32.
Section
Articles