Shared Tasks INACL 2020

Direncanakan merupakan acara tahunan yang berkelanjutan. Mengikuti kalender akademik perguruan tinggi, dimana semester satu sekitar September s/d Januari, semester dua sekitar Januari s/d Agustus. 

Peserta : Peserta umum

Jadwal  : Januari – Agustus 2020 

Task 1. Deteksi parafrase untuk kalimat sitasi dari makalah berbahasa Inggris (koordinator: Ridwan Ilyas)

Deteksi parafrasa adalah tugas untuk menentukan label parafrasa pada pasangan kalimat. Diberikan dua pasang kalimat sebagai input, sistem akan menentukan pasangan tersebut parafrasa atau tidak. Proses pendeteksian parafrasa dapat dilakukan dengan pendekatan supervised atau unsupervised.

Task 2. Deteksi hoaks dari artikel berita berbahasa Indonesia (koordinator: Dr. Ayu Purwarianti)

Dalam shared-task ini, peserta akan diberikan kumpulan berita berbahasa Indonesia, dan menentukan apakah sebuah berita termasuk kategori hoaks atau bukan. Peserta perlu mengembangkan metode dengan pendekatan yang sesuai sehingga pendeteksian hoaks dapat dilakukan secara efektif.

Task 3. Penemuan jawaban dari artikel berbahasa Indonesia (koordinator: Dr. Hapnes Toba)

Dalam shared-task ini, peserta diminta untuk menemukan jawaban akhir terhadap pertanyaan-pertanyaan bertipe faktoid dalam bahasa Indonesia. Peserta akan diberikan pertanyaan, dan merancang mekanisme untuk menemukan jawaban akhir dengan memanfaatkan sekumpulan paragraf (passages) yang akan diberikan sebagai sumber informasi. Pertanyaan berupa fakta-fakta seputar: orang, lokasi, waktu, ataupun organisasi. Melalui perancangan algoritma yang tepat, maka fakta-fakta tersebut dapat ditemukan dari sekumpulan teks yang mengandung jawaban yang seharusnya.

Task 4. Deteksi bahasa kasar untuk korpus Bahasa Indonesia (koordinator: Dr. Ade Ramadhani)

Saat ini, partisipasi masyarakat dalam memberikan komentar di media daring sangat tinggi, terutama pada topik-topik penting dan menarik. Akan tetapi, komentar sering kali disampaikan dalam bahasa yang kasar,dan menyerang pihak lain. Penggunaan bahasa kasar memiliki efek negatif berupa memicu pertikaian yang dapat berlangsung nyata (tidak hanya terbatas di dunia maya). Beberapa penyedia layanan media sosial sudah melakukan penelitian untuk membatasi komentar dengan bahasa kasar, akan tetapi di media daring upaya tersebut masih memiliki keterbatasan. Oleh karena itu keberadaan sebuah sistem untuk dapat mendeteksi bahasa kasar di kolom komentar menjadi sangat penting.

Task 5. Large Vocabulary Continuous Speech Recognition (LVCSR) berbahasa Indonesia untuk diktasi (koordinator: Dr. Dessi Puji Lestari)

Dalam shared-task ini, peserta perlu mengembangkan metode untuk mengenali suara dan merangkai kata dari suara yang berhasil dikenali dalam sebuah sistem diktasi.

Task 6. Mesin penerjemah bahasa-bahasa daerah dengan Bahasa Indonesia (koordinator: Dr. Herry Sujaini & Dr. Arie Ardiyanti)

Penerjemahan bahasa daerah dengan bahasa Indonesia merupakan kasus penerjemahan dengan sumber terbatas karena sedikit atau bahkan tidak ada korpus parallel atau kakas pemroses bahasa daerah. Shared-task penerjemahan bahasa daerah dengan bahasa Indonesia ini bertujuan untuk menumbuhkan minat riset komputasi linguistik bahasa dengan sumber terbatas khususnya bidang penerjemahan bahasa daerah. Kegiatan ini diharapkan dapat menjadi permulaan dalam penyediaan korpus serta kakas pemroses bahasa daerah sehingga riset di bidang ini menjadi lebih banyak dan lebih baik hasilnya.

Koordinator Shared Tasks INACL 2020: Dr. Hapnes Toba