NLP: Kecerdasan Buatan yang Bantu Komputer Pahami Bahasa Manusia
Apa Itu Natural Language Processing?
Natural language processing (NLP) adalah cabang dari kecerdasan buatan yang berhubungan dengan interaksi antara komputer dan manusia menggunakan bahasa alami.
Menurut Textmetrics, NLP digunakan untuk mengukur sentimen dan menentukan bagian mana dari bahasa manusia yang penting.
Natural language processing digunakan untuk aplikasi berikut.
- Aplikasi terjemahan bahasa seperti Google Translate.
- Aplikasi pengolah kata seperti Microsoft Word dan Grammarly, yang menggunakan NLP untuk memeriksa keakuratan tata bahasa teks.
- Aplikasi chatbot ataupun Interactive Voice Response (IVR) untuk menanggapi permintaan pengguna tertentu.
- Aplikasi personal assistant seperti OK Google, Siri, Cortana, dan Alexa.
Ada berbagai pendekatan yang digunakan agar komputer dapat memahami bahasa manusia.
1. Pendekatan simbolik
Pendekatan simbolik menggunakan pendekatan yang berdasarkan pada aturan dan leksikon yang dikembangkan manusia.
Artinya, sistem menerima aturan bicara dalam bahasa tertentu yang diwujudkan dan direkam oleh pakar linguistik untuk diikuti.
2. Pendekatan statistik
Pendekatan statistik didasarkan pada contoh fenomena linguistik yang dapat diamati dan berulang. Sistem mengenali tema berulang melalui analisis matematis.
Setelah mengidentifikasi tren dalam sampel teks yang besar, sistem komputer dapat mengembangkan aturan linguistiknya sendiri yang akan digunakan untuk menganalisis input bahasa yang digunakan.
3. Pendekatan koneksi
Pendekatan koneksi merupakan pendekatan yang menggabungkan pendekatan simbolik dan pendekatan statistik.
Hal ini dimulai dengan menggunakan aturan bahasa secara umum dan menyesuaikannya dengan aplikasi spesifik dari input yang berasal dari pendekatan statistik.
Teknik yang Digunakan dalam NLP
Dilansir dari Becoming Human, NLP menggunakan dua teknik untuk menyelesaikan tugasnya.
1. Syntax
Syntax mengacu pada susunan kata-kata dalam sebuah kalimat sehingga tampak masuk akal secara tata bahasa.
NLP menggunakan analisis syntax untuk menerapkan aturan tata bahasa pada kumpulan kata yang ditemukannya.
Ada beberapa teknik syntax yang bisa digunakan.
- Lemmatization, melakukan pengurangan berbagai bentuk kata yang berubah menjadi satu bentuk untuk memudahkan analisis.
- Segmentasi morfologis, melibatkan pembagian kata menjadi unit-unit individu atau morfem.
- Segmentasi kata, membagi sebagian besar teks berkelanjutan menjadi unit-unit berbeda.
- Penandaan part-of-speech, dengan mengidentifikasi bagian dari ucapan untuk setiap kata.
- Parsing, dengan melakukan analisis tata bahasa untuk kalimat yang disediakan.
- Pemutusan kalimat, dengan menempatkan batas kalimat pada sepotong teks besar.
- Stemming, memotong kata-kata yang diubah ke bentuk akarnya.
2. Semantics
Semantics mengacu pada makna yang disampaikan oleh sebuah teks. Ini merupakan aspek yang paling sulit dianalisis dalam natural language processing dan belum sepenuhnya dipelajari.
Analisis ini melibatkan penerapan algoritma komputer untuk memahami arti dan interpretasi kata-kata dan bagaimana kalimat disusun.
Berikut beberapa teknik semantics yang umum digunakan dalam NLP.
- Named entity recognition (NER), melibatkan penentuan bagian-bagian teks yang dapat diidentifikasi dan dikategorikan ke dalam grup tertentu. Contohnya nama orang dan nama tempat.
- Disambiguasi arti kata, melibatkan pemberian makna pada kata berdasarkan konteksnya.
- Natural language generation, melibatkan penggunaan database untuk mendapatkan maksud semantik dari teks dan mengubahnya menjadi bahasa manusia.
Bagaimana Sistem NLP Menginterpretasikan Bahasa?
NLP menginterpretasikan bahasa dalam enam level.
1. Morphological level
Morfem adalah unit makna terkecil dari sebuah kata. Level ini berkaitan dengan morfem dalam perannya sebagai bagian yang menyusun kata.
2. Lexical level
Pada level ini, sistem akan fokus pada bagaimana bagian-bagian kata (morfem) bergabung untuk membuat kata-kata. Kemudian, sistem akan mengidentifikasi perbedaan-perbedaan untuk menemukan arti dari setiap kata.
3. Syntactic level
Level ini berfokus pada teks di level kalimat. Tahap ini berkisar pada gagasan bahwa dalam kebanyakan bahasa, arti kalimat bergantung pada urutan kata dan tata bahasanya.
4. Semantic level
Pada level ini, sistem berfokus pada bagaimana konteks kata dalam kalimat membantu menentukan arti kata pada tingkat individu.
5. Discourse level
Level ini berfokus pada bagaimana kalimat berhubungan satu sama lain dalam satu teks. Sistem akan mengidentifikasi urutan dan pengaturan kalimat yang dapat mempengaruhi arti kalimat.
6. Pragmatic level
Level ini berfokus pada makna kata atau kalimat pada kesadaran situasional dan pengetahuan dunia. Pada dasarnya, sistem akan mengidentifikasi apa arti yang paling mungkin dan paling masuk akal dari teks tersebut.
Comments
Post a Comment