Pemrosesan seperti apa yang harus dilakukan terhadap input yang diberikan ke parser.

Seperti yang saya tahu saya menggunakan stanford parser.jar tetapi ada juga stanford coreNLP.jar apa perbedaan antara parser.jar dan metode parsing coreNLP.jar

Sesuai dokumentasi coreNLP Anda dapat melewati operasi yang ingin Anda lakukan sebagai input di annotator

PERINTAH:

java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse,dcoref -file input.txt

Untuk menggunakan parsing di coreNLP, bisakah saya hanya melewatkan parse atau haruskah saya melewati semua annotator kecuali dcoref

yaitu)

java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,parse -file input.txt
                                      or
java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse,dcoref -file input.txt

Apakah parser.jar memiliki pemisahan kalimat di dalam jarnya?

Bisakah saya memberikan paragraf sebagai input dan mendapatkan kalimat dan data yang diuraikan sebagai out

Atau haruskah saya memberikan hanya satu kalimat dalam satu waktu
Terima kasih,

1
The6thSense 14 Mei 2015, 08:07
1
Itu bukan pertanyaan konyol. stanford area tidak banyak dieksplorasi semua pertanyaan yang terkait dengan ini adalah valid. Tolong hapus kalimat pertama
 – 
Partha Bisoi
15 Mei 2015, 07:46

1 menjawab

Jawaban Terbaik

Annotator CoreNLP dapat dianggap sebagai grafik ketergantungan. Annotator parser bergantung pada tokenization (tokenize) dan pemisahan kalimat (ssplit) saja. Jadi, Anda bisa menjalankan parser dengan perintah pertama Anda:

java -cp "*" -Xmx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,parse -file input.txt

Jika Anda tahu teks Anda sudah di-token, hal termudah untuk dilakukan adalah menyetel opsi tokenize.whitespace = "true" di file properti Anda (atau meneruskannya sebagai flag: -tokenize.whitespace). Untuk hanya memisahkan kalimat di akhir baris, Anda dapat mengatur opsi (ssplit.eolonly).

Tapi, secara default, ya CoreNLP akan memberi token dan membagi kalimat Anda untuk Anda. Anda cukup memasukkan setumpuk teks, dan itu akan menampilkan kalimat yang diuraikan.

2
Gabor Angeli 15 Mei 2015, 08:16
Jadi mengapa ada perbedaan antara keluaran CoreNLP dan parser yang harus saya gunakan. Yang akan memberikan hasil yang lebih baik
 – 
The6thSense
15 Mei 2015, 08:32
Annotator CoreNLP parse dan parser Stanford sama persis. Seharusnya tidak ada perbedaan antara output, di luar itu CoreNLP melakukan hal-hal lain juga.
 – 
Gabor Angeli
15 Mei 2015, 09:46
Tetapi sesuai tautan ini tautan yang diberikannya hasil yang berbeda antara coreNLP dan parser saat digunakan dengan POS di coreNLP
 – 
The6thSense
15 Mei 2015, 10:32
1
Ini hanya jika Anda mengaktifkan pos annotator, dan bahkan perbedaannya kemungkinan kecil dan jarang. Tidak mungkin membuat perbedaan besar dalam tugas hilir apa pun.
 – 
Gabor Angeli
16 Mei 2015, 03:28
Jadi tidak masalah jika saya menggunakan parser atau coreNLP dengan POS diaktifkan keduanya hampir sama. Tidak ada yang lebih baik atau lebih buruk dari yang lain kan
 – 
The6thSense
18 Mei 2015, 08:20