Saya seorang mahasiswa (ilmu komputer). Ini adalah pertanyaan pertama saya di stackoverflow. Saya sangat menghargai bantuan Anda! (Paket yang saya maksud disebut 'word2vec', itu sebabnya tag/judul agak membingungkan untuk dipilih.)

Dalam deskripsi fungsi doc2vec (di sini https://cran.r -project.org/web/packages/word2vec/word2vec.pdf) dikatakan:

Vektor dokumen adalah jumlah vektor kata-kata yang merupakan bagian dari dokumen yang distandarisasi oleh skala ruang vektor. Skala ini adalah kuadrat dari produk dalam rata-rata elemen vektor.

Dari apa yang saya pahami, doc2vec mengambil satu vektor tambahan untuk setiap paragraf. Yang menurut saya berbeda dengan uraian di atas.

Apakah pemahaman saya tentang doc2vec benar, atau cukup dekat? Dan: Apakah implementasi yang dikutip berfungsi seperti algoritma doc2vec?

0
Frederic Klein 10 November 2020, 18:52

1 menjawab

Jawaban Terbaik