Saya mencoba memeriksa apakah nilai sebelumnya cocok dengan nilai di kolom yang sama. Jadi pada dasarnya saya ingin memeriksa apakah df$variable[1] == df$variable[2], dan df$variable[2] == df$variable[3] dan seterusnya. Saya telah melampirkan kode saya di bawah ini. Saya memiliki jawaban yang bertentangan sekalipun. Saya menjalankan test case tertentu dan yang mengatakan mereka cocok, tetapi kemudian ketika saya menjalankannya untuk seluruh kolom, itu tidak mendeteksi kecocokan apa pun.

if(FinalLR$`Revised Claim`[2072] == FinalLR$`Revised Claim`[2073]){
  print("YEP")
}

## Actual
for (i in 2:len(FinalLR$`Revised Claim`)){
  if(FinalLR$`Revised Claim`[i] == FinalLR$`Revised Claim`[i-1]){
    FinalLR$`Dist Claim#` <- 0
  } else {
    FinalLR$`Dist Claim#` <- 1
  }
}
table(FinalLR$`Dist Claim#`)

Keluaran [1] "YA"

1

7070

1
Sam Edeus 19 September 2019, 20:16

1 menjawab

Jawaban Terbaik

Kita dapat melakukan perbandingan lag dan mengonversinya ke biner

library(dplyr)
FinalLR %>% 
        mutate(`Dist Claim#` = as.integer(`Revised Claim` != 
                lag(`Revised Claim`, default = first(`Revised Claim`))))
1
akrun 19 September 2019, 18:25