У меня есть 2 кадра данных, в которых мне нужно найти, сколько раз записи в mock$num попадают в диапазон x-y, указанный в кадре данных диапазона.
id <- c(1:9)
num <- c(99,101,199,250,999,1500,3000,4000,5000)
mock <- data.frame(id, num)
x <- c(100,100,200,1000,4000,4000)
y <- c(198,200,300,2000,5000,5000)
range <- data.frame(x,y)
Желаемый результат показан ниже
id num check
1 99 0
2 101 2
3 199 1
4 250 1
5 999 0
6 1500 1
7 3000 0
8 4000 2
9 5000 2
который можно получить с помощью следующего кода
mock$check <- mapply(
function(x){
count = 0
for (i in 1:nrow(range)){
if (x >= range$x[i] & x <= range$y[i]){
count = count + 1
}
}
paste0(count)
},
mock$num
)
Приведенный выше подход непригоден для больших наборов данных из-за цикла for, и я пытался использовать метод неэквивалентного соединения (через data.table
). Однако я застрял в вопросе о том, как выполнить неравномерное соединение между двумя таблицами (не уверен, как перейти к...)
nonequi <- mock[range, on =.(num >= x, num <=y),]
Хотел бы получить некоторые рекомендации по этой проблеме. Ценю вашу помощь.