У меня есть dataframe
подобный этому
index col1 col2 col3 col4
0 11/20 11/26 abc 35
1 11/21 11/24 xxx 30
2 11/22 11/27 abc 20
Здесь col3
имеет одинаковое значение (дублируется на основе значения).
Я sum()
col4
из строк, основанных на col3
ценность.
Так что в данном случае я делаю
df = df.groupby(['col3'])[['col4']].sum()
Но при таком подходе я получаю
index col3 col4
0 abc 55
1 xxx 30
Я хотел бы иметь возможность сохранить первое появление дублированного значения col1
(11/20) и последнее появление col2
(11/27), поэтому конечный продукт будет выглядеть следующим образом
index col1 col2 col3 col4
0 11/20 11/27 abc 55
1 11/21 11/24 xxx 30