Получите первое и последнее вхождение повторяющегося значения

0

Вопрос

У меня есть dataframe подобный этому

index    col1     col2    col3    col4
  0      11/20    11/26   abc     35
  1      11/21    11/24   xxx     30
  2      11/22    11/27   abc     20

Здесь col3 имеет одинаковое значение (дублируется на основе значения). Я sum() col4 из строк, основанных на col3 ценность.

Так что в данном случае я делаю

df = df.groupby(['col3'])[['col4']].sum()

Но при таком подходе я получаю

index    col3    col4
  0      abc     55
  1      xxx     30

Я хотел бы иметь возможность сохранить первое появление дублированного значения col1(11/20) и последнее появление col2(11/27), поэтому конечный продукт будет выглядеть следующим образом

index    col1     col2    col3    col4
  0      11/20    11/27   abc     55
  1      11/21    11/24   xxx     30

pandas python
2021-11-24 05:23:58
2

Лучший ответ

2

Один из способов использования pandas.DataFrame.groupby.agg:

new_df = df.groupby("col3", as_index=False).agg({"col1": "first",
                                                 "col2": "last",
                                                 "col4": "sum"})
print(new_df)

Выход:

  col3   col1   col2  col4
0  abc  11/20  11/27    55
1  xxx  11/21  11/24    30
2021-11-24 05:27:44

Преобразование col1/col2 в datetime и использование min/max может быть более надежным, если мы всегда хотим "первую" (самую раннюю) дату и "последнюю" (последнюю) дату. (Опять же, это зависит от варианта использования)
Henry Ecker
0

Панды обеспечиваютfirst иlast агрегации.

2021-11-24 05:28:04

На других языках

Эта страница на других языках

Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................