Как удалить 50% строк, разделяющих определенное значение столбца

0

Вопрос

df.groupby(['target']).count()
Цель данные
Отрицательный 103210
Положительный 211082

Прямо сейчас мои положительные данные слишком велики. Я хочу удалить 50% строк, значение которых в Target колонка является Positive. Как я могу это сделать?

dataframe drop pandas python
2021-11-24 03:30:28
1

Лучший ответ

6

Чтобы сохранить половину Positive строки,sample 50% от Positive строки с использованием frac=0.5 иdrop эти индексы:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

Чтобы сохранить ровно 100 тысяч Positive строки,sample 100К Positive строки с использованием n=100_000 иconcat их с помощью Negative строки:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])
2021-11-24 04:27:20

На других языках

Эта страница на других языках

Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

Популярное в этой категории

Популярные вопросы в этой категории