У меня есть два фрейма данных панд, вот так:
df1
Сайт | Ссылка |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
Сайт | Ссылка |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
Поэтому я хочу пройти через df2 и найти экземпляры ссылок из df2 в df1. Вот мой код:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
Когда я печатаю boolean_findings, я получаю все ложные, что, как я знаю, не может быть правдой, потому что я вижу совпадения локально в своих файлах excel:
логические привязки |
---|
Ложный |
Ложный |
... |
Ложный |
Я хочу знать, почему текст строки гиперссылки не сопоставляется с его эквивалентом в первом df, и что я могу сделать, чтобы сопоставить сайты.
TypeError: replace() takes no keyword arguments
. Когда я удалюregex=True
, это не приводит к ошибке, но и не заменяет ее. Я думаю, что посмотрю вre
модуль, чтобы разобраться в этом, но спасибо, что наставили меня на правильный путь!