import numpy as np
import pandas as pd
from pandas import Series,DataFrame

# 重複したデータを含むDataFrame
dframe = DataFrame({'key1': ['A'] * 2 + ['B'] * 3,
                  'key2': [2, 2, 2, 3, 3]})
dframe

# 重複したデータがあるかどうかがわかります。
dframe.duplicated()

0    False
1     True
2    False
3    False
4     True
dtype: bool

# 重複した行を削除できます。
dframe.drop_duplicates()

# 1つの列に注目して、重複を削除できます。
dframe.drop_duplicates(['key1'])

# 元のデータです。
dframe

# 最初の重複ではなく、最後のデータを残す事もできます。
dframe.drop_duplicates(['key1'],take_last=True)

	key1	key2
0	A	2
2	B	2