How to get rid of " Unnamed : 0" column in a pandas DataFrame read in from CSV file?

在使用 pandas 读取 CSV 文件时，如果 CSV 文件中包括了索引列，而在读取时未正确处理，通常会出现一个名为 Unnamed: 0 的额外列。删除这个列有几种方法，我将逐一说明。

当您使用 pandas.read_csv 读取 CSV 文件时，可以直接设置 index_col=0 参数，这样 pandas 就会将第一列作为 DataFrame 的索引，而不是作为一个普通的列导入。

例如：

python
import pandas as pd

# 假设 'data.csv' 中第一列就是原本的索引
df = pd.read_csv('data.csv', index_col=0)

这种方法在读取文件时就避免了 Unnamed: 0 列的生成。

如果已经读取了包含 Unnamed: 0 的 DataFrame，可以使用 DataFrame.drop 方法来删除这列。

python
import pandas as pd

# 读取 CSV 文件
df = pd.read_csv('data.csv')

# 删除 'Unnamed: 0' 列
df = df.drop('Unnamed: 0', axis=1)

这里，axis=1 表示我们指定的是列而非行。

通常，推荐在读取 CSV 文件时就正确处理索引，以防止不必要的数据处理步骤。然而，如果文件已经被读入并且包含了不需要的索引列，使用 drop 方法即可轻松删除。这两种方法都很有效，但在处理大数据集时，第一种方法（在读取时处理）更为高效，因为它避免了额外的数据处理步骤。

2024年7月20日 14:47 回复

1个答案