解决pandas读取csv、tsv文件出现错误《ParserError: Error tokenizing data. C error: Expected 1 fields in line...》

admin 阅读： 2024-03-25

后台-插件-广告管理-内容页头部广告（手机）

读取文件方式改为

import pandas as pd pd_data = pd.read_csv('./files.tsv')

出错，ParserError: Error tokenizing data. C error: Expected 1 fields in line…
将读取方式改为

documents = pd.read_csv('./files.tsv', sep='\t', header=0)

OK，问题解决！

read_csv()是Pandas库中用于读取CSV文件的函数，其常用参数如下：

filepath_or_buffer---->CSV文件的路径或URL地址。 sep---->CSV文件中字段分隔符，默认为逗号。 delimiter---->CSV文件中字段分隔符，默认为None。 header---->指定哪一行作为列名，默认为0，即第一行。 names---->自定义列名，如果header=None，则可以使用该参数。 index_col---->用作行索引的列编号或列名。 usecols---->读取指定的列，可以是列名或列编号。 dtype---->指定每列的数据类型，可以是字典或者函数。 na_values---->用于替换缺失值的值。 skiprows---->跳过指定的行数。 skipfooter---->跳过文件末尾的指定行数。 nrows---->读取指定的行数。 parse_dates---->指定哪些列需要转换为日期类型。 infer_datetime_format---->尝试解析日期时间格式（提高效率）。 dayfirst---->将日期解析为“日-月-年”而不是“月-日-年”的格式。 encoding---->CSV文件的编码方式，默认为None，使用系统默认编码。 squeeze---->如果文件只包含一列，则返回Series对象而不是DataFrame对象。 thousands---->千位分隔符。 decimal---->小数点分隔符。

标签:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。

在线投稿：投稿站长QQ：1888636

后台-插件-广告管理-内容页尾部广告（手机）