加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

处理统一码文件是场噩梦?这些诀窍助你大梦初醒

发布时间:2019-08-27 15:30:08 所属栏目:建站 来源:读芯术
导读:对付那些常常在一般事变中处理赏罚同一码文件(也合用于其他编码)的人来说,这篇文章是必读的。对付天然说话处理赏罚的从颐魅者,处理赏罚同一码文件是一场恶梦,尤其是行使Windows操纵体系。想象一下,当在编码或解码进程中碰着错误时的沮丧,譬喻: UnicodeEncodeError:

假如在Windows操纵体系中运行呼吁提醒符,那么在大大都环境下表现同一码字符城市有题目,呈现如下图所示的乱码字符:

处理赏罚同一码文件是场恶梦?这些诀窍助你大梦初醒

表现乱码字符的呼吁提醒符

为了办理这个题目,必要将配置变动为正确的字体。

  • 右键单击顶部菜单并单击属性。
  • 单击字体菜单。
  • 将字体修改为可表现字符的所需字体。譬喻,可以行使楷体来泛起中笔墨符。

处理赏罚同一码文件是场恶梦?这些诀窍助你大梦初醒

呼吁提醒符的字体属性

打开一个有同一码字符的文件路径——通过pandas模块合用于read_csv

这部门有点棘手,尤其是在行使某些特定Python模块(如pandas)时。假设有以下非英语的文件路径:

  1. file_path = 'C:pathto数据说明data.csv' 

试图通过read_csv读取文件将会抛堕落误,由于文件路径包括同一码字符。在Python中行使内置的open()函数不是题目地址。为了办理这个题目,必要先打开文件,然后转达给read_csv函数:

  1. with open(file_path, 'r', encoding='utf-8') as f: 
  2.     df = pd.read_csv(f, encoding='utf-8') 

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读