python-unicode

unicode一直是头疼事儿,今天清理一下。

  1. ipython notebook默认编码 'Ascii'
  2. 输入open(f,'r'),如果有中文,需要转换才能使用
  3. 网络数据如果要写入文件open(f,'w'),需要encode转为utf8

只要是中文使用出现出入"Ascii ....Unicode",就转换下:

addressto = addressto.decode("utf-8")

彻底改变编码:

  1. python3,都是utf-8
  2. 通过sys改变编码,可以在cmd里面用,notebook不支持
  1. # -*- coding: utf-8 -*-
  2. import sys
  3. reload(sys)
  4. sys.setdefaultencoding('utf-8')
  5. # print sys.getdefaultencoding()