出自群里的提问,试了几次就实现了,现在分享出来。
#coding=utf-8 import re s = 'hi新手oh'.decode('utf-8') #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码 p = re.compile(ur'[\u4e00-\u9fa5]') #这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur print p.split(s) #使用re库的split切割
出自群里的提问,试了几次就实现了,现在分享出来。
#coding=utf-8 import re s = 'hi新手oh'.decode('utf-8') #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码 p = re.compile(ur'[\u4e00-\u9fa5]') #这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur print p.split(s) #使用re库的split切割
上一篇:python函数之参数传递
下一篇:Python 常见的17个错误分析
PythonTab微信公众号:
Python技术交流互助群 ( 请勿加多个群 ):
群1: 87464755
群2: 333646237
群3: 318130924
群4: 385100854