1. 自然语言处理中String常用方法

在数据的分析时,我们经常会遇到自然语言处理的案例。我将在这篇文章对主要几个高频使用的字符串方法进行整合。我们将

  • 去除字符串的前缀和后缀
  • 保留前缀去后缀
  • 保留后缀去前缀
  • 字符串中文本的替换
  • 字符串中查找文本
  • 对字符串类型的判断(是否为字母或者数字)
  • 字符串的切割同合并
  • 查找帮助文档

2. 代码展示

# -*- coding: utf-8 -*-
"""
Created on Tue Aug 20 09:35:30 2019

@author:  jlblog.tech
"""
#1. 去前缀和后缀
input_str=' 今天,天气不错 '
print(input_str.strip())

input_str='AAA今天天气不错AAA'
#保留前缀的方法
print(input_str.rstrip('A'))

#保留后缀的方法
print(input_str.lstrip('A'))

#2. 文本的替换

print(input_str.replace('A','B'))


#3.查找文本,return index

print(input_str.find('今天'))

#4.判断成分
#其中isalpha()判断是否全为基于ASCII码纯字母的判断
print(input_str.isalpha())
#中文要需要转码才能判断
print(input_str.encode('utf-8').isalpha())
print(input_str.isdigit())

#切割字符串
input_str='今日 天气 不错'
input_str=input_str.split(' ')
print(input_str)
#合并
print(''.join(input_str))

3. 运行结果

4. 查找帮助文档

在实战过程中,难免遇到新的挑战,

help(str)