机器学习之利用NTLK作词文本预处理(一)
机器学习利用NTLK作词文本预处理(一)1. 文本挖掘文本挖掘是数据挖掘中非常重要的一个环节。现在很多的数据是以文本的形式储存在数据库里。文本可以流露出很多重要的信息。我们可以通过文本挖掘,了解比如一个YouTube的特别的视频里的所有评论里的有价值信息。所谓的数据挖掘,在我看来,就是一个把Raw Data转变成Valuable Information的过程。而在当今时代下,大量的文本信息就是ra
机器学习利用NTLK作词文本预处理(一)1. 文本挖掘文本挖掘是数据挖掘中非常重要的一个环节。现在很多的数据是以文本的形式储存在数据库里。文本可以流露出很多重要的信息。我们可以通过文本挖掘,了解比如一个YouTube的特别的视频里的所有评论里的有价值信息。所谓的数据挖掘,在我看来,就是一个把Raw Data转变成Valuable Information的过程。而在当今时代下,大量的文本信息就是ra