mwbr.net
当前位置:首页 >> r语言 rEADlinEs >>

r语言 rEADlinEs

如果用Python或者C#可能更容易。但是R本身也有很强的处理功能。 用regular expression. 将html的source打开,比如可以将其按照txt的格式打开。里面的编码都是有规律的,接下来用regular experssion打开。比较常用的函数gsub, strsplit, grep等...

这几条语句都没有问题啊?你是说解决不了你想要解决的问题吗?还是结果跟你想要的不一样?

R怎么知道你的文件是放在桌面而不是别的地方。两个办法: 设定工作目录: setwd("d:/") 然后把txt放在d盘根目录下,用read.table读取 直接把路径带入读入 read.table("d:/exam0203.txt", header=T) 其余的就都解决了吧

要清理stopwords的文件: [plain] view plain copy print? library('tm') stw

有啊,只需要在读入的时候设置下分隔符就行,比如read.table(file,sep=",");

网站首页 | 网站地图
All rights reserved Powered by www.mwbr.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com