当前位置 博文首页 > 文章内容

    R语言 如何获取指定位置的数据

    作者:shunshunshun18 栏目:未分类 时间:2021-04-02 14:42:28

    本站于2023年9月4日。收到“大连君*****咨询有限公司”通知
    说我们IIS7站长博客,有一篇博文用了他们的图片。
    要求我们给他们一张图片6000元。要不然法院告我们

    为避免不必要的麻烦,IIS7站长博客,全站内容图片下架、并积极应诉
    博文内容全部不再显示,请需要相关资讯的站长朋友到必应搜索。谢谢!

    另祝:版权碰瓷诈骗团伙,早日弃暗投明。

    相关新闻:借版权之名、行诈骗之实,周某因犯诈骗罪被判处有期徒刑十一年六个月

    叹!百花齐放的时代,渐行渐远!



    R语言-获取指定位置的数据

    R中采用数据对象+[ , ]的方式获取对应位置的数据,根据填入索引参数的不同类型可具体分为:

    正整数、负整数、零、空格、逻辑值、名称

    > matrix
       [,1] [,2] [,3] [,4] [,5]
    [1,]  1  5  9  13  17
    [2,]  2  6  10  14  18
    [3,]  3  7  11  15  19
    [4,]  4  8  12  16  20

    1.正整数索引

    因为R中的起始位置为1,与一般的编程语言不同,所以这类索引最为常见。

    需要注意的是,如果索引中存在重复值,R会继续执行进而重复提取部分值,如:

    > matrix[c(1,1),1:5]
       [,1] [,2] [,3] [,4] [,5]
    [1,]  1  5  9  13  17
    [2,]  1  5  9  13  17

    2.负整数索引

    使用负整数索引与正整数正好相反,R会返回不包含在负整数对应位置的元素,当需要选取的行或列很多时,用这个索引会更快捷。

    需要注意,正整数索引与负整数索引可以同时出现在不同索引位置,但不能同时出现在同一位置,否则将报错,具体如下:

    > matrix[c(-1,-1),1]
    [1] 2 3 4
    > matrix[c(-1,1),1]
    Error in matrix[c(-1, 1), 1] : only 0's may be mixed with negative subscripts

    3.零索引

    零索引的存在说实话并没有什么意义,很有可能是设计师为了防止很多程序员无法避开从0开始计数而经常导致error的一种保护措施而已。使用情况如下:

    > matrix[1,0]
    integer(0)
    > matrix[0,0]
    <0 x 0 matrix>

    4.空格索引

    空格表示提取该索引位置所对应的所有维度,但不写空格效果也一样,具体如下:

    > matrix[1,]
    [1] 1 5 9 13 17
    > matrix[1, ]
    [1] 1 5 9 13 17

    5.逻辑值索引

    当提供的索引位置是一个包含TRUE和FALSE逻辑值的向量,那么R会匹配出索引值为TRUE的列,并取出相应元素。

    使用这种方法,需要向量长度与索引位置的维度相同,否则就达不到需要的效果,具体如下:

    > matrix[c(T,F,F,F),]
    [1] 1 5 9 13 17

    这种方式看似笨重,但在特殊情况下作用十分明显

    6.名称索引

    当被索引的对象有名称属性,就可以采用名称作为索引提取相关元素,这是提取列的常用方法,因为列总会有名称,具体如下:

    > colnames(matrix)<-c("a","b","c","d","e")
    > matrix[,"b"]
    [1] 5 6 7 8

    补充:R语言获取特定时间段的数据

    获取特定时间段的表格数据方法:

    1. 方法一:正则表达式

    data <- read.csv('F:/data.csv')
    date <- as.Date(data$Date)
    #获取2018-3-1到2018-3-10之间的第3-5列数据
    subT <- date[(format(date,format = "%Y")=="2018"&as.numeric(format(date,format =       
       "%m"))=="3" &as.numeric(format(date,format = "%d"))>=1&as.numeric(format(date,format 
       = "%d"))<=10),3:5]
    #对2018-3-1到2018-3-10之间第3-5列的数据进行按列求平均值
    mean <- apply(subT,2, mean)

    2. 方法二:

    date1 <- as.POSIXct(paste("2018-3-1","08:00:00"))
    date2 <- as.POSIXct(paste("2018-3-1","17:00:00"))
    int <- interval(date1, date2)
    #获取2018-3-1 08:00:00到2018-3-1 17:00:00之间的第3-5列数据
    subT <- data[ymd_hms(data$Date) %within% int,3:5]

    注意:

    1. within判断数据是否在该时间段之内,其中包括起始时间,不包括末尾时间。

    2.paste0(num_year[y],'_',m,'_1') 实现字符串的合并,其中m,num_year[y]为变量。

    paste拼接时有空格,paste0无空格

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持IIS7站长之家博文。如有错误或未考虑完全的地方,望不吝赐教。