Contents

1 覦覯
2 覲旧伎 覿願鍵
3 殊 覿り鍵
3.1
3.2 CSV
3.3 螻螳蟆
3.4 SPSS
3.5 Excel
4 DB 覿り鍵
5 豢豌


1 覦覯 #

R 襭襯 覿れ企 覦覯 蟆 4螳讌螳 .

  • 讌 ロ蠍
  • 覲旧伎 覿願鍵
  • 殊 覿り鍵
  • DB 覿り鍵

2 覲旧伎 覿願鍵 #

覲旧伎 覿企 覦覯 螳. 一危磯ゼ ロ螻 覿覿 螻 Ctrl-C襯 覲旧襯 .

r01.jpg

覲旧襯 伎 clipboard朱 螻褐 襦 ル. read.table 殊 襯 覿れ企 clipboard 殊 る0 .
> read.table('clipboard',header=T)
  id age
1  1  23
2  2  35
3  3  19
襷 , SPSS, 麹伎, ろ誤, CSV 朱 螳 覦覯朱 覿れ .

3 殊 覿り鍵 #

蠍一 る0 ろ, CSV, SPSS, 螳讌企. 襾語 るジ 譬襯 朱る 覦覯 觜訣覩襦 襷 谿場覲企 所 .

3.1 #
read.table ろ 殊 曙伎 一危壱朱 襷れ伎. 蠍磯蓋 覯 螳. れ螻 螳 ろ test.txt螳


1 蟾螳 22
2 覦 36
3 覲讌 19

れ螻 螳 ロ覃 .


read.table("test.txt")

襷 ろ 殊 豌 譴 豌 覲 企 る

id name score
1 蟾螳 22
2 覦 36
3 覲讌 19

れ螻 螳 header襯 谿(T)朱 れ.
> read.table("test.txt", header=T)

襷 觜 豺 狩襦 蟲覿 る
id,name,score
1,蟾螳,22
2,覦,36
3,覲讌,19

delim 狩襦 れ.
> read.table("test.txt", header=T, delim=",")

3.2 CSV #
CSV(Comma-Seperated Values) 觜襦 螻 襦蠏碁れ 讌 狩企. 覲 企ゼ 觜 豺 狩襦 ろ 殊願鍵 覓語 read.table header=T, delim=","朱 れ覃 讌襷 螳 read.csv 襯 企 .
> read.csv("test.csv")
read.csv read.table 襯 覦朱 襷れ伎蠍 覓語 るジ 覈 旧 覯 狩.

3.3 螻螳蟆 #
る語 煙 螻螳蟆 ろ 朱 貊 蟆曙郁 襷. 螻螳蟆企 螳 覲螳 谿讌 豺 襯 螻 蟆 襷. 襯 れ 蟆曙磯ゼ 覲伎.
54321|1|01|80|1|0|1|1|
54322|0|02|79|1|0|1|1|

豌覯讌 覲 5豺, 覯讌 覲 1豺, 碁讌 覲 2豺 朱 螳 覲螳 谿讌 豺語螳 譟一 . ( | 覲願鍵所 蠍 l 蟆朱 れ 殊 .)

read.fwf 企 殊 曙企れ碁. 覯 るジ 譬襯 read 螻 り骸 螳. widths 旧 覲れ 谿讌 豺語襯 覯″磯 l伎朱 . 襯 れ 殊 螳 覲螳 5豺, 1豺, 2豺, 2豺 1豺, 1豺, 1豺, 1豺語 谿讌る れ螻 螳.
read.fwf( filename, widths=c(5,1,2,2,1,1,1,1) )

覿覿 蟆曙 覿覿 覲伎 企麹 覲蠍 覓語 豺語 螳蟆 れ讚讌襷 血曙朱 螳覃 1豺碁 谿讌 蟆曙郁 襷. 1 覯 ロ rep 襯 伎. 蟆曙 1 4覯 覦覲給覩襦 れ螻 螳 .
read.fwf( filename, widths=c(5,1,2,2, rep(1,4) ) )

襷 譴螳 覈 豺語 誤螻 矩る 襦 蠍壱. 襯 れ 覯讌 覲 企麹 豺語 蟇企郁る れ螻 螳 .
read.fwf( filename, widths=c(5,1,-2,2,rep(1,4)))

3.4 SPSS #
foreign れ襯 伎覃 るジ 糾れ 一危 殊 覿れ . SPSS SAV 殊 read.spss 襯 .
> library(foreign)
> dat = read.spss("test.sav")

3.5 Excel #
ODBC(Open DataBase Connectivity) 襦 るジ 譬襯 一危磯伎れ 狩 覦覯朱 襦 襷 譴企. RODBC れ襯 伎覃 R DB 襭襯 覿り碓 DB 襭襯 ロ . MS ODBC襦 .

襾殊 れ螻 螳 test.xls朱 殊 り .
r02.jpg

蠏碁覃 R れ螻 螳 覈轟朱 覿れ .
> library(RODBC)                           # RODBC襯 覿れ碁.
> xls = odbcConnectExcel("hills.xls")    #  殊 .
> sheet1 = sqlFetch(xls, "Sheet1")      #  殊 Sheet1 碁ゼ 暑.
> sheet1
   id   name score
1   1 蟾螳    22
2   2 覦    36
3   3 覲讌    19
4   4 譟一    45
5   5 企伎    10
6   6 蟾蠍一綾    30
7   7 り化    22
8   8     17
9   9     33
10 10 蟾螻    42

4 DB 覿り鍵 #

library("RODBC")
conn <- odbcConnect("26")
data <- sqlQuery(conn, "
select 
accountkey
,	sum(saleamt) amt 
,	log(sum(saleamt)) log_amt 
from cji_eis.PubSales.Fact_Sales 
where datekey between 20100601 and 20100630
and gamekey = 20
group by
accountkey
")
hist(data$log_amt)

5 豢豌 #