티스토리 뷰

현재 업무상 진행 중인 작업에 참고하고자 내 마음대로 ‘물류거점’ 예제 데이터 파일을 (R로) 만들어 보며 놀기로 했다.

오늘은 그 예제 데이터를 만들고, 산점도 행렬을 그려 보는 데까지만 나갈 생각이다.

생각해 본 예제 데이터의 내용은 다음과 같다.

  1. 이 데이터는 총 400개 관측치로, 각각의 관측치는 가상의 물류거점에 입점해 있는 가상의 물류사업체다.
  2. 각 물류사업장은 총 25개 물류거점(base)에 나누어 입점해 있다.
  3. 각 물류거점은 규모가 다른 5개 종류(kind)로 나누어 볼 수 있다.
  4. 각 관측치는 다음의 변수들도 갖고 있다. 종사자 수(emp), 시설 면적(area)=제곱미터 단위, 지난 한 달간 처리한 물동량(volume)=톤 단위, 입하 화물차 대수(arrival_car), 출하 화물차 대수(shipment_car)

아래 코드는 위에 설명한 예제 데이터세트를 내 마음대로 만들어 보고자 사용한 것이다.

(저 수치들이 말이 되는지 깊이 생각해 보지 않은 게 문제이긴 하다. 그저 kind 숫자가 큰 물류거점일수록, 종사자 수, 시설, 물동량 규모가 크다고 전제를 뒀다.)

kind1 <- rep(1, 200)
base1 <- round(runif(200, min=1, max=10), digits=0)
emp1 <- round(runif(200, min=1, max=100), digits=0)
area1 <- round(runif(200, min=99, max=1500), digits=0)
volume1 <- round(runif(200, min=1, max=50000), digits=0)
arrival_car1 <- round(runif(200, min=1, max=500), digits=0)
shipment_car1 <- round(runif(200, min=1, max=500), digits=0)
data1 <- cbind(kind1, base1, emp1, area1, volume1, arrival_car1, shipment_car1)

kind2 <- rep(2, 75)
base2 <- round(runif(75, min=11, max=16), digits=0)
emp2 <- round(runif(75, min=50, max=500), digits=0)
area2 <- round(runif(75, min=99, max=3000), digits=0)
volume2 <- round(runif(75, min=100, max=75000), digits=0)
arrival_car2 <- round(runif(75, min=1, max=1000), digits=0)
shipment_car2 <- round(runif(75, min=1, max=1000), digits=0)
data2 <- cbind(kind2, base2, emp2, area2, volume2, arrival_car2, shipment_car2)

kind3 <- rep(3, 50)
base3 <- round(runif(50, min=17, max=20), digits=0)
emp3 <- round(runif(50, min=65, max=750), digits=0)
area3 <- round(runif(50, min=150, max=5000), digits=0)
volume3 <- round(runif(50, min=1000, max=100000), digits=0)
arrival_car3 <- round(runif(50, min=10, max=2500), digits=0)
shipment_car3 <- round(runif(50, min=10, max=2500), digits=0)
data3 <- cbind(kind3, base3, emp3, area3, volume3, arrival_car3, shipment_car3)

kind4 <- rep(4, 40)
base4 <- round(runif(40, min=21, max=23), digits=0)
emp4 <- round(runif(40, min=100, max=1000), digits=0)
area4 <- round(runif(40, min=500, max=10000), digits=0)
volume4 <- round(runif(40, min=5000, max=250000), digits=0)
arrival_car4 <- round(runif(40, min=50, max=3750), digits=0)
shipment_car4 <- round(runif(40, min=50, max=3750), digits=0)
data4 <- cbind(kind4, base4, emp4, area4, volume4, arrival_car4, shipment_car4)

kind5 <- rep(5, 35)
base5 <- round(runif(35, min=24, max=25), digits=0)
emp5 <- round(runif(35, min=150, max=5000), digits=0)
area5 <- round(runif(35, min=750, max=30000), digits=0)
volume5 <- round(runif(35, min=7500, max=500000), digits=0)
arrival_car5 <- round(runif(35, min=100, max=5000), digits=0)
shipment_car5 <- round(runif(35, min=100, max=5000), digits=0)
data5 <- cbind(kind5, base5, emp5, area5, volume5, arrival_car5, shipment_car5)

data <- rbind(data1, data2, data3, data4, data5)
colnames(data)
## [1] "kind1"         "base1"         "emp1"          "area1"        
## [5] "volume1"       "arrival_car1"  "shipment_car1"
colnames(data) <- c("kind", "base", "emp", "area", "volume", "arrival_car", "shipment_car")
colnames(data)
## [1] "kind"         "base"         "emp"          "area"         "volume"      
## [6] "arrival_car"  "shipment_car"

끝으로 물류거점 종류(kind), 거점 번호(base)를 제외한 변수들만으로 산점도 행렬을 그려 보자.

pairs(data[, 3:7])

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함