Skip to content

Commit fd0cb22

Browse files
Update Cap11
1 parent 33512c5 commit fd0cb22

File tree

12 files changed

+563
-0
lines changed

12 files changed

+563
-0
lines changed

Cap11/01-Medidas-Posicao/Cap11.pbix

2.3 KB
Binary file not shown.

Cap11/01-Medidas-Posicao/moda.txt

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -1,3 +1,5 @@
1+
# Caso tenha problemas, substitua as vírgulas por ponto-e-vírgula
2+
13
Moda = MINX (
24
TOPN (
35
1,

Cap11/03-Revisao1/03-Revisao1.R

Lines changed: 76 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,76 @@
1+
# Revisão 1
2+
3+
# Definindo a pasta de trabalho
4+
# Substitua o caminho abaixo pela pasta no seu computador
5+
setwd("D:/Dropbox/DSA/PowerBI-DataScience/Cap11/03-Revisao1")
6+
getwd()
7+
8+
# Carregando o dataset
9+
amostras <- read.csv("amostras.csv", fileEncoding = "windows-1252")
10+
11+
# Resumo do dataset
12+
View(amostras)
13+
str(amostras)
14+
summary(amostras$AmostraA)
15+
summary(amostras$AmostraB)
16+
17+
# Média
18+
# A média de uma variável de observação é uma medida numérica da localização central dos valores dos dados.
19+
# É a soma de seus valores de dados divididos pela contagem de dados.
20+
21+
# Mediana
22+
# A mediana de uma variável é o valor no meio quando os dados são classificados em ordem crescente.
23+
# É uma medida ordinal da localização central dos valores de dados.
24+
25+
# Variância
26+
# A variância é uma medida numérica de como os valores dos dados estão dispersos em torno da média.
27+
28+
# Desvio Padrão
29+
# O desvio padrão de uma variável é a raiz quadrada de sua variância.
30+
31+
32+
# Exemplo 1 - Comparar as amostras dos preços de ações
33+
# Que medidas usar?
34+
# Média, Desvio Padrão e CV
35+
mean(amostras$AmostraA)
36+
mean(amostras$AmostraB)
37+
sd(amostras$AmostraA)
38+
sd(amostras$AmostraB)
39+
cvA <- sd(amostras$AmostraA) / mean(amostras$AmostraA) * 100
40+
cvB <- sd(amostras$AmostraB) / mean(amostras$AmostraA) * 100
41+
cvA
42+
cvB
43+
44+
45+
# Exemplo 2 - Comparar as amostras de produtos fabricados
46+
# Que medidas usar?
47+
# Variância
48+
var(amostras$AmostraA)
49+
var(amostras$AmostraB)
50+
51+
52+
# Exemplo 3 - Comparar as amostras na produção de camisas
53+
# Que medidas usar?
54+
# Moda
55+
calculaModa <- function(v) {
56+
uniqv <- unique(v)
57+
uniqv[which.max(tabulate(match(v, uniqv)))]
58+
}
59+
60+
calculaModa(amostras$AmostraA)
61+
calculaModa(amostras$AmostraB)
62+
63+
64+
# Exemplo 4 - Comparar as amostras das notas de alunos
65+
# Que medidas usar?
66+
# Mediana
67+
median(amostras$AmostraA)
68+
median(amostras$AmostraB)
69+
70+
71+
72+
73+
74+
75+
76+

Cap11/03-Revisao1/amostras.csv

Lines changed: 19 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,19 @@
1+
AmostraA,AmostraB
2+
83,67
3+
58,64
4+
82,49
5+
76,58
6+
74,68
7+
54,56
8+
54,61
9+
73,66
10+
39,71
11+
46,61
12+
80,60
13+
77,60
14+
82,63
15+
68,53
16+
51,55
17+
71,73
18+
46,60
19+
76,64
Lines changed: 30 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,30 @@
1+
# Medidas de Posição Relativa
2+
3+
# Definindo a pasta de trabalho
4+
# Substitua o caminho abaixo pela pasta no seu computador
5+
setwd("D:/Dropbox/DSA/PowerBI-DataScience/Cap11/04-Medidas-Posicao-Relativa")
6+
getwd()
7+
8+
9+
# Carregando o dataset
10+
carros <- read.csv("carros.csv")
11+
12+
# Resumo dos dados
13+
head(carros)
14+
str(carros)
15+
16+
# Medidas de Tendência Central
17+
summary(carros$ano)
18+
summary(carros[c('preco', 'kilometragem')])
19+
20+
21+
## Explorando variáveis numéricas
22+
mean(carros$preco)
23+
median(carros$preco)
24+
quantile(carros$preco)
25+
quantile(carros$preco, probs = c(0.01, 0.99))
26+
quantile(carros$preco, seq(from = 0, to = 1, by = 0.20))
27+
IQR(carros$preco) # Diferença entre Q3 e Q1
28+
range(carros$preco)
29+
summary(carros$preco)
30+
diff(range(carros$preco))
Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1 @@
1+
MediaTop20 = CALCULATE(Average(Vendas[Valor]), Filter(Vendas,Vendas[Valor] >= PERCENTILE.EXC(Vendas[Valor], 0.8)))
Lines changed: 151 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,151 @@
1+
ano,modelo,preco,kilometragem,cor,transmissao
2+
2011,SEL,21992,7413,Bege,AUTO
3+
2011,SEL,20995,10926,Cinza,AUTO
4+
2011,SEL,19995,7351,Prata,AUTO
5+
2011,SEL,17809,11613,Cinza,AUTO
6+
2012,SE,17500,8367,Branco,AUTO
7+
2010,SEL,17495,25125,Prata,AUTO
8+
2011,SEL,17000,27393,Azul,AUTO
9+
2010,SEL,16995,21026,Prata,AUTO
10+
2011,SES,16995,32655,Prata,AUTO
11+
2010,SES,16995,36116,Prata,AUTO
12+
2010,SES,16995,40539,Preto,AUTO
13+
2011,SES,16992,9199,Prata,AUTO
14+
2011,SEL,16950,9388,Verde,AUTO
15+
2010,SES,16950,32058,Vermelho,AUTO
16+
2011,SE,16000,15367,Branco,AUTO
17+
2011,SES,15999,16368,Azul,AUTO
18+
2010,SEL,15999,19926,Prata,AUTO
19+
2010,SES,15995,36049,Prata,AUTO
20+
2011,SEL,15992,11662,Azul,AUTO
21+
2011,SEL,15992,32069,Prata,AUTO
22+
2010,SES,15988,16035,Prata,MANUAL
23+
2010,SEL,15980,39943,Branco,AUTO
24+
2011,SE,15899,36685,Prata,AUTO
25+
2010,SEL,15889,24920,Preto,AUTO
26+
2009,SEL,15688,20019,Azul,AUTO
27+
2010,SE,15500,29338,Azul,AUTO
28+
2010,SE,15499,7784,Preto,AUTO
29+
2010,SE,15499,35636,Preto,AUTO
30+
2010,SES,15298,22029,Cinza,AUTO
31+
2009,SEL,14999,33107,Prata,AUTO
32+
2010,SES,14999,36306,Vermelho,AUTO
33+
2009,SE,14995,34419,Preto,MANUAL
34+
2011,SE,14992,4867,Preto,AUTO
35+
2011,SEL,14992,18948,Preto,AUTO
36+
2009,SES,14992,24030,Vermelho,AUTO
37+
2010,SEL,14990,33036,Preto,AUTO
38+
2011,SE,14989,23967,Branco,AUTO
39+
2010,SE,14906,37905,Prata,AUTO
40+
2010,SE,14900,28955,Branco,AUTO
41+
2010,SE,14893,11165,Branco,AUTO
42+
2010,SES,14761,44813,Preto,AUTO
43+
2010,SES,14699,36469,Cinza,AUTO
44+
2010,SES,14677,22143,Preto,MANUAL
45+
2009,SES,14549,34046,Prata,AUTO
46+
2010,SE,14499,32703,Vermelho,AUTO
47+
2010,SES,14495,35894,Prata,AUTO
48+
2010,SE,14495,38275,Preto,AUTO
49+
2010,SE,14480,24855,Azul,AUTO
50+
2009,SEL,14477,29501,Cinza,MANUAL
51+
2009,SEL,14355,35394,Vermelho,AUTO
52+
2010,SE,14299,36447,Preto,AUTO
53+
2010,SES,14275,35318,Preto,AUTO
54+
2010,SES,14000,24929,Prata,AUTO
55+
2009,SE,13999,23785,Vermelho,AUTO
56+
2010,SE,13997,15167,Preto,MANUAL
57+
2010,SE,13995,13541,Prata,AUTO
58+
2010,SE,13995,20278,Preto,MANUAL
59+
2009,SES,13995,46126,Preto,AUTO
60+
2009,SES,13995,53733,Prata,AUTO
61+
2009,SES,13992,21108,Prata,AUTO
62+
2010,SE,13992,21721,Verde,AUTO
63+
2010,SES,13992,26716,Cinza,MANUAL
64+
2009,SES,13992,26887,Preto,AUTO
65+
2009,SE,13991,36252,Prata,MANUAL
66+
2009,SE,13950,9450,Preto,AUTO
67+
2010,SE,13950,31414,Preto,AUTO
68+
2010,SE,13950,37185,Azul,AUTO
69+
2010,SE,13895,48174,Cinza,AUTO
70+
2009,SE,13888,50533,Branco,AUTO
71+
2009,SE,13845,36713,Azul,AUTO
72+
2009,SES,13799,34888,Preto,AUTO
73+
2009,SES,13742,38380,Preto,AUTO
74+
2010,SEL,13687,35574,Cinza,AUTO
75+
2009,SEL,13663,27528,Prata,AUTO
76+
2010,SES,13599,33302,Vermelho,AUTO
77+
2009,SEL,13584,43369,Vermelho,AUTO
78+
2009,SES,13425,64055,Preto,AUTO
79+
2010,SE,13384,41342,Cinza,AUTO
80+
2010,SE,13383,34503,Preto,AUTO
81+
2010,SE,13350,16573,Azul,AUTO
82+
2009,SES,12999,32403,Azul,AUTO
83+
2009,SE,12998,34846,Azul,AUTO
84+
2007,SE,12997,39665,Vermelho,AUTO
85+
2010,SE,12995,21325,Preto,AUTO
86+
2010,SE,12995,32743,Preto,MANUAL
87+
2010,SE,12995,40058,Branco,MANUAL
88+
2009,SE,12995,42325,Azul,AUTO
89+
2009,SE,12995,44518,Vermelho,AUTO
90+
2009,SE,12995,53902,Cinza,AUTO
91+
2008,SE,12995,127327,Vermelho,AUTO
92+
2009,SE,12992,27136,Cinza,AUTO
93+
2009,SES,12990,45813,Prata,AUTO
94+
2009,SE,12988,31538,Cinza,AUTO
95+
2010,SE,12849,29517,Prata,AUTO
96+
2010,SE,12780,35871,Preto,AUTO
97+
2008,SE,12777,49787,Preto,MANUAL
98+
2008,SES,12704,36323,Azul,AUTO
99+
2009,SES,12595,39211,Azul,AUTO
100+
2009,SE,12507,44789,Cinza,AUTO
101+
2008,SE,12500,45996,Branco,MANUAL
102+
2009,SE,12500,54988,Branco,MANUAL
103+
2009,SE,12280,29288,Vermelho,AUTO
104+
2009,SE,11999,36124,Azul,AUTO
105+
2009,SE,11992,32559,Preto,MANUAL
106+
2009,SES,11984,59048,Preto,AUTO
107+
2009,SE,11980,55170,Vermelho,AUTO
108+
2010,SE,11792,39722,Verde,AUTO
109+
2008,SE,11754,38286,Preto,AUTO
110+
2008,SES,11749,57341,Vermelho,AUTO
111+
2008,SES,11495,82221,Prata,AUTO
112+
2008,SE,11450,85229,Vermelho,MANUAL
113+
2009,SES,10995,42834,Vermelho,AUTO
114+
2005,SES,10995,69415,Azul,AUTO
115+
2009,SEL,10995,78264,Cinza,AUTO
116+
2009,SE,10979,60709,Vermelho,AUTO
117+
2008,SE,10955,39643,Cinza,AUTO
118+
2009,SE,10955,40180,Gold,AUTO
119+
2008,SE,10836,40330,Verde,MANUAL
120+
2007,SES,10815,77231,Vermelho,AUTO
121+
2007,SE,10770,72937,Prata,MANUAL
122+
2010,SE,10717,64199,Preto,AUTO
123+
2007,SES,10000,63926,Vermelho,AUTO
124+
2007,SES,9999,74427,Prata,AUTO
125+
2007,SES,9999,78948,Preto,MANUAL
126+
2006,SE,9995,51311,Prata,AUTO
127+
2008,SE,9995,95364,Branco,AUTO
128+
2008,SE,9992,74109,Branco,AUTO
129+
2007,SE,9651,63296,Azul,AUTO
130+
2007,SES,9000,80605,Vermelho,AUTO
131+
2006,SE,8999,49656,Prata,AUTO
132+
2007,SE,8996,48652,Prata,MANUAL
133+
2006,SE,8800,71331,Branco,AUTO
134+
2008,SE,8495,106171,Preto,AUTO
135+
2008,SE,8494,68901,Prata,AUTO
136+
2009,SE,8480,70036,Branco,MANUAL
137+
2007,SES,7999,81596,Bege,MANUAL
138+
2006,SES,7995,35000,Preto,MANUAL
139+
2006,SES,7995,97987,Vermelho,AUTO
140+
2003,SES,7900,96000,Branco,AUTO
141+
2005,SES,7488,59013,Vermelho,AUTO
142+
2004,SE,6999,105714,Prata,AUTO
143+
2007,SE,6995,86862,Branco,AUTO
144+
2000,SE,6980,60161,Verde,AUTO
145+
2004,SES,6980,101130,Cinza,AUTO
146+
2004,SES,6950,119720,Preto,AUTO
147+
2006,SES,6200,95000,Prata,AUTO
148+
2002,SE,5995,87003,Vermelho,AUTO
149+
2000,SE,5980,96841,Vermelho,AUTO
150+
2001,SE,4899,151479,Bege,AUTO
151+
2000,SE,3800,109259,Vermelho,AUTO

Cap11/05-Frequencia/05-Frequencia.R

Lines changed: 39 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,39 @@
1+
# Tabela de Frequência
2+
3+
# Definindo a pasta de trabalho
4+
# Substitua o caminho abaixo pela pasta no seu computador
5+
setwd("D:/Dropbox/DSA/PowerBI-DataScience/Cap11/05-Frequencia")
6+
getwd()
7+
8+
# Carregando e sumarizando os dados
9+
dados <- read.table("usuarios.csv", dec = ".", sep = ",", h = T, fileEncoding = "windows-1252")
10+
names(dados)
11+
str(dados)
12+
summary(dados$salario)
13+
14+
# Tabela de Frequências Absolutas
15+
freq <- table(dados$grau_instrucao)
16+
freq
17+
18+
# Tabela de Frequências Relativas
19+
freq_rel <- prop.table(freq)
20+
freq_rel
21+
22+
# Porcentagem (100 * freq_rel_table)
23+
p_freq_rel <- 100 * prop.table(freq_rel)
24+
p_freq_rel
25+
26+
# Adiciona linhas de total
27+
freq <- c(freq, sum(freq))
28+
freq_rel <- c(freq_rel, sum(freq_rel))
29+
p_freq_rel <- c(p_freq_rel, sum(p_freq_rel))
30+
names(freq)[4] <- "Total"
31+
32+
# Tabela final
33+
tabela_final <- cbind(freq,
34+
freq_rel = round(freq_rel, digits = 2),
35+
p_freq_rel = round(p_freq_rel, digits = 2))
36+
tabela_final
37+
38+
39+

Cap11/05-Frequencia/usuarios.csv

Lines changed: 37 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,37 @@
1+
"","N","estado_civil","grau_instrucao","n_filhos","salario","idade_anos","idade_meses","reg_procedencia"
2+
"1",1,"solteiro","ensino fundamental",NA,4,26,3,"interior"
3+
"2",2,"casado","ensino fundamental",1,4.56,32,10,"capital"
4+
"3",3,"casado","ensino fundamental",2,5.25,36,5,"capital"
5+
"4",4,"solteiro","ensino medio",NA,5.73,20,10,"outra"
6+
"5",5,"solteiro","ensino fundamental",NA,6.26,40,7,"outra"
7+
"6",6,"casado","ensino fundamental",0,6.66,28,0,"interior"
8+
"7",7,"solteiro","ensino fundamental",NA,6.86,41,0,"interior"
9+
"8",8,"solteiro","ensino fundamental",NA,7.39,43,4,"capital"
10+
"9",9,"casado","ensino medio",1,7.59,34,10,"capital"
11+
"10",10,"solteiro","ensino medio",NA,7.44,23,6,"outra"
12+
"11",11,"casado","ensino medio",2,8.12,33,6,"interior"
13+
"12",12,"solteiro","ensino fundamental",NA,8.46,27,11,"capital"
14+
"13",13,"solteiro","ensino medio",NA,8.74,37,5,"outra"
15+
"14",14,"casado","ensino fundamental",3,8.95,44,2,"outra"
16+
"15",15,"casado","ensino medio",0,9.13,30,5,"interior"
17+
"16",16,"solteiro","ensino medio",NA,9.35,38,8,"outra"
18+
"17",17,"casado","ensino medio",1,9.77,31,7,"capital"
19+
"18",18,"casado","ensino fundamental",2,9.8,39,7,"outra"
20+
"19",19,"solteiro","superior",NA,10.53,25,8,"interior"
21+
"20",20,"solteiro","ensino medio",NA,10.76,37,4,"interior"
22+
"21",21,"casado","ensino medio",1,11.06,30,9,"outra"
23+
"22",22,"solteiro","ensino medio",NA,11.59,34,2,"capital"
24+
"23",23,"solteiro","ensino fundamental",NA,12,41,0,"outra"
25+
"24",24,"casado","superior",0,12.79,26,1,"outra"
26+
"25",25,"casado","ensino medio",2,13.23,32,5,"interior"
27+
"26",26,"casado","ensino medio",2,13.6,35,0,"outra"
28+
"27",27,"solteiro","ensino fundamental",NA,13.85,46,7,"outra"
29+
"28",28,"casado","ensino medio",0,14.69,29,8,"interior"
30+
"29",29,"casado","ensino medio",5,14.71,40,6,"interior"
31+
"30",30,"casado","ensino medio",2,15.99,35,10,"capital"
32+
"31",31,"solteiro","superior",NA,16.22,31,5,"outra"
33+
"32",32,"casado","ensino medio",1,16.61,36,4,"interior"
34+
"33",33,"casado","superior",3,17.26,43,7,"capital"
35+
"34",34,"solteiro","superior",NA,18.75,33,7,"capital"
36+
"35",35,"casado","ensino medio",2,19.4,48,11,"capital"
37+
"36",36,"casado","superior",3,23.3,42,2,"interior"

0 commit comments

Comments
 (0)