sexta-feira, 4 de dezembro de 2015

Testes estatísticos: paramétricos e não paramétricos; amostras independentes e amostras dependentes (2015-2016)

Exemplo de um teste estatístico: teste não paramétrico para uma amostra - Teste X2)

Análise:

Temos uma distribuição normal e equilibrada, porque possuímos aproximadamente o mesmo número de portas.

Estimar parâmetros da população (2015-2016)

                   Estimar intervalo de confiança, para uma probabilidade de 95% (SPSS)

Análise: As variáveis 1,2 e 3 referem-se à idade, peso e altura, podemos então dizer que o intervalo de confiança de 95% se encontra entre 19,84 e 22,16, no que se trata da idade e de seguida no peso observamos 58,80 e 61,60 por fim na altura apresenta os valores de 179,49 e 181,98. 

Amostragem: construção tabela número aleatórios e selecção de uma amostra aleatória simples (2015-2016)


Análise: Entre 27 países do conjunto da União Europeia foram escolhidos aleatoriamente 10 países, sendo eles a Áustria,a Dinamarca, a Eslovénia, a Finlândia, a Irlanda, a Letónia, a Lituânia, o Luxemburgo, a Roménia e a Suécia.

domingo, 29 de novembro de 2015

Análise de tendências: regressão não linear (2015-2016)


Regressão Não Linear (Excel)

EXERCÍCIO F-9



EXERCÍCIO F-10




EXERCÍCIO F-9 (SPSS)




    
Análise: Com a observação do exercício F9 concluo-o que quanto maior for a distância da residência ao museu, menor é o número de visitantes. O contrário acontece, quando menor é a distância da residência ao museu, maior será o número de visitantes. Podemos ver que no exercício F 10 é semelhante ao F9.


Análise de tendências: regressão linear (2015-2016)


Regressão Linear simples (Excel)

EXERCÍCIO F-1





EXERCÍCIO F-2




EXERCÍCIO F-3



EXERCÍCIO F-4








EXERCÍCIO F-1 (Excel)

SUMÁRIO DOS RESULTADOS




RESULTADO RESIDUAL



SPSS

EXERCÍCIO F-1






Análise: A regressão linear, serve para ver valor esperado de uma variável (y- variável dependente), dados os valores de outras variáveis (x- variável independente).
Podemos observar que há uma correlação entre os pontos.

No  exercício F1, podemos ver que a sua correlação é de  0,8191 apresentando-se como uma correlação forte. No exercício F2 é o que apresenta uma correlação mais fraca dos 4 exercícios sendo o valor de 0,4931.

No gráfico do exercício F3, a correlação é forte apresenta-se com um valor de 0,9258.
Por fim, no gráfico do exercício F4 a  a correlação apresenta-se de 0,8892 sendo então uma correlação forte.

sexta-feira, 20 de novembro de 2015

Análise de relações: correlação de Spearman (2015-2016)




EXERCÍCIO E-6  


 Análise: A correlação existente no Exercício E-6 é VAR 1 com VAR 2 é forte positiva.

EXERCÍCIO E-7

 Análise: A correlação existente no Exercício E-7 é VAR 1 com VAR 2 é média positiva.

EXERCÍCIO E-8


 Análise: A correlação existente no Exercício E-7 é VAR 1 com VAR 2 é forte positiva.

Análise de relações: correlação de Pearson (2015-2016)





 Análise: A correlação existente no Exercício E-1 é VAR 1 com VAR 2 é nula, na primeira linha. Na segunda linha a VAR 2 com VAR 1 é forte positiva.



Análise: A correlação existente no Exercício E-2 é  VAR 1 com VAR 2 é nula, na primeira linha. Na segunda linha a VAR 2 com VAR 1 é forte positiva.



Análise: A correlação existente no Exercício E-3 é  VAR 1 com VAR 2 é nula, na primeira linha. Na segunda linha a VAR 2 com VAR 1 é forte positiva.



Análise: A correlação existente no Exercício E-4  é  VAR 1 com VAR 2 é nula, na primeira linha. Na segunda linha a VAR 2 com VAR 1 é fraca positiva.

Análise: A correlação existente no Exercício E-5  é VAR 1 com VAR 2 é nula, na primeira linha. Na segunda linha a VAR 2 com VAR 1 é média positiva.




sexta-feira, 13 de novembro de 2015

Noções elementares: exercício de revisão

1. Identifique, nos enunciados a seguir indicados, o universo estatístico, a unidade de análise, o atributo ou variável, o indicador, a escala de medida.

a). Número de hectares de floresta ardida anualmente, em Portugal Continental, no período de 2000 a 2010. 
Universo estatístico ou população estatística: os anos de 200o a 2010
Indivíduo ou unidade de análise: cada um dos anos
Atributo ou variável: Número de hectares de floresta ardida anualmente, em Portugal Continental
Indicador: -
Escala de medida: razão

b). Taxa de mortalidade infantil nos países de África, em 2010.
Universo estatístico ou população estatística: os países de África, em 2010
Indivíduo ou unidade de análise: cada um dos países de África, em 2010
Atributo ou variável: Número de óbitos de crianças com menos de 1 ano de idade observado durante um determinado período de tempo, normalmente um ano civil, referido ao número de nados-vivos do mesmo período (habitualmente expressa em número de óbitos de crianças com menos de 1 ano por 1000 nados-vivos) (INE)
Indicador: Taxa de mortalidade infantil
Escala de medida: razão

c). Número de pessoas que residiam em lugares com mais de 500 habitantes, na Região do Alentejo, em 2001.
Universo estatístico ou população estatística: lugares com mais de 500 habitantes, na Região do Alentejo, em 2001
Indivíduo ou unidade de análise: cada um desses lugares
Atributo ou variável: Número de pessoas residentes (em cada um desses lugares)
Indicador: -
Escala de medida: razão

d). Evolução da população residente no município de Santarém, de 1900 a 2009.
Universo estatístico ou população estatística: os anos de 1900 a 2009
Indivíduo ou unidade de análise: cada um desses anos
Atributo ou variável: população residente no município de Santarém
Indicador: --
Escala de medida: razão

e). A idade dos visitantes do Museu de Serralves, em 2010.
Universo estatístico ou população estatística: visitantes do Museu de Serralves, em 2010
Indivíduo ou unidade de análise: cada um desses visitantes
Atributo ou variável: Idade
Indicador: --
Escala de medida: razão

f). Evolução da população do concelho do Funchal, de 1911 a 2009.
Universo estatístico ou população estatística: os anos de 1911 a 2009
Indivíduo ou unidade de análise: cada um desses anos
Atributo ou variável: a população do concelho do Funchal
Indicador: --
Escala de medida: razão

g). Taxa de natalidade nos municípios da Região Autónoma dos Açores, em 2009.
Universo estatístico ou população estatística: os municípios da Região Autónoma dos Açores, em 2009
Indivíduo ou unidade de análise: cada um dos municípios
Atributo ou variável: Número de nados-vivos ocorrido durante um determinado período de tempo, normalmente um ano civil, referido à população média desse período (habitualmente expressa em número de nados-vivos por 1000 habitantes) (INE)
Indicador: Taxa de natalidade
Escala de medida: razão

h).  Velocidade do vento às 12 horas, na cidade de Bragança, durante o mês de dezembro de 2009.
Universo estatístico ou população estatística:  os 31 dias do mês de dezembro de 2009
Indivíduo ou unidade de análise: cada um desses dias
Atributo ou variável: Velocidade do vento às 12 horas, na cidade de Bragança
Indicador: --
Escala de medida: razão

2. Medidas de tendência central: moda. Média, mediana, quartis, decis, percentis

a). Diga o que entende por Moda? Moda é o valor com maior frequência
b). Diga o que entende por Classe Modal? Classe Modal é a classe com maior frequência
c). O que é uma distribuição amodal, unimodal, bimodal ou multimodal?
Amodal: sem moda; unimodal - uma moda; bimodal - duas modas; multimodal - três ou mais modas
d). O que é a mediana? é uma medida estatística que divide a distribuição em duas partes de igual efetivo
e). O que é a classe mediana? é a classe que contém a mediana
f). O que são os Quantis? Quartis? Decis? Percentis? Quantis é uma família de medidas estatísticas que dividem a distribuição de valores em partes de igual efetivo. Quartis em 4 partes; Decis em 10 partes; Percentis em 100 partes.

3. Medidas de dispersão absoluta: amplitudes e desvios

Defina:

a). Amplitude total:  é a diferença entre os valores extremos de uma distribuição.
b). Intervalo de Kelley: é a diferença entre o nono e o primeiro decil.
c). Amplitude interquartil: é a diferença entre o terceiro e o primeiro quartil.
d). Desvio médio: é a média aritmética dos módulos dos desvios de cada valor à média do conjunto dos valores.
e). Variância: é a média aritmética do quadrado dos desvios.
f). Desvio padrão: é a raiz quadrada da variância

4. Medidas de dispersão relativa

a). Coeficiente de variação (CV): relaciona o desvio padrão com a média (cv=desvio padrão / média)
b). Coeficiente Interquartil (CIQ): relaciona a amplitude interquartil com a mediana ou 2º quartil (ciq=aiq/q2)

5. Diga o que entende por:

a). Marca da classe: (Limite superior + Limite inferior) / 2
b). Amplitude da classe: (Limite superior – Limite inferior)
c). Efetivo da classe: número de indivíduos que a classe contém

6. Etapas do processo de investigação

1 - A pergunta de partida
2 - A exploração
3 - A problemática
4 - A construção do modelo de análise
5 - A observação (ou recolha da informação)
6 - A análise das informações
7 - As conclusões


sexta-feira, 6 de novembro de 2015

Descrição da informação: medidas de concentração - Curva de Lorenz e Índice de Gini (2015-2016)


Análise: A Curva de Lorenz é a representação gráfica que compara a desigualdade entre duas variáveis. Nestes gráficos podemos ver que na empresa A a maior desigualdade é com os 70% trabalhadores e 45% de massa salarial e na empresa B é com 50% dos trabalhadores e 20% de massa salarial.
 O Índice de Gini é uma medida de concentração que mede o grau de desigualdade existente na repartição de um atributo pelos indivíduos, ou seja, quanto mais perto do zero o Índice de Gini estiver mais justa é a empresa. Sendo neste caso a empresa A.

sexta-feira, 30 de outubro de 2015

D26





Descrição da informação: medidas de tendência central, dispersão e forma. Cálculo com utilização do SPSS e Excel (2015-2016)

População residente na AML, 2008




Análise: Ao compararmos os valores, vemos que se apresentam menor valor nos homens e um valor superior nas mulheres.
Apenas o erro de assimetria padrão e o erro de curtose padrão apresenta valores idênticos para ambos os sexos. 
Ou seja vemos que existe mais mulheres a viver na AML em 2008.

sexta-feira, 23 de outubro de 2015

Pirâmide etária (2015-2016)



Análise: Neste gráfico observo que existe uma predominância de adultos em que se sobressai a idade de 30-34 anos tanto nos homens com nas mulheres tendo valores aproximados.Podemos também observar que a esperança media de vida nas mulheres e maior do que nos homens, onde existe uma predominância de mulheres a partir da idade 70-74 até aos 80-84.

Tabela de cruzamento de variáveis (cross-tabulation) (2015-2016)


Análise: Observando este tabela denoto que no total de 30 pessoas existe 8 com 18 anos e têm alturas compreendidas entre os 1,75m e 1,81m e com 19 anos existem 5 pessoas das quais 2 com 1,79m e 3 com 1,80m.
Olhando agora para a altura vemos que a que se destaca é a de 1,79m e que sao 10 pessoas em 30.

sexta-feira, 16 de outubro de 2015

Tabela de frequências (2015-2016)


















Análise: De acordo com esta tabela de frequência relativa à idade, podemos verificar que as idades variam entre os 18 e aos 27 anos.
No que diz respeito à coluna da frequência absoluta simples podemos verificar que temos 8 pessoas com 18 anos, sendo este o maior valor num total de 30 pessoas, como consequentemente na frequência relativa simples esta idade tem 26,7% que é também o maior valor.
Na frequência absoluta acumulada temos 18 pessoas com idade igual ou inferior a 20 anos que é logo 60% da população.

sexta-feira, 9 de outubro de 2015

Questionário sobre a utilização das redes sociais ...

O questionário - "Utilização das Redes Sociais" tem como objetivo recolher informação sobre a utilização das redes sociais pelo/as estudantes do IGOT, em 2015.

Este questionário é elaborado no âmbito das atividades da unidade curricular "Metodologias de Análise de Dados", do 1º ano, da Licenciatura em Geografia e da Licenciatura em Planeamento e Gestão do Território, no ano letivo de 2015-2016.

A sua resposta será tratada de forma anónima.

Para responder ao questionário prima aqui: Questionário Redes Sociais - IGOT (até 31 de dezembro de 2015).

Fontes estatísticas



Repositórios científicos

RCAAP - Repositório Científico de Acesso Aberto de Portugal



Bibliotecas


Biblioteca Nacional

Biblioteca do IGOT e Biblioteca da Faculdade de Letras de Lisboa

Arquivo Municipal de Lisboa

Página Web e Blogue da unidade curricular "Metodologias de Análise de Dados" (MAD), 2015-201


Bibliografia complementar, 2015-2016

Albarello, Luc et al. (1997). Práticas e métodos de investigação em Ciências Sociais.Gradiva, Lisboa.
Bassett, Elizabeth H.; O’Riordan, Kate (2002). Ethics of Internet research: Contesting the human subjects research modelEthics and Information Technology 4: 233–247.
Bell, J. (2004). Como realizar um projecto de investigação. Gradiva, Lisboa.
Blanke, Jordan M. (2004). Copyright law in the digital age. In Brennan, Linda L.; Johnson, Victoria E. - Social, Ethical and Policy Implications of Information Technology. Information Science Publishing, Londres, pp. 223-233.
Buchanan, Elizabeth (Ed.) (2004). Readings in Virtual Research Ethics: Issues and controversiesInformation Science Publishing, Londres.
Burguess, R. (1997). A pesquisa de terreno. Uma introdução. Celta Editora, Oeiras.
Capurro, Rafael; Pingel, Christoph (2002). Ethical issues of online communication research. Ethics and Information Technology 4: 189–194.
Clark; W.; Hoskins, P. (1986). Statistical methods for geographersJohn Wiley & sons, Nova Iorque.
Coelho, J.; Cunha, L.; Martins, I. (2008). Inferência estatística. Com utilização do SPSS e G*power. Edições Sílabo, Lisboa.
Cohen, L.; Holliday, M. (1996). Practical statistics for studentsPaul Chapman Publishing, Londres.
Cronan, J. (2007). Microsoft Office Excel 2007 em imagens. McGrawHill, Lisboa.
Dever, Jill; Rafferty, A.; Valliant, R. (2008) – Internet survey: can statistical adjustments eliminate coverage bias? Survey Research Methods, vol. 2 (2): 47-60.
D'Hainault, L. (1990). Conceitos e métodos da Estatística. Fundação Calouste Gulbenkian, Lisboa.
Elgesem, Dag (2002). What is special about the ethical issues in online research? Ethics and Information Technology 4: 195–203.
Estebanez  Alvarez, J.; Bradshaw, R. P. (1979). Técnicas de cuantificación en Geografía.Ed. Tebar Flores, Madrid.
Fine, Gary A. et al. (1988). Knowing children. Participant observation with minors. Sage Publications, Londres.
Finkelstein, Ellen (2003). How to do everything with Microsoft Office PowerPoint.McGraw-Hill, Nova Iorque.
Foddy, W. (1993). Como perguntar. Teoria e prática da construção de perguntas em entrevistas e questionáriosCelta Editores, Oeiras.
Frankfort-Nachmias, C.; Nachmias, D. (2000). Research Methods in the Social Sciences. Worth Publishers, Nova Iorque (6ª ed.).
Ganassali, Stéphane (2008). The influence of the design of web survey questionnaires on the quality of responses. Survey Research Methods, vol. 2 (1): 21-32.
Glasser, Dara J.; Goodman, Kenneth W.; Einspruch, Norman G. (2006). Chips, tags and scanners: Ethical challenges for radio frequency identification. Ethics and Information Technology (2007) 9:101–109.
Groupe Chadoule (1994). Initiation aux pratiques statistiques en Géographie. Masson, Paris (3ªed.).
Gumuchian, H.; Marois, C. (2000). Initiation à la recherche en géographieAnthropos, Paris.
Hambridge, Sally (1995). Netiquette guidelines. IETF - The Internet Engineering Task Force.
Jansen, Bernard J. (2008). Searching for digital images on the web. Journal of Documentation, vol. 64(1): 81-100.
Jansen, Bernard J.; Spink, Amanda; Saracevic, Tefko (2000). Real life, real users, and real needs: a study and analysis of user queries on the web. Information Processing and Management, 36, 207-227.
Laureano, Raul M. S. (2011). Testes de Hipóteses com o SPSS – O Meu Manual de Consulta RápidaEdições Sílabo, Lisboa.
Laureano, Raul M. S.; Maria Botelho (2010). SPSS, O meu manual de consulta rápida. Edições Sílabo, Lisboa.
Lavrakas, P. (2008). Encyclopedia of Survey Research Methods2 vols., Sage, Washington.
Lee, Thomas W. (1999). Using qualitative methods in organizational research. Sage Publications, Londres.
Lessard-Hébert, Michelle et al. (1997). La recherché qualitative. Fondements et pratiques. DeBoeck Université, Paris.
Levin, J. (1987). Estatística aplicada a Ciências Humanas. Harper & Row, São Paulo, 2ªed.
Limb, M.; Dwyer, C. (Eds.) (2001). Qualitative Methodologies for Geographers. Issues and debates. Arnold, Londres.
Lindsay, J. (1997). Techniques in Human Geography. Routledge, Londres.
Marshall, Catherine et al. (2006). Designing qualitative research. Sage Publications, Londres.
Matthews, Carole (2007). Microsoft Office PowerPoint 2007 em imagensMcGrawHill, Lisboa.
May, Tim (1998). Social research. Issues, methods and process. Open University Press, Buckingham
McGrew, J.; Monroe, C. (2000). An introduction to statistical problem solving in Geography. McGraw-Hill, Boston.
Melville, Rose (2007). Ethical dilemmas in online research. In Ari-Veikko Anttiroiko e Matti Malkia (Eds). Encyclopedia of Digital Government. Idea Group Publishing, Hershey PA, pp. 734-739.
Moreira, António C.; Pedro Macedo, Maria L. Costa, Victor Moutinho (2011).Exercícios de Estatística – Com Recurso ao SPSS. Edições Sílabo, Lisboa.
Mucchielli, Alex (dir.) (1996). Dictionnaire dês méthodes qualitatives en sciences humaines et socialesArmand Colin, Paris.
Oliveira, P. (2008). Excel Office 2007. Porto Editora, Porto.
Pereira, Alexandre; Poupa, Carlos (2004). Como apresentar em público teses, relatórios, comunicações usando o PowerPoint. Edições Sílabo, Lisboa.
Pereira, Alexandre; Poupa, Carlos (2006). Como escrever uma tese, monografia ou livro científico usando o Word. Edições Sílabo, Lisboa (3ª edição).
Pinto, R. (2009). Introdução à análise de dados com recurso ao SPSSEdições Sílabo, Lisboa.
Porter, Stephen; Whitcomb, Michael (2005). E-mail subject lines and their effect on web survey viewing and responseSocial Science Computer Review, vol. 23 (3): 380-387.
Reis, E. (2000). Estatística descritiva. Edições Sílabo, Lisboa.
Robalo, M. (2008). Tabelas estatísticas. Edições Sílabo, Lisboa.
Robinson, G.M. (1998). Methods and Techniques in Human Geography. Wiley, Chichester.
Rose, D.; Sillivan, O. (1996). Introducing data analysis for social scientists (2ªed.). Open University Press, Buckingham.
Santo, Paula do Espírito (2010). Introdução à Metodologia das Ciências Sociais. Génese, Fundamentos e Problemas. Edições Sílabo, Lisboa.
Sheppard, Stephen R.J.; Petr Cizek (2009). The ethics of Google Earth: Crossing thresholds from spatial data to landscape visualisation. Journal of Environmental Management 90: 2102–2117.
Silva, Carlos Nunes (2007). Urban Planning and Ethics. In Rabin, Jack and Berman, Evam M. (Ed.) - Encyclopedia of Public Administration and Public Policy. 3 volumes, CRC Press / Taylor & Francis Group, Nova Iorque, 2ª ed.
Silva, Carlos Nunes (2008). Experimental Design. In Lavrakas, Paul (ed.) Encyclopedia of survey research methods. Sage, Thousand Oaks, vol.1.
Silva, Carlos Nunes (2008). Research ethics in e-public administration. In Garson, G. David; Khosrow-Pour, Mehdi (Eds.). Handbook of Research on Public Information Technology. Information Science Reference, Nova Iorque, vol. I, pp. 314 – 322.
Silvestre, A. (2007). Análise de dados e estatística descritiva. Escolar Editora, Lisboa.
Singly, François de (1992). L’ Enquête et ses méthodes: Le questionnaire. Éditions Nathan, Paris.
Sousa, F. (1995). História da Estatística em Portugal. Instituto Nacional de Estatística, Lisboa.
Spinello, Richard (2003). The future of intellectual property. Ethics and Information Technology 5: 1-16.
Urbano, Magno (2008). Google. Guia de consulta rápida. Lisboa: FCA – Editora de Informática (3ª ed.).
Vilelas, José (2009). Investigação – O Processo de Construção do Conhecimento.Edições Sílabo, Lisboa.
AAG (2009). Statement on Professional Ethics. Association of American Geographers.
ASA (1999). Ethical Guidelines for Statistical Practice. American Statistical Association
AAAS (1999). Ethical and legal aspects of human subjects research on the Internet. American Association for the Advancement of Science, Washington. [http://www.aaas.org/spp/sfrl/projects/intres/report.pdf]
International Center for Information Ethics (Center for Art and Media, Karlsruhe)
Singapore Statement on Research Integrity (2010).