<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet href="http://valley.egloos.com/rss/style/style.xsl" type="text/xsl" media="screen"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
	<channel>
		<title>이글루스 'r' 태그 최근글</title>
		<link>http://valley.egloos.com/tag/r</link>
		<description>r</description>
		<language>ko</language>
		<pubDate>Tue, 07 Feb 2012 19:54:19 +0900</pubDate>
		<generator>Egloos</generator>
		<item>
	<title><![CDATA[g]]></title>
	<link>http://ehdzlehsjt.egloos.com/459297</link>
	<guid>http://ehdzlehsjt.egloos.com/459297</guid>
	<description>
	<![CDATA[ 
g	]]>
	</description>
	<pubDate>Tue, 07 Feb 2012 19:54:19 +0900</pubDate>
	<dc:creator><![CDATA[태민]]></dc:creator>
</item>
<item>
	<title><![CDATA[유용한 R function]]></title>
	<link>http://jihea0122.egloos.com/5628414</link>
	<guid>http://jihea0122.egloos.com/5628414</guid>
	<description>
	<![CDATA[ 
평균 : mean()두 그룹 사이 중복되는 String 찾기 : intersect()Fold Change      Package : DEDS     Function : Comp.FC()          두 array group 사이의 FC구할 때 사용.     log값과 아닌 값 두개 모두 적용 가능.     단, original 값으로 할 시, 평균을 나누기 때문에 up, down 구별이 안됨 -&amp;gt; 개인이 따로 수정해야함.string 합치기 : paste(str, sep=&quot;-&quot;)work space 저장 : save.image()work sapce 불러오기 : load()color 종류 확인 : colors()String 종류별 count 정리 : table()	]]>
	</description>
	<pubDate>Fri, 03 Feb 2012 14:51:35 +0900</pubDate>
	<dc:creator><![CDATA[jihea0122]]></dc:creator>
</item>
<item>
	<title><![CDATA[계수초등학교 학예회 (2011년) - 3]]></title>
	<link>http://tourace1.egloos.com/10809014</link>
	<guid>http://tourace1.egloos.com/10809014</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds23.egloos.com/pds/201111/22/78/a0113278_4ecb09e37731e.jpg"  
				alt="계수초등학교 학예회 (2011년) - 3" 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/>                                                                                                 	]]>
	</description>
	<pubDate>Tue, 22 Nov 2011 11:36:27 +0900</pubDate>
	<dc:creator><![CDATA[자비랑]]></dc:creator>
</item>
<item>
	<title><![CDATA[명절은 사랑을 싣고]]></title>
	<link>http://jinniey.egloos.com/5544495</link>
	<guid>http://jinniey.egloos.com/5544495</guid>
	<description>
	<![CDATA[ 
제 인생, 한국에서 보내는 마지막 추석이 될 듯합니다.  그러나 제 사촌언니들은 다들 시댁덕후고 [그럴리 없는거 아시리라 믿습니다. 그냥 시댁가 있는 거지요...] 사촌오빠들이랑 할일없이 저는 pc방에 와있지요.  그렇습니다, 저 제목은 반어법?!ㅋㅋㅋㅋㅋㅋ    저희 가족이 딱히 애정이 없는 건 아닌데, 남은게 죄다 오빠들 뿐이고 저는 사촌들중 막내인지라 이런 명절을 매번 보내고 있습니다;;  여자사촌들은 저 말곤 다들 결혼하고 애도 있고 ;ㅁ; 핡! 남자들도 그래서 남은건 저랑 제 동생뿐이네요. 그래서 허구헌날 사촌오라방들이랑 PC방에서 노닥이다가 찜질방에서 잠들고 제사 고고씽 - 귀가 의 스케쥴일색입니다.  찜질방에서 새벽라면에 칙힌드링킹!!!!!!! 아니면 사실 집에서 새언니들+어른들 틈바구니 인데,	]]>
	</description>
	<pubDate>Mon, 12 Sep 2011 00:31:52 +0900</pubDate>
	<dc:creator><![CDATA[귤대구의 맛 S03 in Korea]]></dc:creator>
</item>
<item>
	<title><![CDATA[RHadoop - Integrating hadoop and R]]></title>
	<link>http://monetary.egloos.com/3730163</link>
	<guid>http://monetary.egloos.com/3730163</guid>
	<description>
	<![CDATA[ 
RHadoop는 3개의 R패키지로 구성되어 있습니다. 이 패키지를 통해 R사용자는 Hadoop으로 데이터를 관리하거나 분석할 수 있습니다. 현재 패키지들은 CDH3(Cloudera's distribution of Hadoop)과 R 2.13.0 버전에서 구현되어 테스트되었습니다.    [세부 패키지]rmr - R에서 Hadoop MapReduce 기능을 제공하는 함수들rhdfs - R에서 HDFS 파일 관리를 하기 위해 제공되는 함수들rhbase - R에서 분산 데이터베이스 HBase를 이용하기 위해 제공되는 함수들    [GitHub 링크] https://github.com/RevolutionAnalytics/RHadoop/wiki    	]]>
	</description>
	<pubDate>Thu, 08 Sep 2011 13:19:39 +0900</pubDate>
	<dc:creator><![CDATA[묵호칼치]]></dc:creator>
</item>
<item>
	<title><![CDATA[계수초등학교 야영 (2)]]></title>
	<link>http://tourace1.egloos.com/10750225</link>
	<guid>http://tourace1.egloos.com/10750225</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds21.egloos.com/pds/201107/26/78/a0113278_4e2e0881aac03.jpg"  
				alt="계수초등학교 야영 (2)" 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/>                                                             	]]>
	</description>
	<pubDate>Tue, 26 Jul 2011 09:25:30 +0900</pubDate>
	<dc:creator><![CDATA[자비랑]]></dc:creator>
</item>
<item>
	<title><![CDATA[비모수검증(non-parametric tests)(2) : Wilcoxon &amp; Kruskal-wallis test]]></title>
	<link>http://bayes.egloos.com/2796184</link>
	<guid>http://bayes.egloos.com/2796184</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds19.egloos.com/pds/201106/25/68/f0077068_4e057613184f2.jpg"  
				alt="비모수검증(non-parametric tests)(2) : Wil.." 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 이번 연재를 끝으로 계획된 연재는 모두 마치게 되었다. 아마 이제부터는 쓴다면 bayesian statistics위주로 쓰지 않을까 싶지만, ANCOVA나 Logistic Regression같이 좀 더 advanced 기법에 대해 대해서도 소개하게 될 것이다. 처음에 연재를 시작했을 때는 무사히 마칠 수 있을지 의문이 들었는데, 무사히 마치게 되어서 다행이다.     스피어만 상관계수를 계산할 때 데이터의 순위를 매겨서 계산하였다. Wilcoxon 순위합검정/부호순위검정도 이러한 방식을 사용한다. 단 통계에서는 순위를 매길 때 오름차순으로 매기며, 따라서 순위가 클수록 높은 순위임을 잊지 말자. 윌콕슨 순위합검정은 two-sample인 경우의 t-test에 해당되는 비모수적 방법인데, 두 집단을 비교할 때 	]]>
	</description>
	<pubDate>Sat, 25 Jun 2011 15:11:07 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[비모수검증(non-parametric tests)(1) : 카이제곱 독립성검증]]></title>
	<link>http://bayes.egloos.com/2796169</link>
	<guid>http://bayes.egloos.com/2796169</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds21.egloos.com/pds/201106/25/68/f0077068_4e0571ddcc32c.jpg"  
				alt="비모수검증(non-parametric tests)(1) : .." 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 연재가 끝을 향해 달리고 있다. 물론 연재가 끝난 뒤에도 이런저런 더 세부적인 주제들을 추가로 다루게 될 것이다. 아무튼 지금부터 다루게 될 내용은 비모수검증 절차들이다. 비모수검증 절차는 모수치에 대한 가정을 세우지 않고, 우리가 획득한 데이터 안에서만 분석을 하는 절차이다. 따라서 모수적 검증절차들이 갖고 있는 여러 가지 문제점들을 피할 수 있다. 예를 들면 독립표본 t-test는 세 가지 중요한 가정을 하는데 그것들은 정규성, 독립성, 등분산성이다. 하지만 이러한 가정들이 언제나 충족되는 것은 아니며, 때로 이러한 위반은 심각한 왜곡을 초래할 수 있다. 비모수검증은 이러한 가정들 대신 '측정 척도가 등간척도 이상일 것' 과 같은 최소한의 가정만을 함으로써 이러한 문제를 피하게 해 준다. 하지만 모수적 	]]>
	</description>
	<pubDate>Sat, 25 Jun 2011 14:30:50 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[회귀분석(4) : 더미변수와 대비계수를 이용한 ANOVA의 후속검증]]></title>
	<link>http://bayes.egloos.com/2796160</link>
	<guid>http://bayes.egloos.com/2796160</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds22.egloos.com/pds/201106/25/68/f0077068_4e055f500aaa7.jpg"  
				alt="회귀분석(4) : 더미변수와 대비계수를 이용한 AN.." 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 앞서 ANOVA에서 후속검증에 대해 다룰 때, 회귀분석을 아직 다루지 않았기 때문에 planned comparison은 다루지 못한다고 하였다. 이제 그것을 마무리지을 때가되었다. 사실 이것은 회귀분석을 통해 이루어지는데, 구체적으로는 하나의 준거집단(reference group)이 있고, 각각의 집단을 이것과 비교하게 된다. 일단 이 작업을 하려면 더미코딩에 대해 이해해야 한다. 더미코딩이란 집단을 나타내는 변수를 (일반적으로)논리형 값을 주어 코딩하는 것을 말하는데, 더미코딩의 대표적인 예로는 성별이 있다. 남성을 0, 여성을 1로 코딩한다거나 거꾸로 할 수도 있다. 하지만 아노바에서는 셋 이상의 집단을 다루는데, 어떻게 더미 변수로 코딩을 한다는 말인가? 그것은 여러 개의 변수를 사용함으로써 해결 가능	]]>
	</description>
	<pubDate>Sat, 25 Jun 2011 14:06:52 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[회귀분석(3) : 중다회귀분석(Multiple regression)]]></title>
	<link>http://bayes.egloos.com/2795807</link>
	<guid>http://bayes.egloos.com/2795807</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds18.egloos.com/pds/201106/24/68/f0077068_4e047bdad3d89.jpg"  
				alt="회귀분석(3) : 중다회귀분석(Multiple regressi.." 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 이번에 다룰 내용은 중다회귀분석이다. 이것과 단순회귀의 가장 큰 차이는 역시 중다회귀는 예측변수를 두 개 이상 사용한다는 것이다.그 외에 큰 차이는 없다. 바로 해 보도록 하자. 예제 데이터부터 생성하겠다.    a는 종속변수로, b,c,d는 예측(독립)변수로 사용할 것이다. 그    이제 모형을 만들어보자. 이 모형은 상호작용은 고려하지 않는 모형이다. 요령은 ANOVA의 경우와 비슷하게 하면 된다. + 로 변수들을 이어주면 상호작용을 고려하지 않는 모형을 만들어 준다.    중다회귀에서는 한 가지 중요한 가정에 대한 테스트를 해 주어야 한다. 그것은 공선성(collinearity) 검사이다. 공선성이란 예측변수들 간에 상관이 높은 경우를 말하는데, 이런 경우에는 분석이 잘 되지 않는다. (다중)공선성을 	]]>
	</description>
	<pubDate>Fri, 24 Jun 2011 21:20:51 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[회귀분석(2) : 모형의 진단(잔차 보기)]]></title>
	<link>http://bayes.egloos.com/2795782</link>
	<guid>http://bayes.egloos.com/2795782</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds18.egloos.com/pds/201106/24/68/f0077068_4e0468970f7b9.jpg"  
				alt="회귀분석(2) : 모형의 진단(잔차 보기)" 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 회귀분석은 가정이 많이 필요한 절차인데 흔히 이러한 가정들이 위배된다. 따라서 이를 진단하고 적절한 처치를 하는 것이 필요하다. 이 포스팅에서는 학부 수준에서 쉽게 할 수 있는 잔차분석을 다루겠다. (사실 이것보다 해야할 것이 더 많은데, 필자의 역량 부족으로 인해 다 하지는 못할것 같다. ㅜㅜ) 회귀분석은 잔차에 대해     1)잔차의 평균은 0  2)잔차들의 분산은 동일함  3)잔차에 자기상관이 없음  4)잔차는 독립변수와 (선형)독립임  5)잔차는 평균이 0인 정규분포를 따름    의 가정을 하고 있는데, 이번에는 일부만 다루겠다. 일단 잔차 도표를 그리는 방법에 대해 알아보자. 이를 통해 간단하게 이상점에 대해 알아볼 수 있다. 그 전에 lm()모형을 저장한 변수 안에는 어떤 것들이 있는지 알아보자.	]]>
	</description>
	<pubDate>Fri, 24 Jun 2011 20:37:37 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[회귀분석(1): 단순회귀(Simple Regression)]]></title>
	<link>http://bayes.egloos.com/2795748</link>
	<guid>http://bayes.egloos.com/2795748</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds21.egloos.com/pds/201106/24/68/f0077068_4e046495a0d2c.jpg"  
				alt="회귀분석(1): 단순회귀(Simple Regression)" 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 앞의 포스팅인 상관분석에서는 두 변수의 값이 같은 방향으로 또는 반대 방향으로 얼마나 같이 변하는지만을(공변하는지를)검증했으며 하나의 변수가 다른 변수에 영향을 끼치는지에 대해서는 검증하지 않았다. 이보다 조금 더 인과모형에 가까운 것이 회귀분석이다. 회귀분석에서는 predictor와 종속변수가 뚜렷이 규정된다. (하지만 이것이 인과성을 반드시 보장해주는 것은 아니다. 상관분석과 마찬가지로 인과의 방향, 제3의 변인 등의 문제가 있다. 인과성은 잘 통제된 실험 절차를 통해서 엄밀하게 검증될 수 있다) 예측변수가 하나인 경우에는 단순회귀(Simple regression)라 부르며 여럿인 경우에는 중다회귀(Multiple regression)이라 부른다. 하지만 단순회귀는 중다회귀의 predictor가 하나인 	]]>
	</description>
	<pubDate>Fri, 24 Jun 2011 19:29:35 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[상관분석]]></title>
	<link>http://bayes.egloos.com/2795739</link>
	<guid>http://bayes.egloos.com/2795739</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds22.egloos.com/pds/201106/24/68/f0077068_4e0460299e04a.jpg"  
				alt="상관분석" 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> 상관연구는 보통 실험 연구보다는 관찰 연구에서 주로 쓰이는 방식이다. 관찰된 두 변수 사이에 어떤 관계가 있는지를 알고 싶을 때 주로 사용하는 절차인데, 상관연구는 두 변인이 함께 정적인(+)방향으로 움직이는지, 그렇지 않고 반대 방향(-)으로 움직이는지를 알려 주지만 어느 변수가 독립변수(예측변수)이고, 어느 변수가 종속변수(반응변수)인지를 알려주지는 않는다. 따라서 상관연구를 함에 있어서는 양 또는 음의 상관으로부터 인과관계를 직접 도출하는 것은 가급적 삼가야 한다. 인과성이 어떤 방향인지 정확히 알기 힘들 뿐 아니라 제 3의 변수가 두 변수 모두에 영향을 미치고 있을 가능성도 있기 때문이다. 예를 들어 아이스크림 판매량과 에어컨 판매량은 아마도 정적인 상관을 보일 것이다. 하지만 아이스크림이 많이 팔리	]]>
	</description>
	<pubDate>Fri, 24 Jun 2011 19:11:46 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[ANOVA(5) : Mixed design ANOVA]]></title>
	<link>http://bayes.egloos.com/2794954</link>
	<guid>http://bayes.egloos.com/2794954</guid>
	<description>
	<![CDATA[ 
 이번 연재가 ANOVA 연재의 마지막이다. 이번에 다룰 내용은 참가자-간 요인(between-subject factor)과 참가자-내 요인(within-subject factor)가 모두 있는 연구 설계의 경우에 ANOVA를 하는 방법이다. 이런 설계를 mixed design이라고 하며 가끔 논문에서 볼 수 있다.특히 이런 유형의 연구는 상호작용의 해석에 있어서 주의를 기울여야 한다. mixed design은 흔히 3개 이상의 요인을 포함하는데, 3-way 또는 4-way interaction을 해석하는 것이 생각보다 만만한 작업이 아니다. 이번 포스팅에서는 간결성을 위해 두 개의 요인만을 포함하지만, 이렇게 많은 요인들 사이에 상호작용이 있다면 follow-up study가 여간 힘든 게 아니다. 이번 포	]]>
	</description>
	<pubDate>Thu, 23 Jun 2011 10:55:19 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
<item>
	<title><![CDATA[ANOVA(4) : Repeated measure ANOVA(반복측정 디자인)]]></title>
	<link>http://bayes.egloos.com/2794940</link>
	<guid>http://bayes.egloos.com/2794940</guid>
	<description>
	<![CDATA[ 
<img 
				src="http://thumb.egloos.net/100x76/http://pds20.egloos.com/pds/201106/23/68/f0077068_4e02848717bb8.jpg"  
				alt="ANOVA(4) : Repeated measure ANOVA(.." 
				width="100px"  
				height="76pxpx"
				align="left"
				style="border:1px solid #DDDDDD;margin:0 10px 10px 0px;"
				/> (주의 : 이 내용부터는 학부 수준을 넘어서는 것이므로 학부생들은 이 포스팅부터 mixed design ANOVA까지는 굳이 볼 필요까지는 없다. 하지만 내용의 완결성을 위해서 올린다. 앞으로 하게 될 실습 및 연구를 위해서나 반복측정 및 mixed design ANOVA까지는 보아두면 더욱 좋다. 따라서 이후로 올리게 될 ANOVA 관련 포스팅도 봐 둘 것을 권하는 바임.)    실험 연구를 할 때 흔히 한 참가자로부터 시간 간격을 두고 반복적으로 데이터를 획득하게 된다. 특히 임상 장면이나 발달심리 연구와 같은 경우에는 한 참가자에게서 시간의 흐름에 따라 반복적으로 데이터를 수집하게 되는 경우가 많다. 이를 종단연구(longitudinal study)라 보통 부르는데, 이렇게 한 참가자에게 계속 데이터를	]]>
	</description>
	<pubDate>Thu, 23 Jun 2011 09:34:06 +0900</pubDate>
	<dc:creator><![CDATA[Psychology &amp;amp; Statistics]]></dc:creator>
</item>
	</channel>
</rss>

