#title Data Analysis [[TableOfContents]] 통계 패키지는 R을 사용한다. ==== 기본 ==== * [분석] ==== 데이터 준비 ==== * [Vector] * [Data Frame] * [데이터 수집] * [JDBC 연동](Hive, Tajo) * [String 처리] * [병렬 처리] * [파일 처리] * [Sampling] * [Encoding] * [R의 기능들] * [sqldf] * [dplyr] * [R Tips] * [Regular Expressions] * [RHive] * [http://www.r-bloggers.com/complex-tables-exercises/ Complex Tables – Exercises] * [https://www.r-bloggers.com/image-convolution-in-r-using-magick/ Image Convolution] * [https://spark.rstudio.com sparklyr R interface to Apache Spark] * [DataExplorer package] ==== 탐색 ==== * [4-plot] * [Outlier Detection] * [변수 변환] * [푸리에 변환] * [변곡점(inflection point)] * [기술통계량] * [Histogram] * [지니계수] * [runFun] * [변수의 중요도 탐색] * [주성분분석] * [변수간의 상관정도에 대한 분석] -> 상관분석 * [공분산과 상관계수], [상관분석] * [관리도] * [고유벡터인지 판별하는 함수] * [라플라스 보정] * [확률분포 적합성] * [https://real-statistics.com REAL STATISTICS USING EXCEL] * [http://www.r-bloggers.com/exploring-recursive-ctes-with-sqldf/ Exploring Recursive CTEs with sqldf] * [dbplyr] * [변수선택] ==== 가설 검정 ==== * [비율에 대한 검정] * [카이제곱 검정] * [평균의 차이에 대한 검정](t검정, 분산분석) * [중앙값 차이에 대한 검정] * [분산의 차이에 대한 검정] * [런검정] * [분포 동일성 검정] * [경향(Trend) 검정] * [Bonferroni correction] * [Error propagation] * [검정력] * [표본크기] * [효과크기] ==== 회귀 ==== * [회귀분석] --> 시간에 따라 변화하는 데이터나 가설적 실험, 어떤 영향, 인과관계의 모델링 등의 통계적 예측에 사용 * [비선형 회귀분석] * [로지스틱 회귀분석] -> 사망/생존과 같은 0 또는 1의 값을 종속변수 예측에 사용 * [Beta regression] * [Poisson regression] * [로버스트 회귀분석] * [Quantile regression] * [Piecewise linear regression] * [http://www.uni-kiel.de/psychologie/rexrepos/posts/regressionOrdinal.html Ordinal regression] * [위계선형모델] * [일반화 가법 모형] * [생존분석] * [Error] * [평균의 구간추정]([구간추정]) * [Curve Fitting] * [http://www.karlin.mff.cuni.cz/~kulich/vyuka/pokreg/index.html Advanced Regression Models] ==== 군집 ==== * [K-Medoids Clustering] * [K-Means Clustering] * [Sequence Clustering] * [Hierarchical Clustering] * [SOM] * [http://manuals.bioinformatics.ucr.edu/home/R_BioCondManual#TOC-Clustering-and-Data-Mining-in-R Clustering and Data Mining in R] * [http://stackoverflow.com/questions/15376075/cluster-analysis-in-r-determine-the-optimal-number-of-clusters Cluster analysis in R: determine the optimal number of clusters] * [Similarity] * [Burstiness] * [https://www.r-bloggers.com/clustering-mixed-data-types-in-r/ Clustering Mixed Data Types in R] * [https://dabblingwithdata.wordpress.com/2016/10/10/clustering-categorical-data-with-r/ Clustering categorical data with R] * [DBSCAN - R버전] ==== 분류 ==== * [분류기 예제] --> 분류 알고리즘에 대한 개념만 있으면, 이 문서만 봐도 된다. * [Decision Tree] * [http://www.r-bloggers.com/comparing-tree-based-classification-methods-via-the-kaggle-otto-competition/ Comparing Tree-Based Classification Methods via the Kaggle Otto Competition] * [랜덤포레스트] * [조건트리] * [판별분석] * [CART] * [Naive Bayes] * [Neural Network] * [Support Vector Machines] * [k-Nearest Neighbors] * [AUC] * [Confusion Matrix] * [http://www.r-bloggers.com/learning-kernels-svm/ Learning Kernels SVM] * [https://www.r-bloggers.com/r-tensorflow-deep-neural-network/ R TensorFlow Deep Neural Network] ==== 시퀀스 패턴 ==== * [연관성 분석] * [Markov Chains] * [http://cran.r-project.org/web/packages/rEMM/vignettes/rEMM.pdf Extensible Markov Model for Data Stream Clustering in R] * [https://cran.r-project.org/web/packages/TraMineR/TraMineR.pdf TraMineR] --> {{{Trajectory Miner: a Toolbox for Exploring and Rendering Sequences}}} * http://traminer.unige.ch/doc/seqdist.html * [Parallel Coordinates Plot] * [https://velog.io/@emplam27/%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%EA%B7%B8%EB%A6%BC%EC%9C%BC%EB%A1%9C-%EC%95%8C%EC%95%84%EB%B3%B4%EB%8A%94-LCS-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-Longest-Common-Substring%EC%99%80-Longest-Common-Subsequence 그림으로 알아보는 LCS 알고리즘 - Longest Common Substring와 Longest Common Subsequence] ==== 최적화 ==== * [Linear Regression] * [선형 계획법] * [http://zoonek.free.fr/blosxom/R/2012-06-01_Optimization.html Optimization] * [구조방정식] * [요인분석] * [정준상관분석] -> 변수집단간의 상관분석 * [Conjoint Analysis] * [http://www.r-bloggers.com/on-nested-models/ On Nested Models] * [https://mattmazur.com/2015/03/17/a-step-by-step-backpropagation-example/ A Step by Step Backpropagation Example] ==== 시각화 ==== * [https://bookdown.org/content/b298e479-b1ab-49fa-b83d-a57c2b034d49/ R Gallery Book] * [https://visjs.github.io/vis-network/examples/ visNetwork Example] * https://stackoverflow.com/questions/45722206/r-visnetwork-node-position-issue * [https://help.tableau.com/current/pro/desktop/ko-kr/story_best_practices.htm 좋은 스토리를 만드는 최상의 방법] * [https://www.makeovermonday.co.uk/gallery/ Makeover Monday] --> 태블로, 시각화 관련 볼거리가 많다. * [https://cran.r-project.org/web/packages/ggparty/vignettes/ggparty-graphic-partying.html ggparty: Graphic Partying] * [https://www.datisticsblog.com/2018/10/intro_easyalluvial/#introduction Data exploration with alluvial plots - An introduction to easyalluvial] * [http://rosuda.org/software/iPlots/ iPlots] * [https://www.r-bloggers.com/easyalluvial-0-2-0-released/ easyalluvial] * https://www.data-to-viz.com/ * [https://www.r-bloggers.com/ggpubr-create-easily-publication-ready-plots/ ggpubr: Create Easily Publication Ready Plots] --> 좋구나~ * [4-plot] * [Boxplot] * [Histogram] * [Scatter Plot] * [multiplot.R] * [R그래픽스-유용한 예제들] * [Plot Structure] * [R그래픽스] * [ggtree] * [R그래픽스-매개변수 참고] * [하나의 차트에 여러 그림 그리기] * [lattice] * [http://rgm3.lab.nig.ac.jp/RGM/R_image_list?page=1600&init=true R Graphical Manual] * [http://www.statmethods.net/advgraphs/parameters.html Graphical Parameters] * [https://code.google.com/p/google-motion-charts-with-r/wiki/GadgetExamples#googleVis_Examples googleVis 예제(익스플로러에서 봐라)] * [MotionChart] * [Google Sankey Chart with R] --> 시퀀스 * [트리형태의 그래프] * [gif로 여러 그림 합치기] * [error bar] * [시각화 관련 링크들] * locator() --> plot에다가 마우스 클릭 후 esc 키 누르면 x,y 포인트 값이 반환된다. * diagram package * [http://www.r-bloggers.com/adding-a-subtitle-to-ggplot2/ Adding a subtitle to ggplot2] * [http://www.r-bloggers.com/candlestick-charts-using-plotly-and-quantmod/ Candlestick charts using Plotly and Quantmod] * [https://www.r-bloggers.com/can-we-predict-flu-deaths-with-machine-learning-and-r/ Can we predict flu deaths with Machine Learning and R?] --> ggplot의 좋은 예제들이 많다. * [Colors] * [http://students.brown.edu/seeing-theory/ 시각화 가이드] * [자료 포락 분석(DEA)] * [팔레트] * [http://www.sqlservercentral.com/articles/R+Services/156107/ View R Plots from within SQL Server Management Studio] * [plot 파일로 내리기] ==== Bayesian, SNA, Time Series ==== * [Bayesian Statistic] * [Social Network Analysis] * [Time Series] * [https://www.r-bloggers.com/predictability-in-network-models/ Predictability in Network Models] ==== 라이브러리 & etc ==== * [한글깨짐] * [Angle] * [https://www.r-bloggers.com/shiny-crud/ Shiny CRUD] * [https://www.r-bloggers.com/september-2017-new-package-picks/ September 2017 New Package Picks] * [https://www.analyticsvidhya.com/blog/2017/02/top-28-cheat-sheets-for-machine-learning-data-science-probability-sql-big-data/ Top 28 Cheat Sheets for Machine Learning, Data Science, Probability, SQL & Big Data] * [https://www.r-bloggers.com/july-2017-new-package-picks/ July 2017 New Package Picks] * [Convolution] * [R Lib] * [http://www.r-bloggers.com/introducing-distributed-data-structures-in-r/ Introducing Distributed Data-structures in R] * [http://www.r-bloggers.com/a-first-look-at-distributed-r/ A first look at Distributed R] * [http://www.r-bloggers.com/5-new-r-packages-for-data-scientists/ 5 New R Packages for Data Scientists] * [https://www.rstudio.com/resources/cheatsheets/ Cheatsheets] * [Levenshtein Distance] * [몬테카를로법으로 원주율 구하기] * [유의확률] * [기준치와 편차치] * [체비셰프 정리] * [분위수 구간] * [이상치 제거 방법] * [모평균 검정] * [행렬의 분해] * [비/비율/율] * [Odds Ratio] * [Entropy] * [Binning] * [수량화법] * [고객 세분화 사례1] * [비모수통계] * [House of Quality] * [고객이탈] * [RFM Analysis] * [통계용어] * [LinkComm] * [R2HTML] * [RODBC] * [자료불러오기] * [자료다루기] * [출력내용 저장하기] * [문자열 찾기와 바꾸기] * [메타 프로그래밍] * [날짜 및 날짜의 loop] * [문자열로 데이터 프레임만들기] * [변수의 메타] * [R의 설치] * [Vector] * [Matrix] * [Simple manipulations(numbers and vectors)] * [Objects - their modes and attributes] * [Ordered and unordered factors] * [함수정리] * [패키지 인스톨] * [attachment:DataAnalysis/R_forSAS_SPSSproducts.pdf SAS, SPSS, R 함수 비교자료] * [R Graphic User Interface] * [t검정] - 평균의 차이에 대한 검정, [평균의 구간추정] (단일표본 T-검정), [두 표본집단의 평균 차이 검정] * [분산분석] - 평균의 차이에 대한 검정 * {{{R CMD BATCH --no-save --no-restore job.R}}} * [http://www.ciokorea.com/news/31889 머신러닝 프로젝트를 망치는 '6가지 흔한 실수'] ==== 통계 개요 ==== * [통계학이란 무엇인가] * [기술통계학I - 표와 그래프적 방법] * [기술통계학II - 수치적 방법] * [확률이론] * [CRISP-DM] * [통계 모델링 절차] * [비즈니스 분석에 있어서 가장 강력한 동인] * [불량 데이터의 8가지 증상] * [Customer-Ready를 실현하기 위한 7단계] * [Data-ready enterprise를 조직하는 방법] * [자유도] * [데이터와 정보] * [평균과 비율은 같은 같은 것] * [확률변수] ==== 확률 분포 ==== * [벤포드 법칙] * [감마분포] * [Maxwell-Boltzmann distribution] * [Beta distribution] * [정규분포로 확률구하기] * [T-SQL로 표준정규분포표 만들기] * [정규성 검정] * [정규분포 - 모분산과 모평균의 추정] * [확률분포 적합성] -> 정규분포인지, 어떤 분포인지, 같은 분포에서 온 샘플인지.. * [http://en.wikipedia.org/wiki/Relativistic_Breit%E2%80%93Wigner_distribution Breit?Wigner distribution] 좌우 대칭이 아닌.. * [http://en.wikipedia.org/wiki/List_of_probability_distributions List of probability distributions] * [http://www.itl.nist.gov/div898/handbook/eda/section3/eda366.htm Gallery of Distributions] * [확률분포 정리] * [이항분포 - BINOMDIST], [이항분포] * [다항분포] * [음이항분포] * [포아송분포 - POISSON], [Poisson분포] * [초기하분포 - HYPGEOMDIST], [초기하분포] * [정규분포 - NORMDIST] * [지수분포 - EXPONDIST] * [확률분포함수] * [attachment:DataAnalysis/Stochastic_process_and_Gaussian__process.pdf Stochastic process and Gaussian process] [http://enginius.tistory.com/489 출처] * [Distributional Choices] * [http://www.sqlservercentral.com/articles/SQL+Uniform+Random+Numbers/91103/ Generating Non-uniform Random Numbers with SQL] * Multinomial Random Numbers * Gaussian (or Normally) Distributed Random Numbers * Exponential Random Numbers * Weibull Random Numbers * Laplace Random Numbers ==== 책 or 강좌 ==== * [https://livebook.datascienceheroes.com/ Data Science Live Book] * [http://www.ats.ucla.edu/stat/r/ Resources to help you learn and use R - UCLA] * [http://www.uni-kiel.de/psychologie/rexrepos/index.html R Examples Repository] * [http://www.kocw.net/home/cview.do?mty=p&kemId=1094729 데이터 마이닝] * [http://www.omniascience.com/scholar/index.php/scholar/article/download/20/15 Modeling and Solving Linear Programming with R] [attachment:DataAnalysis/20-73-1-PB.pdf pdf] * 최병선 교수(서울대) 저술 * [http://s-space.snu.ac.kr/handle/10371/94393 (제2판) SAS를 이용한 현대통계학 (이성백교수와 공저)] * [http://s-space.snu.ac.kr/handle/10371/94394 행렬의 대각화와 Jordan표준형 (이성백교수와 공저)] * [http://s-space.snu.ac.kr/handle/10371/94413 Fourier 해석 입문] * [http://s-space.snu.ac.kr/handle/10371/94414 Lebesgue적분 입문] * [http://s-space.snu.ac.kr/handle/10371/94415 Wavelet 해석] * [http://s-space.snu.ac.kr/handle/10371/94433 회귀분석 (상)] * [http://s-space.snu.ac.kr/handle/10371/94456 회귀분석 (하)] * [http://s-space.snu.ac.kr/handle/10371/94455 단변량시계열분석] * [http://s-space.snu.ac.kr/handle/10371/94434 다변량시계열분석] * [http://s-space.snu.ac.kr/handle/10371/94457 이산형 재무모형의 수리적 배경] * [http://www.di.fc.ul.pt/~jpn/r/ R Markdowns] * http://onlinestatbook.com/2/index.html * [attachment:DataAnalysis/데이터_분석의_철학과_과학성_20150626.pdf 데이터 분석의 철학과 과학성(20150626, R User Conference 키노트)] [http://www.statground.org/index.php?document_srl=3398&mid=MyungHoeHuh 출처] * [http://little-book-of-r-for-multivariate-analysis.readthedocs.org/en/latest/index.html R for Multivariate Analysis] * [http://zoonek2.free.fr/UNIX/48_R/all.html Statistics with R] * [http://zoonek2.free.fr/UNIX/48_R/01.html Introduction to R] * [http://zoonek2.free.fr/UNIX/48_R/02.html Programming in R] * [http://zoonek2.free.fr/UNIX/48_R/03.html From Data to Graphics] * [http://zoonek2.free.fr/UNIX/48_R/04.html Customizing graphics] * [http://zoonek2.free.fr/UNIX/48_R/05.html Factorial methods: Around Principal Component Analysis (PCA)] * [http://zoonek2.free.fr/UNIX/48_R/06.html Clustering] * [http://zoonek2.free.fr/UNIX/48_R/07.html Probability Distributions] * [http://zoonek2.free.fr/UNIX/48_R/08.html Estimators and Statistical Tests] * [http://zoonek2.free.fr/UNIX/48_R/09.html Regression] * [http://zoonek2.free.fr/UNIX/48_R/10.html Other regressions] * [http://zoonek2.free.fr/UNIX/48_R/11.html Regression Problems -- and their Solutions] * [http://zoonek2.free.fr/UNIX/48_R/12.html Generalized Linear Models: logistic regression, Poisson regression, etc.] * [http://zoonek2.free.fr/UNIX/48_R/13.html Analysis of Variance (Anova)] * [http://zoonek2.free.fr/UNIX/48_R/14.html Mixed Models] * [http://zoonek2.free.fr/UNIX/48_R/15.html Time series] * [http://zoonek2.free.fr/UNIX/48_R/16.html Miscellaneous] * [http://zoonek2.free.fr/UNIX/48_R/17.html Applications] * http://www.q-engineering.pe.kr/ --> 품질공학 강좌 * 서울대 평생교육원 * [http://snui.snu.ac.kr/ocw/index.php?mode=view&id=1494 경제통계학, 류근관] * [http://snui.snu.ac.kr/ocw/index.php?mode=view&id=1174 인문사회계를 위한 수학2, 계승혁] * [http://blog.naver.com/PostList.nhn?blogId=moduvictory&from=postList&categoryNo=47&parentCategoryNo=47 한석원의 포인트 특강(수학)] * [http://wwww.cbgstat.com/ 통계분석 생존 지침서-의학통계 SPSS위주, 예제 참고용] * [http://adv-r.had.co.nz/ Advanced R] * [http://mmlab.snu.ac.kr/~shlee/prob/ 확률론과 확률 프로세스] * [http://www.kocw.net/home/search/kemView.do?kemId=422509 확률론 - KOCW 단국대] * attachment:DataAnalysis/의사결정이론과기법.pdf * [http://www.seehint.com/hint.asp?md=213&no=12162 멱함수 법칙] * [http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R Data Mining Algorithms In R] * [attachment:DataAnalysis/Data_Analysis_Methodology.pdf Data Analysis Methodology] * [http://www.itl.nist.gov/div898/handbook/index.htm Engineering Statistics HandBook] * [attachment:DataAnalysis/사회적원자_버스트.pdf 사회적 원자, 버스트 ] * [http://r4pda.co.kr/ R을 이용한 데이터 분석 실무] * [http://freesearch.pe.kr/archives/3891 R기반의 데이터시각화(전희원)] * http://press.knou.ac.kr/home/shop/homeBookDetail.do?isbn=9788920006340 --> 데이터마이닝 (R활용) * http://www.cookbook-r.com/ * http://osl7.kaist.ac.kr/ --> 채교수의 ... 시리즈 책들 * http://wsyang.com/2013/08/free-ebooks-for-statistics/ --> 무료 통계학 e-book 모음 * [http://thinkstats.com/thinkstats.pdf Think Stats: Probability and Statistics for Programmers] [http://www.lleess.com/2013/06/free-python-book-think-stats.html#.U1Z3aE2_mHs 목차] http://thinkstats.com * [http://www-bcf.usc.edu/~gareth/ISL/index.html An Introduction to Statistical Learning] * [http://statweb.stanford.edu/~tibs/ElemStatLearn/ The Elements of Statistical Learning] * https://www.coursera.org/ * [http://isao76.egloos.com/category/%EB%85%B8%EC%A7%80%EB%A7%88%20%EB%AF%B8%ED%98%B8%EC%9D%98%20%EC%86%8C%EC%85%9C%EA%B2%8C%EC%9E%84%EA%B4%80%EB%A0%A8 노지마 미호의 소셜 게임 컬럼] --> [노지마 미호의 소셜 게임 컬럼 주요 글귀 정리] * [http://onepager.togaware.com/ One Page R: A Survival Guide to Data Science with R ] * [http://datamining.dongguk.ac.kr/lectures/2010-2/dm/dm_notes R을 이용한 데이터마이닝의 활용] * [http://en.wikibooks.org/wiki/R_Programming R Programming-WikiBooks] * [http://www.statoek.wiso.uni-goettingen.de/mitarbeiter/ogi/pub/r_workshop.pdf Statistical Analysis with R] * [http://www.daytraders.co.kr/stock_study/biz.mk.co.kr/biznews/school/school_basic.php-gubun=1&level1=3&level2=1.htm 마케팅 기초 강좌] * attachment:DataAnalysis/R로_하는_멀티코어_병렬_프로그래밍.pdf * [attachment:DataAnalysis/HHI설명.pdf 허쉬만-허핀달 지수(HHI) 설명] * [attachment:DataAnalysis/장리미래예측과_시나리오_방법론.pdf 장기미래예측과 시나리오 방법론] * [http://tavon.org/teach-yourself-programming-in-ten-years-korean.html 10년 안에 프로그래밍 정복하기] * [http://duru1024.blog.me/70038444865 R로하는 수치해석] * [http://terms.naver.com/entry.nhn?docId=656028&cid=1137&categoryId=1137 인사이트] * 인공지능 * http://kowon.dongseo.ac.kr/~dkkang/AI2011Fall/ --> 인공지능 누리집 * http://uopen.ulsan.ac.kr/college/lecture/Default.aspx?cidx=87&menu=2012%EB%85%84+2%ED%95%99%EA%B8%B0&sub=%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5&sort=regist&crud=L&page=2 --> 울산대 인공지능 강의 * 고유값과 고유벡터 * http://blog.naver.com/dhkdwnddml/220313393285 * http://blog.naver.com/PostView.nhn?blogId=cbr399&logNo=90038240189 * http://darkpgmr.tistory.com/105 ---- ==== 외부자료 ==== * http://support.minitab.com/ko-kr/minitab/17/topic-library/ --> 통계에 대한 설명, 데이터 집합 등 * [데이터 사이언스란] * attachment:DataAnalysis/대륙별_나라목록.txt [http://ko.wikipedia.org/wiki/%EB%8C%80%EB%A5%99%EB%B3%84_%EB%82%98%EB%9D%BC_%EB%AA%A9%EB%A1%9D 여기에서 노가다 복사] * [http://kosis.kr/ 통계청] * 트랜드 검색 * http://trend.naver.com/ * http://www.google.com/trends [https://www.r-bloggers.com/analyzing-google-trends-data-in-r-2/ 구글트랜드 R] * http://insight.some.co.kr/ * [http://think.withgoogle.com/mobileplanet/ko/graph/?country=kr&category=KEYACT&subcategory=GSA&topic=Q23_2&stat=Q23_2_21&wave=2011&wave=2012&wave=2013&age=all&gender=all&chart_type=bar Our Mobile Planet] ==== R 또는 기타 ==== * [http://www.itworld.co.kr/news/94517 개발자들을 위한 성공적인 머신러닝의 10가지 핵심 요소] * attachment:DataAnalysis/02.예측의기본개념.pdf * [http://blog.naver.com/leoyang99/10182036722 스타트업 서비스 운영과 데이터분석] * 데이터 사이언티스트 * [http://www.ciobiz.co.kr/news/global/analysis/2895748_1827.html 당신이 찾는 데이터 사이언티스트는 허구다!] * [http://www.itdaily.kr/atl/view.asp?a_id=47431 빅 데이터 전망 2014 : 스몰 데이터의 역습] * [http://www.ciobiz.co.kr/news/global/analysis/2892531_1827.html “하둡 프로젝트는 실패…” 새해 빅데이터 전망 6가지] * http://blog.naver.com/woogado?Redirect=Log&logNo=90181783335 * http://opinionx.khan.kr/4492 * http://studyinaustralia.tistory.com/277 * http://kostat.go.kr/portal/korea/kor_ki/2/1/index.board?aSeq=198888&bmode=read&rowNum=10 --> 통계청:통계에 대한 이해 * System Dynamics * http://www.r-project.org/conferences/useR-2009/slides/Petzoldt.pdf * https://docs.google.com/presentation/d/160pr8GGbicQnx5seGoDtP6NwQqhOEOM5Gvj1xGOK1V4/present?pli=1&ueb=true#slide=id.p * http://desolve.r-forge.r-project.org/slides/petz_soet2011.pdf * http://babokonline.tumblr.com/babok --> BABOK? * http://orange.biolab.si/ --> 데이터 마이닝 툴.. 뭔가 쩌러주는거 같음.. * http://davetang.org/muse/2013/05/09/on-curve-fitting/ --> On curve fitting using R * http://www.index.go.kr/egams/index.jsp --> 나라지표 * http://docs.ggplot2.org/current/ * http://docs.ggplot2.org/current/stat_smooth.html * http://docs.ggplot2.org/current/plotmatrix.html * http://srcdsc.snu.ac.kr/srcstat/ * [http://blog.naver.com/nsh425?Redirect=Log&logNo=30045960540 푸리에 변환에 대한 설명] * http://blog.naver.com/PostView.nhn?blogId=someonenice&logNo=10048432097 --> Packages for classification * http://blog.naver.com/cardcheck82?Redirect=Log&logNo=70011939032 --> 범주형 자료분석 * [https://github.com/nexr/RHive/blob/master/INSTALL RHive Install] * [http://cran.us.r-project.org/doc/manuals/R-intro.html An Introduction to R] * [http://cran.r-project.org/doc/manuals/R-data.html R Data Import/Export] ==== 참고자료 ==== * [https://worldhotels.tistory.com/entry/10waysofdigitalmarketingsegmentation 10가지 디지털마케팅 세그먼트(Segment) 만들기 - 타게팅과 CRM 마케팅용 세그멘테이션 방법 (Segmentation)] * [https://www.rapidtables.com/math/symbols/Basic_Math_Symbols.html 수학기호] * {{{library(AppliedPredictiveModeling)}}} * [http://www.penews.kr/news/articleView.html?idxno=11517 빅데이터에 대한 잘못된 믿음 5가지] --> 데이터 품질과 통합 문제는 정말 크다 * [http://blog.daum.net/weather-marketing/8657968 통계에서 쓰이는 특별한 문자에 대한 이야기] * LTV * http://conversionxl.com/customer-lifetime-value/ * http://customerlifetimevalue.co/ * http://blog.naver.com/PostList.nhn?from=postList&blogId=asus1984&categoryNo=16¤tPage=2 --> 통계/수치해석 등등 R자료가 많다. * [http://www.tillionpanel.com/graphics/view.do?seq=ede0df1c-6527-4147-9413-e024b8b7247a 스마트폰 어플 광고, 과연 효과적인가요?] * [http://kobaco.co.kr/information/adinfo/UploadFile/(1)074_%B1%A4%B0%ED%C8%BF%B0%FA%C1%A6%B4%EB%B7%CE%20%BA%B8%B1%E2.pdf 광고노출빈도와 광고효과] * [http://blog.daum.net/newdaf/16130295 인터넷광고의 유효빈도는 몇 회 일까?] * http://data.seoul.go.kr * http://www.r-statistics.com/2013/06/top-100-r-packages-for-2013-jan-may/ --> Top 100 R packages for 2013 (Jan-May)! * http://wtfviz.net/ --> 나쁜 시각화의 예들 * [http://synap.tistory.com/103 조건부 확률 예제] * [게임의 미학] * [http://icr.snu.ac.kr/subpage/41.php 국민생활시간조사(2010)] * [http://rdotnet.codeplex.com/ R.NET] * 시차상관관련.. * https://onlinecourses.science.psu.edu/stat510/?q=node/74 * http://www.stat.pitt.edu/stoffer/tsa2/Examples.htm --> 예제 데이터 파일 * [http://otexts.com/fpp/ Forecasting: principles and practice] * social_network_analysis * https://sites.google.com/site/daishizuka/toolkits/sna/weighted-edgelists * http://www.cybaea.net/Blogs/Data/SNA-with-R-Loading-your-network-data.html * http://sna.stanford.edu/rlabs.php * http://www.slideshare.net/ianmcook/social-network-analysis-in-r * attachment:DataAnalysis/social_network_analysis_02.pdf * attachment:DataAnalysis/social_network_analysis_01.pdf * http://stackoverflow.com/questions/1169426/manipulating-network-data-in-r * [http://rdatamining.wordpress.com/2012/05/17/an-example-of-social-network-analysis-with-r-using-package-igraph/ An Example of Social Network Analysis with R using Package igraph] * [attachment:DataAnalysis/E6-3.pdf UCC 추천을 위한 협업 필터링 기법과 사회 네트워크 분석의 통합적 활용 방안] * [attachment:DataAnalysis/jitter01.pdf 고속직렬데이터의 지터 측정방법] * [http://timebird.egloos.com/4675107 Unit root testing ] * [attachment:DataAnalysis/Pfaff.pdf Analysis of Integrated and Cointegrated Time Series] * attachment:DataAnalysis/게임로그분석_NCSoft.pdf * [http://my.safaribooksonline.com/book/-/9781449358204/12dot-preparing-data/id683512#X2ludGVybmFsX0ZsYXNoUmVhZGVyP3htbGlkPTk3ODE0NDkzNTgyMDQlMkZpZDExMzMxOTQ=] ---> R in a Nutshell * [http://freesearch.pe.kr/archives/3052 안철수 교수 대선 출마 선언문 텍스트 요약] * [http://freesearch.pe.kr/archives/3074 안철수 교수 대선 출마 선언문 텍스트 요약?2] * [http://www.sqlservercentral.com/articles/Excel/91179/ Set Up Grouping Intervals for Excel] * attachment:DataAnalysis/R전문가로가는길.pdf * [http://cafe.naver.com/supermd/51 R에서 제공하는 확률분포들] * [http://blog.naver.com/PostView.nhn?blogId=chcher&logNo=70139319614&categoryNo=29&parentCategoryNo=0&viewDate=¤tPage=1&postListTopCurrentPage=&userTopListOpen=true&userTopListCount=5&userTopListManageOpen=false&userTopListCurrentPage=1 --> 다변량 분석] * http://www.ats.ucla.edu/stat/r/ --> UCLA R자료 * http://blog.naver.com/chcher?Redirect=Log&logNo=70139444817 * http://gephi.org/ * http://www.r-bloggers.com/ * http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9788973388523&orderClick=LAG&Kc=SETLBkserp1_5 R 프로그래밍: 예제로 배우는 * [http://faculty.washington.edu/tlumley/Rcourse/ R Fundamentals and Programming Techniques] * http://bayes.egloos.com/category/R --> R강좌.. * http://wolfpack.hnu.ac.kr/ * [http://www.sqlservercentral.com/articles/TVPs/89442/ A Stock Price Correlation Matrix] * http://r-project.kr * [http://www.bloter.net/archives/93240 페이스북 정보원은 느슨하게 엮인 친구] --> 1973년에 발표한 그라노베터의 논문이 지금도 유효함을 보여준다. * [http://www.ciokorea.com/news/11197/2011%EB%85%84+%EA%B8%80%EB%A1%9C%EB%B2%8C+%ED%95%AB%EC%9D%B4%EC%8A%88+%EB%94%B0%EB%9D%BC%EC%9E%A1%EA%B8%B0-%EB%B9%85+%EB%8D%B0%EC%9D%B4%ED%84%B0 2011년 글로벌 핫이슈 따라잡기-빅 데이터] * [http://www.dbguide.net/knowledge.db?cmd=view&boardUid=152090&boardConfigUid=20&categoryUid=574 R로 빅 데이터 분석] * 메모리의 한계를 벗어나는 방법 * 하둡과의 연동 * rstudio .. (http://rstudio.org) * [attachment:DataAnalysis/mining_process_01.pdf 불균형 이분 데이터 분류분석을 위한 데이터마이닝 절차] * [커뮤니티 결속 형태와 활용 포인트] * [http://www.statmethods.net/advstats/cluster.html Quick-R] * [http://www.bikorea.net/news/articleView.html?idxno=4616 이 땅, 통계학의 오늘①] * [http://www.bikorea.net/news/articleView.html?idxno=4625 이 땅, 통계학의 오늘②] * [attachment:DataAnalysis/R_and_Hadoop_Integrated_Processing_Environment.ppt R and Hadoop Integrated Processing Environment] * [http://baoqiang.org/?p=594 Install Rhipe (R+Hadoop) on ubuntu] * [http://www.slideshare.net/jseidman/oscon-2011-orbitz-final-8694731 Distributed Data Analysis with Hadoop and R - OSCON 2011] * [attachment:DataAnalysis/Simple_Parallel_Computing_in_R_Using_Hadoop.pdf Simple Parallel Computing in R Using Hadoop] * [http://ml.stat.purdue.edu/rhipe/ RHIPE: R and Hadoop Integrated Programming Environment] * [http://www.lecturemaker.com/2011/02/rhipe/ RHIPE: An Interface Between Hadoop and R for Large and Complex Data Analysis] * http://www.ats.ucla.edu/stat/R/ * http://blog.naver.com/dash1216?Redirect=Log&logNo=140066289845 * [http://blog.naver.com/enjoystat?Redirect=Log&logNo=140109260238 R프로그램을 이용한 통계분석] * [http://infostat2.knou.ac.kr/Pre/intro/index.htm 코스웨어-R입문] * [http://kin.naver.com/open100/detail.nhn?d1id=11&dirId=1113&docId=536937 R을 이용한 t-test] * [Statistics] * [Minitab에서 ODBC 질의하기] * [http://media.daum.net/economic/view.html?cateid=1038&newsid=20100811183220818&p=ked&t__nil_economy=uptxt&nil_id=5 롯데마트, 고객 동선까지 분석 年 250억 절감] * [http://blog.naver.com/y5304923?Redirect=Log&logNo=80060980980 통계툴 URL 모음] * 구조방정식 * [http://fs.mis.kuas.edu.tw/~fred/vpls/ Visual PLS] * [http://www.smartpls.de Smart PLS (회원등록이 되는데.. 1~2일 걸린다고 한다)] * [http://blog.naver.com/jinwon_hong?Redirect=Log&logNo=140055156755 PLS블로그] * [http://www.ssicentral.com/lisrel/index.html LISREL] * [http://amosdevelopment.com/download/ AMOS Student Version Download] * [http://kin.naver.com/qna/detail.nhn?d1id=11&dirId=1113&docId=128277400&qb=7J6Q7Jew64yA7IiY7J2YIOydmOuvuA==&enc=utf8§ion=kin&rank=2&search_sort=0&spq=0&pid=RtckvU5Y7tRssaKWbg4ssc--199356&sid=UAiwF5uRCFAAACW0Eis 자연로그와 e에대한 QA] ==== Tools ==== * [R에서 Tensorflow 사용하기] * [https://www.jamovi.org/] + https://www.r-bloggers.com/rj-editor-analyse-your-data-with-r-in-jamovi/ --> R 개발환경? * [R Notebook] * [RStudio Server 세팅] * [http://sourceforge.net/projects/yale/ RapidMiner -- Data Mining, ETL, OLAP, BI] * [http://sourceforge.net/projects/ferda/files/latest/download?source=directory Ferda Data Miner] * [http://mdp-toolkit.sourceforge.net/ Modular toolkit for Data Processing] --> Python * [http://insahara.tistory.com/271 엑셀 단축키 정리] ---- 혼자서 R을 공부하고 있습니다. 정말 좋은자료를 많이 모아 놓으셨네요. 자주 들르겠습니다. 감사합니다. -- 장운호 2014-08-08 09:57:55 ---- 좋은 자료 대단히 감사합니다! -- 허국동 2014-10-07 19:31:09 ---- 통계분석의 위키피디아네요~~! 놀랍습니다~!!! 북마크걸어놓고 자주 들르고 있습니다. 감사합니다. -- 김승현 2014-12-07 00:14:54 ---- R 위키피디아인거 같군요! 자주 애용하며 배우겠습니다 ^^ -- 송효진 2015-07-29 14:42:07 ---- 감사합니다 R을 공부하는데 큰 도움을 받습니다. -- 박성률 2016-01-04 00:30:05 ---- 좋은 자료 감사합니다!! 매일와서 공부 열심히해야겠네요>< -- 이지현 2016-05-15 16:29:19 ---- 통계분석의 좋은 사이트라고 추천해서 와 봤는데, 정말 한눈에 들어올 수 있도록 정리가 엄청 잘 되어 있습니다. 자주 들러 참고하겠습니다. -- 배민호 2019-01-31 19:10:00 ---- 이런자료 공유 해주시다니 정말 감사합닏. -- YuHyunJun 2019-06-25 16:27:07