#title 데이터 애널리틱스 실패 법칙 7가지 [[TableOfContents]] --http://www.itworld.co.kr/news/107126 --> 여기서 발췌 ==== 찾는 것이 무엇인지도 모르고 뛰어들기 ==== * 분석 과정에서 가장 큰 문제는 데이터에서 무엇을 얻으려는 것인지 모를 때 * 시스템이 알아서 흥미롭거나 알아 둘만한 가치가 있는 데이터를 찾아 줄 것이라는 오해 때문에 기업들은 10여 년이 넘도록 데이터 마이닝과 관련해 헛물을 켜 왔다. 설령 머신러닝 기술이 있다고 해도, 데이터의 관계와 관련해 어떤 정보를 찾고 싶은지, 애널리틱스의 방향성 정도는 설정해 둬야 한다. * 데이터에 대한 쿼리와 데이터가 말하고자 하는 바를 정확하고 완전한 스토리로 엮어낼 수 있는 사람 * 데이터를 이용해 질문에 대답하고, 또 자신들이 찾아낸 결과물을 끊임없이 따지고 탐색해 데이터가 단순히 내러티브만을 제공하는 것이 아니라 실제 현상을 설명할 수 있는지, 향후 일어날 일을 예측할 수 있는지 알아보려 한다. 또한 우리가 데이터를 통해 찾아내려 하는 것이 무엇인지, 우리의 목표가 무엇인지 모두에게 알리고 지속적이고 일관된 데이터 측정을 하는 것이 중요하다 ==== 자체적인 인프라스트럭처 정립과 유지 고수 ==== * 자체적 빅데이터 인프라스트럭처를 구축하려 할 경우, 데이터 과학자들은 실제로 애널리틱스를 개발하는 것 외에 다른 업무에 지나치게 많은 시간을 낭비하게 된다 * 클러스터는 때로는 하드웨어 실패로 인해, 그리고 무엇보다 소프트웨어 실패로 인해 자주 무너졌다. 소프트웨어 패키지가 데이터를 이탈하고 때로는 이로 인해 수시간 넘게 클러스터가 불가용한 상태가 되기도 했다. ==== 데이터의 분산과 분리 ==== * 데이터 사일로(data silos)' 문제 * 통합 테크놀로지를 활용해 데이터는 최대한 현재의 시스템에 머무르게 하면서도 다양한 데이터에 대한 통합적 관점을 확보할 수 있도록 해야 한다 ==== 데이터 품질 관리 소홀하기 ==== * 고품질 데이터는 유의미한 정보와 통찰력을 얻기 위해 가장 중요한 요소다. 데이터웨어하우스와 데이터 레이크를 통해 정형 및 비정형 데이터를 한 데 모을 수 있어야 한다. 성공적으로 애널리틱스 작업을 해내는 기업은 데이터 청소와 정확한 레이블링을 통해 데이터의 품질을 향상시키려 노력한다. * 데이터의 신선도를 유지 ==== 경영자, 비즈니스 파트너를 설득하지 못하는 것 ==== * 기업의 문화와 조직에 변화를 가해야 한다는 이유로 이것이 도입되지 않았다면 그것은 실패한 애널리틱스 프로젝트라고 밖에는 볼 수 없다 * 데이터 매니지먼트 기반을 세우는 것은 수년 넘게 지속적인 노력이 필요하다 ==== 실무자들의 인풋을 반영하지 않는 것 ==== * 중간급과 실무급 매니저들의 참여없이 진행된 분석은 실무에서 매니저들에게 큰 도움이 되지 않는 정보만을 내놓기가 쉽다 * 이렇게 얻은 정보는 좀 더 큰 그림만을 보게 된다. 그저 시간이 남을 때 생각해 볼 만한 문제들일 뿐이다. 대부분의 매니저는 이런 시간적 여유를 가지고 있지 않다. * 애널리틱스의 역할은 현재 기업의 문제가 무엇인지, 실패의 가능성이 가장 높은 영역이 어디인 지를 미리 말해줘 이를 예방할 수 있도록 하는 것이다. 그리고 만일 실무자들이 이 정보를 일상적인 업무 환경에서 활용할 수 있게 된다면 그 이니셔티브는 성공한 것이라 할 수 있다 ==== 애널리틱스가 번성할 수 있는 기업 문화와 기술을 갖춘 인재 부족 ==== * 이미 존재하는 슈퍼스타만을 찾으려 할 것이 아니다. * 데이터 분석 역량을 강화하는 가장 좋은 방법 가운데 하나는 가능성있고 전도 유망한 인재를 데려와 직접 교육하는 것이다.