본문 바로가기

지역정보

데이터 마이닝에 대해서

빅데이터와 데이터 마이닝

빅데이터와 데이터 마이닝의 관계에 대해 포스팅하도록 하겠습니다. 빅데이터는 표현하자면 풍부한 미개발 귀금속의 정맥과 같습니다. 표면 위에 작은 부분이 보일 수도 있지만, 좋은 것, 즉 정말로 유용한 정보를 얻으려면 약간의 발굴이 필요합니다. 다이아몬드 원석이 가치가 없고 가공 후 그 가치가 더해지듯이 거기서 데이터 마이닝이 일어납니다. 데이터 마이닝은 무엇일까요? 그 정의는 비즈니스 지향적입니다. 데이터 마이닝은 기업들이 원시 데이터를 유용한 정보로 바꾸기 위해 사용하는 과정입니다. 소프트웨어를 사용하여 대규모 데이터 묶음에서 패턴을 찾아냄으로써 기업은 고객에 대해 더 많이 알게 되고, 판매 증가와 비용 절감은 물론 보다 효과적인 마케팅 전략을 개발할 수 있습니다. 데이터 마이닝은 컴퓨터 처리뿐만 아니라 효과적인 데이터 수집과 웨어하우징에 달려 있습니다라고 설명했습니다. 마이크로소프트의 정의는 다음과 같은 좀 더 분석적인 방법을 취합니다. 데이터 마이닝은 대규모 데이터 집합에서 실행 가능한 정보를 발견하는 과정입니다. 데이터 마이닝은 수학적 분석을 사용하여 데이터에 존재하는 패턴과 추세를 도출합니다. 일반적으로 이러한 패턴은 관계가 너무 복잡하거나 데이터가 너무 많기 때문에 전통적인 데이터 탐사에 의해 발견될 수 없습니다. 두 정의 모두 유용한 정의입니다. 데이터 마이닝은 사업을 하는 데 있어 중요한 측면이 되었지만, 데이터 수집과 보고의 방법이 올바르게 구조화되지 않는 한 그 행위는 결실을 맺을 수 없습니다. 마이크로소프트는 이 구조를 데이터 마이닝 모델이라고 부릅니다. 이 구조를 조직의 데이터 중심 목표를 지원하기 위해 구축해야 합니다. 데이터 마이닝 프로세스는 유용한 5단계 데이터 마이닝 프로세스를 제공합니다. 데이터를 수집하여 데이터 웨어하우스에 로드합니다. 데이터는 전용 서버 또는 클라우드에 저장 및 관리됩니다. 분석가, 관리 팀 및 IT 전문가가 데이터를 가장 잘 구성하는 방법을 결정합니다. 데이터 마이닝 소프트웨어는 사용자의 결과에 따라 데이터를 분류하는 데 사용됩니다. 최종 사용자는 시각적 또는 서면 형식으로 데이터를 보고합니다. 각 단계의 성공은 숙련된 데이터 관리자와 분석가의 기술과 전문지식에 달려 있습니다. 그 과정에서 한 발짝 잘못하면 잘못된 최종 결과가 초래되어 조직의 성공을 위태롭게 할 수 있습니다. 식료품을 이용한 데이터 마이닝 모델은 어떤 용도로 사용될까요? 예를 들어, 가게의 웹사이트에 로그인한 쇼핑객들에게 디지털 쿠폰을 제공하는 식료품 가게 체인의 비교적 새로운 관행을 생각해 봅시다. 이러한 디지털 쿠폰을 사용하기 위해서, 쇼핑하는 사람은 등록부에 신분증 형태, 종종 전화번호를 제공해야 합니다. 식료품점 체인점의 데이터 광부들은 이미 쇼핑객이 온라인에서 어떤 쿠폰을 클릭했는지 알고 있으며, 이제 전화번호는 그 가게가 그날 어떤 상품을 구매했는지 기록할 수 있게 해 줍니다. 이런 과정을 거치면 보통 구매 패턴이 나타납니다. 식료품 체인점은 과거의 쇼핑 습관에 근거하여 쇼핑객이 구매하기 쉬운 것으로 알고 있는 쇼핑객을 대상으로 한 거래를 제공하는 개인 맞춤형, 그리고 이론적으로 더 효과적인 이메일 캠페인을 제공할 수 있습니다. 마이크로소프트는 데이터 마이닝의 사용과 개념에 대한 깨달음을 제공합니다. 집계된 정보는 매출 및 수요 추이 추정과 같은 예측 활동에 사용될 수 있습니다. 발굴된 데이터를 사용하여 가장 수용 가능한 고객 기반을 결정함으로써 확률과 위험을 최소화할 수 있습니다. 함께 판매할 수 있는 서비스 및 제품 그룹화 구매자의 의사결정 과정에서 발생할 수 있는 다음 사건 예측 인구통계, 경제상황, 구매이력 등과 같은 기준에 따라 잠재고객 그룹화 비즈니스 소프트웨어와 분석 회사인 오라클이 제공하는 정보에 따르면, 데이터 마이닝은 패턴의 발견에 특히 유용하며, 이는 기업 리더들이 정보에 입각한 데이터 중심 결정을 내릴 수 있는 실행 가능한 정보를 만드는 데 사용될 수 있습니다. 오라클은 데이터 마이닝 작업을 예측 분석이라고 알려진 데이터 과학 분야에 집중합니다. 오라클에 따르면, 단순한 루틴을 사용하여 프로세스를 포착하는 기술입니다. 본질적으로 오라클은 예측 분석을 데이터 마이닝 프로세스를 단순화하는 방법으로 간주합니다. 데이터 마이닝에 예측 분석이 어떻게 사용되고 있는가를 봅시다. 프로필 개발은 클라이언트, 판매, 수요, 기타 경향 특정 결과를 초래하는 요인의 발견 가장 가능성이 높은 결과의 예측 예측에 대한 신뢰도 설정 알아야 할 데이터 마이닝 약관 모든 기술적 노력과 마찬가지로 데이터 마이닝도 고유의 언어를 가지고 있습니다. 다행히 데이터 마이닝에 사용되는 언어와 용어는 오랜 과학 연구와 데이터 수집의 역사에 바탕을 두고 있습니다. 오라클에 따르면 다음과 같은 몇 가지 중요한 데이터 마이닝 용어는 이렇습니다. 이상 징후 감지는 일반적으로 동질적인 데이터 내에서 비정상적인 발생을 식별합니다. 클러스터링은 유사한 데이터 요소의 그룹을 찾는 관행 연관성입니다. 데이터 집합 내에서 항목이 함께 발생할 가능성이 발견됩니다.