빅데이터의 특징
오늘은 빅데이터에 대해 알아보도록 하겠습니다. 첫째, 볼륨입니다. 빅데이터라는 이름 자체는 거대한 크기와 관련이 있습니다. 과거에는 데이터의 양 자체가 많지 않았습니다. 컴퓨터가 크게 발전하지 않았고 사람들도 자료를 생산하는데 있어 한정적이었기 때문입니다. 자료는 한군대로 모아지지 않았고 여전히 활자 데이터만이 쌓이고 있었습니다. 이것들도 데이터라고 할 수 있으나 이는 빅데이터화가 되지 못합니다. 데이터 크기는 데이터에서 가치를 결정하는데 매우 중요한 역할을 합니다. 또한 특정 데이터를 실제로 빅데이터로 간주 할 수 있는지 여부는 데이터 양에 따라 다릅니다. 예를 들어 언어학에서 어휘의 데이터를 따져 볼 때 한 언어의 어휘가 그 양이 많이 축적이 되지 않는다면 이는 자료를 활용하는 데 있어 큰 제약이 따를 것입니다. 따라서 '볼륨'은 빅데이터를 처리하는 동안 고려해야 할 특성 중 하나입니다. 둘째, 다양성입니다. 빅 데이터의 다음 측면은 다양성입니다. 다양성은 이기종 소스와 구조적이든 비구조적이든 데이터의 특성을 말합니다. 초기에는 스프레드 시트와 데이터베이스가 대부분의 응용 프로그램에서 고려한 유일한 데이터 소스였습니다. 요즘에는 이메일, 사진, 비디오, 모니터링 장치, PDF, 오디오 등의 데이터도 분석 응용 프로그램에서 고려되고 있습니다. 이러한 다양한 비정형 데이터는 데이터 저장, 마이닝 및 분석에 특정 문제를 제기합니다. 인터넷의 발달은 필연적으로 빅데이터의 시대를 앞당길 수 밖에 없습니다. 사회관계망은 날이 갈수록 커지고 최근 페이스북, 인스타그램 등 하루에도 수천 수만의 데이터가 양산이 되고 있습니다. 그리고 그 다양성은 앞으로도 더 많아질 것입니다. 셋째, 속도입니다. '속도'라는 용어는 데이터 생성 속도를 나타냅니다. 요구를 충족시키기 위해 데이터를 생성하고 처리하는 속도는 데이터의 실제 잠재력을 결정합니다. 빅데이터 벨로시티는 비즈니스 프로세스, 응용 프로그램 로그, 네트워크 및 소셜 미디어 사이트, 센서, 모바일 장치 등과 같은 소스에서 데이터가 유입되는 속도를 처리 합니다. 데이터 흐름은 방대하고 연속적입니다. 넷째, 변동성입니다. 이것은 때때로 데이터에 의해 보여 질 수있는 불일치를 나타내므로 데이터를 효과적으로 처리하고 관리 할 수있는 프로세스를 방해합니다.
'지역정보' 카테고리의 다른 글
빅데이터의 개요 (0) | 2020.06.15 |
---|---|
빅데이터의 특징, 보건의료분야 (0) | 2020.06.14 |
빅데이터 기술 (0) | 2020.06.09 |
아무 것도 안 하는 것의 즐거움 (0) | 2020.05.01 |
21세기 영상의 시대, 오히려 책을 읽고 써야 하는 이유 (0) | 2020.05.01 |