본문 바로가기
정보

빅데이터란? 빅데이터의 개념과 역사 및 활용

by Sunnyspotho 2024. 9. 26.


빅데이터의 역사
빅데이터란 너무 방대하거나 빠르거나 복잡하여 기존 방식으로 처리하기 어렵거나 불가능한 데이터를 의미합니다. 방대한 양의 정보를 수집하고 저장하는 것은 오래전부터 이루어져 왔지만, ‘빅데이터’라는 개념은 2000년대 초반 산업 분석가 더그레이니까 이를 세 가지 V로 정의하면서 주목받기 위해 시작했습니다.


볼륨: 조직은 거래, 스마트(IoT) 기기, 산업 장비, 비디오, 이미지, 오디오, 소셜 미디어 등 다양한 출처에서 데이터를 수집합니다. 과거에는 모든 데이터를 저장하는 데 큰 비용이 들었겠지만, 데이터 호수, Hadoop, 클라우드 기술 덕분에 이제는 훨씬 저렴하게 저장할 수 있게 되었습니다.

속도: 사물 인터넷(IoT)의 발전으로 데이터는 전례 없는 속도로 기업에 유입되며, 시기적절하게 처리되어야 합니다. RFID 태그, 센서, 스마트 미터 등은 이러한 대량의 데이터를 거의 실시간으로 처리해야 하는 필요성을 부여합니다.

다양성: 데이터는 여러 형식으로 존재합니다. 기존 데이터베이스의 구조화된 숫자 데이터부터 비구조화된 텍스트 문서, 이메일, 비디오, 오디오, 주식 티커 데이터 및 금융 거래까지 다양한 형태를 포함합니다.

SAS에서는 빅데이터와 관련하여 두 가지 추가적인 차원도 고려합니다.

가변성: 데이터의 흐름은 예측하기 어려울 정도로 자주 변하고 큰 차이를 보입니다. 기업은 소셜 미디어에서 트렌드가 시작되는 시점을 파악하고, 일일 및 계절별 피크 데이터 부하를 관리하는 방법을 알아야 합니다.

정확성: 데이터의 품질을 나타내는 진실성은 다양한 출처에서 나온 데이터를 연결하고 비교하는 데 어려움을 겪습니다. 기업은 관계, 계층 및 여러 데이터 연결을 파악하고 상관관계를 맺어야 하며, 그렇지 않으면 데이터가 쉽게 통제 불능 상태에 빠질 수 있습니다.

빅데이터의 중요성
빅데이터의 중요성은 단순히 데이터의 양에 그치지 않습니다. 진정한 가치는 데이터를 어떻게 활용하느냐에 달려 있습니다. 다양한 출처에서 데이터를 분석하면 다음과 같은 이점을 얻을 수 있습니다:

자원 관리 간소화
운영 효율성 개선
제품 개발 최적화
새로운 수익 및 성장 기회 창출
현명한 의사 결정을 위한 인사이트 발견
고성능 분석과 결합한 빅데이터는 다음과 같은 비즈니스 작업을 가능하게 합니다.

거의 실시간으로 문제 및 결함의 근본 원인 파악
사람의 눈보다 빠르고 정확하게 이상 현상 탐지
의료 영상 데이터를 신속하게 인사이트로 변환하여 환자 결과 개선
몇 분 안에 전체 위험 포트폴리오 재계산
딥 러닝 모델의 변수를 정확히 분류하고 대응
조직에 영향을 미치기 전에 사기 감지
빅데이터의 작동 방식
빅데이터 전략 수립:
빅데이터 전략은 조직 내외부에서 데이터를 수집, 저장, 관리, 공유 및 사용하는 방식을 감독하고 개선하기 위한 계획입니다. 이는 비즈니스 성공을 위한 기초를 마련하며, 기존 및 미래의 비즈니스 및 기술 목표를 고려해야 합니다. 빅데이터는 단순한 부산물이 아닌 귀중한 비즈니스 자산으로 취급되어야 합니다.

빅데이터 소스 식별:
스트리밍 데이터는 IoT 및 웨어러블 기기, 스마트카, 의료 기기, 산업 장비 등에서 유입됩니다. 데이터가 도착하면 어떤 데이터를 저장하고 추가 분석할지를 결정할 수 있습니다. 소셜 미디어 데이터는 Facebook, YouTube, Instagram과 같은 플랫폼에서 생성되며, 비정형 또는 반전형 데이터로 인해 분석이 더 복잡해질 수 있습니다. 공개적으로 이용할 수 있는 데이터는 정부의 데이터 포털, CIA 세계 팩트북 등에서 제공됩니다. 또한, 데이터 호수, 클라우드, 공급업체 및 고객으로부터도 데이터가 발생할 수 있습니다.

빅데이터 접근, 관리 및 저장:
최신 컴퓨팅 시스템은 다양한 유형의 빅데이터에 빠르게 접근할 수 있는 속도와 유연성을 제공합니다. 기업은 데이터를 통합하고, 데이터 파이프라인을 구축하며, 데이터 품질을 보장하고 데이터 거버넌스 및 저장을 관리해야 합니다. 일부 빅데이터는 기존 데이터 웨어하우스에 저장할 수 있지만, 클라우드 설루션이나 데이터 호수를 통해 저장하고 처리하는 더 유연하고 저렴한 옵션도 존재합니다.

데이터 분석:
고성능 기술인 그리드 컴퓨팅이나 메모리 내 분석을 사용하여 모든 빅데이터를 분석하는 것이 가능합니다. 어떤 데이터가 관련성이 있는지를 사전에 판단할 수도 있습니다. 빅데이터 분석은 기업이 데이터에서 가치와 인사이트를 얻는 방법으로, 인공지능(AI) 및 기계학습과 같은 현대의 고급 분석 노력에 중요한 역할을 합니다.

지능적이고 데이터 기반의 의사 결정 내리기:
잘 관리되고 신뢰할 수 있는 데이터는 신뢰할 수 있는 분석과 의사결정으로 이어집니다. 기업은 빅데이터의 모든 가치를 포착하고 데이터 중심으로 운영해야 경쟁력을 유지할 수 있습니다. 데이터 기반의 접근 방식은 직감이 아닌 증거에 근거한 결정을 가능하게 하며, 데이터 중심 조직은 더 나은 성과와 예측 가능성을 가지며, 수익성이 높아집니다.

'정보' 카테고리의 다른 글

데이터베이스란?  (2) 2024.10.02
앙상블 분석과 인공신경망 분석  (2) 2024.10.02
시계열 분석  (2) 2024.09.27
[범죄와 형벌] 1~3장  (0) 2024.09.26
인문학이란? 인문학에 대해서  (0) 2024.09.26