- Level Foundation
- Course by University of California San Diego
-
Offered by
About
분석해야 할 빅 데이터 문제를 파악했다면, 빅 데이터 솔루션을 사용해 어떻게 데이터를 수집, 저장 및 정리할 수 있을까요? 이 강의에서는 각 문제에 적합한 다양한 데이터 유형과 관리 도구를 소개합니다. 이 강의를 통해 빅 데이터 관리 시스템과 분석 도구의 관점에서 새로운 빅 데이터 플랫폼이 진화하고 있는 이유를 설명할 있을 것입니다. 이 실습 튜토리얼을 통해 실시간 및 반정형 데이터 사례를 사용한 기술에 익숙해질 것입니다. 여기서 다루는 시스템과 도구에는 다음이 포함됩니다. AsterixDB, HP Vertica, Impala, Neo4j, Redis, SparkSQL. 이 강의는 기존의 미개척 데이터 소스에서 가치를 창출하는 기법과 새로운 데이터 소스를 소개합니다. 이 강의를 마치고 나면 다음을 기대할 수 있습니다. * 업무 및 실생활 속 문제들에서 다양한 데이터 요소를 식별할 수 있습니다. * 팀에서 빅 데이터 인프라 계획과 정보 시스템 디자인을 설계해야 하는 이유를 설명할 수 있습니다. * 다양한 데이터 유형에 요구되는 흔한 데이터 연산을 파악할 수 있습니다. * 데이터의 성격에 맞는 데이터 모델을 선택할 수 있습니다. * 스트리밍 데이터를 처리하기 위한 기술을 적용할 수 있습니다. * 전통적 데이터베이스 관리 시스템과 빅 데이터 관리 시스템의 차이를 알 수 있습니다. * 데이터 관리 시스템이 왜 이토록 많은지 이해할 수 있습니다. * 온라인 게임 업체에 사용되는 빅 데이터 정보 시스템을 설계할 수 있습니다. 이 강의는 데이터 과학 분야의 초심자를 위한 강의입니다. 빅 데이터 개요를 수강할 것을 권장합니다. 프로그래밍에 대한 사전 지식은 필요하지 않지만, 실습 과제를 수행하려면 애플리케이션을 설치하고 가상 머신을 활용할 수 있어야 합니다. 전체 하드웨어 및 소프트웨어 요구 사항은 전문 기술 요구 사항을 참조하세요. 하드웨어 요구 사항: (A) 쿼드코어 프로세서(VT-x, AMD-V 지원 권장), 64비트 (B) 8GB RAM (C) 20GB 여유 디스크 하드웨어 정보를 찾는 방법: (Windows): 시작 버튼을 눌러 System을 여신 후, Computer를 우클릭해 Properties 메뉴를 확인하세요. (Mac): Apple 메뉴를 클릭해 Overview를 열고 “About this Mac”을 클릭하세요. 3년 이내에 구매한 대부분의 컴퓨터는 8GB RAM 최소 사양을 만족할 것입니다. 최대 4GB 용량의 파일을 다운로드해야 하기 때문에 고속 인터넷 연결이 필요합니다. 소프트웨어 요구 사항: 이 강의는 Apache Hadoop을 포함한 몇몇 오픈소스 소프트웨어 도구를 사용합니다. 필요한 모든 소프트웨어는 무료로 다운로드 및 설치할 수 있습니다(인터넷 제공업체에 내는 데이터 사용료는 제외). 소프트웨어 요구 사항은 다음과 같습니다. Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ 또는 CentOS 6+ VirtualBox 5+Modules
이 강의에 포함된 내용
1
Discussions
- 자기소개: 여러분을 소개하고 이 강의를 수강하는 이유를 알려주세요
2
Videos
- 빅 데이터 모델링 및 관리에 오신 걸 환영합니다
- 왜 이 강의가 빅 데이터 전문 과정의 새로운 강의인가요?
빅 데이터 모델링과 관리가 왜 중요할까요?
1
Discussions
- 토론: 빅 데이터 관리에서 가장 관심 있는 분야는 무엇인가요?
9
Videos
- 빅 데이터 개요 요약 (파트 1)
- 빅 데이터 개요 요약 (파트 2)
- 빅 데이터 개요 요약 (파트 3)
- 빅 데이터 관리 ‘꼭 해봐야 할 질문’
- 데이터 흡수
- 데이터 저장소
- 데이터 품질
- 데이터 연산
- 데이터 확장성 및 보안
3
Readings
- 슬라이드: 빅 데이터 개요 요약
- 슬라이드: 빅 데이터 관리
- 저장소 시스템 읽기 자료
실제 빅 데이터 관리 애플리케이션
1
Discussions
- 토론: 빅 데이터 애플리케이션의 설계 기준 중 무엇을 알고 있나요?
3
Videos
- ConEd에서 에너지 데이터 관리 시 문제점
- 게임 업계 데이터 관리: Apmetrix CTO Mark Caldwell과의 Q&A
- FlightStats의 항공 데이터 관리: CTO Chad Berkley의 강의
2
Readings
- 슬라이드: ConEd에서 에너지 데이터 관리 시 문제점
- 슬라이드: FlightStats의 항공 데이터 관리
실습
3
Readings
- Cloudera VM 다운로드 및 설치하기(Windows)
- Cloudera VM 다운로드 및 설치하기(Mac)
- 실습 데이터세트 다운로드 방법
데이터 모델이란
1
Discussions
- 토론: 실생활에서의 데이터 모델링
4
Videos
- 데이터 모델 개요
- 데이터 모델 구조
- 데이터 모델 연산
- 데이터 모델 제약조건
1
Readings
- 슬라이드: 데이터 모델이란
실습
1
Videos
- CSV 데이터 개요
1
Readings
- CSV 데이터 개요
데이터 모델의 다양한 종류 (파트 1)
1
Discussions
- 토론: 인터넷에서 XML이나 JSON 활용
2
Videos
- 관계형 데이터 모델이란
- 반정형 데이터 모델이란
2
Readings
- 슬라이드: 관계형 데이터 모델이란
- 슬라이드: 반정형 데이터 모델이란
실습
1
Assignment
- 2주 차 실습 강의에 대한 연습 퀴즈
4
Videos
- CSV 파일의 관계형 모델 알아보기
- JSON 데이터의 반정형 데이터 모델 알아보기
- 이미지의 배열 데이터 모델 알아보기
- 센서 데이터 알아보기
4
Readings
- Comma Separated Values(CSV)의 관계형 데이터 모델 알아보기
- JSON 데이터의 반정형 데이터 모델 알아보기
- 이미지의 배열 데이터 모델 알아보기
- 센서 데이터 알아보기
데이터 모델의 다양한 종류 (파트 2)
1
Assignment
- 데이터 모델 퀴즈
3
Videos
- 벡터 스페이스 모델
- 그래프 데이터 모델
- 기타 데이터 모델
3
Readings
- 슬라이드: 벡터 스페이스 모델
- 슬라이드: 그래프 데이터 모델
- 슬라이드: 기타 데이터 모델
실습
2
Videos
- Lucene 검색 엔진의 벡터 데이터 모델 알아보기
- Gephi를 활용한 그래프 데이터 모델 알아보기
2
Readings
- Lucene을 활용한 벡터 데이터 모델 알아보기
- Gephi를 활용한 그래프 데이터 모델 알아보기
데이터 모델 vs. 데이터 포맷
1
Videos
- 데이터 모델 vs. 데이터 포맷
1
Readings
- 슬라이드: 데이터 모델 vs. 데이터 포맷
스트리밍 데이터로 작업하기
1
Assignment
- 데이터 포맷 및 스트리밍 데이터 퀴즈
1
Discussions
- 토론: 스트리밍 데이터 애플리케이션
3
Videos
- 데이터 스트림이란
- 스트리밍 데이터는 왜 다를까?
- 데이터 호수 이해하기
3
Readings
- 슬라이드: 데이터 스트림이란
- 슬라이드: 스트리밍 데이터는 왜 다를까?
- 슬라이드: 데이터 호수 이해하기
실습: 데이터 스트림 다루기
2
Videos
- 스트리밍 센서 데이터 알아보기
- Twitter 데이터 스트리밍 알아보기(선택 강의)
3
Readings
- 스트리밍 센서 데이터 알아보기
- Twitter 앱 생성 방법(선택 강의)
- Twitter 데이터 스트리밍 알아보기(선택 강의)
데이터 관리가 필요한 이유
1
Videos
- 빅 데이터에 대한 DBMS 기반/비DBMS 기반 접근법
1
Readings
- 슬라이드: 빅 데이터에 대한 DBMS 기반/비DBMS 기반 접근법
DBMS에서 BDMS로
1
Assignment
- BDMS 퀴즈
6
Videos
- DBMS에서 BDMS로
- Redis: 향상된 키-값 스토어
- Aerospike: 차세대 KV 스토어
- 반정형 데이터 – AsterixDB
- Solr: 텍스트 관리
- 관계형 데이터 – Vertica
1
Readings
- 슬라이드: DBMS에서 BDMS로
정보 시스템이란
1
Peer Review
- 'Catch the Pink Flamingo'를 위한 데이터 모델 설계하기
2
Discussions
- 토론: Catch the Pink Flamingo의 성능 향상을 위한 분석 작업
- 토론: Catch the Pink Flamingo에 데이터 모델 사용하기
1
Readings
- Eglence Inc.의 게임: Catch The Pink Flamingo
Auto Summary
Explore the world of big data with "빅 데이터 모델링 및 관리 시스템" on Coursera. This foundational course by expert instructors focuses on data collection, storage, and management using advanced tools like AsterixDB, HP Vertica, and SparkSQL. Perfect for beginners in Data Science & AI, it provides hands-on tutorials and practical skills for identifying data elements, designing big data infrastructure, and applying streaming data techniques. With no prior programming knowledge required, jumpstart your big data journey with flexible subscription options: Starter and Professional.

Ilkay Altintas