과정 설명
빅 데이터는 방대한 데이터 양과 다양한 데이터 유형을 포함합니다. 현대 조직은 이러한 대규모 데이터 세트를 처리하는 데 필요한 도구를 구현할 수 있는 인재가 필요합니다. 이 과정에서는 빅 데이터 기술을 배우고 수요가 많은 기술을 습득하게 됩니다. 최신 데이터베이스 관리 시스템과 도구를 사용하여 실습 경험을 쌓을 수 있습니다. Hadoop, Spark, Cassandra와 같은 새로운 NoSQL 기술과 빅 데이터 도구의 폭발적인 성장을 경험해보세요.
이 12주 과정은 완전히 온라인으로 진행되며, 강사 지원과 동료 네트워킹을 제공합니다. 바쁜 일정 속에서도 학습을 이어갈 수 있도록 설계되었으며, 동기식 세션에 참석할 필요 없이 편리한 시간에 과제를 완료할 수 있습니다. Anaconda 배포판의 Jupyter 노트북을 사용하여 주간 텍스트 기반 모듈을 완료하며, 데이터 작업과 코딩을 연습할 수 있는 기회를 제공합니다. 또한, 데이터 과학 분야의 현재 이슈에 대해 이야기하는 강사의 녹화된 프레젠테이션에 접근할 수 있습니다. 과제를 완료하고 데이터 과학 전문가로서의 프로젝트와 관련된 주요 그룹 과제를 통해 학습 내용을 보여줄 수 있습니다.
선수 과목
이 과정을 수강하기 위해서는 데이터 과학 기초 과정(Data Science Course 1)을 성공적으로 완료해야 합니다. Python에 대한 실무 지식이 요구되기 때문입니다.
학습 목표
이 과정을 마치면 학습자는 다음을 할 수 있습니다:
- 신뢰할 수 있는 빅 데이터 시스템의 아키텍처를 이해합니다.
- 전통적인 시스템과의 차이점을 설명합니다.
- 여러 NoSQL 데이터베이스 관리 시스템을 사용합니다.
- 대규모 데이터 작업의 많은 도전 과제를 해결합니다.
- MongoDB와 Spark와 같은 도구를 사용하여 대규모 데이터 세트를 처리합니다.
인증서
이 과정은 데이터 과학 인증서 프로그램의 네 번째 과정입니다.
이 과정은 토론토 대학교 평생교육원과 워털루 대학교 WatSPEED의 협력으로 제공되는 데이터 과학 인증서 프로그램의 일부입니다.
이 온라인 과정은 Larry Simon, Gaurav Bagga, Indrani Gorti, Sheldon Leeloy가 개발했으며, 워털루 대학교의 확장 학습 센터에서 교육 설계 및 지원을 제공했습니다.
Curriculum
- 13 Sections
- 4 Lessons
- 10 Weeks
- Week 0 Getting Start4
- Week 1 Reliable and Scalable Data-Intensive Applications0
- Week 2 Relational Databases0
- Week 3 NoSQL0
- Week 4 Distributed Datastores0
- Week 5 Introduction to Spark0
- Week 6 Analytics with Spark0
- Week 7 Spark Streaming0
- Week 8 Data in Motion0
- Week 9 Big Data Architecture0
- Week 10 Cloud Analytics0
- Week 11 MLOps0
- Week 12 Group Assignment Discussion & Submit to it0