1. 토픽 시작하기
1-1 토픽 소개
언어 : Python
Toolkit 4가지
- Jupyter Notebook : python 환경, VS code를 쓰지 않음
- Numpy : 데이터 관련 연산
- matplotlib : 데이터 시각화
- pandas : 표 형식 데이터
1-2 수강 가이드
선이수 지식 안내
이번 토픽에서는 파이썬이라는 프로그래밍 언어를 사용합니다. 아직 파이썬을 써 본 적 없다면 [Python 기초]를 공부해 보세요!
개발 환경
이번 토픽에서는 아래와 같은 프로그램을 사용합니다. 여러분의 PC에서 직접 실습해 보고 싶다면 설치 가이드를 참고해서 프로그램을 설치해 주세요!
Anaconda(Windows 설치 가이드, macOS 설치 가이드)
Anaconda를 설치하면 Jupyter Notebook, NumPy, pandas, Matplotlib 등 데이터 사이언스를 할 때 주로 사용되는 툴들이 함께 설치됩니다. 이번 토픽에서는 23.03-0 버전을 사용했습니다.
라이브러리
이번 토픽 영상 레슨들에서 사용된 라이브러리의 버전은 아래와 같습니다. 여러분의 PC에 설치된 라이브러리 버전이 더 낮거나 높다면 실습 결과가 조금 달라질 수 있습니다.
NumPy 1.26.4
pandas 2.1.4
Matplotlib 3.8.0
이미 Anaconda가 설치되어 있는 경우에는 Jupyter Notebook에서 아래와 같은 코드를 실행해서 conda와 관련 패키지들을 최신 버전으로 업데이트해 보세요! 시간이 몇 분 정도 걸릴 수 있습니다.
!conda update conda -y
!conda update --all -y
데이터셋
이번 토픽에서 사용하는 데이터는 아래와 같습니다. 미리 다운로드해 두셔도 좋고, 데이터를 처음 사용하는 레슨에서 다운로드하셔도 괜찮습니다. 다운로드 링크는 그때 다시 한번 안내드릴 예정이에요.
2. Jupyter Notebook
2-1 Jupyer Notebook이 무엇인가요?
- 코드, 실행결과가 순서대로 작성됨
- 데이터 사이언스는 일반적인 제품 개발과는 다르다
- 일반적인 서비스 [웹 사이트, 앱, 게임] : 결과가 중요함
- 데이터 사이언스는 과정이 중요하다
- 주피터 노트북 : VS code 처럼 로컬 환경에서만 작동됨, 인터넷이 필요하지 않음
- Coalb : 구글 클라우드 환경에서 작성 가능, 인터넷이 필요함
2-2 Jupyer Notebook 둘러보기
데이터 사이언스는 결국 데이터를 갖고 인사이트를 창출하는게 목적이다
주피터 노트죽은 인사이트를 창출하는 과정을 저장하기 용이한 노트북이다
2-3 셀의 작동 방식
주피터 노트북 셀의 사용 방법 : 단축키를 외워서 사용하는 것이 유리!
2-4 마크다운 사용하기
마크다운(Markdown) : 일반 텍스트 기반의 경량 마크업 언어
=> 주피터 노트북에서 설명을 적을 때 사용
'데이터 사이언스 > 인강' 카테고리의 다른 글
[코드잇] 데이터 사이언스 Toolkit 4. pandas (0) | 2024.08.19 |
---|---|
[코드잇] 데이터 사이언스 Toolkit 3. Matplotlib (0) | 2024.08.07 |
[코드잇] 데이터 사이언스 Toolkit 2. Numpy (0) | 2024.08.07 |
[코드잇] 기초 통계와 데이터 시각화 (0) | 2024.08.05 |
[코드잇] 데이터 사이언스 오버뷰 (1) | 2024.07.29 |