데이터 사이언스

    [코드잇] DataFrame 마스터하기

    파이썬의 강력한 데이터 분석 도구, Pandas를 사용하면 데이터를 DataFrame이라는 표에 담아서 활용할 수 있습니다. 이번 토픽을 통해 DataFrame을 다루기 위해 꼭 알아야 하는 핵심 기능들을 익혀 보세요. 금융, 의료, 과학, 스포츠, 여행, 콘텐츠 등 다양한 분야의 데이터를 분석해 보면서 데이터를 보는 눈을 길러 봅시다.토픽 시작하기01. 토픽 소개02. 수강 가이드DataFrame 기본기01. DataFrame 살펴보기 02. describe()? describe? 03. DataFrame 살펴보기 퀴즈 04. 엑셀 파일 불러오기 05. 인덱스, 컬럼명, 데이터 타입 설정하기 06. Series 살펴보기 07. Series 살펴보기 실습 08. 여러 개의 조건으로 불린 인덱싱하기 09...

    [코드잇] 데이터 사이언스 Toolkit 4. pandas

    행=가로=ROW=HORIZONTAL=엑셀쉬트의 숫자 방향 행가(Hanger) + 가 로(ROW)라고 외우면 쉬울듯행가로우~  열=세=COLUMN=VERTICAL=엑셀쉬트의 영어 방향열세(쉽세) + 기둥(COLUMN)은 수직으로 서 있다고 외우면 쉬울듯 열세콜!5. pandas5-1 pandas와 DataFramenumpy array : 복잡한 수학 연산을 할 때 사용가독성이 떨어짐정보에 대한 레이블 삽입 불가한 가지 데이터 타입만 사용 가능 pandas : 표 형태의 데이터를 간편하게 다루고 싶을 때데이터 불러오기데이터 가공데이터 분석데이터 시각화  In [1]:import pandas as pd In [2]:df = pd.DataFrame({ 'category' : ['skirt', 'sweate..

    [코드잇] 데이터 사이언스 Toolkit 3. Matplotlib

    [코드잇] 데이터 사이언스 Toolkit 3. Matplotlib

    4. Matplotlib4-1 Matplotlib과 데이터 시각화직관적인 그래프가 보기 좋음!숫자와 통계에 약한 사람에게도 좋음!Matplotlib : 파이썬, 넘파이를 기반으로 만들어진 데이터 시각화 라이브러리4-2 다양한 그래프 그려보기In [1]:import numpy as npimport matplotlib.pyplot as plt In [2]:year_array = np.array([2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020]) # 년도stock_array = np.array([14.46, 19.01, 20.04, 27.59, 26.32, 28.96, 42.31, 39.44, 73.41, 132.69]) # 년도별 애플 주가 In [..

    [코드잇] 데이터 사이언스 Toolkit 2. Numpy

    3. Numpy3-1 NumPy란?많은 양의 데이터를 처리하려면 파이썬으로는 부족하다!=> NumPy(Numerical Python) : 수와 파이썬 라이브러리 ex) 그냥 파이썬 문법의 리스트를 사용하는 것보다 넘파이의 배열을 사용하는 게 빠름!NumPY Array : 메모리 최적화, 연산 최적화3-2 NumPy와 arrayIn [1]:import numpy as np In [2]:array1 = np.array([1, 3, 5, 6, 7, 9])array1 Out[2]:array([1, 3, 5, 6, 7, 9]) In [3]:np.zeros(5) # 숫자 0 5개 자동 생성 Out[3]:array([0., 0., 0., 0., 0.]) In [4]:np.arange(10) # 0~9 숫자 순서대로 ..

    [코드잇] 기초 통계와 데이터 시각화

    [코드잇] 기초 통계와 데이터 시각화

    1. 토픽 소개1-1 토픽 소개통계 : 어떤 상황을 쉽게 이해할 수 있도록 숫자로 정리하는 것=> 종류 2가지 : 기술 통계, 추론 통계 시각화seabron : 파이썬 라이브러리=> 통계 기반 데이터 시각화 툴1-2 수강 가이드선이수 지식 안내 이번 토픽에서는 파이썬이라는 프로그래밍 언어를 사용합니다. 아직 파이썬을 써 본 적 없다면 [Python 기초]를 공부해 보세요! 그리고 [데이터 사이언스 Toolkit] 토픽을 통해 NumPy, pandas, Matplotlib 등 데이터 분석에 필요한 툴들의 사용법을 익힌 뒤 이번 토픽을 수강하는 것을 추천합니다. 개발 환경 이번 토픽에서는 아래와 같은 프로그램을 사용합니다. 여러분의 PC에서 직접 실습해 보고 싶다면 설치 가이드를 참고해서 프로그램을 설치해 ..

    [코드잇] 데이터 사이언스 Toolkit 1. Jupyter Notebook

    [코드잇] 데이터 사이언스 Toolkit 1. Jupyter Notebook

    1. 토픽 시작하기1-1 토픽 소개언어 : Python Toolkit 4가지Jupyter Notebook : python 환경, VS code를 쓰지 않음Numpy : 데이터 관련 연산matplotlib : 데이터 시각화pandas : 표 형식 데이터1-2 수강 가이드선이수 지식 안내 이번 토픽에서는 파이썬이라는 프로그래밍 언어를 사용합니다. 아직 파이썬을 써 본 적 없다면 [Python 기초]를 공부해 보세요! 개발 환경 이번 토픽에서는 아래와 같은 프로그램을 사용합니다. 여러분의 PC에서 직접 실습해 보고 싶다면 설치 가이드를 참고해서 프로그램을 설치해 주세요! Anaconda(Windows 설치 가이드, macOS 설치 가이드) Anaconda를 설치하면 Jupyter Notebook, NumPy,..

    [코드잇] 데이터 사이언스 오버뷰

    [코드잇] 데이터 사이언스 오버뷰

    1. 데이터 리터러시 갖추기1-1 세상을 바꾸고 있는 데이터 사이언스Data 와 Computer와 연관이 있을 것 같지만 아니다!데이터는 컴퓨터, 스마트폰이 있기 전부터 있었다 [ ex) 초등학생들의 수학 점수들 ]데이터 사이언스 = 데이터를 다루는 일소프트웨어 = 데이터를 모으는 1등 공신!그래서 21세기에 데이터 사이언스가 뜨는 이유다!1-2 데이터 사이언스 이해하기프로그래밍 + 수학과 통계 + 특정 분야 전문성 = 데이터 사이언스데이터 사이언티스트 : 가치를 더할 수 있는 일이 무엇인지 찾아내고 데이터를 이용해서 위 문제를 해결하는 것이다1-3 데이터 사이언스에 대한 오해오해 1 : 데이터 사이언스의 핵심은 인공지능, 딥러닝 이다=> 인공지능, 딥러닝은 피라미드 데이터 사이언스의 최종 단계이다 오해..