데이터사이언스

    [코드잇] 머신 러닝 기본기

    [코드잇] 머신 러닝 기본기

    01. 머신 러닝이란? Machine Learning (기계 학습): 기계가 학습을 통해 발전 프로그램 vs 머신 러닝 프로그램: 일반 프로그램과 달리 머신 러닝 프로그램은 경험을 통해서 스스로 업무 능력 향상 ex) 스팸 메일 분류 프로그램 일반 프로그램인간이 직접 스팸 메일의 특징들을 파악해서 컴퓨터에게 분류하는 방식을 알려줌완벽하게 스팸 분류가 불가능인간이 복잡한 규칙들을 모두 찾아낼 수는 없기 때문에 이 프로그램을 크게 개선하기 어려움 머신 러닝 프로그램인간인 우리가 규칙을 찾아서 알려주는 게 아니라 프로그램이 스스로 규칙을 찾도록 하는 것머신 러닝을 할 때는 이런 규칙들을 코드에 명시하는 게 아니라 컴퓨터가 직접 이 규칙들을 찾아낼 수 있도록 하는 것머신러닝은 데이터를 통해서 가능하다새로운 데이..

    [코드잇] 데이터 사이언스 Toolkit 4. pandas

    행=가로=ROW=HORIZONTAL=엑셀쉬트의 숫자 방향 행가(Hanger) + 가 로(ROW)라고 외우면 쉬울듯행가로우~  열=세=COLUMN=VERTICAL=엑셀쉬트의 영어 방향열세(쉽세) + 기둥(COLUMN)은 수직으로 서 있다고 외우면 쉬울듯 열세콜!5. pandas5-1 pandas와 DataFramenumpy array : 복잡한 수학 연산을 할 때 사용가독성이 떨어짐정보에 대한 레이블 삽입 불가한 가지 데이터 타입만 사용 가능 pandas : 표 형태의 데이터를 간편하게 다루고 싶을 때데이터 불러오기데이터 가공데이터 분석데이터 시각화  In [1]:import pandas as pd In [2]:df = pd.DataFrame({ 'category' : ['skirt', 'sweate..

    [코드잇] 데이터 사이언스 Toolkit 3. Matplotlib

    [코드잇] 데이터 사이언스 Toolkit 3. Matplotlib

    4. Matplotlib4-1 Matplotlib과 데이터 시각화직관적인 그래프가 보기 좋음!숫자와 통계에 약한 사람에게도 좋음!Matplotlib : 파이썬, 넘파이를 기반으로 만들어진 데이터 시각화 라이브러리4-2 다양한 그래프 그려보기In [1]:import numpy as npimport matplotlib.pyplot as plt In [2]:year_array = np.array([2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020]) # 년도stock_array = np.array([14.46, 19.01, 20.04, 27.59, 26.32, 28.96, 42.31, 39.44, 73.41, 132.69]) # 년도별 애플 주가 In [..

    [코드잇] 데이터 사이언스 Toolkit 2. Numpy

    3. Numpy3-1 NumPy란?많은 양의 데이터를 처리하려면 파이썬으로는 부족하다!=> NumPy(Numerical Python) : 수와 파이썬 라이브러리 ex) 그냥 파이썬 문법의 리스트를 사용하는 것보다 넘파이의 배열을 사용하는 게 빠름!NumPY Array : 메모리 최적화, 연산 최적화3-2 NumPy와 arrayIn [1]:import numpy as np In [2]:array1 = np.array([1, 3, 5, 6, 7, 9])array1 Out[2]:array([1, 3, 5, 6, 7, 9]) In [3]:np.zeros(5) # 숫자 0 5개 자동 생성 Out[3]:array([0., 0., 0., 0., 0.]) In [4]:np.arange(10) # 0~9 숫자 순서대로 ..

    [코드잇] 데이터 사이언스 Toolkit 1. Jupyter Notebook

    [코드잇] 데이터 사이언스 Toolkit 1. Jupyter Notebook

    1. 토픽 시작하기1-1 토픽 소개언어 : Python Toolkit 4가지Jupyter Notebook : python 환경, VS code를 쓰지 않음Numpy : 데이터 관련 연산matplotlib : 데이터 시각화pandas : 표 형식 데이터1-2 수강 가이드선이수 지식 안내 이번 토픽에서는 파이썬이라는 프로그래밍 언어를 사용합니다. 아직 파이썬을 써 본 적 없다면 [Python 기초]를 공부해 보세요! 개발 환경 이번 토픽에서는 아래와 같은 프로그램을 사용합니다. 여러분의 PC에서 직접 실습해 보고 싶다면 설치 가이드를 참고해서 프로그램을 설치해 주세요! Anaconda(Windows 설치 가이드, macOS 설치 가이드) Anaconda를 설치하면 Jupyter Notebook, NumPy,..

    [코드잇] 데이터 사이언스 오버뷰

    [코드잇] 데이터 사이언스 오버뷰

    1. 데이터 리터러시 갖추기1-1 세상을 바꾸고 있는 데이터 사이언스Data 와 Computer와 연관이 있을 것 같지만 아니다!데이터는 컴퓨터, 스마트폰이 있기 전부터 있었다 [ ex) 초등학생들의 수학 점수들 ]데이터 사이언스 = 데이터를 다루는 일소프트웨어 = 데이터를 모으는 1등 공신!그래서 21세기에 데이터 사이언스가 뜨는 이유다!1-2 데이터 사이언스 이해하기프로그래밍 + 수학과 통계 + 특정 분야 전문성 = 데이터 사이언스데이터 사이언티스트 : 가치를 더할 수 있는 일이 무엇인지 찾아내고 데이터를 이용해서 위 문제를 해결하는 것이다1-3 데이터 사이언스에 대한 오해오해 1 : 데이터 사이언스의 핵심은 인공지능, 딥러닝 이다=> 인공지능, 딥러닝은 피라미드 데이터 사이언스의 최종 단계이다 오해..

    데이터 사이언티스트 관련 책들

    참고 사이트https://kongju7.github.io/data_science/2022/11/07/Book-for-DS-1.html 데이터 과학 관련 책 목록(1)저는 박사학위 소지자답게(!) 새로운 분야 공부를 할 때면 항상 책부터 사서 보는 습관이 있는데요, 공부하고 싶은 내용이 자꾸 늘어나다 보니 데이터 과학 분야 책도 생각보다 많이 쌓였더라구kongju7.github.io https://www.youtube.com/watch?v=v4yMNm3V0C8&t=725s코딩 입문 책http://www.yes24.com/product/goods/109323347 혼자 공부하는 얄팍한 코딩 지식 - 예스24혼자 해도 충분합니다! 1:1 과외하듯 배우는 IT 지식 입문서! 이 책은 독학으로 IT 지식을 배우는..