전체 글
-
[CHAPTER 12] 데이터 분석 | pandasDeep Learning/인공지능 입문 코딩 2021. 6. 3. 18:18
pandas는 파이썬 데이터 처리를 위한 라이브러리이다. 데이터 분석과 같은 작업에서 필수적인 라이브러리이니 자세히 살펴보도록 하자. pandas의 특징 빠르고 효율적이며 다양한 표현력을 갖춘 자료구조 실세계 데이터 분석을 위해 만들어진 파이썬 패키지 다양한 형태의 데이터에 적합 이종(heterogeneous) 자료형의 열을 가진 테이블 데이터 시계열 데이터 레이블을 가진 다양한 행렬 데이터 다양한 관측 통계 데이터 핵심 구조 시리즈(Series) : 레이블이 붙어있는 1차원 벡터 데이터 프레임(DataFrame) : 행과 열로 되어있는 2차원 테이블, 각 열은 시리즈로 되어 있다. 이들 데이터 구조는 모두 넘파이 배열을 이용하여 구현된다. 행의 이름을 Index 열의 이름을 columns 라고 부른다...
-
[CHAPTER 11] 데이터 시각화 | matplotlibDeep Learning/인공지능 입문 코딩 2021. 6. 2. 02:00
데이터 시각화를 하기위한 파이썬 라이브러리중 하나인 matplotlib 라이브러리를 사용해보자. matplotlib 기본적인 사용법 matpoltlib을 이용하여 우리나라의 GDP의 변화를 그려봤다. import matplotlib.pyplot as plt # 우리나라의 연간 1인당 국민소득을 각각 years, gdp에 저장 years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = [67.0, 80.0, 257.0, 1686.0, 6505, 11865.3, 22105.3] # 선 그래프를 그린다. x축에는 years값, y축에는 gdp 값이 표시된다. plt.plot(years, gdp, color='green', marker='o', linestyle='so..
-
Pythrch | 기초Deep Learning/PyTorch 2021. 6. 1. 22:01
Basic Tensor 파이토치를 이용해 텐서의 차원을 다루어보자 import torch def print_description(x): print(x) print(f'Size:{x.size()}') print(f'Shape:{x.shape}') print(f'dimension:{x.ndimension()}') print() # make tensor and print description x = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) print_description(x) # 랭크 늘리기 x = torch.unsqueeze(x, 0) print_description(x) # 랭크 줄이기 x = torch.squeeze(x) print_description(x) ..
-
PyTorch 설치Deep Learning/PyTorch 2021. 6. 1. 20:54
PyTorch 설치 1. 파이토치 홈페이지 접속 https://pytorch.kr/ PyTorch Korea User Group (Unofficial) Korean user community for PyTorch which is an open source machine learning framework that accelerates the path from research prototyping to production deployment. pytorch.kr 2. "시작하기" 클릭 3. 자신에게 맞는 버전, OS등 선택 나는 안정화된 1.8.1버전, OS는 Windows, anaconda를 사용하기 때문에 conda, python 언어를 사용하기에 Python GPU와 연동해주는 CUDA 11.1 버전을..
-
[CHAPTER 10]넘파이(numpy)Deep Learning/인공지능 입문 코딩 2021. 5. 30. 21:29
넘파이는 리스트 대신 쓸 수 있는 라이브러리이다. numpy는 파이썬에서 수치 데이터를 다루는 가장 기본적이고 강력한 패키지이다. 데이터 과학에서는 파이썬의 기본 리스트로 충분하지 않다. 데이터를 처리할 때는 리스트와 리스트 간의 다양한 연산이 팔요한데, 파이썬의 기본 리스트 자료형은 이러한 기능이 부족하며, 연산 속도도 빠르지 않다. numpy를 사용하는 이유 리스트보다 연산이 훨씬 빠르다. 대용량의 배열과 행렬연산을 빠르게 수행한다. 고차원적인 수학 연산자와 함수를 포함하고 있다. 데이터 분석을 위한 패키지인 판다스pands나 기계학습을 위한 scikit-learn, tensorflow등이 넘파이 위에서 작동한다. numpy를 사용해보자. 먼저 nuimpy 라이브러리를 설치한다. C:\> pip in..
-
[CHAPTER 9] 텍스트 처리Deep Learning/인공지능 입문 코딩 2021. 5. 29. 12:18
문자열 처리 문자열을 처리하는 방법들을 살펴보자. 슬라이싱 리스트에서 이미 배웠던 내용이다. 문자열에도 똑같이 적용할 수 있다. >>> s = 'Monty Python' >>> s[6:10] 'Pyth' >>> s[-12:-7] 'Monty' >>> t = s[:-2] >>> t 'Monty Pyth' >>> t = s[-2:] >>> t 'on' >>> s[:-2] + s[-2:] 'Monty Python' 'Monty Python' 문자열의 각각의 인덱스 번호는 아래와 같다. 다양한 문자열 처리 메서드, 함수 split() 문자열을 잘라주는 메소드이다. 인자가 없으면 공백을 기준으로 잘라준다. >>> s = 'Welcome to Python' >>> s.split() ['Welcome', 'to', ..
-
[CHAPTER 8] 딕셔너리와 집합Deep Learning/인공지능 입문 코딩 2021. 5. 24. 14:49
여러개의 데이터를 한꺼번에 저장하는 방법중 하나인 딕셔너리에 대해 알아보자. 딕셔너리(dictionary) 딕셔너리(dictionary)는 리스트와 같이 파이썬에서 기본 자료형으로 제공되고있다. 딕셔너리는 키-값(key-value)의 쌍으로 이루어져있다. 딕셔너리 생성 아래와 같이 생성한다. >>> phone_book = {} >>> phone_book['홍길동'] = "010-1234-1234" >>> phone_book {'홍길동': '010-1234-5678'} '홍길동' 은 key, '010-1234-1234'는 value가 된다. 딕셔너리를 생성하면서 초기화하는 방법은 아래와 같다. >>> phone_book = {"홍길동": "010-1234-5678"} >>> phone_book {'홍길동'..
-
[CHAPTER 7] 리스트, 튜플Deep Learning/인공지능 입문 코딩 2021. 5. 23. 23:23
데이터 여러 개를 하나로 묶어서 저장하는 방법을 배워보자. 리스트(list) 리스트(list)는 파이썬에서 여러 개의 데이터를 하나로 묶어서 저장하는 방법들 중 하나다. 대괄호를 이용해서 만들 수 있다. 리스트(list) 사용법 그룹 BTS의 멤버 3명을 리스트에 저장한다. >>> bts = ['V', 'Junkook', 'Jimin'] >>> bts ['V', 'Junkook', 'Jimin'] append 메서드를 이용하여 리스트에 요소를 추가할 수 있다. >>> bts = ['V', 'Junkook', 'Jimin'] >>> bts.append('RM') >>> bts ['V', 'Junkook', 'Jimin', 'RM'] list() 함수를이용해 list로 변환할 수도 있다. >>> data =..